HuggingFace学习3：加载预训练模型完成机器翻译（中译英）任务

加载模型页面为：https://huggingface.co/liam168/trans-opus-mt-zh-en

文章目录

整理文件
跑通程序，测试预训练模型
拆解Pipeline，逐步进行翻译任务

整理文件

首先下载模型所需的全部文件：https://huggingface.co/liam168/trans-opus-mt-zh-en/tree/main，将文件全部下载到本地，命名为trans_model

然后创建一个调用模型的python程序文件：use_translate.py

整个文件结构如下：
在这里插入图片描述

跑通程序，测试预训练模型

在use_translate.py文件中写入：

from transformers import AutoModelWithLMHead, AutoTokenizer, pipelinemode_name = "trans_model"
model = AutoModelWithLMHead.from_pretrained(mode_name)
tokenizer = AutoTokenizer.from_pretrained(mode_name)
translation = pipeline("translation_zh_to_en", model=model, tokenizer=tokenizer)
translate_result = translation('自然语言处理的技术之一：机器翻译', max_length=400)
print(translate_result)
# [{'translation_text': 'One of the technologies for natural language processing: machine translation'}]

如果控制台输出：

[{'translation_text': 'One of the technologies for natural language processing: machine translation'}]

则说明模型是通的，都没有问题

拆解Pipeline，逐步进行翻译任务

from transformers import AutoModelWithLMHead, AutoTokenizer# 加载预训练模型
mode_name = "trans_model"
model = AutoModelWithLMHead.from_pretrained(mode_name)
tokenizer = AutoTokenizer.from_pretrained(mode_name)# 开始翻译
text = "自然语言处理的技术之一：机器翻译"# 步骤1：将文本变为token，返回pytorch的tensor
tokenized_text = tokenizer.prepare_seq2seq_batch([text], return_tensors='pt')
# 也可以使用：
# tokenized_text = tokenizer([text], return_tensors="pt")# 步骤2：通过模型，得到预测出的token
translation = model.generate(**tokenized_text)  # 执行翻译，返回翻译后的tensor# 步骤3：将预测出的token转为单词
translated_text = tokenizer.batch_decode(translation, skip_special_tokens=True)
print(translated_text)

输出：

['One of the technologies for natural language processing: machine translation']

因此我们可以发现，整体的流程是：

将原始中文文本变为token
通过模型，得到预测出的token（对应英文的token）
将预测出的token转为英文单词

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/33187.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

HuggingFace学习3：加载预训练模型完成机器翻译（中译英）任务

文章目录

整理文件

跑通程序，测试预训练模型

拆解Pipeline，逐步进行翻译任务

相关文章

有没有什么好用的汉译英的学术翻译软件推荐（医学sci方面）？

数据平台投标方案模板

训练软件类项目投标文件示例

企企通：采购方怕投标方串通“围标”，怎么办？电子招投标来帮你

招标采购中，如何编写有效的RFI（信息邀请书）？

【漫画】不同性格程序员遇到产品经理

产品经理 | 职业选择及面试技巧

产品经理

【干货】产品经理面试指南（完整版）

简历推荐_26位AI产品经理

产品经理｜HR都夸赞的简历

产品经理|市场分析

就业喜报：转岗之后发现，太喜欢产品经理这个岗位了！

一名优秀的产品经理

关于产品经理的简历和面试，我的 20 个建议

招聘公司喜欢这样的程序员和产品经理

产品经理如何写出一看就想约的简历

chatgpt赋能python：Python数据：从入门到实战

chatgpt赋能python：Python编写股票买卖程序：一场AI技术的革命

chatgpt赋能python：Python长连接详解：优化用户体验和节约资源的有效方式