Python调用API翻译Excel中的英语句子并回填数据

一、问题描述

最近遇到一个把Excel表中两列单元格中的文本读取,然后翻译,再重新回填到单元格中的案例。大约有700多行,1400多个句子,一个个手动复制粘贴要花费不少时间,而且极易出错。这时,我们就可以请出批量Excel的工具Python,利用Python读取两列中非空单元格,调用小牛机器翻译的API,然后把例句翻译后,与原文分两段排列,有效解决了手工复制慢的问题。

样例

二、解决过程

1. 前期准备,申请小牛API

要申请小牛机器翻译的api,拿到它的样例代码,如果你还不太熟练这个过程,可以参考我以前的文章:

用小牛翻译API让ChatGPT给我做个在线翻译网站_chatgpt在线翻译-CSDN博客文章浏览阅读2.2k次。经过测试,上面这段代码有两个问题,一是返回的翻译结果是json格式,不是我们想要的译文,二是打开网页时,这个翻译结果框不显示,显得不是特别好看。这时,我们要请出ChatGPT,设计好我们想要的网页呈现形式,同时还要把我们在小牛翻译上面得到的代码样例,同时在开发过程中,还要在我们的网站上进行测试效果,以期达到我们想到的目标。在上面例子中,我对于生成的译文可以进行译后编辑,也可以再喂给ChatGPT,让它指出我们的语法错误,润色我们的文字,提出进一步修改的意见,这样我们的译文质量就又可以更上一层楼了。_chatgpt在线翻译https://pythonfun.blog.csdn.net/article/details/130538982

2. 分析任务,确保效果

有了api,下一步是分析一下这个Excel表,发现要翻译的是E列和F列,所以我们就可以设置从E列和F列的第三行开始读取,然后翻译,遇到空的单元格就跳过。由于小牛翻译每天给20万字符的翻译,而且QPS可以达到5,也就是一秒可以调用五次,因次是非常适合python调用的。

3. 明晰步骤,编写代码

于是,我们就撰写出下面的代码:

import requests
from openpyxl import load_workbook
from urllib import parse,request
# 翻译函数
apikey="xiaoniu_api_key" #把你的小牛翻译api贴到这里
def translate_txt(sentence):url = 'http://api.niutrans.com/NiuTransServer/translation?'data = {"from": "en", "to": 'zh', "apikey": apikey, "src_text": sentence}data_en = parse.urlencode(data)req = url + "&" + data_enres = request.urlopen(req)res_dict = json.loads(res.read())if "tgt_text" in res_dict:result = res_dict['tgt_text']else:result = resreturn result# 读取Excel文件并进行翻译
def translate_excel(file_path):# 加载工作簿wb = load_workbook(file_path)ws = wb.active  # 获取当前活动的工作表# 从E3和F3开始读取row = 3while True:e_cell = ws[f'E{row}']f_cell = ws[f'F{row}']# 如果E列和F列的单元格都为空,结束循环if not e_cell.value and not f_cell.value:break# 翻译非空的E列和F列if e_cell.value:e_cell.value = e_cell.value+ "\n"+ translate_txt(e_cell.value)if f_cell.value:f_cell.value = f_cell.value + "\n" + translate_txt(f_cell.value)row += 1# 保存修改后的Excel文件wb.save('translated_file.xlsx')print("翻译完成,已保存为 'translated_file_外研版 语境版单词表xlsx(1) - 副本.xlsx'")try:translate_excel('外研版 语境版单词表xlsx(1) - 副本.xlsx')
except Exception as exc:print(exc)

经过测试,翻译的效果还不错,1400个单元格大约用了不到五分钟就完成了任务,而且全过程无人职守,出去吃个水果,回来工作就已经完成了。

三、学后总结

1. 在日常工作和办公中,如果是批量的、重复性的工作可以想办法用python来解决,节省人才和物力,提高办公的效率。

2. 使用Python时,一定要明确目标和方法,分析问题确定解决步骤,会借助常用的python模块解决现实问题,这样学Python就会感觉非常有成就感。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/472194.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NFS-Ganesha 核心架构解读

NFSv4 简要概述 NFS 这个协议( NFSv2 )最初由 Sun Microsystems 在 1984 年设计提出,由于存在一些不足,因此在随后由几家公司联合推出了 NFSv3。到了 NFSv4 时,开发完全由 IETF 主导,设计目标是: 提高互联下的 NFS 访…

直流保护电路设计及保护器件参数说明和选型

在工控产品设计中时常会涉及到电源保护的电路设计的问题,在深圳瑞隆源电子给出的参考电路来切入主题,对气体放电管、压敏电阻和TVS这三类保护器件的参数及选型进行详细说明,以达到深刻理解的目的。 图1 直流保护电路 举例说明,若…

VBA学习笔记:点击单元格显示指定的列

应用场景: 表格中列数较多,特定条件下隐藏一些无关的列,只保留相关的列,使表格更加清晰。 示例:原表格如下 点击一年级,只显示一年级相关的科目: 点击二年级,只显示二年级相关的科…

一种时间戳对齐的方法(离线)

这段代码的主要功能是: 读取指定目录下的 pcd 文件和 jpg 文件。对于每个 pcd 文件,在 jpg 目录中找到时间戳最接近的 jpg 文件。将找到的 jpg 文件复制到对应的输出目录,实现时间戳对齐。 这种时间戳对齐的操作在多传感器数据融合中非常常见,它确保了不同传感器采集的数据在时…

『VUE』27. 透传属性与inheritAttrs(详细图文注释)

目录 什么是透传属性(Forwarding Attributes)使用条件唯一根节点禁用透传属性继承总结 欢迎关注 『VUE』 专栏,持续更新中 欢迎关注 『VUE』 专栏,持续更新中 什么是透传属性(Forwarding Attributes) 在 V…

【代码大模型】Is Your Code Generated by ChatGPT Really Correct?论文阅读

Is Your Code Generated by ChatGPT Really Correct? Rigorous Evaluation of Large Language Models for Code Generation key word: evaluation framework, LLM-synthesized code, benchmark 论文:https://arxiv.org/pdf/2305.01210.pdf 代码:https:…

AdaBoost 二分类问题

代码功能 生成数据集: 使用 make_classification 创建一个模拟分类问题的数据集。 数据集包含 10 个特征,其中 5 个是有用特征,2 个是冗余特征。 数据集划分: 将数据分为训练集(70%)和测试集(3…

maven的optional选项说明以及具体应用

写在前面 本文看下maven的optional选项的作用和用法。 1:什么作用 考虑这样的场景,A依赖B,B依赖C,正常的按照依赖的传递性,A也会间接的依赖C,但是在一些特定的场景中项目A只希望依赖B,而不依…

QSS 设置bug

问题描述: 在QWidget上add 一个QLabel,但是死活不生效 原因: c 主程序如下: QWidget* LOGO new QWidget(logo_wnd);LOGO->setFixedSize(logo_width, 41);LOGO->setObjectName("TittltLogo");QVBoxLayout* tit…

论文阅读 - Causally Regularized Learning with Agnostic Data Selection

代码链接: GitHub - HMTTT/CRLR: CRLR尝试实现 https://arxiv.org/pdf/1708.06656v2 目录 摘要 INTRODUCTION 2 RELATED WORK 3 CAUSALLY REGULARIZED LOGISTIC REGRESSION 3.1 Problem Formulation 3.2 Confounder Balancing 3.3 Causally Regularized Lo…

JVM双亲委派与自定义类加载器

一. 类加载过程 Java Application运行前需要将编译生成的字节码文件加载到JVM中,JVM类加载过程如下: 1. 加载 加载阶段是类加载的第一步,在加载阶段JVM会查找并加载类的字节码文件,这个过程通常从类路径(Classpath…

Android Osmdroid + 天地图 (二)

Osmdroid 天地图 (二) 前言正文一、定位监听二、改变地图中心三、添加Marker四、地图点击五、其他配置① 缩放控件② Marker更换图标③ 添加比例尺④ 添加指南针⑤ 添加经纬度网格线⑥ 启用旋转手势⑦ 添加小地图 六、源码 前言 上一篇中我们显示了地图…

R语言贝叶斯分析:INLA 、MCMC混合模型、生存分析肿瘤临床试验、间歇泉喷发时间数据应用|附数据代码...

全文链接:https://tecdat.cn/?p38273 多模态数据在统计学中并不罕见,常出现在观测数据来自两个或多个潜在群体或总体的情况。混合模型常用于分析这类数据,它利用不同的组件来对数据中的不同群体或总体进行建模。本质上,混合模型是…

AI开发-计算机视觉库-OpenCV

1 需求 官网:OpenCV - Open Computer Vision Library 2 接口 3 示例 import cv2image cv2.imread("./data/train/1_1.jpg") print(type(image)) 4 参考资料

RK3588 C++ 多线程运行

RK3588 C 多线程 实际运行解决OpenCV问题: 1. OpenCV 安装 sudo apt-get update sudo apt-get install libopencv-dev2. 检查 OpenCV 安装路径 find / -name OpenCVConfig.cmake3. 设置 OpenCV_DIR 环境变量 export OpenCV_DIR/usr/lib/aarch64-linux-gnu/cmake/op…

从0开始学习机器学习--Day26--聚类算法

无监督学习(Unsupervised learning and introduction) 监督学习问题的样本 无监督学习样本 如图,可以看到两者的区别在于无监督学习的样本是没有标签的,换言之就是无监督学习不会赋予主观上的判断,需要算法自己去探寻区别,第二张…

git使用及上线流程(仅为我工作中常用)

推荐软件或者直接终端 ⚠️注意:在确保远程和本地分支都可使用的情况下 git常见使用命令 ls---查看所有目录 pwd---本机密码 cd 目录名---进入目录 Touch ---创建文本文件 git status---查看状态 git branch---查看分支 git pull---拉取远程最新代码 git checkou…

shell编程之变量与引用

目录 深入认识变量什么是变量变量的名称变量数据类型变量的定义自定义变量环境变量位置变量 变量赋值和作用域赋值:变量名变量值read从键盘读入变量值变量和引号变量的作用域变量的运算 深入认识变量 什么是变量 变量是在程序中保存用户数据的一段内存存储空间&am…

精华帖分享|浅谈金融时间序列分析与股价随机游走

本文来源于量化小论坛公共讨论区板块精华帖,作者为正扬,发布于2024年6月3日。 以下为精华帖正文: 01 引 时间序列分析是个很唬人的术语,实际上它也不是一个很容易接近的话题。我本科曾经短暂地学过一点点,又看到互联…

计算机网络 (4)计算机网络体系结构

前言 计算机网络体系结构是指计算机网络层次结构模型,它是各层的协议以及层次之间的端口的集合。这一体系结构为计算机网络及其部件应完成的功能提供了精确定义,并规定了这些功能应由何种硬件或软件来实现。 一、主流模型 计算机网络体系结构存在多种模型…