利用python批量将excel中文翻译成英文

目录

  • 操作过程中不断遇到新的问题,思路的转换过程
  • 背景
    • 第一天 操作过程
    • 第二天
      • 正则表达式是个好东西
    • 第三天
    • 第四天
    • 第五天
    • 遇到的小问题

操作过程中不断遇到新的问题,思路的转换过程

背景

今天接到一个任务,需要将EXCEL文件中的中文翻译成英文,由于表格内容非常大,我想着 这要是手动翻译,三天啥都不用干了,就翻译这个吧
于是有了用python批量翻译的想法
目前的思路是,将excel中每个单元的内容拿出来,放在一个列表中,然后用翻译软件翻译再批量存入新的表格(应该可以用API接口,将所有单元内容依次拿出、翻译、存入,这个还没学会。。。)
参考文章:pandas操作

第一天 操作过程

1.发现一个问题,google翻译有字数上限。。。一次最多5000字符在这里插入图片描述
于是想到分几步粘贴,需要翻译的表格差不多两万多。自己多动几次手就好了。
好,终于翻译完了,开始运行
在这里插入图片描述
新问题来了,谷歌在翻译的大段字符的时候,把有的引号 ‘’ 给吞了,这就造成了列表中间的元素发生了紊乱,这个就比较麻烦了,刚开始尝试手动修改,把吞掉的引号给他补上,手动操作5分钟之后,我放弃了,这尼玛也太坑了。就在我准备砸电脑放弃的时候,突然灵光一闪,想到可以用正则表达式批量计算啊,简直不要太机智

import pandas as pdpath = r'C:\Users\hao\Desktop\批量翻译\源文件\两广-住宅调研问卷.xlsx'
df = pd.read_excel(path, header=None)
contents = []
for i in range(len(df[0])):for j in range(len(df.iloc[0])):content = df.iloc[i,j]print('第{}行第{}列元素:%s'.format(i, j)%content)contents.append(content)
print('行和列的长度:%d,%d'%(len(df[0]), len(df.iloc[0])))
print(contents)

第二天

正则表达式是个好东西

正则表达式常见操作
先导入所有翻译好的数据
在这里插入图片描述
在编译器的提示下,可以很明显地看出出现错误的地方(白色就代表出错了),英文里面所有格 's中会带来引号,与列表中的引号发生了冲突,于是想到用正则把其他的引号改为双引号,
在这里插入图片描述
然后把开头和结尾的单引号也改为双引号,但依然提示错误。。。发现是由于数字不是字符串没有引号,没有被正则匹配上,于是又回去修改代码,把int和float型加上引号,再接着运行,发现还是有错误,中间有些空白字符被吞了,就导致后面的整个秩序对不上,导入到表格中发生错位。。。最后就放弃用正则修改了。。。

第三天

既然批量提取,翻译之后再批量导入的方法行不通,就只能试一试之前想到的API了,提取一个,翻译一个,这样就不会错位了,说干就干,百度了一个方法,代码如下

#利用translate模块,但有两个缺点,一个是限制翻译数量,每天就能翻译1000个词
#再一个是只能由英文翻译成中文,比较瓜
import pandas as pd
from translate import Translator
path = r'C:\Users\hao\Desktop\批量翻译\源文件\test_db1.xlsx'
df = pd.read_excel(path,

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/71345.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用python做一个文本翻译器,自动将中文翻译成英文,超方便的

translate非标准库是python中可以实现对多种语言进行互相翻译的库,使用时只需要设置目标语言(比如:中文、英文)后,会自动将原始文本翻译成我们需要的目标语言。 【阅读全文】 使用pip的方式安装translate非标准库。 …

无手机号注册Outlook邮箱方法

目前,拥有电子邮件地址已成为一项基本需求,因为有必要其他平台上注册,App注册等等。 创建电子邮件帐户很简单,但同时在安全性方面可能会变得有些微妙,因为我们的电子邮件通常包含与我们公开使用的银行数据、家庭数据或…

配置cloudreve邮箱发信用outlook邮箱时的权限异常,做个记录

介绍 之前用163的默认邮箱发信,改用outlook的自定域名后缀发信但是居然后台出现错误,现现以下错误提示 既然发送失败,第一时间就是拉取日志查看异常原因了,异常原因“Caused by: javax.mail.AuthenticationFailedException: 535…

.Net使用163smtp发送邮件时错误:邮箱不可用. has no permission解决方法

C#实现简单邮件发送代码如下 public static void SendAsync(string emailTo, string subject, string mailBody){var msg new MailMessage();msg.To.Add(emailTo);//msg.From new MailAddress(_userNameForEmail, "显示的发件人名称", System.Text.Encoding.UTF8);…

Foxmail登陆报错outlook邮箱报错:foxmail,C4 NO LOGIN failed.

1 事件 Foxmail登陆报错outlook邮箱报错: foxmail,C4 NO LOGIN failed. 2 原因 这是由于outlook邮箱设置了双重验证登陆,foxmail无法弹出验证登陆窗口 3操作方法 方法一:更换邮箱客户端 方法二: (1)网页登陆…

文心一言 VS chatgpt (13)-- 算法导论3.1 8题 3.2 1题

八、可以扩展我们的记号到有两个参数n和m的情形,其中的n和m可以按不同速率独立地趋于无穷。对于给定的函数g(n, m),用O(g(n, m))来表示以下函数集: O(g(n, m)) { f(n, m): 存在正常量c、和,使得对所有n>n0或m>m0&#xff…

Windows中文账户名修改为英文

原理:使用第三者管理员账户对当前中文名管理员账户的名称进行修改。 1、创建新的管理员账户 在Windows开始菜单处点击右键,选择Windows PowerShell(管理员),输入以下命令,创建tempuser管理员用户&#xff…

win10修改用户名||user中文名改英文名

操作可能有系统重装风险,修改需谨慎! 1.修改注册表 winR 打开regedit: 打开路径:计算机\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion,双击RegisteredOwner将其值改为要改成的新名字name&#…

chatgpt赋能python:Python聊天机器人:让沟通变得更加智能

Python 聊天机器人:让沟通变得更加智能 随着人工智能的快速发展,聊天机器人正在变得越来越流行。Python 作为一种简单易用的编程语言,也在聊天机器人的开发中得到了广泛应用。本篇文章将介绍 Python 聊天机器人,并探讨它的优势以…

【信息安全】shamir(t,n)密钥共享

一、应用场景 有一个房间,里面放的是某公司的机密文件。如何设计该房间的门钥匙比较合理呢?有以下几种可选方案。 方案一:给其中一个人,只有这个人能够打开该房间。方案二:给n个人,只有这n个人都到齐了&am…

公钥密码体制概述

1976年,Whitefield Diffie和Martin Hellman在论文《密码学的新方向》(New Directions in Cryptography)中提出一个设想:用户A有一对密钥:加密密钥,和解密密钥,公开,保密。若B要给A发送加密信息&…

GPG生成密钥对(Windows)及应用

安装Gpg4win,下载链接:https://download.csdn.net/download/zyhlwzy/11099228 1、生成密钥对 C:\WINDOWS\system32>gpg --gen-key gpg (GnuPG) 2.0.30; Copyright (C) 2015 Free Software Foundation, Inc. This is free software: you are free to…

密钥类型详解大全

0x01 生成随机密钥 随机密钥可以大大增加密钥的安全性,生成随机密钥这里要用到随机数生成器(RNG),是一个用于生成随机数的程序或硬件 随机数在密码学的很多算法中都是必不可少的,如果某些算法的密钥不能采用随机生成的…

hutool国密sm2算法使用, 正确的秘钥生成签名及验签,签名为64字节

hutool工具类: 在糊涂提供的国密算法,需要通过椭圆曲线生成秘钥,且当前业内私钥长度为固定32字节,公用固定长度为64字节。在参考hutool官方文档中的国密算法的例子,发现生成的秘钥非常长,远大于32字节和64…

通信加密和解密,公钥,私钥,CA

监听模式:打开ip和端口=套接字 等待别人来连接 为众所周知的服务--固定的端口<1024 客户端程序都是打开一个大于40&#…

如何用Rdkit计算MACCS密钥以及每个指纹位点代表什么

1.MACCS密钥是什么 MACCS(分子访问系统)键是最常用的结构键之一,有时也被称为 MDL 密钥,MDL来源于开发它的公司的名称(MDL 信息系统,现为 BIOVIA)。 虽然有两组 MACCS 密钥(一组包含…

5分钟让你知道什么是PKI 密钥

译者博客 原文出处 前言 Public Key Infrastructure(PKI),中文叫做公开密钥基础设施,也就是利用公开密钥机制建立起来的基础设施。但是如果这么解释起来,到底是个什么东西,大家想必是没办法理解的。 现在大家的很多重要…

公钥、密钥和数字证书

转自 我理解的数字证书-1-公钥,私钥和数字证书 英文原文地址: http://www.youdzone.com/signature.html 若下文有任何错误,请告知我,谢谢。79996286qq.com 主角介绍:Bob and Alice 提起RSA加密算法,公…

一文看懂公钥、私钥、数字签名、数字证书

好文章,记录下来!源文地址:What is a Digital Signature? (youdzone.com) 1. 鲍勃有两把钥匙,一把是公钥,另一把是私钥。 2. 鲍勃把公钥送给他的朋友们----帕蒂、道格、苏珊----每人一把。 3. 苏珊要给鲍勃写一封保密…

密钥对,密钥,公钥,私钥的 区分!!!

密钥对,密钥,公钥,私钥的区分: 一、概念 1、密钥对:在非对称加密技术中,有两种密钥,分为公钥和私钥。 公钥是密钥对所有者持有,公布给他人的;私钥也是密钥对所有者持有…