构建具有音频功能的中英翻译器:一个Python应用程序的旅程

在当今的全球化世界中,语言翻译工具变得越来越重要。作为一名软件开发者,我最近完成了一个有趣的项目:一个结合了翻译、文字转语音和数据管理功能的中英翻译器。在这篇博客中,我将分享这个应用程序的主要特性和开发过程中的一些见解。
C:\pythoncode\new\travlelanguage.py

全部代码

import wx
import wx.grid
import sqlite3
import datetime
import os
from deep_translator import GoogleTranslator
import pyttsx3
from pydub import AudioSegment
import pygame
import openpyxlclass TranslatorFrame(wx.Frame):def __init__(self):super().__init__(parent=None, title='Chinese-English Translator', size=(800, 600))panel = wx.Panel(self)self.chinese_text = wx.TextCtrl(panel, pos=(5, 5), size=(200, 25))self.translate_button = wx.Button(panel, label='Translate', pos=(210, 5), size=(70, 25))self.english_text = wx.TextCtrl(panel, pos=(5, 35), size=(200, 25))self.speak_button = wx.Button(panel, label='Speak', pos=(210, 35), size=(70, 25))self.save_button = wx.Button(panel, label='Save', pos=(285, 35), size=(70, 25))self.grid = wx.grid.Grid(panel, pos=(5, 70), size=(780, 400))self.grid.CreateGrid(0, 3)self.grid.SetColLabelValue(0, "Chinese")self.grid.SetColLabelValue(1, "English")self.grid.SetColLabelValue(2, "WAV Path")# Add buttons for all featuresself.play_button = wx.Button(panel, label='Play', pos=(5, 480), size=(70, 25))self.merge_button = wx.Button(panel, label='Merge', pos=(80, 480), size=(70, 25))self.export_button = wx.Button(panel, label='Export to Excel', pos=(155, 480), size=(100, 25))self.select_all_button = wx.Button(panel, label='Select All', pos=(260, 480), size=(70, 25))self.open_db_button = wx.Button(panel, label='Open DB', pos=(335, 480), size=(70, 25))self.delete_button = wx.Button(panel, label='Delete Selected', pos=(410, 480), size=(100, 25))self.translate_button.Bind(wx.EVT_BUTTON, self.on_translate)self.speak_button.Bind(wx.EVT_BUTTON, self.on_speak)self.save_button.Bind(wx.EVT_BUTTON, self.on_save)self.play_button.Bind(wx.EVT_BUTTON, self.on_play)self.merge_button.Bind(wx.EVT_BUTTON, self.on_merge)self.export_button.Bind(wx.EVT_BUTTON, self.on_export)self.select_all_button.Bind(wx.EVT_BUTTON, self.on_select_all)self.open_db_button.Bind(wx.EVT_BUTTON, self.on_open_db)self.delete_button.Bind(wx.EVT_BUTTON, self.on_delete_selected)self.translator = GoogleTranslator(source='zh-CN', target='en')self.engine = pyttsx3.init()self.conn = sqlite3.connect('travelenglish.db')self.create_table()self.Show()def create_table(self):cursor = self.conn.cursor()cursor.execute('''CREATE TABLE IF NOT EXISTS travelenglish(chinese TEXT, english TEXT, wav_path TEXT)''')self.conn.commit()def on_translate(self, event):chinese = self.chinese_text.GetValue()english = self.translator.translate(chinese)self.english_text.SetValue(english)def on_speak(self, event):english = self.english_text.GetValue()self.engine.say(english)self.engine.runAndWait()def on_save(self, event):chinese = self.chinese_text.GetValue()english = self.english_text.GetValue()wav_path = f"audio_{datetime.datetime.now().strftime('%Y%m%d%H%M%S')}.wav"self.engine.save_to_file(english, wav_path)self.engine.runAndWait()cursor = self.conn.cursor()cursor.execute("INSERT INTO travelenglish VALUES (?, ?, ?)", (chinese, english, wav_path))self.conn.commit()self.update_grid()def update_grid(self):cursor = self.conn.cursor()cursor.execute("SELECT * FROM travelenglish")rows = cursor.fetchall()self.grid.ClearGrid()current_rows = self.grid.GetNumberRows()if current_rows < len(rows):self.grid.AppendRows(len(rows) - current_rows)elif current_rows > len(rows):self.grid.DeleteRows(0, current_rows - len(rows))for i, row in enumerate(rows):for j, value in enumerate(row):self.grid.SetCellValue(i, j, str(value))def on_play(self, event):selected_rows = self.grid.GetSelectedRows()if selected_rows:wav_path = self.grid.GetCellValue(selected_rows[0], 2)pygame.mixer.init()pygame.mixer.music.load(wav_path)pygame.mixer.music.play()def on_merge(self, event):selected_rows = self.grid.GetSelectedRows()wav_paths = [self.grid.GetCellValue(row, 2) for row in selected_rows]combined = AudioSegment.empty()for wav_path in wav_paths:sound = AudioSegment.from_wav(wav_path)combined += soundoutput_path = f"merged_{datetime.datetime.now().strftime('%Y%m%d')}_{len(wav_paths)}.mp3"combined.export(output_path, format="mp3")wx.MessageBox(f"Merged audio saved as {output_path}", "Merge Complete")def on_export(self, event):with wx.FileDialog(self, "Save Excel file", wildcard="Excel files (*.xlsx)|*.xlsx",style=wx.FD_SAVE | wx.FD_OVERWRITE_PROMPT) as fileDialog:if fileDialog.ShowModal() == wx.ID_CANCEL:returnpathname = fileDialog.GetPath()try:workbook = openpyxl.Workbook()sheet = workbook.activesheet.title = "Translation Data"# Add headersheaders = ["Chinese", "English", "WAV Path"]for col, header in enumerate(headers, start=1):sheet.cell(row=1, column=col, value=header)# Add datafor row in range(self.grid.GetNumberRows()):for col in range(self.grid.GetNumberCols()):sheet.cell(row=row+2, column=col+1, value=self.grid.GetCellValue(row, col))workbook.save(pathname)wx.MessageBox(f"Data exported to {pathname}", "Export Complete")except IOError:wx.LogError(f"Cannot save file '{pathname}'.")def on_select_all(self, event):self.grid.SelectAll()def on_open_db(self, event):self.update_grid()wx.MessageBox("Database table loaded into grid", "Open Database")def on_delete_selected(self, event):selected_rows = self.grid.GetSelectedRows()if not selected_rows:wx.MessageBox("No rows selected", "Delete Error")returndlg = wx.MessageDialog(self, "Are you sure you want to delete the selected records?","Confirm Deletion", wx.YES_NO | wx.ICON_QUESTION)result = dlg.ShowModal()dlg.Destroy()if result == wx.ID_YES:cursor = self.conn.cursor()for row in sorted(selected_rows, reverse=True):chinese = self.grid.GetCellValue(row, 0)english = self.grid.GetCellValue(row, 1)wav_path = self.grid.GetCellValue(row, 2)# Delete from databasecursor.execute("DELETE FROM travelenglish WHERE chinese=? AND english=? AND wav_path=?",(chinese, english, wav_path))# Delete WAV fileif os.path.exists(wav_path):os.remove(wav_path)self.conn.commit()self.update_grid()wx.MessageBox(f"{len(selected_rows)} record(s) deleted", "Delete Complete")if __name__ == '__main__':app = wx.App()frame = TranslatorFrame()app.MainLoop()

应用程序概述

这个应用程序是使用Python开发的,主要功能包括:

  1. 中英文翻译
  2. 文本转语音(TTS)
  3. 音频文件的保存和播放
  4. 数据管理(包括保存到数据库和导出到Excel)
  5. 音频文件合并

主要特性详解

1. 翻译功能

使用Google Translate API实现翻译功能。用户输入中文文本后,程序会自动将其翻译成英文。这为快速理解和学习新词汇提供了便利。

2. 文本转语音

集成了pyttsx3库来实现文本转语音功能。用户可以听到翻译后的英文发音,这对于语言学习者来说是一个很有价值的功能。

3. 音频管理

应用程序允许用户保存生成的音频文件,并可以随时播放。这为创建个人化的语音库提供了可能。

4. 数据管理

所有的翻译记录都保存在SQLite数据库中,用户可以方便地查看、删除记录。此外,还可以将数据导出为Excel文件,便于进一步分析或共享。

5. 音频合并

用户可以选择多个音频文件并将它们合并成一个单独的MP3文件。这个功能对于创建自定义的语音课程或复习材料非常有用。

技术细节

  • GUI框架:使用wxPython创建用户界面
  • 翻译API:Google Translate(通过deep_translator库)
  • 数据库:SQLite
  • 音频处理:pydub和pygame库
  • Excel导出:openpyxl库

开发过程中的挑战和解决方案

  1. 兼容性问题:在集成不同库时遇到了一些兼容性问题,特别是与wxPython和音频处理库相关的问题。通过仔细研究文档和在线社区的帮助,最终解决了这些问题。

  2. 性能优化:处理大量数据和音频文件时,性能是一个挑战。通过优化数据库查询和使用异步处理来改善了应用程序的响应性。

  3. 用户体验:设计一个直观且功能丰富的界面是一个挑战。通过多次迭代和用户反馈,不断改进了界面设计。

未来改进计划

  1. 支持更多语言对
  2. 添加语音识别功能,实现语音输入
  3. 实现云同步,使用户可以在多个设备上访问他们的翻译和音频数据
  4. 优化音频质量和文件大小

结果如下

在这里插入图片描述

结论

开发这个中英翻译器不仅是一次有趣的编程练习,更是一次探索语言学习工具潜力的旅程。通过结合翻译、语音和数据管理功能,我们创造了一个功能丰富的应用程序,它不仅可以帮助用户翻译文本,还能辅助语言学习过程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/403394.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【k8s从节点报错】error: You must be logged in to the server (Unauthorized)

k8s主节点可以获取nodes节点信息&#xff0c;但是从节点无法获取&#xff0c;且报错“error: You must be logged in to the server (Unauthorized)” 排查思路&#xff1a; 当时证书过期了&#xff0c;只处理的主节点的证书过期&#xff0c;没有处理从节点的 kubeadm alpha …

基于Windows系统和‌Linux系统,以tomcat为案例,讲解如何新增自启动服务。

文章目录 引言‌I Linux系统‌(以CentOS为例)基础知识:运行级别(run level)基于chkconfig 工具,设置服务启动类型。基于systemctl 新增系统服务制定定时任务优化停止Tomcat服务命令II 基于Windows系统设置服务自启动的常规操作安装多个tomcat服务,并设置自启动。引言 场景…

Vue UI - 可视化的Vue项目管理器

概述 Vue CLI 3.0 更新后&#xff0c;提供了一套全新的可视化Vue项目管理器 —— Vue UI。所以要想使用它&#xff0c;你的 Vue CL I版本必须要在v3.0以上。 一、启动Vue UI 1.1 环境准备 1.1.1 安装node.js 访问官网&#xff08;外网下载速度较慢&#xff09;或 http://nod…

【HeadFirst 设计模式】装饰者模式的C++实现

一、案例背景 Starbuzz是以扩张速度最快而闻名的咖啡连锁店。如果你在街角看到它的店&#xff0c;在对面街上肯定还会看到另一家。因为扩张速度实在太快了&#xff0c;他们准备更新订单系统&#xff0c;以合乎他们的饮料供应要求。他们原先的类设计是这样的…… 购买咖啡时&am…

西安旅游系统--论文pf

TOC springboot383西安旅游系统--论文pf 第1章 绪论 1.1 课题背景 二十一世纪互联网的出现&#xff0c;改变了几千年以来人们的生活&#xff0c;不仅仅是生活物资的丰富&#xff0c;还有精神层次的丰富。在互联网诞生之前&#xff0c;地域位置往往是人们思想上不可跨域的鸿…

Linux快捷方式创建、输出重定向(正确输出和错误输出)

一.正确输出 创建一个1.txt文件&#xff0c;然后用vim打开这个文件&#xff0c;然后再开一个窗口 进程号是5602 通过proc可以看到5602这个进程 进入5602里面这里记录了程序的信息&#xff0c;找到fd 进入fd目录下面有0124快捷方式&#xff1a;快捷方式对应的真正的文件是 /de…

HarmonyOS笔记4:从云数据库获取数据

移动应用获取数据的方式主要有&#xff1a; 1.从网络中获取数据接口API。 2.从华为云数据库获取云数据库的资源。 3.从移动终端直接获取本地的数据 在HarmonyOS笔记3中已经完成了方式一从网络中获取数据接口API的方式。在本篇笔记中&#xff0c;将讨论从云数据库中获取数据。 因…

Docker下安装Redis

下载最新Redis镜像 docker pull redis启动Redis容器 docker run -itd --name myFirstRedis -p 6379:6379 redis:latest观察Redis启动效果 docker ps查看Redis的版本 docker exec -it myFirstRedis /bin/bash redis-server --versionRedis服务器和客户端 Redis是基于键值对存…

了解Android

Android 系统架构 从图中可以看出&#xff0c;整个Android操作系统分为五层。它们分别是&#xff1a; 内核层 Android系统是基于Linux内核的&#xff0c;这一层为Android设备的各种硬件提供了底层的驱动。硬件抽象层 该层为硬件厂商定义了一套标准的接口。这样可以在不影响上层…

android13禁用打开wifi ap 热点

总纲 android13 rom 开发总纲说明 目录 1.前言 2.情况分析 3.代码分析 4.代码修改 5.彩蛋 1.前言 这个文章介绍的是如何禁止用户打开wifi热点,禁止用户安装app后,打开wifi热点。 2.情况分析 android13 应用层打开wifi AP public void setWifiApEnabled(boolean isEn…

LoRA微调大语言模型Bert

LoRA是一种流行的微调大语言模型的手段&#xff0c;这是因为LoRA仅需在预训练模型需要微调的地方添加旁路矩阵。LoRA 的作者们还提供了一个易于使用的库 loralib&#xff0c;它极大地简化了使用 LoRA 微调模型的过程。这个库允许用户轻松地将 LoRA 层添加到现有的模型架构中&am…

MATLAB R2023b配置Fortran编译器

MATLAB R2023b配置Fortran编译器 引言1. 安装Visual Studio 20192. 安装Intel API20243. 配置xml文件文件4. 设置环境变量5. MATLAB编译Fortran 引言 当我们需要用到MATLAB编译Fortran代码后进行调用计算时&#xff0c;整个配置流程较繁琐。下面以MATLAB R2023b为例&#xff0…

在亚马逊云科技上部署开源大模型并利用RAG和LangChain开发生成式AI应用

项目简介&#xff1a; 小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案&#xff0c;帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWS AI最佳实践&#xff0c;并应用到自己的日常工作里。 本次介绍的是如何在亚马逊云科技上利用Sag…

IDEA2023版本创建mavenWeb项目及maven的相关配置

在使用idea创建maven项目之前&#xff0c;首先要确保本地已经下载并配置好maven的环境变量&#xff0c;可以参考我主页的maven下载及环境变量配置篇。 接下来首先介绍我们需要对maven安装目录文件进行的修改介绍。 maven功能配置 我们需要需改 maven/conf/settings.xml 配置…

中间件|day1.Redis

Redis 定义 Redis 是一个开源&#xff08;BSD许可&#xff09;的&#xff0c;内存中的数据结构存储系统&#xff0c;它可以用作数据库、缓存和消息中间件。 它支持多种类型的数据结构&#xff0c;如 字符串&#xff08;strings&#xff09;&#xff0c; 散列&#xff08;hash…

构建一个Markdown编辑器:Fyne综合案例

在本文中&#xff0c;我们将通过一个完整的案例来介绍如何使用Go语言的Fyne库来构建一个简单的Markdown编辑器。Fyne是一个易于使用的库&#xff0c;它允许开发者使用Go语言来创建跨平台的GUI应用程序。 1. 项目结构 首先&#xff0c;我们需要创建一个Go项目&#xff0c;并引…

Linux进程间通信——SystemV共享内存

文章目录 System V共享内存创建内存共享释放共享内存命令行shmctlshmatshmdt System V共享内存 System V是一种进程间通信的标准&#xff0c;在这种标准之下&#xff0c;本地通信的方式一般由三种&#xff0c;内存共享、消息队列、信号量 这里我们主要介绍共享内存 创建内存…

Shell参考 - Linux Shell 训练营

出品方<Linux.cn & 阿里云开发者学堂> 一&#xff0c;Linux 可以划分为以下四个部分&#xff1a; 1. 应用软件 2. 窗口管理软件 Unity Gnome KDE 3. GNU 系统工具链 Software- GNU Project - Free Software Foundation 4. Linux 内核 二&#xff0c;什么是shell 1. L…

达梦数据库的系统视图v$database

达梦数据库的系统视图v$database 达梦数据库&#xff08;DM Database&#xff09;提供了多个系统视图&#xff0c;以便管理员能够监控和管理数据库的运行状态和性能。V$DATABASE 是其中一个关键系统视图&#xff0c;它包含有关数据库全局状态和配置的综合信息。 V$DATABASE 系…

Linux 软件编程学习第十五天

1.TCP粘包问题&#xff1a; TCP发送数据是连续的&#xff0c;两次发送的数据可能粘连成一包被接收到 1.解决粘包问题方法&#xff1a; 1.接收指定长度&#xff1a;&#xff08;不稳定&#xff09; 发送5个字节 接收5个字节 2.睡眠&#x…