百度新突破:AI同声传译系统STACL,可预测,低延迟

百度新突破:AI同声传译系统STACL,可预测,低延迟

文章来源:ATYUN AI平台 

百度开发了新的AI系统,名为同声传译和预期与可控延迟(STACL),百度声称这代表了自然语言处理的重大突破。

与大多数AI翻译系统不同,STACL能够在演讲者讲话后几秒钟开始翻译,并在句子结束后几秒钟内完成翻译。它与连续解释相反,翻译器等待,直到说话者暂停开始翻译。

百度新突破:AI同声传译系统STACL,可预测,低延迟

百度表示,它通过在人工翻译之后对系统进行建模来应对挑战。STACL直接预测翻译中的目标语言单词,并将翻译和预期融合到单个模型中,“wait-k”,即总是翻译说话者语音后面的k个单词以允许预测上下文。系统经过训练,使用源句子的可用前缀来决定翻译中的下一个单词。

百度新突破:AI同声传译系统STACL,可预测,低延迟

以下是百度解释的方式:

在例子Bùshí Zǒngtǒng zài Mòsīkē(布什总统在莫斯科)和英译“President Bush”中,ķ=2,2个词落后于中文,我们的系统准确地预测,下一个翻译的单词必须是“会见”,因为布什很可能在莫斯科会见某人(例如普京),早在中文动词出现之前。

STACL的另一个关键优势是延迟灵活性。它可以设置得更低或更高,取决于两种语言的相关程度,例如,法语和西班牙语较低,英语和中文等远程语言较高,或英语和德语等不同单词顺序的语言较高。

“翻译质量更常见的是低延迟要求,但与传统的全句(例如非同步)翻译相比,我们的系统在质量上只有很小的损失,”百度写道,“考虑到低延迟要求,我们将继续提高翻译质量。”

那么STACL与人类口译员相比如何呢?根据百度的说法,它比传统的全句翻译少了3.4个BLEU点(“双语评估替补”的缩写,是评估机器翻译文本的标准指标)。在中英文同声传译中,AI系统落后于中文语音大约三秒钟,翻译质量比全句(非同步)翻译低3.4个BLEU点。

“即使有最新进展,我们也完全了解同步机器翻译系统的诸多限制,”百度写道,“STACL的发布并不是要取代人类口译员,他们将在未来许多年继续依赖他们的专业服务,而是让同步翻译更容易获得。”

STACL推进了该公司早期的语音识别工作,更广泛地说,是AI相关工作。在2016年和2017年,百度推出SwiftScribe,一个Web应用程序搭载了DeepSpeech平台,TalkType分别听写为中心的Android键盘。最近,在7月,它推出了定制设计的AI芯片,昆仑AI,用于边缘和云计算,以及百度脑3.0,一套110种AI服务,从自然语言处理到计算机视觉。

百度不是唯一一家在AI翻译和转录方面掀起波澜的公司。微软在3月展示了一个系统,该系统在将新闻从中文翻译成英文时与人类表现相匹配。Facebook已经开始利用无监督的机器学习将内容从一种语言翻译成另一种语言。多伦多大学的研究人员开发了一种离线语音识别模型,其准确率为97%。

论文:arxiv.org/abs/1810.08398

本文转自ATYUN人工智能媒体平台,原文链接:百度新突破:AI同声传译系统STACL,可预测,低延迟

更多推荐

使用LSTM循环神经网络的时间序列预测实例:预测未来的货币汇率

从Siri到Mobile AI,华为人工智能突击苹果

看! Facebook 的 AI机器人可以像人一样聊天了

生成对抗网络GAN实现:比较不同的生成对抗网络的作用

欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com
欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/35146.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

语音识别+语音合成+同声传译 微信小程序

语音识别语音合成同声传译 微信小程序 代码库链接为:https://github.com/Resulte/SpeechProcessMiniProgram (希望您去Github的时候顺便给个Star) 项目预览 扫描下方小程序码,即可查看预览: 主页 语音识别 #### 语…

“同声传译”的难度有多大?

同声传译,简称“同传”,又称“同声翻译”、“同步口译”,是指译员在不打断讲话者讲话的情况下,不间断地将内容口译给听众的一种翻译方式。 同声传译作为一种翻译方式,其最大特点在于效率高,原文与译文翻译…

小程序=》添加同声传译插件,做简单的播放文本功能

一、进入小程序管理后台,菜单拉到最底下的“设置” 二、设置》第三方设置》插件管理》添加插件,输入“微信同声传译”即可添加 三、修改app.json文件,plugins节点下增加 "WechatSI": {"version": "0.3.5",&qu…

中英同声传译,线上同声传译服务

疫情期间,线上会议需求量激增,英信翻译升级同传翻译功能,制定线上同传大会解决方案,可远程快速接入,以线上同传(云同传)形式为大会提供全流程实时同传翻译服务。 3月份,“中信证券年度业绩交流会”会议以网…

交替传译和同声传译哪个难

我们知道,交替传译和同声传译是会议口译的高级形式。在涉外会议和商务活动中,往往根据需要采用这两种不同的口译方式。那么,针对交替传译Consecutive Interpreting和同声传译 Simultaneous Interpretation,这两种口译方式哪种比较…

使用微信同声传译插件开发一款翻译类的小程序

使用微信同声传译插件开发一款翻译类的小程序 1. 微信同声传译插件简介 1.1 微信同声传译插件有三个功能:语音输入、文本翻译、语音合成。可参考微信开发文档https://developers.weixin.qq.com/miniprogram/dev/platform-capabilities/extended/translator.html 2. …

Taro 微信同声传译插件使用详解

最近在做语音交互用到了 微信同声传译插件 ,下面介绍一下这个插件的用法 1.首先在微信公众后台添加 同声传译插件 正式开始使用微信同声传译小程序插件之前需先在微信公众平台 -> 第三方设置 -> 插件管理处添加插件,点击详情可以查看文档。如下图…

微信小程序使用同声传译实现语音识别功能

微信小程序使用同声传译实现语音识别功能 我使用同声传译语音识别功能是为了实现微信小程序首页的语音搜索功能,如果你也是那么恭喜你,你可以ctrlc、ctrlv再改一改,如果你不是那么你也不要着急的走可以看完我的文章会对你有所帮助&#xff0…

微信小程序同声传译使用总结

最近在做项目中需要使用录音转文字,之前用微信SDK可以直接使用wx.translateVoice({}),但是小程序中没有提供此类方法,没办法只能查资料解决了,看了好多大多是保存当前录音文件掉讯飞接口实现语音转译,还需要…

(保姆教程及高级玩法及坑)微信同声传译插件-语音识别

目录 一、背景 二、效果 ​编辑 三、保姆级教程 3.1 小程序后台添加插件:微信同声传译 3.1.1 设置 -> 第三方设置 -> 添加插件 3.1.2 搜索插件 3.1.3 成功添加后,点击详情 3.1.4 复制它的AppID和最新版本号(后序有用) …

微信小程序语音识别、语音合成(微信同声传译)使用代码实例

最近在开发一款“单词大作战”的微信小程序,想增加语音识别、语音合成这2个功能。(让用户能听到单词的读音,并对比自己读音是否标准正确)。 查了一下资料,大概有几种方式:用百度翻译(需要配置后…

同声传译,主要难在哪里?

搜狗的机器翻译团队成绩有目共睹,而且搜狗同传也是国内目前唯一曾应用于大型会议的语音识别机器翻译系统,从去年世界互联网大会上,搜狗CEO王小川首秀了这项技术。随后,搜狗同传又在香港科技大学学术讲座、前哨大会、GMIS大会上“炫…

使用微信同声传译,实现页面滑动播放

一、添加微信同声传译插件 由于目前使用官方推荐的添加方式无法查找到微信同声传译插件,因此,我们直接使用微信服务平台进行添加,操作步骤如下: 1.点击微信服务平台链接,下滑找到微信同声传译 2.点击添加插件按钮&am…

线上Debug,学会Arthas拿捏所有bug

点击上方“Java基基”,选择“设为星标” 做积极的人,而不是积极废人! 每天 14:00 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~中文详细注释的开源项目RPC 框架 Dubbo 源码解析网络应…

中国首档程序员真人秀,20位选手找bug做模型,结果一开场主办方就惨遭攻击...

金磊 杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI 终于!终于!终于! 以程序员为主题的综艺真人秀,真真儿的诞生了! 你以为是参赛选手都会是秃头、黑眼圈,21岁拥有40岁的面容? 图源&#xff1a…

跑分达ChatGPT的99%,人类难以分辨!开源「原驼」爆火,iPhone都能微调大模型了...

梦晨 发自 凹非寺量子位 | 公众号 QbitAI 自动测试分数达到ChatGPT的99.3%,人类难以分辨两者的回答…… 这是开源大模型最新成果,来自羊驼家族的又一重磅成员——华盛顿大学原驼(Guanaco)。 更关键的是,与原驼一起提出…

跑分达ChatGPT的99%,人类难以分辨!开源「原驼」爆火,iPhone都能微调大模型了

来源 | 量子位 | 公众号 QbitAI 自动测试分数达到ChatGPT的99.3%,人类难以分辨两者的回答…… 这是开源大模型最新成果,来自羊驼家族的又一重磅成员——华盛顿大学原驼(Guanaco)。 更关键的是,与原驼一起提出的新方法…

一键让ChatGPT教出新模型!100美元单卡炼出平替「白泽」,数据集权重代码都开源...

梦晨 发自 凹非寺量子位 | 公众号 QbitAI 炼ChatGPT需要高质量对话数据。 在以前这可是稀缺资源,但自从有了ChatGPT,时代就变了。 加州大学圣迭戈分校(UCSD)与中山大学、MSRA合作团队提出最新方法: 使用少量“种子问题…

爆火ChatGPT代码解释器食用指南,来了

丰色 发自 凹非寺 ChatGPT推出至今最强最有用的功能是什么? 可能要非代码解释器(Code Interpreter)莫属了。 这项功能下周才会正式向所有Plus用户开放,但不少提前进行测试的网友都不约而同地发现: 它的潜力实在太太太深…

烧掉300亿美元,小扎和元宇宙说再见!Meta转投AIGC,制定搞钱时间表

视学算法报道 编辑:Aeneas 好困 【导读】Meta已经成立机构,专门研究生成式AI,并计划今年12月前完成商业化。看到小扎终于不在元宇宙上一条路走到黑,Meta的投资人们总算要松一口气了吧。 所以,小扎决定抛弃元宇宙了&a…