同声传译,主要难在哪里?

搜狗的机器翻译团队成绩有目共睹,而且搜狗同传也是国内目前唯一曾应用于大型会议的语音识别+机器翻译系统,从去年世界互联网大会上,搜狗CEO王小川首秀了这项技术。随后,搜狗同传又在香港科技大学学术讲座、前哨大会、GMIS大会上“炫技”。

随着台上嘉宾演讲的进行,经由语音识别、机器翻译,其身后的屏幕上同步出现中英字幕。即便演讲内容涉及人工智能领域大量专业词汇,搜狗同传也能转化并呈现。看样子,搜狗能够取代人工同传,实现不同语言人们低成本的有效交流。

但是并不完全那么简单。以中英文的机器同传为例,它大致需要将搜集来的中文语音信息经过语音断句,获得小的语音片段,然后会送到语音识别中获得文本,此时需要对文本进行一些顺滑处理,将这个经过语音识别后的处理文本送到端到端的神经网络(目前机器翻译的主流方法),通过翻译器进行语音翻译。

机器同传是语音识别+机器翻译的过程,目前在业内语音识别领域就存在难以解决的问题,包括如何指定麦克风,比如有多个人说话、多个说话声混在一起时,在机器系统里面就会默认是人声嘈杂的环境,没有主说话人;另外还有包括噪声、口音和距离造成的识别准确度等问题。而同传要做好必然会受到两个方面的能力影响,一是识别的能力,二是翻译的能力,这两个能力一般的错误是乘的关系,识别的错误会累加到翻译的错误上。这就意味着,要做好机器同传,在识别和翻译上每一块都要足够强,不然最后叠加出来的效果就惨不忍睹了。

就机器同传而言,目前搜狗的语音识别率已达97%,而机器翻译的准确率则要略低一些,这也是业界的难题。虽然机器同传依旧有这样那样的缺陷,但随着AI的进步,我们相信五年内会继续有一个大的飞跃。

对于何时出现一个“完美”的机器同传,搜狗语音交互中心技术总监陈伟说,搜狗机器同传接下来的发展,一方面需要保证稳定的语音识别率,比如噪音场景下;另一方面是机器翻译如何能更好的找到一个完整的语义边界。同传系统最核心的就是建立一个连接语音识别和机器翻译文本的处理系统,这个处理系统可以接收语音识别的结果,去做容错。此外,就是如何处理更多口语化的表达,如“这个”、“那个”,以及如何断句问题,确保翻译出来的是一个完成的语义句子。当这些问题都解决的时候,机器同传的效果才会提升很多。
  人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
机器翻译革命强势来袭
http://www.duozhishidai.com/article-10325-1.html
什么是机器翻译,主要有哪几种类型?
http://www.duozhishidai.com/article-1735-1.html
人机结合对于机器翻译发展的重要性,理解问题要看本质?
http://www.duozhishidai.com/article-1026-1.html


多智时代-人工智能大数据学习入门网站|人工智能、大数据、物联网云计算的学习交流网站

多智时代-人工智能大数据学习入门网站|人工智能、大数据、云计算、物联网的学习服务的好平台

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/35132.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用微信同声传译,实现页面滑动播放

一、添加微信同声传译插件 由于目前使用官方推荐的添加方式无法查找到微信同声传译插件,因此,我们直接使用微信服务平台进行添加,操作步骤如下: 1.点击微信服务平台链接,下滑找到微信同声传译 2.点击添加插件按钮&am…

线上Debug,学会Arthas拿捏所有bug

点击上方“Java基基”,选择“设为星标” 做积极的人,而不是积极废人! 每天 14:00 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~中文详细注释的开源项目RPC 框架 Dubbo 源码解析网络应…

中国首档程序员真人秀,20位选手找bug做模型,结果一开场主办方就惨遭攻击...

金磊 杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI 终于!终于!终于! 以程序员为主题的综艺真人秀,真真儿的诞生了! 你以为是参赛选手都会是秃头、黑眼圈,21岁拥有40岁的面容? 图源&#xff1a…

跑分达ChatGPT的99%,人类难以分辨!开源「原驼」爆火,iPhone都能微调大模型了...

梦晨 发自 凹非寺量子位 | 公众号 QbitAI 自动测试分数达到ChatGPT的99.3%,人类难以分辨两者的回答…… 这是开源大模型最新成果,来自羊驼家族的又一重磅成员——华盛顿大学原驼(Guanaco)。 更关键的是,与原驼一起提出…

跑分达ChatGPT的99%,人类难以分辨!开源「原驼」爆火,iPhone都能微调大模型了

来源 | 量子位 | 公众号 QbitAI 自动测试分数达到ChatGPT的99.3%,人类难以分辨两者的回答…… 这是开源大模型最新成果,来自羊驼家族的又一重磅成员——华盛顿大学原驼(Guanaco)。 更关键的是,与原驼一起提出的新方法…

一键让ChatGPT教出新模型!100美元单卡炼出平替「白泽」,数据集权重代码都开源...

梦晨 发自 凹非寺量子位 | 公众号 QbitAI 炼ChatGPT需要高质量对话数据。 在以前这可是稀缺资源,但自从有了ChatGPT,时代就变了。 加州大学圣迭戈分校(UCSD)与中山大学、MSRA合作团队提出最新方法: 使用少量“种子问题…

爆火ChatGPT代码解释器食用指南,来了

丰色 发自 凹非寺 ChatGPT推出至今最强最有用的功能是什么? 可能要非代码解释器(Code Interpreter)莫属了。 这项功能下周才会正式向所有Plus用户开放,但不少提前进行测试的网友都不约而同地发现: 它的潜力实在太太太深…

烧掉300亿美元,小扎和元宇宙说再见!Meta转投AIGC,制定搞钱时间表

视学算法报道 编辑:Aeneas 好困 【导读】Meta已经成立机构,专门研究生成式AI,并计划今年12月前完成商业化。看到小扎终于不在元宇宙上一条路走到黑,Meta的投资人们总算要松一口气了吧。 所以,小扎决定抛弃元宇宙了&a…

jQuery快速入门

前言 在二次开发人脸识别来进行注册登录时,卡在了前端上传图片到后端这一步,莫得办法,只得来学习前端的jQuery和AJAX看看能不能解决问题 大致思路分为系统性学习和情境性学习,前期以系统性学习为主,跟着视频进行快速入…

运营策略:影响内容病毒式传播的 8 个维度

目录 01 第一个影响要素就是内容的类型 02 第二个要素时内容的长度 03 第三个要素是要唤起正确的情感 04 第四个是利用趋势,也就是热点问题或事件 05 第五个是视觉效果 06 第六个是增加作者署 07 第七个是在正确的时间发布内容 08 第八个是影响者的力量 病毒…

拼多多解散了在应用中加入恶意功能的团队;苹果首款混合现实头显即将亮相;Pandas 2.0 发布|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

自行车+ChatGPT主打“陪伴”?感觉哪里怪怪的

强大的ChatGPT引得各行各业的产品经理两眼放光,抓住机会就想“”一把。智能汽车GPT不新鲜了,自行车来了。 几天前,名为Urtopia的电助力单车(E-Bike)品牌发布了世界上首款搭载的ChatGPT的自行车。利用蓝牙音箱当“嘴替…

ChatGPT:DevSecOps 落地实践的最后一公里

DevSecOps 背后的三个逻辑 复杂性:让安全从 “幕后” 走向 “台前” 安全并不是一个新鲜的话题,自软件诞生以来,安全就一路伴随,但是近几年安全似乎又到了一个新的 “热度” 与 “高度”。 一些企业、组织都在探讨软件供应链安全…

ChatGPT背后的打工人:你不干,有的是AI干

AI“出圈” 如今,数字技术发展速度惊人,AI提高了社会生产效率,更真切地冲击到原有的生产秩序。 年初AI技术的爆发,让国内看到了进一步降本增效的希望。 国内多家互联网企业相继推出类ChatGPT产品,复旦大学邱锡鹏教授…

杀入GPT战场,「两翼齐飞」的360胜算有几分?|内测体验

衡宇 发自 凹非寺量子位 | 公众号 QbitAI 360,正站在GPT风口浪尖迎来新一春。 在透露相关计划后2个月内,360快速给出了类ChatGPT产品。公开展示后半个月,就在昨天,360大模型进入落地加速期: 基于360GPT开发的“360智脑…

GPT-4再次引爆科技圈?

北京时间3月15日凌晨, Open AI如期发布最新的大模型GPT-4,众多亮点功能直接引爆了科技圈。科技板块头条被GPT-4的发布会占据,朋友圈里面也被发布霸屏,满满的全员围观即视感。 Open ai在官网上放出了发布会的全部内容,…

Java音视频处理——JavaCV

目录 简介 Maven 软件环境 JavaCV-Examples OpenCV Cookbook Examples 概述 示例 OpenCV文档 如何使用JavaCV示例 示例代码的组织结构 示例列表 Why Scala? 学习地址 图像简单处理代码示例 1.打开保存一张图 2.画直线 3.画圆圈 4.画折现 5.添加文字水印 6.裁…

大模型与AIGC峰会!知名专家学者现场论道!

6月30日-7月1日,在由稀土掘金开发者社区主办的稀土开发者大会上,邀你与专业前沿的嘉宾面对面交流!6月30日上午的主会场,北京大学王选计算机研究所教授、CCF 自然语言处理专委会秘书长万小军,会带来关于AIGC的重磅分享。…

第三周C++与PCL的学习(3.13-3.19)

目录 第一天3.13 星期一 Qt安装于简单应用 第二天3.14 星期二 ui闪退的解决、PCL的pri文件配置 第三天3.15 星期三 百度地图api的调用以及在Qt中的配置 第四天3.16 星期四 PCM软件的学习 第五天3.17 星期五 数据库的建立和使用 第六天3.18 星期六 Kinect融合、时…

利用微软Bing进行AI绘画

我的新书《Android App开发入门与实战》已于2020年8月由人民邮电出版社出版,欢迎购买。点击进入详情 Link: http://bing.com/create