搜狗的机器翻译团队成绩有目共睹,而且搜狗同传也是国内目前唯一曾应用于大型会议的语音识别+机器翻译系统,从去年世界互联网大会上,搜狗CEO王小川首秀了这项技术。随后,搜狗同传又在香港科技大学学术讲座、前哨大会、GMIS大会上“炫技”。
随着台上嘉宾演讲的进行,经由语音识别、机器翻译,其身后的屏幕上同步出现中英字幕。即便演讲内容涉及人工智能领域大量专业词汇,搜狗同传也能转化并呈现。看样子,搜狗能够取代人工同传,实现不同语言人们低成本的有效交流。
但是并不完全那么简单。以中英文的机器同传为例,它大致需要将搜集来的中文语音信息经过语音断句,获得小的语音片段,然后会送到语音识别中获得文本,此时需要对文本进行一些顺滑处理,将这个经过语音识别后的处理文本送到端到端的神经网络(目前机器翻译的主流方法),通过翻译器进行语音翻译。
机器同传是语音识别+机器翻译的过程,目前在业内语音识别领域就存在难以解决的问题,包括如何指定麦克风,比如有多个人说话、多个说话声混在一起时,在机器系统里面就会默认是人声嘈杂的环境,没有主说话人;另外还有包括噪声、口音和距离造成的识别准确度等问题。而同传要做好必然会受到两个方面的能力影响,一是识别的能力,二是翻译的能力,这两个能力一般的错误是乘的关系,识别的错误会累加到翻译的错误上。这就意味着,要做好机器同传,在识别和翻译上每一块都要足够强,不然最后叠加出来的效果就惨不忍睹了。
就机器同传而言,目前搜狗的语音识别率已达97%,而机器翻译的准确率则要略低一些,这也是业界的难题。虽然机器同传依旧有这样那样的缺陷,但随着AI的进步,我们相信五年内会继续有一个大的飞跃。
对于何时出现一个“完美”的机器同传,搜狗语音交互中心技术总监陈伟说,搜狗机器同传接下来的发展,一方面需要保证稳定的语音识别率,比如噪音场景下;另一方面是机器翻译如何能更好的找到一个完整的语义边界。同传系统最核心的就是建立一个连接语音识别和机器翻译文本的处理系统,这个处理系统可以接收语音识别的结果,去做容错。此外,就是如何处理更多口语化的表达,如“这个”、“那个”,以及如何断句问题,确保翻译出来的是一个完成的语义句子。当这些问题都解决的时候,机器同传的效果才会提升很多。
人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
机器翻译革命强势来袭
http://www.duozhishidai.com/article-10325-1.html
什么是机器翻译,主要有哪几种类型?
http://www.duozhishidai.com/article-1735-1.html
人机结合对于机器翻译发展的重要性,理解问题要看本质?
http://www.duozhishidai.com/article-1026-1.html
多智时代-人工智能和大数据学习入门网站|人工智能、大数据、物联网、云计算的学习交流网站