广告关闭
2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品。未来,我们一起乘风破浪,创造无限可能。
【新智元导读】微软语音识别系统取得最新突破:微软的语音对话研究小组在switchboard语音识别任务中,将错误率从去年的 5.9% 再一次降低到 5.1%,达到目前最先进水平。 去年,微软的语音与对话研究小组宣布在switchboard 对话语音识别任务上达到人类水平,实现里程碑式的突破。 微软技术fellow黄学东在微软官方博客上...
这两项研究都转录了总机语料库的录音,这是一个从20世纪90年代初就开始被研究人员用来测试语音识别系统的2400个电话对话的集合,这项新研究是由微软ai研究团队完成的,旨在让ai的语音识别达到与人类相同的准确度。 总的来说,最新研究的研究人员通过改进微软语音识别系统的基于神经网络的声学与语言模型,将错误率...
1. 语音识别概况 时至今日,语音识别已经有了突破性进展。 2017年8月20日,微软语音识别系统错误率由5.9%降低到5.1%,可达到专业速记员的水平; 国内语音识别行业的佼佼者科大讯飞的语音听写准确率则达到了95%,表现强悍。 国内诸如阿里、百度、腾讯等大公司,也纷纷发力语音识别,前景一片看好。 并且,语音识别系统...
【新智元导读】 微软语音识别研究团队在黄学东的带领下,去年将语音识别的单词错误率降至5.9%,又在最近降至5.1%。 在本次专访中,我们讨论了语音识别错误率百分之几的小数点在研究和实际应用上的意义。 黄学东认为,从研究角度来说,这个意义十分重大,即便是0.1%的差距,无论是运算量还是时间,耗费都是巨大的...
微软研究院ai头条【新智元导读】继9月13日微软将对话语音识别错误率降至6.3%的记录后,前天再次宣布进一步将错误率降至 5.9%,首次达成与专业速记员持平且优于绝大多数人的表现。 该成功归功于他们采用了一种神经语言模型,该模型在空间中被表现为连续的向量,计算机能通过该模型得知比如“fast”和“quick”是具有...
亚马逊携手微软整合语音助手,语音识别即将面临大洗牌?? 途鸽云通信sdk助力以晴sunelan x5s,打造智能安全手机sunelan 以晴x5安全手机以通信安全为核心功能,内嵌支持国密算法的安全芯片,实现了软硬件一体化的通信安全解决方案。 该手机采用搭载了展讯的sl8301八核处理器和公安专用数据通信密码芯片,双芯片...
选自ibm作者:george saon机器之心编译参与:吴攀、黄小天去年十月,微软人工智能与研究部门的一个研究者和工程师团队报告他们的语音识别系统实现了和专业速录员相当甚至更低的词错率(wer)——达到了 5.9%,参考机器之心文章《重磅 | 微软语音识别实现历史性突破:语音转录达到专业速录员水平(附论文)》...
【新智元导读】微软的语音识别技术又获得了新的突破:9月13日,微软语音与对话研究团队在arxive上发表论文,宣布在 作为行业标准的 switchboard 基准上,微软的错误率做到了6.3%,比上周 ibm 公布的 6.6 % 有小幅提升。 要实现微软 ceo 纳德拉提到的“对话即平台”ai战略,语音识别准确度的提升是不可或缺的。 昨天...
【文】王艺 关注人工智能投稿请联系wangyi@csdn.net或公众号后台留言----本周一,微软人工智能科研小组在arxiv上发表了一篇名为achieving human parity inconversational speech recognition的论文(详见http:dwz.cn4p4ibi),宣布其语音识别系统的误字率首次低于人类专业打字员(听音速记)。 据该团队的统计表明...
」但他也表示,「真正的语音识别有口音、噪音、远场、语速等等问题,在这些方面,人的鲁棒性还是不同一般的。 所以我们在这个任务上达到了『超人』的水平只是一个小小的里程碑。 」在这个领域,还有大量的工作需要完成。 参见:重磅 | 语音识别新里程碑:微软新系统词错率低至 6.3%(附论文)重磅 | 微软语音识别实现...
这个设备中的摄像头支持1024×1024分辨率,这款摄像头也将在下一代hololens头盔中使用。? 其他语音ai工具“四合一”微软旗下的四种语音相关ai工具,这次也被统一起来。 其中包括微软语音识别服务、文本到语音api、定制化语音模型和翻译服务。 此前这些工具都作为单独的api存在(bing speech api、speaker recognition...
未来的研究方向目前采用深度学习结合隐马尔科夫模型的语音识别系统已经取得了较好的识别效果,如百度 deep speech 2 的短语识别的词错率降到了3.7%,微软英语语音识别词错率达到了 5.9%,并且已经推向了商业应用,但目前的智能语音识别还是存在着相当的提升空间。 在机器之心主办的第一届全球机器智能峰会(gmis 2017...
【新智元导读】微软亚洲研究院常务副院长芮勇在《新智元:机器+人类=超智能时代》书中畅想人工智能发展6大阶段,详细介绍微软语音识别、图像识别、牛津计划等多项人工智能项目。 芮勇指出,越来越多的科技公司都在开放或开源核心的人工智能技术。 微软已经开放了很多人工智能技术,包括我在上文中提到的牛津计划...
其他现有的语音转文字服务包括支持29种语言的微软语音识别api、支持7种语言的ibmwatson api,以及2017年11月发布的亚马逊transcribe,到目前为止,其只支持美式英语和西班牙语。 来自佛罗里达技术学院(the florida institute of technology)对其中这些服务的比较显示,谷歌服务api的错误率较低。 另一组比较测试...
在语音识别方面,几个月前在switchboard标准测试数据集上,微软基于深度学习的语音识别系统的词错率(word error rate, wer)降到了创纪录的5.1%这意味着其精准度已超过专业速记员。 其实,早在2016年10月,微软在 switchboard 语音识别任务测试中的词错率就低至5.9%,达到了人类专业速记员的水平。 图2展示了这一情况 ...
语音识别技术演进及实现方法、效果,既是语音识别从业者需要系统掌握的知识,也是智能化应用开发者应当了解的内容。 日前,微软研究院首席研究员、《解析深度学习-语音识别实践》第一作者俞栋接受csdn专访,深入解析了基于深度学习的语音识别的最新技术方向,和微软团队的实践心得,并对微软开源的深度学习工具cntk的...
据介绍,在azure iot edge的帮助下,工业设备、无人机等即便在没有联网的情况下,也能运行机器学习模型。 在今天的大会上,微软宣布azure iot edge已经和高通、大疆达成合作。 语音ai工具“四合一”微软旗下的四种语音相关ai工具,这次也被统一起来。 其中包括微软语音识别服务、文本到语音api、定制化语音模型和翻译...
据介绍,在azure iot edge的帮助下,工业设备、无人机等即便在没有联网的情况下,也能运行机器学习模型。 在今天的大会上,微软宣布azure iot edge已经和高通、大疆达成合作。 语音ai工具“四合一”微软旗下的四种语音相关ai工具,这次也被统一起来。 其中包括微软语音识别服务、文本到语音api、定制化语音模型和翻译...
作者:侯艺馨总结目前语音识别的发展现状,dnn、rnnlstm和cnn算是语音识别中几个比较主流的方向。 2012年,微软邓力和俞栋老师将前馈神经网络ffdnn(feed forward deep neural network)引入到声学模型建模中,将ffdnn的输出层概率用于替换之前gmm-hmm中使用gmm计算的输出概率,引领了dnn-hmm混合系统的风潮...
未来的语音识别市场,预计将会有越来越多的公司参与,以后语音识别的性能可能更多的体现在前端技术和语义理解上。 国内著名的语音识别产品主要有百度语音、科大讯飞的灵犀、云知声的语音助手等。? 人脸识别:全球科技业者不仅陆续推出指纹辨识解锁手机的技术,包括苹果(apple)、微软(microsoft)等亦加速脸部辨识技术...