写在前面的话:
博客园是分享原创精品博文的地方,感觉自己的这篇博客至少是原创,也花了一些心思,自我感觉良好,呵呵,所以还是发布上来了,期望和大家一起交流。这个HiVoice是个人根据时下流行的语音识别技术加上自己的一点点小想法完成的,后面的扩展应用也期望和大家一起交流分享。
使用谷歌语音识别打造语音管家HiVoice
一、背景
随着苹果和谷歌等语音识别技术的推广,语音识别技术越来越受人关注。
二、SWOT分析
使用谷歌语音识别的SWOT分析如下:
S(强势,Strength):
1)WEB语音识别,只需要最新版谷歌浏览器就可体验语音识别服务;例如微软的SAPI语音接口,则必须要用户客户端安装SAPI SDK等;
2)良好的语音识别率;
3)集成方便,例如需要为您自己的网站集成谷歌语音识别服务,只需要添加一个语音识别标记即可。
W(劣势,Weakness):
1)浏览器要求,例如必须使用谷歌浏览器最新版浏览器。
2)必须联网。
O(机会,Opportunity):
1)用户体验需求,现在用户体验的需求越来越高,语音识别的需求越来越大;
2)您觉得还有其他哪些机会,欢迎交流。
T(威胁,Threat):
1)版权、授权;
2)只能依赖谷歌语音识别服务,如果谷歌服务器无法与国内进行良好的稳定连接,国内的服务就会受影响。
三、想法:语音管家HiVoice
开发一个常规的语音识别程序,可能需要安装很多语音包和框架组件,最主要的是识别率不太高,要做到好的识别率需要进行较长时间的语音识别训练和更多的细节处理,但是现在只需要添加一个语音识别标记,再编写语音识别结果的处理程序即可完成属于我们自己的语音识别控制程序 - 语音管家HiVoice。
语音管家HiVoice是什么?
语音管家HiVoice = 谷歌语音识别 + 语音识别控制、集成程序。
即利用谷歌语音识别完成语音识别功能,而语音管家则根据识别后的文本结果进行处理,例如使用一个switch程序判断来执行不同的事件响应,当然也可以有更复杂程序处理。
四、视频实践演示
目前语音管家HiVoice V1.0完成了,演示网站是http://www.100fks.com,必须使用谷歌浏览器,这是一个论坛程序,能通过语音进行常见的论坛操作。
请先看视频演示(高清请看附件):
视频地址:http://player.youku.com/player.php/sid/XMzgyODYzNjY0/v.swf
语音指令动作表
五、扩展应用
根据不同的应用场合,我们可以扩展出很多应用:
1)网页语音管家程序,例如只需要网站引用一个hivoice.js文件,即可允许用户进行网站的语音识别控制,例如语音控制浏览网站各个栏目和文章、发表文章和评论等;
2)电脑语音管家程序,编写一个客户端软件框架再结合谷歌语音识别,可以完成语音控制管理电脑的各种操作,例如打开音乐,打开网站,打开word,关闭等操作,同时可以拷贝到U盘/邮件/网盘等地方便于携带;
3)移动应用服务;
4)浏览器插件,开发火狐、谷歌等各种浏览器插件(例如谷歌插件Voice Search)。
六、免费定制
1)交流分享,欢迎大家一起交流和分享;
2)免费定制,如果您的网站也想集成语音识别服务,请联系我 ,申请表请参考下面的附件。
高清演示视频附件下载:请点击这儿下载