google语音 API vs 国产 科大讯飞

GOOGLE 语音 API  参考文章地址:

http://blog.laobubu.net/546


iphone 4s 中的 siry  google android 手机上面的 语音搜索。(我用的很少。。。 衰),  前段时间 在微博上看到 baidu 也在 做语音。。。当时还提到国产的 “科大讯飞”

我真的 很激动。。。  自己想做一款 语音方面的 游戏,, 当做 iphone 练手项目。。


//----------------------------------------------------------------------------------------

[API]Google的语音识别API,支持各种语言

没好用的智能机的孩子你伤不起啊有木有!成天都是倒霉Symbian60啊有木有!上次超流量下载了Google Search for S60,里面神奇的有“语音搜索”……然后就是今天碰到android手机了,自带一个语音输入法啊!这准确率杆杆地!不过根据我多秒经验,S60的废柴API库绝对没有这么完美的语音识别(玩过诺基亚的应该都知道,待机状态长按右软件那个出来的是自带的识别功能),所以肯定Google留了一手!


(软件见http://www.google.com/intl/zh-CN_ALL/mobile/google-mobile-app/)

废话多了,现在看看Google的猥琐API之STT!(属于speech-api v1的recognize)

http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN

不过使用不是那么简单的哦……

如何调用

要使用这个API,你得先有一些心理素质:面对倒霉的FLAC格式,因为这个API只支持FLAC格式的数据,杯具啊。

不过你找到了我的博客,那么你是幸福的,因为我已经为你准备了不少好东西了。(顺便说一句,如果要转载记得清楚地标注“来自http://blog.laobubu.net”,我信任你。)

现在看看如何请求数据:

  • 【URL】http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN
  • 【方式】POST
  • 【请求头】Content-Type:audio/x-flac; rate=16000
  • 【POST】flac文件的数据
  • 【URL里可选参数】&maxresults=返回结果数

如果你人品大爆发,你成功了,可以得到类似这个的结果

{"status":0,"id":"54e1babccaa58682ffbb02ceb42aa47c-1",
"hypotheses":[{"utterance":"测试程序","confidence":0.8556527}]}

或者你的请求URL里设置了maxresults(比如 http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN&maxresults=10 )你就会得到:

{"status":0,"id":"fbf23a887b9ac2bfb630aa40dd1a776c-1","hypotheses":
[
{"utterance":"欢迎访问过的网址","confidence":0.7275984},
{"utterance":"欢迎访问我的网站"},
{"utterance":"欢迎访问我的网址"},
{"utterance":"欢迎访问过的网站"},
{"utterance":"白云访问过的网址"},
{"utterance":"怀孕访问过的网址"},
{"utterance":"欢迎访问有的网址"},
{"utterance":"欢迎访问过的网址哦"},
{"utterance":"白云访问我的网站"},
{"utterance":"怀孕访问我的网站"}
]
}

不过不简单哦

实例

Python代码

  1. #By laobubu.net
  2. import urllib2
  3. FILE= '1.flac' #这里假设在当前文件夹下有一个叫1.flac的文件被识别
  4. url = 'http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN'
  5. audio= open (FILE, 'rb' ). read ( )
  6. headers = { 'Content-Type' : 'audio/x-flac; rate=16000' }
  7. req = urllib2. Request (url, audio, headers )
  8. response = urllib2. urlopen (req )
  9. print response. read ( ). decode ( 'UTF-8' )

PHP代码

  1. <?php
  2. $ch = curl_init ( ) ;
  3. curl_setopt ( $ch , CURLOPT_URL , "http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN&maxresults=10" ) ;
  4. curl_setopt ( $ch , CURLOPT_VERBOSE , 0 ) ;
  5. curl_setopt ( $ch , CURLOPT_HEADER , 0 ) ;
  6. curl_setopt ( $ch , CURLOPT_POST , 1 ) ;
  7. curl_setopt ( $ch , CURLOPT_RETURNTRANSFER , 1 ) ;
  8. curl_setopt ( $ch , CURLOPT_POSTFIELDS , file_get_contents ( '1.flac' ) ) ;
  9. curl_setopt ( $ch , CURLOPT_HTTPHEADER , array ( "Content-Type: audio/x-flac; rate=16000" ) ) ;
  10. $data = curl_exec ( $ch ) ;
  11. curl_close ( $ch ) ;
  12. if ( $data =json_decode ( $data , true ) ) {
  13. echo "<ul>" ;
  14. foreach ( $data [ 'hypotheses' ] as $i ) echo "<li>" . $i [ 'utterance' ] . "</li>" ;
  15. echo "</ul>" ;
  16. } else {
  17. echo "<i>识别出错</i>" ;
  18. }
  19. ?>

头疼:FLAC文件格式

这里我长话短说,google的flac也有限制,22050 Hz+201kbps还正常,如果比这个大多了就不对了。

不过还有最要命的问题,怎么生成FLAC文件?

没关系,这里有救星:flac.exe包下载

http://datastorage.laobubu.net/FLAC.zip 

具体使用方法是【flac.exe 文件.wav】这样在命令行调用即可,测试得知:不支持MP3等格式,但是支持基本的wav格式。

至于其他环境下(如linux里)也有对应的flac下载。我没有怎么用过linux就不说啥了。

好了,你可以去制造你的app了,哈哈。

来自laobubu实验室自动转换API

为了方便,我写了一个python程序,放在Google App Engine上面,只要提交一个音频文件的URL(支持MP3、wav等常见格式),且文件不大,就可以得到结果了哦。

API入口:http://laobubumf.appspot.com/stt/
备用入口:http://glab.laobubu.net/stt/

喜欢的话记得+1哦,当然捐赠我最不介意 :)





本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/63049.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

区块链软件公司:区块链技术三大主要特性的优势

到底什么是区块链?区块链真的有这么厉害吗?区块链能为世界带来什么样的改变?相信这是很多区块链新手的疑问。 今天整理了区块链的三个主要特性&#xff0c;带大家了解为何区块链如此特别。 大部分的区块链是分布式的丶去中心化的以及开源的系统&#xff0c;并且基本上是无从…

进军NFT,第三代公链GGC与NFT3.0技术平台BOBO、OKEx NFT深度联合

近期第三代公链GGC&#xff08;Global Game Chain&#xff09;即将为生态赋能&#xff0c;正式进军NFT及 GameFi 领域&#xff0c;在NFT3.0技术平台BOBO的技术支持下&#xff0c;GGC即将上线OKEx NFT板块&#xff0c;限量发售NFT。 NFT &#xff08;Non-Fungible Token&#xf…

区块链性能腾飞:基于DAG的并行交易执行引擎

大咖揭秘Java人都栽在了哪&#xff1f;点击免费领取《大厂面试清单》&#xff0c;攻克面试难关~>>> FISCO BCOS是完全开源的联盟区块链底层技术平台&#xff0c;由金融区块链合作联盟(深圳)(简称金链盟)成立开源工作组通力打造。开源工作组成员包括博彦科技、华为、深…

企业需要使用财务管理软件的3个原因

财务软件是一种专门为企业财务管理而设计的软件&#xff0c;它可以帮助企业管理财务数据、制定预算、进行财务分析和报告等。在当今商业环境中&#xff0c;财务软件已经成为企业管理中最重要的工具之一&#xff0c;因为它可以帮助企业提高效率并优化业务流程。 首先&#xff0…

业务:财务会计业务知识

一、引言 会计是以货币为主要计量单位&#xff0c;对企业、事业、机关、团体及其他经济组织的经济活动进行记录、计算、控制、分析、报告&#xff0c;以提供财务和管理信息的工作。会计的职能主要是反映和控制经济活动过程&#xff0c;保证会计信息的合法、真实、准确和完整&a…

【财务】三大报表

资产负债表 概念&#xff1a; 资产负债表反映企业在某一特定日期的财务状况的财务报表。 用于反映企业的资产、负债和所有者权益金额机器结构情况&#xff0c;帮助使用者评价企业资产的质量机器短期偿债能力、长期偿债能力、利润分配能力等。 作用&#xff1a; 1. 提供某一…

管理会计报告和财务报告的区别

财务会计报告是给投资人看的&#xff0c;可以反映公司总体的盈利能力。不过&#xff0c;我们回顾一下前 面“第一天”里面提到的问题。 如果你是公司的产品经理&#xff0c;目前有三个产品在你的管辖范围内。上级给你一笔新的资 金&#xff0c;这笔资金应该投到哪个产品上&…

用Python实现一个电影订票系统!

一、效果展示 通过Python实现一个电影订票系统&#xff0c;效果如下所示&#xff1a; 二、整体结构图 三、代码分解 3.1 infos.py 一部电影的详细信息适合用 字典 结构来存储&#xff0c;我们可以给字典里添加多个键值对来保存电影的名称、座位表和宣传时用的字符画&#xff0c…

详解Python文件: .py、.ipynb、.pyi、.pyc、​.pyd !

&#xff08;永久免费&#xff0c;扫码加入&#xff09; 来源丨麦叔编程 今天同事给我扔了一个.pyd文件&#xff0c;说让我跑个数据。然后我就傻了。。 不知道多少粉丝小伙伴会run .pyd代码文件&#xff1f;如果你也懵懵的&#xff0c;请继续往下读吧。。 今天科普下各类Python…

一位老程序员的忠告:别想着靠技术生存一辈子

&#xff08;永久免费&#xff0c;扫码加入&#xff09; 来源&#xff1a;https://segmentfault.com/a/1190000009745139 一、 在一个地方工作8小时就是“穷” 在国内&#xff0c;你千万不要因为学习技术&#xff0c;就可以换来稳定的生活和高的薪水待遇&#xff0c;你更不要认…

大模型技术发展展望

来自&#xff1a;大大的模型 进NLP群—>加入NLP交流群 &#xff08;题目是ChatGPT起的&#xff0c;封面图是SD画的 本文纯属个人观点&#xff0c;抛砖引玉&#xff0c;欢迎后台留言探讨。&#xff09; 从去年年底发布以来&#xff0c;ChatGPT 已经被普通民众和业界广泛接受&…

Python 扩展教程(1): 调用百度AI

关于AI 自有计算机以来&#xff0c;人们就想让计算机具有人的感知、意识、概念、思维、行为&#xff0c;代替人的工作。AI (Artificial Interligence)是计算机科学的一个分支&#xff0c;专注研究、开发、模拟、扩展人的智能的理论、方法、技术及应用。 从研究领域和方法上&…

去TM的领导:发烧请病假,不意味着在家睡大觉

往期热门文章&#xff1a; 1、5年半老程序员被System.out.println() 考懵逼了... 2、妙用Java 8中的 Function接口&#xff0c;消灭if...else&#xff08;非常新颖的写法&#xff09; 3、Controller中的请求方法&#xff0c;private和public有什么区别&#xff1f; 4、再见Jenk…

上海车展归来,聊聊“无人驾驶”:滴滴疯狂炒概念,百度默默降成本

观点| Mr.K 主笔| Wendy.L 编辑| Emma 来源| 技术领导力(ID&#xff1a;jishulingdaoli) 最近一周在上海市最火热的是什么&#xff1f; 若是在国家会展中心举行的上海车展说是第二&#xff0c;恐怕没人再敢说第一。 汽车诞生百余年后&#xff0c;本次进入第二十届的上海车展…

百度,这下要歇菜了?

点关注公众号&#xff0c;回复“1024”获取2TB学习资源&#xff01; 谁也不会想到&#xff0c;一个非常小众的必应&#xff0c;居然把百度给"揍"了。 根据美国网站通讯流量监测机构 StatCounter 公布的数据显示&#xff0c;2023 年 4 月份&#xff0c;微软必应的市场…

5年半老程序员被System.out.println() 考懵逼了...

往期热门文章&#xff1a; 1、妙用Java 8中的 Function接口&#xff0c;消灭if...else&#xff08;非常新颖的写法&#xff09; 2、Controller中的请求方法&#xff0c;private和public有什么区别&#xff1f; 3、再见Jenkins&#xff01;一款更适合国人的自动化部署工具&#…

Controller中的请求方法,private和public有什么区别?

往期热门文章&#xff1a; 1、再见Jenkins&#xff01;一款更适合国人的自动化部署工具&#xff0c;贼带劲&#xff01;&#xff01; 2、MySQL中这14个小玩意&#xff0c;让人眼前一亮&#xff01;&#xff01;&#xff01; 3、Spring 官方证实&#xff01;大漏洞&#xff0c;J…

妙用Java 8中的 Function接口,消灭if...else(非常新颖的写法)

往期热门文章&#xff1a; 1、Controller中的请求方法&#xff0c;private和public有什么区别&#xff1f; 2、再见Jenkins&#xff01;一款更适合国人的自动化部署工具&#xff0c;贼带劲&#xff01;&#xff01; 3、MySQL中这14个小玩意&#xff0c;让人眼前一亮&#xff01…

SpringBoot + MDC 实现全链路调用日志跟踪

往期热门文章&#xff1a; 1、去TM的领导&#xff1a;发烧请病假&#xff0c;不意味着在家睡大觉 2、5年半老程序员被System.out.println() 考懵逼了... 3、妙用Java 8中的 Function接口&#xff0c;消灭if...else&#xff08;非常新颖的写法&#xff09; 4、Controller中的请求…

chatgpt赋能python:Python安装Kivy:强大的跨平台应用程序框架

Python安装Kivy: 强大的跨平台应用程序框架 Kivy是一个基于Python的跨平台开源应用程序框架&#xff0c;它可以用于开发多点触摸应用程序&#xff0c;使开发者能够轻松地创建适用于Windows&#xff0c;Mac&#xff0c;Linux&#xff0c;Android和iOS等平台的应用程序。Python作…