离线智能语音产品方案的开发主要包含两个方面:硬件和软件。这里硬件是指采用语音芯片等电子元器件为该产品设计的电路板,软件是指基于电路板上主控芯片的种类及产品功能需求所开发的代码,再经过编译工具等生成可下载到主控芯片中的语音固件,配合语音芯片等硬件工作,实现产品的语音功能。
启英泰伦成立于2015年,在硬件方面,截止目前已推出15款型号的智能语音芯片和配套解决方案。针对语音固件开发,推出了启英泰伦语音AI平台(以下简称“平台”),目前已迭代至3.0版本。
该平台面向开发者和硬件厂商免费开放,只需登录平台注册即可自主针对各自产品进行个性化的功能开发,全流程低代码、平台化,操作便捷,赋能开发者进行更方便敏捷的应用产品开发。目前已服务客户超过5000家,赋能个人开发者超过10万人,覆盖300多个应用领域。
01 产品开发
平台推出【产品固件及SDK深度开发】和【演示固件快速开发】两个版块。【产品固件及SDK深度开发】支持开发者根据应用环境和功能的不同,进行技术参数和IO选配,实现固件的定制开发,也可定制SDK,方便离线开发。【演示固件快速开发】针对使用启英泰伦标准模块的用户,十分钟内即可完成标准固件的开发。
以上开发模式均可实现模型优化,支持自定义协议和标准协议。
02 组件开发
包括【语言模型开发】、【播报音合成】、【语言模型优化】、【小语种语音模型开发】。
【语言模型开发】:确定命令词后,将文本提交至平台,1分钟快速生成语言模型。支持中、英、日、韩等语种,支持命令词任意更改,更改命令词后,直接重新提交平台生成语言模型即可。
【播报音合成】:上传文本,平台自动批量进行语音合成,支持20多种风格音色,可调语速及音量,每个词条合成平均耗时仅需0.1s。
【语言模型优化】:平台提供模型自动优化功能,20分钟即可完成优化,平台自动优化后的效果即达到量产标准,很大程度上提高了开发效率和降低了开发难度。
【小语种语音模型开发】:上传小语种命令词文件和少量录音音频文件,即可通过平台自动进行训练,从而识别小语种的语音识别。
03固件在线测试
做好的固件不清楚语音识别效果怎么办,自己搭建一套测试环境既费时又费力。启英泰伦新推出的【固件在线测试】让这一难题10分钟即可解决。当开发者需要进行语音识别率初步测试时,只需上传测试语料(音频)和制作好的固件,10分钟内即可获得识别测试结果。需要进行语音误识别初步测试时,只需上传固件后选择测试的语料集,10分钟左右即可获得识别测试结果。在测试完成后会提供详尽的测试报告,开发者可以根据报告再通过【语言模型优化】组件进行调优。
04标准产品语音固件
智能语音产品个性化需求多,场景碎片化,不同的产品唤醒词不同,命令词也各有区别,比如风扇唤醒词小爱小爱,控制命令是开关风扇、控制档位、定时时间等,播报音是温柔的女声,所处的环境是客厅。油烟机的唤醒词用小智小智,控制命令是开关油烟机、控制风量、选择爆炒模式等,播报音是讲川普的男生,所处的环境是厨房高噪声环境。两者的语音功能完全不一。碎片化的应用需求为智能语音产品开发提出了更高的要求,那就是需要开发更简单、更快速。
平台推出了多个产品领域的标准语音固件,涵盖照明、取暖器、风扇、浴霸、窗帘、油烟机、晾衣杆等。开发者通过选择产品类型,芯片型号、语言类型、配置SDK、播报音和命令词,5分钟即可生成自定义的语音固件和SDK,烧录到芯片中即可。全程零代码,极大地简化了开发流程,让开发门槛更低,更高效。
05第三方API接口
平台开放第三方API接口,启英泰伦离线工具、第三方云平台都可通过该接口与AI平台进行对接。启英泰伦目前已和多家物联生态IoT平台合作,共同打造IoT新生态,旨在实现千万级智能设备的互联互通。
06完善开发文档
平台提供完善的开发文档,包括SDK、标准固件、硬件设计资料、芯片数据手册、开发工具及手册等资料,还有详细的开发流程指引,让开发不迷茫。
在方案开发类型上,AI平台可开发离线语音方案、离在线语音方案、AIoT方案,覆盖智能家居家电、AI教育、医疗、汽车等领域,赋能产品实现智能化升级。