教育科技公司“精准学”宣布,公司已在AI语音交互技术上取得领先性的突破,成功训练了中国首个语音端到端大模型“心流知镜-s(V02)”,可直接实现语音输入-语音输出的交互,使其更适配辅学场景,使大模型达到“真人老师”级别的自然对话交流体验。
“心流知镜-s(V02)” 使用端到端语音结构,避免了级联ASR+LLM+TTS方式额外延迟,同时也更好的改善纯文本模型损失的情感节奏等丰富信息,接近人类的语音交互体验。
精准学也提供时间表开放基础模型供学术和非商用使用,致力于为中文 AI社区的科研和技术探索作出贡献。
“心流知镜-s(V02)”的发布,不仅将在高质量中文语音Codec 和中文自监督预训练Encoder 基础设施上填补中文开源社区的空白,还将在全球范围内成为首个开放给技术社区的语音端到端大模型。
据「TMT星球」了解,精准学将于近期对外展示这项技术的应用成果。5月,公司获得了阿里2亿元投资,目前其AI辅学机Bong系列已在天猫京东上线。不久后用户也可以在精准学AI辅学机上体验到这项技术突破成果。