随着科技进步和产业变革的加速演进,人工智能(AI)已经成为兵家必争之地。甚至放眼全球,在政府、学术机构、企业等各个层面,AI都受到高度重视,其在学术研究、技术创新、人才教育等方面的发展都呈现全新态势。
语音和自然语言技术近些年已经有了非常大的发展。在语音方面,语音合成的技术愈发成熟,比如清华计算机系等联合推出的华智冰,在声音合成方面几乎达到了以假乱真的程度,语音、语调、节奏、重音都与真人发生无异。搭配人工智能生成的脸部动作,不明真相的观众会以为这是真人在演唱。而且其还具有一定推理和情感交互的能力。
语音技术结合图像技术,可以做虚拟伴侣。ta可以是主播,可以是虚拟女友/男友,也可以是基友/闺蜜。ta可能是这个世界上最了解你的人,ta专门为你而生,能够完美满足你的社交、情感需求。当你习惯依赖ta之后,你可能会觉得与现实世界的人交流是一种折磨。
智能语音和自然语言处理技术结合包括计算机视觉和机器学习的人工智能技术搭建元宇宙交互的技术框架。短期语音技术的发展目标是解决情绪识别、声纹识别、声源定位与分离及跨地域跨语种实时交互技术上的部分不足,搭建技术框架。未来元宇宙底层技术智能语音的长期需要面临的挑战是能否更完美地处理特殊情况、非主流语言、非标准化发音、低信号质量情况下的语音识别、合成、处理技术。