TORGO 数据库:构音障碍语音研究的宝贵资源
在语音识别和语音病理学领域,构音障碍(Dysarthria)是一个重要的研究方向。构音障碍是由神经运动接口异常引起的,导致发音器官运动异常,语音不清晰,传统自动语音识别(ASR)系统难以有效识别。为了推动这一领域的研究,多伦多大学开发了 TORGO 数据库,这是一个包含构音障碍患者和正常对照组语音数据的宝贵资源。
1. 数据库简介
TORGO 数据库是由多伦多大学计算机科学系和言语病理学系与 Holland-Bloorview 儿童康复医院合作开发的。该数据库旨在为开发适用于构音障碍患者的 ASR 模型提供数据支持。数据库包含以下内容:
- 数据类型:声学特征、3D 发音运动数据、语音提示(prompts)和语音转录(transcriptions)。
- 研究对象:构音障碍患者(如脑瘫 CP 和肌萎缩侧索硬化症 ALS)和正常对照组。
- 时间范围:数据记录于 2008 年至 2010 年。
- 资助方