近日,ChatGPT的风越刮越猛,不由让人好奇,作为“能说会道”的ChatGPT,能够运用在专业性更高的行业?遗憾的是,从目前ChatGPT给出的答案来看,它距离运用在医疗等专业领域尚有距离。对此,云知声则依托在医疗以及AI领域深耕多年的经验和技术,致力于开发“医疗版ChatGPT”。
云知声,成立于2012年,是当前国内为数不多拥有算法、算力、芯片设计等全栈式AI技术链条的人工智能企业。云知声以Atlas智算平台为基础,深入探索智能感知、认知、生成三大技术方向,在语音、语义、知识图谱等领域建立完整和领先的技术链条,并构建云芯一体化产品中台,以领跑行业发展的AI基础设施、技术实力和产品能力赋能千行百业。
目前,ChatGPT不能直接运用在医疗行业的原因有二:
一是专业性不够,像医疗等民生行业,专业性强覆盖面广,所需的高质量数据较大,且大部分数据不是网上可以抓取的。这就导致,如果将ChatGPT直接运用在医疗行业,往往让非专业人士难以察觉,从而会引发各种风险。
二是训练成本大。任何一项技术能够大规模落地,都必须要解决“如何以有限的资源,实现效果的最大化”问题。而ChatGPT训练成本高达千万美元以上,每次请求的成本也高达几美分,其高昂的费用也束缚着每个自身不具有预训练大模型开发能力的玩家,阻碍了其在多个行业的广泛应用。
针对上述问题,云知声则凭借在AI领域以及医疗行业积累的技术以及经验,给出了解决方案:
在知识类问题的解答上,云知声给出的解决方案是,利用应用在CirBERTa的持续学习和知识嵌入技术,基于已有知识图谱积累,优化ChatGPT模型的知识获取和更新机制。这样一来可以保证ChatGPT回答中的知识正确性,与此同时还可以给出知识溯源信息。另外,利用云知声业内领先的病历质控技术,可以自动发现生成的病历中的问题,进而自动生成作为ChatGPT核心技术的基于人类反馈的强化学习(RLHF,Reinforcement Learning from Human Feedback)所需的用户反馈数据,加速模型的优化。
在控制成本上,面对逐渐攀升的训练成本,云知声致力以少2个数量级的参数规模,在特定行业领域的问题上,达到甚至超过ChatGPT的表现。同时,参数规模的大幅减少,也将大大降低了训练和服务成本,让大语言模型技术在医疗行业实现真正广泛应用。
总体来说,ChatGPT的出现对于各行各业都具有积极有意义。过去,不同对于AI的探索可能处于“看山是山、看山不是山”的懵懂状态,现在出现了一座“更小,而且明知会有路的山”——ChatGPT让行业看到了AI的具体运用。作为AI领域的独角兽企业,云知声也洞察到ChatGPT的巨大价值,正依托自身优势,积极布局,实现自身技术、能力与行业需求的有效结合,尽快实现行业版ChatGPT的落地。