由ChatGPT掀起的这一波大模型浪潮中, 百度、阿里等大厂相继下场,王慧文、王小川、李开复等大佬也纷纷入场。年初,比尔盖茨高呼“人工智能时代已经开始”,给大模型定下了宏伟的基调。随着竞争的展开,大模型已不是“是否”问题,而是“如何”问题。
大巨头公司也好,小巨人企业也罢,都需要这样的动作展现自身对前沿科技的敏感度与长期以来的积累。目前,大模型的玩家主要分为三类:一是在资源与场景上具备身位优势的互联网(百度、阿里、腾讯等)和产业巨头(中国电信与中国联通等),二是专研AI的人工智能公司(实在智能、商汤、云从、光年之外等),最后一类则是以上海人工智能实验室、复旦大学、哈尔滨工业大学等为代表的科研院所单位。
而专研AI的人工智能公司,目前大都已经研发了自己的垂直大模型。垂直领域大模型是指在特定的领域或行业中经过训练和优化的大型语言模型。与通用语言模型相比,垂直领域大模型更专注于某个特定领域的知识和技能,具备更高的领域专业性和实用性。
相对于GPT这类通用大模型,垂直领域大模型具有以下优势:
- 领域专业性:垂直领域大模型经过专门的训练,能够更好地理解和处理特定领域的知识、术语和上下文。
- 高质量输出:由于在特定领域中进行了优化,垂直领域大模型在该领域的输出质量通常比通用大模型更高。
- 特定任务效果更好:对于特定领域的任务,垂直领域大模型通常比通用大模型表现更好。
例如实在智能近期发布的TARS大模型,作为一家致力于将AI与RPA等自动化技术融合创新,打造各类数字员工的企业,实在智能基于开源基座模型,在千亿级高质量Tokens上进行了充分训练,完整复现了Pretrain、SFT和RLHF三个阶段,语言理解能力及指令跟随能力等在横向对比测试中均取得良好效果。
对于垂直大模型而言,核心和关键离不开算力、算法和数据。在一定程度上,钱可以解决算力和算法,但却很难买到数据,尤其是在垂直领域,很多都是私有数据,能买到的数据意义并不大。这对一直深耕在垂直行业的公司而言,是天然的优势。
实在TARS大模型可以通过快速学习垂直行业的大量数据,可具备思维链、情景学习等能力,生成具有语法和意义的自然语言,可与人类进行对话并执行指令。
不远的将来会有更多垂直领域的大模型面世,百模大战已经拉开序幕,AI渗透到千行百业只是时间问题,我们一起见证机器崛起吧。