国内创业团队
baichuan-7B 是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大约1.2万亿 tokens 上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威 benchmark 上均取得同尺寸最好的效果。
4月刚成立的百川智能科技,就发布了大语言模型,其发布的测试结果来看,除头部外,几乎秒杀其它产品,这仅是一家之言,如果光年之外、Project AI 2.0等相关企业的产品出来后,做个评测,不知道这个图又会是什么样?希望国内的团队多做事,少一些花里胡哨。
交流心得
有朋友自己弄了台配置还不错的服务器,实际操练一些模型后,交流了一些心得体会:中小模型的输出质量比较差,自己练手学习可以,不要指望能做出好产品,等着大厂做出MaaS产品,未来只需要采购相应的服务,就可以具备大模型能力,在这些基础大模型之上做出相应的中上层产品,比如垂直领域的定向模型、解决特定领域问题的2C产品(图文视频等)。
现在阶段比较成熟的商业模式,是做付费社群,教别人使用 AI 工具。很多产品还处在摸索阶段,更多的像玩具,无法在企业中真正产生效益。现阶段的产品更多是在吃信息差的红利,随着技术的迭代,某些产品注定要退出市场。