真假“长文本”,国产大模型混战

文|郝    鑫
 

Kimi有多火爆?凭一己之力搅乱A股和大模型圈。

Kimi概念股连日引爆资本市场,多个概念股随之涨停。在一片看好的态势中,谁都想来沾个边,据光锥智能不完全统计,目前,至少有包括读客文化、掌阅科技、万兴科技等在内的十家上市公司发布公告透露正在了解或接入了Kimi 智能助手。

眼看着Kimi的火越烧越旺,大厂也垂涎三尺,连夜加入了大模型“长文本” 的四国大战。

对标月之暗面Kimi 智能助手的200万字参数量,百度文心一言将在下个月开放200万~500万字长文本处理功能,较此前最高2.8万字的文档处理能力提升上百倍;阿里通义千问宣布升级,开放最高1000万字的长文本处理能力;360智脑正在内测500万字,功能正式升级后将入驻360AI浏览器。

四家中国大模型公司把长文本能力“卷”出了新高度。作为参考,目前,大模型最强王者OpenAI的GPT-4 Turbo-128k可处理文本能力约为10万汉字,专攻长本文的Claude3-200K上下文处理能力约为16万汉字。

但同样都是“长”,有人是孙悟空,有人是六耳猕猴。

一位大模型行业的人士向光锥智能表示:“确实有一些公司用RAG(检索增强)来混淆视听。无损的长文本和RAG,两项技术各有优势,也有结合点,但归根到底还是不同的技术……很容易就用‘长本文’来混淆视听。”

“百度、阿里、360,大概率都使用了RAG方案”,该业内人士表示道。

无论是RAG还是长文本,一味地“长”并不能代表所有。如同上一轮,大模型厂商“卷”参数,大模型参数不是越大就越好,文本长度,也不是越长,模型效果就越好。除了上下文长度,记忆能力、推理能力、算力都是共同的决定性因素。(详细观点请参考《卷完参数后,大模型公司又盯上了“长文本”?》一文)

进入2024国产大模型落地元年,大模型应用千千万,为什么是长文本能率先掀起波澜?基于长文本的特性,又能解决哪些AI应用落地的实际问题呢?

长文本,真的越长越好吗?

自ChatGPT诞生以来,国外一直在持续不断地涌现出新的AI应用,产生流量的同时,也令人看到了商业化的可能性。

据风险投资公司a16z近期发布的《GenAI 消费应用 Top100 报告》显示,用户月访问量最大的应用网站中,类ChatGPT的效率助手占据了榜单前十的大壁江山,ChatGPT的每月网络访问量接近20亿次,第二名Gemini的每月访问量约为4亿次。

但同样AI应用活跃而繁荣的场景却并没有在中国成功上演。在月之暗面的Kimi 智能助手凭借流量和人气出圈之前,国内能够达到一定体量的应用只有两个,一个是百度推出的文心一言App,另一个是字节跳动推出的豆包。

据相关数据统计,截至2023年9月,百度文心一言App的月活量达到最高峰值710万;同年12月,字节豆包月活达到200万,2024年1月在此基础上翻了一番达到400万。

文心一言凭借百度的大模型先发优势和搜索流量优势,一度成为国内流量最大的AI应用;而豆包背靠抖音流量转化池,虽然发布时间稍晚一步,但在后期实现了反超。

在这样背景之下,Kimi的爆火显得尤为特殊,某种意义上可以说,Kimi是国内第一个靠产品能力和用户自来水破圈的AI应用。

月之暗面创始人杨植麟曾告诉光锥智能,其团队发现正是由于大模型输入长度受限,才造成了许多大模型应用落地的困境,这也是月之暗面聚焦长文本技术的原因所在。

站在用户角度来看,好不好用是检验AI应用产品最关键的指标,而这都依赖于Kimi背后的长文本技术。

若将长文本的能力进一步拆解,大致可以包括长度、记忆、理解、推理几个能力。

越来越长的文本长度,可以进一步提升现在AI应用的可用性和专业性。

对普通用户而言,与AI助手简短的闲聊能够引起兴趣,但不能解决问题,特别对于法律、医学、金融等一些专业领域,需要前期“喂”给大模型特定的数据和知识,才能精准地输出答案;对企业而言,更需要一个“专家型”的助手,大量的企业数据、行业数据都需要提前导入,没有损耗地输入和输出,从而保证最后的分析结果具有可参考性。Claude就是一个典型的例子,凭借长文本的优势与ChatGPT走出不同的路线,收获了大量的2B垂直行业的企业用户。

多轮对话和记忆能力可以直接应用到现在大部分的场景中,比如游戏场景中的NPC,通过长文本输入给予其角色设定,玩家每一次的对话都会被记录,并且能够生成个性化的游戏档案,避免了重新登录而需要反复唤醒的问题;在执行Agent(智能体)任务场景,能够增强记忆能力,辅助Agent形成清晰的行动步骤,避免出现Agent打架的现象。

长文本的理解和推理能力体现在两个方面,一类是对想象类的应用理解生成,一类是对逻辑类应用的生成。例如在对AI小说的应用中,长文本的能力体现在能够理解用户输入的prompt,对其想象性的扩写;在编程、医疗问答等领域,则需要调用其逻辑的推理能力,合理化地续写编程,根据用户描述推理病状。

月之暗面副总裁许欣然曾表示,大模型无损上下文长度的数量级提升,将进一步打开对 AI 应用场景的想象力,包括完整代码库的分析理解、自主完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。

所以,长文本从来都是一项综合性的能力,而非越长就越好。相反,过分追求长,可能引发算力匮乏的问题。

大模型公司卷“投流”

一天获客成本20万

流量狂飙、宕机后五次扩容;日活用户数达百万,月环比增长率107.6%;赶超微信、杀进App Store免费版应用第五名,月之暗面交出了一份漂亮的成绩单。

但这也只是一个开始,多位业内人士在今年刚开年曾向光锥智能透露,走过高速技术迭代的2023年,大模型来到了产业落地和商业化的下半场。

去年,各家已经相继亮剑,智谱、百川、面壁不同程度上都开启了商业化。月之暗面稍慢,目前还未公布商业化的方案,但急切地开始了商业化加速进程,B站、抖音等社交平台都能看到Kimi助手投流的广告。

尽管,各家都从未将2C的变现路线排除在外,但是延续2016年AI 1.0时代的思路,多数还是将2B作为了首要的突破口。有了技术,去找技术和产业落地方向,探索落地方案似乎成为了理所应当。

月之暗面则是大模型公司的另类,去年10月份第一次公开露面后,就瞄准了2C的应用市场。杨植麟曾表示,长文本是月之暗面根技术,在这技术之上可以分裂出不同场景和领域的2C应用。

在Kimi效应爆发前,就有很多普通和企业用户反馈,“Kimi是国内最好的AI助手,没有之一”,从一开始就注重产品效果和用户体验的Kimi,现在爆发似乎带有一定的必然性。

商业化压力之下,大模型公司大概率会选择2B、2C两条腿走路。对比其他大模型公司,月之暗面则又提供了另一种商业化的路径参考,其他玩家从先2B再2C,以2B拉动2C,而月之暗面则属于先2C后2B,再以2C的产品拉动2B的单子。

毕竟,除了国外的ChatGPT,之前在国内根本看不到2C产品增长的案例。Kimi靠近半年的积累,凭一己之力在2C撕开了一道口子,众多大厂或许是看到了2C更多的可能性,才急于下场向市场证明自身具备长文本能力。

但回到商业化赚钱的本质,仍要思考如何将一时的流量转化成实打实的付费率。

光锥智能观察发现,现在大部分的大模型公司在推产品时还是互联网推流的那一套,旧瓶装新酒,抖音、B站、小红书投流推广,在线下的写字楼电梯、机场、地铁打广告。

一通操作下来的实际转化率有多少尚未可知,但为获客花出去的都是真金白银。据新浪科技报道,有投资人透露,目前Kimi用户获客成本达到12元~13元。根据下载量预估,Kimi近一个月来日均下载量为17805。按此计算,Kimi每天的获客成本至少20万元。

现在市面上大部分的AI助手都是免费下载使用,基于网络负外部效应,当用户越来越多的时候,其资源的耗损就越来越大。此次的Kimi宕机事件就是最好的例证,顺时暴涨的用户量给算力和服务器都造成了压力,与之带来的还有大量的token成本的消耗。

对大模型公司而言,规模化、付费率和成本的三方拉扯问题,短时间内无法得到解决,即使是流量吊打其他应用的ChatGPT也面临盈亏平衡的困境。

据data.ai数据显示,截至2023年6月19日,ChatGPT iOS端上线首月的日活付费率约为4.36%。OpenAI预测,对于压缩成本后的GPT-3.5模型和GPT-4模型,若月付费率每月提升0.25%或不能持续;若月付费率每月提升0.5%或能扭亏。

月付费率不断提升听起来很性感,但现实却是“未老先衰”,爆发性的增长还未迎来,增长停滞先一步到来。

对大模型厂商,特别是创业公司来说试错的机会并不多,不能刚从技术的坑出来,又一头扎进投流的坑,跟风长文本不能解决所有问题,跑出商业化模式才是。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/285833.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【蓝桥杯知识点】浮点数二分(开n次方根再也不会超时啦!)

今天继续学习基础算法!这篇文章介绍了二分的另一种应用——浮点数二分,可以用于开n次方根的计算,会使时间大大缩短!我偷偷问过电脑编译器了,它说它喜欢优化过的算法哈哈哈哈~相信你也会喜欢的! PS&#xff…

现代化应用部署工具-Docker

Docker 简介 什么是Docker Docker 是一个开源的应用容器引擎,可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的 Linux 机器上。 Docker部署的优势 通过使用Docker等容器技术,可以将应用程序及其依赖项…

构建品牌故事:Kompas.ai在叙事营销中的应用

引言 在数字化和全球化的浪潮中,品牌建设已经从单一的产品竞争演变为品牌故事的较量。叙事营销,作为一种通过讲述故事来传递品牌价值和理念的策略,已经成为连接品牌与消费者情感的桥梁。本文将深入探讨叙事营销的重要性,详细介绍K…

路由 (hash模式和history模式)

首先我们了解一下资源请求: 1.什么是资源 在浏览器需要某一个数据或文件进行解析或者浏览器在解析某个脚本的时候需要数据进行DOM渲染等工作,那么这个数据或文件就是浏览器的资源 2.资源怎么获取 浏览器的资源都必须通过资源请求的方式或从缓存中调出…

【Java程序设计】【C00371】基于(JavaWeb)Springboot的社区防疫物资申报系统(有论文)

TOC 博主介绍:java高级开发,从事互联网行业六年,已经做了六年的毕业设计程序开发,开发过上千套毕业设计程序,博客中有上百套程序可供参考,欢迎共同交流学习。 项目简介 项目获取 🍅文末点击卡片…

MapReduce配置和Yarn的集群部署

一、集群环境,还是如下三台服务器 192.168.32.101 node1192.168.32.102 node2192.168.32.103 node3 二、YARN架构 YARN,主从架构,有2个角色 主(Master)角色:ResourceManager从(Slave&#x…

政安晨:【深度学习实践】【使用 TensorFlow 和 Keras 为结构化数据构建和训练神经网络】(三)—— 随机梯度下降

政安晨的个人主页:政安晨 欢迎 👍点赞✍评论⭐收藏 收录专栏: TensorFlow与Keras实战演绎 希望政安晨的博客能够对您有所裨益,如有不足之处,欢迎在评论区提出指正! 这篇文章中,咱们将使用Keras和TensorFlow…

看似简单的SQL,实则就是简单

加班遇到一个SQL问题,本想把别人的SQL改下成SparkSQL,在YARN上运行,然而数据一直对不上。 原SQL ⚠️说明:a.id,b.id没有空的,数据1:1,b.name可能存在空的 select a.id,b.id,b.name from tab…

JDK1.6、1.7、1.8内存区域的变化?

JDK1.6、1.7/1.8内存区域发生了变化,主要体现在方法区的实现: JDK1.6使用永久代实现方法区: JDK1.7时发生了一些变化,将字符串常量池、静态变量,存放在堆上 在JDK1.8时彻底干掉了永久代,而在直接内存中划出…

【每日八股】Java基础经典面试题4

前言:哈喽大家好,我是黑洞晓威,25届毕业生,正在为即将到来的秋招做准备。本篇将记录学习过程中经常出现的知识点以及自己学习薄弱的地方进行总结🥰。 本篇文章记录的Java基础面试题,如果你也在复习的话不妨…

阿里的库存秒杀是如何实现的?

一、阿里的库存秒杀的实现 阿里有很多业务,几十上百个业务线,各自都有一些需要做抢购、秒杀、热点扣将的场景。他们都用哪些方案呢? 我看了很多资料,也找了很多人做交流,最终得到的结论是啥都有,主要总结几个主流的&…

Linux离线部署gitLab及使用教程

一、下载gitLab的linux系统rpm包 地址:Index of /gitlab-ce/yum/el7/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 找到这个最新版 点击下载 二、上传到linux系统 笔者是在windows系统下的vmware虚拟机中部署安装的,虚拟机中安装了cent…

《C++ Primer 第五版 中文版》第12章 动态内存【阅读笔记 + 个人思考】

《C Primer 第五版 中文版》第12章 动态内存【阅读笔记 个人思考】 12.1 动态内存与智能指针12.1.1 shared_ptr类 静态内存包括:初始化只读数据段,初始化读写数据段,未初始化数据和常量数据段。 详细在下面博客总结: Linux系统下…

商家如何自己零成本免费制作点餐小程序项目完整源码

现在点餐小程序成为餐饮店的标配,顾客只要扫码,即可进入小程序点餐。顾客付款后,后厨自动打印出订单并开始制作。整个过程非常方便流畅,甚至还可以免去收银(或服务)人员。那么,这种餐饮小程序要…

STM32—控制蜂鸣器(定时器)

目录 1 、 电路构成及原理图 2 、编写实现代码 main.c tim_irq.c 3、代码讲解 4、烧录到开发板调试、验证代码 5、检验效果 此笔记基于朗峰 STM32F103 系列全集成开发板的记录。 1 、 电路构成及原理图 定时器中断是利用定时器的计数功能(向上计数或向下计…

ChatGPTGPT4科研应用、数据分析与机器学习、论文高效写作、AI绘图技术教程

原文链接:ChatGPTGPT4科研应用、数据分析与机器学习、论文高效写作、AI绘图技术教程https://mp.weixin.qq.com/s?__bizMzUzNTczMDMxMg&mid2247598798&idx2&sn014f5ae90306a3b1e8fd87ab58561411&chksmfa820329cdf58a3f72799a43016b223057fd1bd02284…

算法系列--动态规划--子序列(1)

💕"深思熟虑的结果往往就是说不清楚。"💕 作者:Mylvzi 文章主要内容:算法系列–动态规划–子序列(2) 今天带来的是算法系列--动态规划--子序列(1),是子序列问题的开篇!带大家初识子序列问题 一.什么是子序列问题 我们…

某蓝队面试经验

背景 据小道消息说今年的国护疑似提前到了五月份,所以最近也是HW面试的一个高峰期啊,这里分享一下上次长亭的蓝队面试问题(附本人的回答,仅供参考) 面试问答 1、谈谈作为蓝队护网过程使用过厂商的设备 这里我回答的…

Spring Boot整合Spring Security

Spring Boot 专栏:Spring Boot 从零单排 Spring Cloud 专栏:Spring Cloud 从零单排 GitHub:SpringBootDemo Gitee:SpringBootDemo Spring Security是针对Spring项目的安全框架,也是Spring Boot底层安全模块的默认技术…

部署Zabbix Agents添加使能监测服务器_Linux平台_Yum源/Archive多模式

Linux平台 一、从yum源脚本安装部署Zabbix-Agent,添加Linux Servers/PC 概述 Zabbix 主要有以下几个组件组成: Zabbix Server:Zabbix 服务端,Zabbix的核心组件,它负责接收监控数据并触发告警,还负责将监控数据持久化到数据库中。 Zabbix Agent:Zabbix客户端,部署在被监…