“ 通过对网站数据分析工具SimilarWeb的数据监控,观察AI相关站点的网站访问量变化,来发掘AI应用端的变化趋势,找到当下最火爆的AI应用。”
AI网站访问量数据变化
访问量成长周冠军 LLamaIndex
本周流量成长冠军是llamaindex.ai,周访问量同比成长122.69%,该网站前身为GPTindex。LLamaIndex是一个数据框架,可以为大语言模型提供数据摄取、数据索引和查询引擎。简单说,LLamaIndex可以将大模型和企业数据连接起来,做定制化的LLMs,管理数据流和任务调度。和它类似的工具还有LangChain。目前LLamaIndex在github上已经有18k+的star。
LLM应用程序新兴技术栈
平均停留最长 Character.ai
近四周平均停留时长最长为22.86分钟。Character.ai是一家致力于实现与计算机进行无限对话的公司。它正在研发下一代的对话机器人技术,应用范围广泛,包括娱乐、教育、常规问答等。该公司的对话机器人基于自有的大型语言模型技术,从头开始构建和训练,专为对话而设计。用户负责编写一个角色的台词,机器人负责创作另一个角色的台词,给用户一种在与另一个角色对话的体验。
访问量类目周冠 AI Chat
AI应用可以分成以下几个类别:
AI Art:造梦日记、MidJourney、Stable Diffusion、Adobe、Stability、Remove
AI Chat:ChatGPT、 Discord、 文心一言、 Google Bard、 星火认知、 Character.AI
AI Community:Kaggle、 Hugging Face、 H2O、 Github、Replicate、 OpenCV
AI Creative:Heygen、 RunwayML、Jasper、 WriteSonic
AI Design:Figma、 Canva
AI Framework:PyTorch、 LlamaIndex、 Auto GPT、 Caffe、 TensorFlow、LangChain、 Keras、 Google generative AI Developers、 Fixie
AI Hardware:AMD、Nvidia、 Hiascend
AI Productivity:阿里通义、 Notion、 Zoom、 Voice AI、Slack
AI Research:Anthropic、 Cohere、 AI21、OpenAI
根据AI应用分类,AI Chat是总访问量最高的应用类别,其中重点观察了ChatGPT、Discord、文心一言、Google Bard、星火认知、Character.AI的周访问量变化。
包括ChatGPT在内,几乎所有的AI聊天机器人,在网站流量上的增长都已经趋于平缓。
ChatGPT流量阶段性见顶?
前期ChatGPT的访问量增长率惊人,1月份的环比增长率为131.6%,2月份为62.5%,3月份为55.8%,在4月份明显放缓,环比增长率为12.6%,到了5月这个数字已经变为了2.8%。
不过,根据OpenAI 6月初流出的闭门会议纪要,CEO Sam Altman认为,ChatGPT的使命是吸引更多企业接入其API,而不是夺取客户流量。
很多的开发者说,他们在使用OpenAI的API构建产品时,担心OpenAI最终会发布他们的竞品。但OpenAI未来不会发布超过ChatGPT的更多产品。
历史上看,每一个伟大的平台公司都有一个“杀手级”应用,ChatGPT的作用是协助客户让他们的产品变得更好。ChatGPT的愿景是成为一个超级智能的工作助手,但也会有很多OpenAI不会触及的其他GPT使用案例。
Hugging Face 模型更新次数创新高
随着越来多的企业通过API来调用模型能力,我们在上文提到网站浏览数据无法直接监控API接口用量,只能通过观察开发者社区的活跃程度来侧面观察To b企业端对于AI模型的潜在消费量。
企业基于自有数据库的LLM开发过程:
数据:使用开源工具自行部署并编写代码。
向量化:利用 OpenAI 等工具进行向量化操作。
向量数据库(Vector Database):使用云服务器,结合自行部署的 Postgres 和 pgvector 开源工具。
调试:自行编写代码进行测试。
集成:自己编写代码进行集成或基于 LangChain/LlamaIndex 等sdk 集成。
部署:编写代码并将其部署在云服务器上。
存储:使用云服务器 + Redis + Postgres 开源工具进行存储。
语言模型 API(LLM API):利用 OpenAI GPT3.5/4、Hugging Face 提供的模型自己部署。
我们选取Hugging Face作为除了Open AI以外重要的观察对象,Hugging Face是一个提供超20万个预训练模型和45,000多个数据集的开发者社区。
Hugging Face在近三个月模型的更新次数和组织 数量上屡创新高,其中5月最后一周TOP 12000的模型的更新次数达到超过3500次。
Hugging Face上的开发者正在以远超几个月前的水平积极更新自己此前新建的模型,这意味着LLM应用的开发者社区正在显现出空前的活跃程度。这些更新的预训练模型最终会通过开发者一系列的集成和部署,最终在企业端(以及一部分C端)完成AI应用的实现。