加上首批的 10 余个大模型,目前已有超过 20 个大模型获得审批。
据钛媒体独家报道,国内第二批通过备案的AI大模型包括11家公司,部分已面向全社会开放服务。加上首批的10余个大模型,目前已有超过20个大模型获得备案。
新一批备案名单包括:网易有道(“子曰”大模型)、蚂蚁集团(百灵大模型)、面壁智能(“面壁露卡Luca”)、出门问问(“序列猴子”)、昆仑万维(“天工”大模型)、美团(模型)、知乎(“知海图AI”模型)、月之暗面(moonshot)、金山办公(WPSAI)、好未来(MathGPT大模型)等。
截至发稿前,面壁智能、出门问问、网易有道、昆仑万维已经官宣了此消息。美团未作回应;金山办公方面则表示需等同步信息。
此前,8月31日首批通过备案的AI大模型(AI大模型太“卷”了!百度、抖音、商汤等获批,华为、腾讯、360在路上)包括百度文心一言、百川智能、商汤商量SenseChat、抖音(云雀大模型)、智谱AI(GLM大模型)、中科院(紫东太初大模型)、上海MiniMax(ABAB大模型)、上海人工智能实验室(书生通用大模型)、“360智脑”等等。
01 网易有道("子曰"大模型)
11 月 4 日,据网易有道官方公众号,网易有道“子曰”教育大模型今日通过相关备案,该大模型及其应用产品将对公众开放。
据介绍,基于“子曰”教育大模型的一系列新产品、新应用也将于近期发布。官方表示,该大模型将不断汲取用户反馈快速迭代升级,并搭载在更丰富的智能硬件产品及 App 中,号称可为全年龄段学习者持续提供高效学习体验。
“子曰”是教育垂类大模型,官方称其相比于通用大模型拥有更专业的预训练语料,可依据用户在学习场景下的需求提供对话式大语言模型,帮助用户答疑解惑。
IT之家此前报道,网易有道 7 月推出国内首个教育领域垂直大模型“子曰”,并发布基于该大模型研发的六大创新应用:“LLM 翻译”、“虚拟人口语教练”、“AI 作文指导”、“语法精讲”、“AI Box”以及“文档问答”。
10 月 11 日,网易有道宣布搭载有道“子曰”大模型的全球首个虚拟人口语私教 Hi Echo 正式推出独立 App 和微信小程序。
官方称 Hi Echo 具备全天候、多平台陪伴能力,可提供随时随地的高质量口语练习,已经覆盖 8 种对话场景和 68 个话题,支持自由对话。Hi Echo 支持从发音、语法两个维度给出口语打分提供语法改错、地道用词、语言风格润色等优化建议。
02 面壁智能(“面壁露卡Luca”)
11月4日,面壁智能多模态大模型应用「面壁露卡Luca」正式面向公众开放服务。广大用户可访问 https://luca.cn 注册使用,开启 Luca 最新体验。
「面壁露卡Luca」于今年 5 月正式推出,是面壁智能基于其自研千亿参数基座模型 CPM 打造的多模态智能对话助手。经过多次迭代更新,Luca 不仅在中英文语言对话方面表现出色,还具备强大的代码、知识、逻辑及图片理解能力。
CPM(Chinese Pretrained Model) 系列是面壁智能自主研发的预训练大语言模型,其中包括国内首个中文大模型 CPM-1,及国内首个开源免费商用基座模型 CPM-Bee。
不仅如此,面壁智能也是最早在 AI Agent 技术取得突破的中国人工智能公司之一,目前已推出由大模型驱动的 AI Agent “三驾马车”创新成果:
• AgentVerse,大模型驱动的智能体通用平台:提供轻松定制多智能体的应用环境,灵活、易用、高度可扩展。
• XAgent,超强AI智能体应用框架:打造大模型 Agent “超级英雄”,在真实复杂任务的处理能力已全面超越 AutoGPT。
• ChatDev,多智能体协作开发框架:创造“用一杯可乐的时间和钱开发一款软件”的智能生产力神话,火遍全球;开源不足两月星标超 1.6 万,屡次登顶 GitHub Trending。
作为领先的人工智能大模型公司,面壁智能致力于推动大模型技术的创新和落地,未来还将把 AI Agent 技术与 Luca 紧密结合,更好地发挥大模型应用潜能。
此外,面壁智能还联合清华大学 NLP 实验室、OpenBMB 开源社区打造了一个 “三位一体” 的大模型产学研生态布局,目前已为数百家企业提供商用服务,覆盖金融、商业、工业、医疗、教育、法律、媒体等多个行业和领域,努力推动大模型落地千行百业。
03 出门问问(“序列猴子”)
11月4日,出门问问自研大模型「序列猴子」正式向全社会开放。即日起,广大用户可登陆基于「序列猴子」的AI写作助手奇妙文(write.mobvoi.com)或AI开放平台(openapi.mobvoi.com/llm)体验。
今年 4 月,出门问问「序列猴子」开启邀测。「序列猴子」以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度。
「奇妙文」是一款基于「序列猴子」的 AI 写作应用,能够满足职场办公、市场营销、新媒体和创意写作等诸多场景的创作需求。「奇妙文」灵活简洁的编辑模式支持续写、改写、扩写、缩写、提炼要点、风格转换、纠错、翻译八大 AI 写作功能,用户可以在写作过程中一键唤醒 AI 帮助自己创作,并且还能在写作中让 AI 自动生成图片,真正做到图文并茂、文思泉涌。
据灼识咨询报告,出门问问是亚洲起步最早、收入规模最大专注于生成式 AI 的人工智能公司,具备深厚的通用大模型研发和创新能力。「序列猴子」向全社会开放之后,来自广大用户的真实反馈将会进一步提升大模型的各项能力,为用户带来更好的使用体验。
04 昆仑万维("天工"大模型)
11月3日,昆仑万维“天工”大模型通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务!
用户在应用商店下载“天工APP”或登陆“天工官网”(www.tiangong.cn)均可直接注册使用。
「天工」是国内首个对标ChatGPT的双千亿级大语言模型,也是一个AI搜索引擎,一个对话式AI助手。「天工」拥有强大的自然语言处理和智能交互能力,能够实现个性化AI搜索、智能问答、聊天互动、文本生成、编写代码、语言翻译等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。
2022年12月15日,昆仑万维在北京举行AIGC技术发布会,发布自研AIGC全系列算法与模型,覆盖了图像、音乐、文本、编程等多模态的AI内容生成能力。
2023年4月17日,昆仑万维正式发布自研千亿级大语言模型“天工”,同时宣布启动邀请测试。“天工”大模型通过自然语言与用户进行问答式交互,AI生成能力可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求。
2023年5月19日,北京市经济和信息化局公布第一批《北京市通用人工智能产业创新伙伴计划成员名单》。昆仑万维凭借在AIGC领域的前沿探索和投资布局,成为第一批模型伙伴和投资伙伴。
2023年8月23日,昆仑万维推出国内第一款AI搜索产品——“天工AI搜索”,并开启内测申请。“天工AI搜索”深度融合AI大模型能力,通过人性化、智能化的方式全面提升用户的搜索体验,为用户提供快速、可靠的交互式搜索服务,并集成AI对话、AI写作等常用功能,帮助用户提升工作效率,全面重塑中文搜索体验。
2023年9月,昆仑万维多模态大模型Skywork-MM在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评MME中,综合得分排名第一。该评测首次对全球范围内MLLM模型进行了全面定量评测并公布了16个排行榜,包含感知、认知两个总榜单以及14个子榜单。Skywork-MM模型位列综合榜单第一,其中,感知榜单排名第一、认知榜单排名第二。
2023年9月16日,在权威推理榜单Benchmark GSM8K 测试中,昆仑万维“天工”大模型以80%的正确率脱颖而出,大幅领先GPT-3.5(57.1%)和LLaMA2-70B(56.8%),这标志着天工的推理能力达到全球领先,接近GPT-4。
2023年9月17日,昆仑万维通过信通院“可信AI”评估,并被评选为人工智能实验室副组长单位。经中国信通院评估,昆仑万维天工大模型符合AIIA/PG 0071-2023、AIIA/PG 0072-2023评估标准,模型开发、以及模型能力均达到了“4+级”。
10月30日,昆仑万维开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。「天工」Skywork-13B系列目前包括130亿参数的两大模型,Skywork-13B-Base模型、Skywork-13B-Math模型,它们在CEVAL、GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。同时,昆仑万维「天工」Skywork-13B系列大模型全面开放商用——开发者无需申请,即可商用。
05 美团(模型)
今年6月底,美团在港交所发布公告称,美团以约20.65亿元的价格,完成对光年之外的股权收购。而前者是美团联合创始人王慧文创立的科技企业。
美团在收购公告中解释称,通过收购事项获得领先的AGI技术及人才,有机会加强其于快速增长的人工智能行业中的竞争力。美团还表示,收购完成后,将继续支持光年团队在大模型领域的探索和研究。
此外,今年7月,美团又花费数亿元投资AI大模型公司智谱华章。公开资料显示,智谱华章成立于2019年,由清华大学计算机系知识工程实验室的技术成果转化而来,曾参与研发超大规模预训练模型。
目前,美团的 AI 大模型没有对外公布过名称。
据介绍,美团一直在扩张算法团队,并启动筹划单独的“平台部门”,帮助美团大模型通过具体的商业化形式落地。在AI方面上,美团已经在视觉、语音、智能交互、自然语言处理能方面有了相关探索。今年5月6日,美团发布招聘对话大模型应用产品岗位,主要负责美团平台对话大模型应用平台和大模型应用产品的设计、开发和实现。
06 知乎("知海图AI"模型)
11月4日,知乎宣布旗下的“知海图AI”大模型即将面向社会公众开放服务,知乎将择机上线相关产品,持续赋能创作者、讨论场、信息获取、内容运营等各项业务场景。
2023年4月,知乎推出首个中文大模型“知海图AI”,该大模型在成熟大模型CPM-Bee基础上研发,拥有千亿级参数,具备更强的逻辑推理能力,更快的训练和推理速度。
据了解,“知海图AI”在公司业务提效上收益显著。知乎在分层、分类、兴趣理解、搜索等业务场景广泛应用大模型能力,人工标注量降低了90%以上,业务准召效果普遍提升了15%以上。
此外,除了优秀的大语言模型能力,“知海图AI”还具备强大的多模态处理能力,助力知乎实现会员故事智能配图,赋能会员业务发展。
值得一提的是,知乎教育业务也开展了基于大模型的产品创新,通过AI智能申论批改、智能作业批改、AI教务领航员,极大提升了教学效率和教学质量。
知乎早在五年前就提出了智能社区的概念,把AI技术应用在社区的内容生产、流通、治理和消费等环节。这些经由真实“讨论场”检验过的技术与模型,是构建AI应用场景和专用数据的信息流来源。
07 月之暗面(moonshot)
10 月9日,成立仅半年的大模型初创公司 —— Moonshot AI 宣布在 " 长文本 " 领域实现了突破,推出了首个支持输入 20 万汉字的智能助手产品 Kimi Chat。并称,这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度。
从技术上看,参数量决定了大模型能够支持多复杂的“计算”,而能够接收多少文本输入(即长文本技术)则决定了大模型有多大的“内存”,两者共同决定模型的应用效果。月之暗面相关负责人介绍,支持更长的上下文意味着大模型拥有更大的“内存”,从而使得大模型的应用更加深入和广泛:比如通过多篇财报进行市场分析、处理超长的法务合同、快速梳理多篇文章或多个网页的关键信息、基于长篇小说设定进行角色扮演等等,都可以在超长文本技术的加持下,成为人们工作和生活的一部分。
相比当前市面上以英文为基础训练的大模型服务,月之暗面推出的Kimi Chat具备较强的多语言能力。例如,其在中文上具备显著优势,实际使用效果能够支持约20万汉字的上下文,8倍于Open AI公司ChatGPT约2.5万字的上下文支持容量。此前,一些大模型仅支持数万字的文本量限制使得律师、分析师、咨询师等需要分析、处理较长文本的工作从业人员使用相关AI应用时颇为苦恼。
根据媒体公布的内测体验视频,当上传一篇长篇小说的电子文档后,月之暗面研发的Moonshot能够清晰地梳理一部小说的主要情节及小说中各个主要人物和人物的命运,也可以根据用户上传的财报进行关键数据和公司发展情况的分析等。目前,月之暗面的智能助手产品Kimi Chat已开放内测。
08 金山办公(WPSAI)
今年9月,2023金山办公技术开放日,金山办公官方宣布,基于大语言模型的智能办公助手WPS AI已接入金山办公全线产品,邀请用户体验全组件AI功能。金山办公将应用大模型重构办公软件,为每一位用户提供AIGC(内容创作)、Copilot(智慧助理)和Insight(知识洞察)三方面全新的产品体验。
WPS AI作为协同办公赛道的类ChatGPT式应用,已接入WPS文字、演示、表格、PDF、金山文档等产品线,解决用户在内容生成、内容理解、指令操作等方面的日常办公难题。公司率先实现大语言模型在各端落地,构建稳定的Office基建服务,并为AI功能提供简洁的交互框架、接入指南和准入标准,确保产品的智能化体验。
10月17日,金山办公与科大讯飞宣布达成战略合作,双方将在智慧教育、智慧医疗、智慧园区、智慧城市等领域展开深度联动。根据官方公众号披露,金山办公与科大讯飞已就终端部署、语音能力、版权保护、教育服务等领域展开合作,已有超35万教研用户在金山办公文档中台支持的科大讯飞AI教研平台进行备课和协同研修工作。公司持续与生态合作伙伴在兼容认证、场景深耕、生态共建、方案创新四个领域不断取得突破。
09 好未来(MathGPT大模型)
8月24日,好未来集团首席技术官田密在20周年直播活动中宣布,该公司自研的数学领域千亿级大模型MathGPT正式上线并开启公测。
今年5月,好未来曾公布正在进行自研数学大模型的研发,由CTO田密牵头,命名为MathGPT。主要面向全球数学爱好者和科研机构,以解题和讲题算法为核心。
MathGPT官网显示,MathGPT的数学计算能力已覆盖小学、初中、高中的数学题,题型涵盖计算题、应用题、代数题等多个类型,还可以针对题目进行追问,暂未开放数学之外的问答互动。
用户使用MathGPT时,用文字或图片方式上传数学题,即可得到对话式的解答反馈,答案包含“分析”、“详解”、“点睛”三个部分;也可以通过“随机来一题”的按钮,随机生成数学题目并由系统给出解答。目前,MathGPT支持中文、英文版本的PC端和移动端。
多个大模型在六个公开数学评测集合的正确率表现。图源:好未来
据好未来提供的MathGPT技术报告显示,在六个公开数学评测集合CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学、Math401的测试结果中,MathGPT的表现不差。
10 蚂蚁集团百灵大模型
11月6日消息,蚂蚁集团宣布,根据国家《生成式人工智能服务管理暂行办法》指导要求,蚂蚁百灵大模型已完成备案。
本次通过备案的是蚂蚁百灵语言大模型,该大模型采用Transfromer架构,基于万亿级Token语料训练而成,支持窗口长度达32K,推理能力领先,在主流推理类榜单中排名前列。
据了解,蚂蚁大模型坚持自主研发、全栈布局,目前已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品在内的完整技术链条。
得益于在大模型基础设施上的坚决投入,蚂蚁百灵在算力、安全力和知识力上表现突出。
算力上,蚂蚁建设了万卡异构集群,其中硬件算力效率(HFU)超过60%,集群有效训练时长占比90%以上,RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍,处于业界先进水平。
安全力方面,蚂蚁研发了大模型安全一体化解决方案——“蚁天鉴”。“蚁鉴”平台作为业内首个大模型安全评测工具,支持50万/天饱和式攻击,全面覆盖生成内容数百类风险;“天鉴”平台可在大模型运行时,覆盖8大类风险,采用大模型对抗大模型的方式,使得风险召回率大于99%,其Guardrails前置护栏功能,能精确召回20多类提问风险意图。
知识力上,蚂蚁通过统一语料体系、数据预处理标准化、数据标注强化、评测立体化,形成了完备的知识处理能力。其中,集评测数据集与评测框架一体化的大模型评测平台—EVE,能支持语言大模型和多模态大模型一站式自动化评测。
据悉,在基础大模型层面,除了本次通过备案的百灵语言大模型,蚂蚁集团也在研发百灵多模态大模型,并已内测。
11 360“奇元大模型”
11月4日,三六零(下称“360”)大模型“奇元大模型”通过备案落地。今年9月,“360智脑大模型”已获批面向公众开放。至此,360也成为国内首家两个大模型均通过备案的科技企业。
从大模型定位和应用角度来看,奇元大模型具备充足的灵活性和可扩展性,商业化和产品定位以B端用户为主,后期将会聚焦更多的商业化应用和垂直领域,帮助用户提升工作效率。
此前,360智脑大模型已于今年9月首批获得备案开放,并全面接入360搜索、360浏览器等互联网全端应用。据悉,360智脑上线首周即获300万用户超5000万次互动。360智脑大模型集成了360GPT大模型、360多模态大模型技术能力,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,覆盖大模型全部应用场景。
本文来源数据观,如有侵权请联系删除