诸神之战!一文盘点中国“大模型”玩家们

开年以来,全球 AI 大模型行业,鲜花着锦,比肩继踵。微软、Google、Meta、百度等科技巨头你追我赶,掀开了大模型“军备竞赛”时代的序幕。新的挑战者入局,大模型概念不断走高,众多 AI 企业纷纷宣告进军,拥抱新一轮生产力革命。

在国内,做类 ChatGPT 产品,建中国版 OpenAI,这个无与伦比的“性感故事”,引燃了互联网大厂和科技大佬的创业热情,AI 2.0 的“诸神之战”已经打响。

今年 2 月,原美团联合创始人王慧文的一则“AI 英雄榜”,高调入局“剑指”大模型。之后,前搜狗 CEO 王小川、前京东 AI 掌门人周伯文、被誉为“AI 框架领域第一华人”的阿里技术副总裁贾扬清、出门问问创始人李志飞等一众大佬争先加入 ChatGPT 掀起的创业热队伍。

还有众多背景华丽的创业团队涌现,其中清华大学处于身负众望的头一梯队。比如,清华唐杰教授的智谱 AI,黄民烈教授的聆心智能,清华大学 NLP 实验室的孙茂松、刘知远团队,深言科技岂凡超,以及循环智能杨植麟等等,都被头部 VC 赋予了颠覆行业的希望,创业的列车再次提速。

互联网大厂也不甘心错过下一个时代。百度已经率先推出“文心一言”,华为的“盘古”大模型,腾讯的“混元”AI 大模型,已经蓄势待发。还有阿里达摩院被曝要推出的类 ChatGPT 产品,字节跳动被爆正在布局大模型,科大讯飞也被传出类 ChatGPT 技术将在今年 5 月落地公司 AI 学习机产品中的消息.......

生产力范式转移,算力时代悄然开启,一场 AIGC 带来的奇幻革命正在进行。诸神之战!决战“中国版 ChatGPT”,谁会是最后的赢家?

一、创业派

王小川团队

据公开信息,2022 年 6 月,王小川设立了人工智能技术公司 —— 北京百方众智信息技术合伙企业,自己占股 80%。另据媒体向王小川本人求证是否回归创业做 AI 大模型的消息,王小川承认自己在“快速筹备中”。

《态℃ 》栏目从接近王小川的消息源获知,王小川近期正在与产业界和学术界的一些重要人士进行密集沟通,目前项目还没有公开,据说已经搞定了一亿美金的启动资金,被称作“亲友轮”。

王小川于 1996 年获得国际奥林匹克信息学竞赛金牌,进入清华大学。进入搜狐后,在 2004 年主导推出搜狗搜索,并在 27 岁那年成为彼时中国互联网界最年轻的高管。2015 年开始,王小川开始讲 AI 的故事,以“自然交互 + 知识计算”为核心,推出 AI 翻译机等产品。

搜狗在 2017 年 11 月登陆美国纽约证券交易所,上市四年多时间,营收最高峰停在 2019 年,营收 11.7 亿美元,净利润 1.05 亿。此后不断下滑,2020 年营收降至 8.37 亿美元,亏损 1.09 亿美元,2021 前两个季度,营收同比基本下降超过 44%。

2021 年 10 月初,搜狗完成私有化,并从纽交所退市。2021 年 9 月 4 日,搜狗宣布与腾讯完成合并。合并完成后,搜狗将成为腾讯控股间接全资子公司。2021 年 10 月 15 日,王小川发布邮件告别搜狗,卸任 CEO 职务,功成身退。

既有技术主义理想,又懂得商业的智慧,王小川无疑是杀向大模型赛道的一匹黑马。

光年之外

前美团联合创始人、高级副总裁王慧文宣布杀入 AI 大模型赛道,曾一度引发科技互联网行业的热议。

2 月 13 日,王慧文在社交媒体上发出 AI 英雄榜,宣布打造中国 OpenAI,成立北京光年之外科技有限公司(以下简称“光年之外”),出资 5 千万美元,估值 2 亿美元,自有资金占股 25%。王慧文进一步表示,下轮融资已有顶级 VC 认购 2.3 亿美元。

3 月 27 日晚,王慧文创立的公司光年之外被传将以换股形式收购北京一流科技,在现有团队基础之上,打造中国版的 ChatGPT。公开信息显示,一流科技成立于 2017 年 1 月,自称是世界上唯一一家以“创业团队”身份研发通用深度学习框架的团队。其产品 OneFlow 的竞争对手包括百度的 PaddlePaddle、谷歌的 TensorFlow 和 Facebook 的 PyTorch。

之前还有消息称,美团创始人兼董事长王兴个人将参与王慧文 AI 创业公司 A 轮融资,并出任董事。王兴曾在朋友圈中表示,“AI 大模型让我既兴奋于即将创造出来的巨大生产力,又忧虑它未来对整个世界的冲击。老王和我在创业路上同行近二十年,既然他决心拥抱这次大浪潮,那我必须支持。”

王慧文和王兴曾联合创办校内网(后更名人人网),此后又一起创办了美团。2020 年 12 月,王慧文宣布从美团退休时,王兴曾在公开信中表示:“老王和我是有共同志趣的同学和室友,是携手创业的搭档和并肩战斗的战友,更是可以思想碰撞、灵魂对话的一生挚友。”

两年后,在 AI 大模型赛道,两人再次走到一起,共同奔赴新的战场。

Project AI 2.0

同样高调入场的还有 AI 大牛李开复,3 月 19 日下午,其在朋友圈宣布成立 Project AI 2.0 公司。同一天,新公司在其创新工场官网正式上线。

据了解,Project AI 2.0 不仅仅要做中文版 ChatGPT。李开复认为,AI 2.0 不仅仅是个高能聊天工具,也不仅仅是图文创作的 AIGC 生成,Co-pilot 和如今看到的应用都还只是 AI 2.0 能力的开端。

他还透露,Project AI 2.0 的资金、算力陆续到位,新公司期权由新团队绝对主导,首批广招大模型、多模态、NLP (自然语言处理)、AI 算法工程与研究、分布式计算 / Infrastructure 等方向大的顶级人才推荐自荐。

澜舟科技

今年 3 月 14 日,语言大模型玩家澜舟科技,刚刚完成了 Pre-A + 轮融资。本轮融资由北京中关村科学城公司领投,斯道资本和创新工场跟投。这也是澜舟科技一年内收获的第 2 轮融资,累计总额已经数亿元。

和融资消息一同公布的还有澜舟科技推出的语言生成模型 —— 孟子 MChat 可控大模型。据介绍,它有类 ChatGPT 的能力,加上原来澜舟科技孟子大模型 N 个项目功能引擎,最终呈现出来的 MChat,既有对话能力,又具备翻译、生成、信息搜索等能力。

澜舟科技创始人周明是闻名世界的 NLP 专家,也是当今 NLP 领域成就最高的华人之一,他不仅是中国第一个中英翻译系统的研制者,还在 2019 年成为 AI 语言领域最高级顶会 ACL(国际计算语言协会)主席。

公开资料显示,周明先后就读于重庆大学、哈尔滨工业大学和清华大学,并在清华大学担任过副教授。创业前,周明长期在微软亚洲研究院担任 NLP 组的负责人、微软亚研副院长。周明在 NLP 领域发表的文章数量居世界前列,2012 年至 2020 年期间,周明在 NLP 领域顶会发表的论文数量居全球第一。

MiniMax

MiniMax 在 2021 年 11 月成立,是一家颇为神秘的人工智能公司,成立至今,对外发声次数屈指可数。根据明势资本官方消息,2022 年上半年,明势资本领投了 MiniMax 的天使轮融资。

但事实上,MiniMax 是国内名列前茅的多模态 AI 大模型创业公司,形成了文本到视觉(text to visual)、文本到语音(text to audio)、文本到文本(text to text)三大模态的基础模型架构,可能也是国内第一家同时拥有 3 个模态大模型能力的创业公司。

MiniMax 首款 C 端产品 Glow,和 ChatGPT 百科全书一样的回答不同,Glow 的定位在 AI 虚拟聊天社交软件,主打聊天、陪伴等情感功能,目前用户数已经破百万。在 to B 方向,MiniMax 计划在今年对外开放 API。

有媒体曾披露,MiniMax 联合创始人为前商汤科技副总裁、通用智能技术负责人闫俊杰,也曾担任商汤研究院副院长,搭建了商汤的人脸识别和智慧城市相关的技术体系。在深度学习和计算机视觉领域,闫俊杰发表顶级会议和期刊论文 100 余篇,Google Scholar 引用超过 10000 次。

目前,MiniMax 团队人数已过百,公司核心技术研发成员均来自全球知名高校和全球顶尖科技公司,拥有世界顶尖自然语言处理,语音,计算机视觉,计算机图形学等工业界和学术界经验,拥有多项全球领先的人工智能领域研究成果,具有上百个全球发明专利,1/3 的团队成员拥有世界顶尖技术实验室的博士学位。

衔远科技

2 月 26 日晚,前京东 AI 掌舵人周伯文发布一则 AI 英雄帖,招募合伙人一起打造中国版 ChatGPT。这是继前王慧文、王小川之后又一位下场的业界大牛。

周伯文长期致力于语音、自然语言处理、多模态内容理解与生成、知识表征与推理、人机对话、可信赖 AI 等研究领域及其在产业化、数智化的应用。他提出的自注意力融合多头机制的自然语言表征机理后来成为 Transformer 架构的核心思想之一,他还曾与图灵奖得主 Yoshua Bengio 在 NLP 方向合作一篇论文,至今被引用 2000 多次,其论文总引用次数也高达近 15000。

周伯文自 2021 年底从京东离职后,转去学术界,担任清华大学惠妍讲席教授、电子系长聘教授 、清华大学电子系协同交互智能研究中心主任。同时,他还是衔远科技的创始人、首席科学家。

在英雄帖中,周伯文也表达了衔远科技参与 ChatGPT 这一波所走的差异化路线 —— 中国的 OpenAI 需要探索一条新的道路:垂直整合从自有基础大模型到应用、用户全场景闭环,实现生成式人工智能技术与商业价值 "双落地"。

今年 3 月 1 日,衔远科技宣布已经完成数亿元天使轮融资,本轮融资由启明创投领投,经纬创投跟投。

二、学院派

智谱 AI

智谱 AI 由清华大学计算机系唐杰教授创立,团队核心成员曾参与清华大学与智源研究院合作项目「悟道」的研发工作,具有丰富的大模型经验。

2022 年 8 月,清华大学知识工程实验室与智谱 AI 合作研发的超大规模预训练语言模型 GLM-130B 正式上线,在多个公开评测集上性能超过 GPT-3。

去年 9 月,智谱 AI 宣布获得数亿元人民币 B 轮融资,由君联资本和启明创投联合领投,本轮融资将被用于继续投入到打造高性能千亿级普惠大模型。

唐杰,清华大学计算机系教授,刚刚入选 2023 AAAI Fellow,也是 ACM / IEEE Fellow。研究方向包括人工智能、数据挖掘、社交网络、机器学习和知识图谱等,曾获 ACM SIGKDD Test-of-Time Award(十年最佳论文)。

就在 GPT4 发布的同一天,唐教授在微博宣布:基于千亿参数大模型的对话机器人 ChatGLM,现在开启邀请制内测。据介绍,这是一个初具问答和对话功能的千亿中英语言模型。

聆心智能

另一支赫赫有名的清华系 NLP 队伍,是交互式人工智能(CoAI)课题组教授朱小燕和其学生黄民烈团队,他们先后提出过 SentiLARE、StoryGPT 等预训练模型。

黄明烈副教授于 2021 年创立聆心智能,专注心理咨询赛道,致力于打造“超拟人底层大模型”。2022 年团队上线“AI 乌托邦”对话机器人,支持自定义 AI 人设进行聊天交互。团队核心成员均来自于清华大学、卡内基梅隆大学、谷歌等国内外顶尖高校及公司,具有丰富的商业化经验。

作为国内具备训练超大规模语言模型能力的团队之一,聆心智能将自己定位为 "中国的 Character AI", 旨在提供情感陪伴的文本生成服务,公司目前已完成 Pre-A 轮融资。

黄明烈本人是自然语言生成领域的资深专家,清华大学计算机科学与技术系长聘副教授,国家杰出青年科学基金获得者,智能技术与系统实验室副主任。研究兴趣主要集中在人工智能、深度学习、强化学习,自然语言处理如自动问答、对话系统、情感与情绪智能等。已超过 100 篇 CCF A / B 类论文发表在 ACL、IJCAI、AAAI、EMNLP、KDD、ACM TOIS、TASLP、TKDE 等国际顶级或主流会议及期刊上。

清华大学 NLP 实验室的孙茂松、刘知远团队

从 NLP 的学科方向上看,清华系孙茂松、刘知远团队算其中一股中坚力量,来自清华自然语言处理与社会人文计算实验室(THUNLP)。THUNLP 成立于上世纪 70 年代的实验室,牵头人是国内 NLP 研究领域的泰斗黄昌宁。

清华大学自然语言处理与社会人文计算实验室(THUNLP),是国内最早开展 NLP 研究、且极具影响力的科研单位。实验室于 20 世纪 70 年代末成立之初,由中国 NLP 开山人物黄昌宁带领,ACL Fellow 孙茂松是他的学生,刘知远则是孙茂松的学生。

在语言大模型方面,孙茂松、刘知远团队从 2018 年跟进预训练范式,2019 年初发布了 ERNIE 语言模型(与同时期百度版 ERNIE 同名),之后研发了 CPM 模型,是智源研究院「悟道・文源」的前身。

2021 年底,该团队发布了机器中文语言能力评测基准“智源指数”(CUGE),以评测和推动中文 NLP 的发展。一个是 AI 写诗模型“九歌”,训练过程中学习了 80 万首中国古诗;另一个是语言表征模型 ERNIE(和百度文心大模型同名),可与当时任务最优的 BERT 媲美。

深言科技

孙茂松、刘知远及其门下毕业的学生,在 NLP 和大模型领域已孵化了多个公司。其中就包括岂凡超于 2022 年成立的深言科技,致力于以自研中文大模型构建工业级中文信息处理引擎。

2019 年,清华大学自然语言处理实验室(THUNLP)研制出一款名为 WantWords 的反向词典,能够根据语义描述查找词语,可用于写作辅助等多个场景;2021 年 11 月,这款应用突然在微博爆红,多次挤爆了服务器;2022 年 5 月,基于语义的名言名句检索系统 WantQuotes 上线,截至去年 8 月,WantWords 和 WantQuotes 已有超 200 万用户。

这支团队就是深言科技的前身,目前当初研发这款应用的几位同学目前已毕业,并和他们的导师孙茂松教授一同创办了创业公司深言科技(DeepLang AI),公司成立之初即获得一线 VC 千万元级投资。

深言科技的 CEO 岂凡超在人工智能和自然语言处理领域的国际刊物发表论文近 30 篇,申请专利十余项。目前,深言科技团队的核心成员主要由清华大学的博士、硕士组成,并由孙茂松教授领衔担任首席科学家。

循环智能

在这次激烈的大模型“军备竞赛”中,不乏履历光鲜的 90 后创业者出现,首屈一指的就是循环智能联合创始人杨植麟。

杨植麟本科就读于清华大学计算机系,师从 IEEE Fellow 唐杰,2015 年以年级第一名的优异成绩毕业;随后,赴自然语言处理(NLP)研究全球排名第一的卡内基梅隆大学语言技术研究所(LTI)攻读博士,师从苹果 AI 研究负责人 Ruslan Salakhutdinov 和谷歌首席科学家 William Cohen,4 年即拿下博士学位。

博士期间,他与图灵奖得主 Yoshua Bengio 合作发布「火锅问答」数据集 HotpotQA,又以一作身份发表的 XLNet 与 Transformer-XL 在 NLP 领域产生重要影响,成为 NeurIPS 2019 与 ACL 2019 的最高引论文之一,谷歌学术引用次数直接破万……

这位 90 后创业者不仅学术履历优秀,在产业界的表现也可圈可点。2016 年,杨植麟创立循环智能,公司主要业务是运用 NLP、语音、多模态、大模型等人工智能技术打造“销售科技”方案。与此同时,智谱 AI 和清华研究团队的多个 AI 项目由他主导,例如华为的“盘古”大模型也是杨植麟团队和华为云联合推出的。

目前,循环智能已进行到 B 轮融资,并连续三年实现了超 200% 的营收增长。

复旦邱锡鹏教授团队

2 月 20 日,复旦大学自然语言处理实验室的邱锡鹏教授团队携上海人工智能实验室发布“国内第一个对话式大型语言模型 MOSS”,它是一种类似于 ChatGPT 的对话聊天机器人或语言模型,可以执行各种功能,例如给出答案、生成对话、编写代码等。邱锡鹏教授介绍,对话式大型语言模型 MOSS 大概有 200 亿参数。

据介绍,未来,MOSS 的优化将会围绕三方面展开:团队会准备更高质量的中文数据;会开放接口,让 MOSS 与人类进行对话,收集更多的对话数据;同时,团队还会进一步加大投入,扩大其参数规模。

邱锡鹏教授为自然语言处理领域的资深学者,曾主导开发 NLP 工具 FudanNLP, 团队主要研究方向为自然语言处理和深度学习。目前,邱锡鹏与他的 MOSS 团队 ——8 位年轻的复旦学生,正紧锣密鼓地开展内测和迭代工作。

三、大厂派

百度

3 月 16 日,百度启动基于百度新一代大语言模型的生成式 AI 产品“文心一言”的邀请测试,使用场景主要包含文学创作、商业文案创作、数理推算、中文理解和多模态生成。

目前来看,“文心一言”的基础能力还算扎实,具备文学创作能力,可以进行总结、分析、内容、检索,延伸至检索增强。只是,从当前的测试状态来看,不乏“翻车现场”,达到的效果并不算是完美。

百度一直坚持压强式、马拉松式的研发投入。百度高额的研发投入主要集中在 AI 领域,自 2012 年成立 AI 部门开始百度在十年里累计投入到 AI 方面的研发费用超过了 1000 亿元,是全球大厂中极少数具有能支撑训练大语言模型的公司。

从算力、算法到数据,从高端芯片昆仑芯,到飞桨深度学习框架,百度在各个层面都早有关键自研技术,给百度文心一言提供了一定的研发投入壁垒。

华为

2021 年 4 月,盘古大模型正式对外发布。其中盘古 NLP 大模型是业界首个千亿参数的中文预训练大模型,在 CLUE 打榜中实现了业界领先。为了训练 NLP 大模型,团队在训练过程中使用了 40TB 的文本数据,包含了大量的通用知识与行业经验。

3 月 27 日有消息传出,华为盘古大模型 4 月将发布,将对标 CHATGPT,同样达到千亿级参数量,是全球最大的中文语言 AI 训练大模型,由华为与鹏城实验室联合开发,鹏城云脑二期提供算力底座。

华为这方面的核心人物,是国际欧亚科学院院士、IEEE Fellow、华为云人工智能领域首席科学家田奇。加入华为之前,田奇已经是业界知名的 AI 领域学者。他是美国伊利诺伊大学香槟分校博士、IEEE Fellow,也是原德州大学圣安东尼奥分校计算机系正教授。在高校任教 17 年之后,带着学术界的前沿思考和科研成果,田奇与团队来到了产业一线。

腾讯

AI 大模型方面,腾讯表示正大力投入人工智能与云基础设施建设,腾讯混元 AI 大模型覆盖 NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业与领域模型,还推出了万亿中文 NLP 预训练模型。

2022 年 4 月,腾讯首次对外披露 HunYuan 大模型研发进展 —HunYuan 集 CV、NLP、多模态理解能力于一体,先后在 MSR-VTT、MSVD 等五大权威数据集榜单中登顶。

2022 年 5 月,“混元”在国际公认的 CLUE 三个榜单同时登顶,一举打破三项纪录。去年年底,腾讯 HunYuan 进一步推出国内首个低成本、可落地的 NLP 万亿大模型,并再次登顶自然语言理解任务榜单 CLUE。

据悉,HunYuan 是业界首个可在工业界海量业务场景直接落地应用的万亿 NLP 大模型,最快用 256 张卡,1 天内就能训练完成,成本直接降至原来的 1/8。

阿里达摩院

AI 大模型方面,据阿里研究院公布的信息显示,达摩院在 2020 年初启动中文多模态预训练模型 M6 项目,同年 6 月推出 3 亿参数的基础模型;2021 年 1 月模型参数规模到达百亿;2021 年 5 月,具有万亿参数规模的模型正式投入使用;2020 年 10 月,M6 的参数规模扩展到 10 万亿,成为当时全球最大的 AI 预训练模型。

M6 于 2021 年 3 月首次发布,后来通过 480 块 GPU 更迭至万亿参数,并成功在 10 天内训练出 10 万亿模型,其参数规模与 GPT-3 相当,但能耗仅为其 1%。

阿里云曾表示,M6 已在超 40 个场景中应用,日调用量上亿。在阿里云内部,M6 大模型的应用包括但不限于在犀牛智造为品牌设计的服饰已在淘宝上线、为天猫虚拟主播创作剧本,以及增进淘宝、支付宝等平台的搜索及内容认知精度等,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等前景中落地。

M6 的负责人为杨红霞,据公开资料,杨红霞 2007 年本科毕业于南开大学,获统计学学士学位。其后她去往美国杜克大学统计科学系攻读博士学位,师从 David Dunson 教授。博士毕业后,先入职 IBM 全球研发中心任 Watson 研究员,之后入职雅虎公司担任首席数据科学家。杨红霞在人工智能领域国际会议、顶级期刊有上百篇顶级论文。

不过,3 月 22 日有消息传出,阿里巴巴的语言生成大模型 M6 的原带头人杨红霞已加入字节跳动 AI Lab,担任语言生成大模型的研发领导。

字节跳动

据媒体消息,字节跳动方面正在大模型方面布局、在语言与图像模态方面发力。字节跳动相关技术负责人表示,技术中台在这些领域的探索仍处于初期,尚未成熟。

报道称,语言大模型团队由字节搜索部门领导,目前规模在十数人左右;图片大模型团队由产品研发与工程架构部下属的智能创作团队牵头。

知情人士表示,字节跳动语言大模型团队在今年组建,探索方向主要为与搜索、广告等下游业务的结合,语言大模型团队的预期是在今年年中推出大模型。

科大讯飞

科大讯飞于 2022 年 12 月份启动生成式预训练大模型“1+N”任务攻关,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。

公开资料披露,科大讯飞类 ChatGPT 技术将在今年 5 月落地公司 AI 学习机产品中。

科大讯飞在教育、医疗、司法等不同行业多年的规模化应用积累了超过 50TB 的行业语料和每天超 10 亿人次用户交互数据,为训练实现达到人类专家水平的行业认知大模型提供了海量行业文本语料和用户反馈数据,也为基于大模型的创新应用研发和试点推广提供了场景保障。

结语:

1769 年,英国人瓦特改良的蒸汽机掀开了热力时代的序幕。今天,伴随 AI 算量需求急剧增加,倒逼传统计算架构加速革新,算力时代已经悄然开启。

未来,AI 大模型技术的影响力,有可能接近印刷术,蒸汽机,电力,芯片,互联网,其所带来的巨大颠覆性,可能引领人类社会整个技术发展产生跃迁,结果是会导致人类经济产生非线性的跃迁。

诱人的前景下,也是指数级上升的入场难度。

首先,高算力就代表着高成本,意味着 AI 2.0 时代创业的绝对高门槛,没有雄厚的资金支撑根本无法承担 AI 训练的费用,这也预示着进场船票非常难得,非大厂和明星创业者团队,几乎没有跑完全程的希望。

同时,AI 2.0 创业对技术有了更严苛的要求。有投资人向《态℃》栏目透露,市面上但凡能做底层的模型,不管是去做语言大模型的,还是去做强化学习的,只要以技术见长,以工程化产品化的思维做底层模型的公司,真正有技术水平的创业公司,国内尚不超过十家。

最后,AI 大模型顶级的技术人才是更为稀缺的资源。大佬们下场,打的第一场仗就是抢人,毕竟国内真正主导开发深度学习框架、人工智能框架的顶尖技术大牛少之又少,优秀人才可谓可遇不可求。

这场诸神之战,最终谁将脱颖而出引领下一个时代?对于中国科技公司,距离终点仍有漫长的道路要摸索、攀登。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12534.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Chat的提问工程师,要上线了你慌不慌?

一、什么是Prompt? (1)Prompt的概念 我们在使用GPT的时候,给GPT发送的消息就是Prompt. 例如,当我们问ChatGPT"WPS是什么软件?"时: 其中,"WPS是什么软件?"这句话就是Prompt. (2)为什么要学习Prompt? Prompt是我们和GPT交流的方式,我们需要让GPT了解…

前端已死?全栈当立?取法于中,仅得其下。

开篇明义,前端已死?根本就是扯淡。前端技术精微渊深,驳杂宽广,除了基础的 HTML、CSS 和 JavaScript 技术外,前端技术还涉及到许多其他相关技术和工具,比如前端框架、UI 库、自动化构建工具、代码管理工具等…

我发现ChatGPT的一个规律,只要向他确认它就可能否定自己先前的回答

今年以来ChatGPT火爆了,我也经常使用它来做一些文案优化,很多时候确实挺聪明的。 例如: 我的问题:玉皇大帝住平流层还是对流层 它的回答:玉皇大帝是道教中的神明,关于他的居住地在道教经典中并没有明确的…

985本科生虽然水,但学历还是很管用!

原文链接: https://www.zhihu.com/question/354234322 01 前言 最近网上有个话题比较有争议:「为什么有些 985、211 的本科学生即使在大学里混得很水,在找工作时学历却那么管用?」考上了重点大学,就真的能够高枕无忧了…

Stable Diffusion云端部署只需三步, 不吃电脑配置, 模型快速部署

牙叔教程 简单易懂 我是小白, 小白跟我一步一步做就可以了, 鼠标点两下就OK了, 学点新东西, 好吗? 不想学的就走吧, 离我远点. Stable Diffusion是什么 Stable diffusion是一个基于Latent Diffusion Models(潜在扩散模型,LDMs)的文图生成…

ChatGLM-6B的P-Tuning微调详细步骤及结果验证

文章目录 1. ChatGLM-6B 1.1 P-Tuning v2简介 2. 运行环境 2.1 项目准备 3.数据准备4.使用P-Tuning v2对ChatGLM-6B微调5. 模型评估6. 利用微调后的模型进行验证 6.1 微调后的模型6.2 原始ChatGLM-6B模型6.3 结果对比 1. ChatGLM-6B ChatGLM-6B仓库地址:https://g…

源码中常见的 where 1=1 是一种高级优化技巧?

你是否曾在 SELECT 查询中看到过 WHERE 11 条件。我在许多不同的查询和许多 SQL 引擎中都有看过。这条件显然意味着 WHERE TRUE,所以它只是返回与没有 WHERE 子句时相同的查询结果。此外,由于查询优化器几乎肯定会删除它,因此对查询执行时间没…

启动您的 MySQL 查询:ChatGPT 如何帮助您检索 MySQL 数据

本文涉及到的相关软件,dbForge Studio for MySQL和ChatGPT,在您尝操作前,请务必先确保两个程序都正常运作哦,废话不多说,开始上干货! Devart 提供包括Oracle、SQL Server、MySQL、PostgreSQL、InterBase以及Firebird在…

ChatGPT与深度学习的完美融合:打造智能化推荐系统新时代

PNN | AutoRec | 推荐算法 NFM | ChatGPT | 深度学习 新技术如ChatGPT、LLM、AIGC等的兴起,使推荐系统拥有更强的学习和预测能力。然而,推荐算法仍然是深度学习推荐系统中不可或缺的关键技术。推荐算法和这些技术应相辅相成,相互补充。推荐…

为什么有些 985 的本科学生即使在大学里混得很水,在找工作时学历却那么管用?...

大家好,我是老赵 最近网上有个话题比较有争议:「为什么有些 985、211 的本科学生即使在大学里混得很水,在找工作时学历却那么管用?」考上了重点大学,就真的能够高枕无忧了吗?让我们一起来了解一下吧。 我做…

如何使用租用的云服务器实现神经网络训练过程(超详细教程,新手小白适用)

超级感谢up主7_xun的B站教学视频:适合深度学习小白的CV实战——在AutoDL上租用云服务器跑YOLOv5的全过程 链接:https://www.bilibili.com/video/BV1jA4y1o7Ph/?spm_id_from333.1007.top_right_bar_window_history.content.click&vd_sourcee482aea0f…

FBEC大会 | 全球元宇宙CEO峰会演讲干货汇总

2023年2月24日,由广东省游戏产业协会、深圳市互联网文化市场协会指导,陀螺科技主办的FBEC未来商业生态链接大会,在深圳福田大中华喜来登酒店6楼宴会厅盛大召开! FBEC大会以“勇毅前行逐光而上”为主题,以具有行业前瞻洞…

GPT-4老板称害怕ChatGPT/ 李彦宏:文心一言符合预期/ 马斯克欠账不还…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是3月20日星期一,又是元气满满的一周。 经历了上一周GPT-4带来的疯狂,科技圈又发生了哪些新鲜事,一起来和日报君看看~ 李彦宏回应外界对文心一言反馈 这两天&…

芯片架构标准首次由中国企业牵头/ 周鸿祎建议大学生做AI训练师/ 港科大不禁ChatGPT…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 工作日最后一天,明天就能尽情嗨皮了~ 今天科技圈都有哪些大事,一起来和日报君康康吧。 周鸿祎称大学生可做人工智能训练师 训练AI,在数据知识标注方面还有所欠缺? 周鸿祎直接…

ChatGPT吸走谷歌人才,谷歌云CEO:AI新游戏刚开场,莫慌

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT搜索被微软抢先一步,内部AI人才又被OpenAI频繁挖角。 最近的谷歌,着实有些内忧外患。 最新曝出的信息是,谷歌的高管们,正在努力安抚员工们不安的情绪。 据Insider消息,…

寻找中国版ChatGPT,量子位邀你共同参与中国AIGC产业峰会

组委会 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT一声枪响,AIGC直接起飞,晋升科技圈最热话题。 问题和争论随之而来: 谁能做出中国版ChatGPT? AIGC是概念炒作,还是真正的「互联网诞生时刻」? …… 机遇与…

总价61亿,“ChatGPT之父”即将收获一个核能公司IPO|钛媒体焦点

OpenAI CEO奥特曼(Sam Altman) ▎“20世纪是碳基能源的世纪。我相信22世纪将是原子能(核能)的世纪”,OpenAI CEO奥特曼表示。 作者|林志佳 编辑|李小年 本文首发于钛媒体APP “ChatGPT之父”、O…

ChatGPT之父:OpenAI不会很快上市 因为会限制我的决策权

雷递网 乐天 6月7日 随着ChatGPT的走红,人工智能企业OpenAI及ChatGPT之父、CEO Sam Altman也炙手可热,公司何时上市,也成为外界关注点。 据外媒披露,Sam Altman参加一场活动时表示,OpenAI不会很快走向资本市场&#xf…

ChatGPT之父提新版摩尔定律!宇宙智能数量每18个月翻一番

来源:新智元 本文约2200字,建议阅读5分钟ChatGPT之父Sam Altman提出了新版摩尔定律,即宇宙中的智能数量每18个月翻一番。 [ 导读 ] 一直以来,半导体行业有自己的摩尔定律。近期,ChatGPT之父Sam Altman提出了新版摩尔定…

【思考】ChatGPT之父:被误解的力量 The Strength of Being Misunderstood

The Strength of Being Misunderstood 被误解的力量 A founder recently asked me how to stop caring what other people think. I didn’t have an answer, and after reflecting on it more, I think its the wrong question. 一位创始人最近问我如何停止关心别人的想法。我…