(图片来源:网络)
近期,背靠微软的AI语言模型ChatGPT风靡全网,以社交媒体为传播媒介,仅5天,注册用户数就超过100万,2个月破亿。随后谷歌眼红不已,匆忙召开自研AI搜索工具Bard新品发布会,可惜惨遇事业滑铁卢,直接导致股票一夜之间暴跌7000亿元,不免令人唏嘘。
一场闹剧之后,ChatGPT的关注度再次攀升。经过众多网友的连续实验,也琢磨出一些ChatGPT的优劣之处。比如除了聊天和答疑,它也擅长撰写一些作文故事,但它并不擅长数学题,甚至会给出错误答案。一旦涉及到种族、政治等敏感词汇,它也会直接拒绝回答或直接报错,严重的甚至会给予封号处理。然而,看似“无所不知”的ChatGPT在专业知识储备上,仍然有“致命”短板。譬如最前沿的量子计算,ChatGPT不仅知之甚少,甚至在知识储备上只有2021年获得的消息。作为2022年11月底上线,一跃成为当前最炙手可热的AI语言模型,这无疑是个不容忽视的巨大bug!
以下是小编与ChatGPT的对话实录:
(小编与ChatGPT的对话截图:它称自己的知识库仅限于2021年)
显然,ChatGPT的回答是有“粗制滥造”的成分在的。不仅过于笼统和简单,甚至没有任何量子计算行业代表性的数据资料和里程碑事件。而近两年数据资料的缺失,暴露出ChatGPT的数据短板,这将直接导致其基于GPT-3.5架构的对话AI模型训练与优化不够完善与精准,所以给出的答案也过于模板化。
(小编与ChatGPT的对话截图:它坦率承认自己使用相同模板“换皮”进行故事创作)
正是在ChatGPT数据缺失的近两年中,量子计算有了突飞猛进的发展,在全球范围内成果突出,从实验室研发到产业化攻坚,量子计算在超导、离子阱、光量子、中性冷原子等技术路线上均实现了技术突破,也接连诞生了不同维度的里程碑事件,可谓一日千里。
从技术突破到场景探索,量子计算领域的初创公司联合全球各行业巨头公司达成了多项“量子+”业务合作。如在汽车行业,量子计算公司Terra Quantum AG与大众汽车合作开发使用混合量子神经网络改善图像识别的新方法,离子阱量子计算上市公司IonQ与现代汽车合作利用量子计算技术推进汽车智能识别技术发展,以改进自动驾驶汽车3D目标检测安全系统的应用场景等。
经典和量子软件供应商QCI将量子计算应用于零售优化场景,为决策者们提供零售全链路优化的最佳解决方案。法国量子计算药物研发公司Qubit Pharmaceuticals将机器学习(ML)、量子计算等新算法和先进的硬件技术应用到医疗保健行业。国内稀缺的专注于光量子计算的高科技公司玻色量子与光大科技、北京量子信息科学研究院联合发布了“天工经世量子计算量化策略平台”,高速解决了金融行业的投资组合配比的优化问题。
此外,在物流、生物制药、人工智能、航空航天、模拟化学、生命科学、肿瘤学等领域也是量子计算优选的最佳探索场景,巨头公司们纷纷布局,争夺量子战略先机。
同时,继量子计算第一股IonQ在2021年上市之后,英国量子加密公司Arqit、美国全栈量子软件和硬件公司Quantum Computing Inc、量子计算机与量子集成电路开发商Rigetti Computing、加拿大量子计算公司D-Wave等在2021-2022年先后上市,整个量子计算行业也呈现着欣欣向荣之势。在2023年量子投资的“狂飙”期,加拿大光量子计算公司Xanadu、法国量子计算初创公司Welinq、法国量子计算公司PASQAL、瑞典查尔姆斯大学仅在两天内就先后宣布获得新一轮巨额融资。
(图片来源:网络)
然而,量子计算领域这两年的硕果累累,ChatGPT一无所知。其在近两年量子计算领域的数据短板同样也折射出AI狂潮下的“底层泡沫”。
在人工智能的道路探索中,可以追溯到1943年。至今已经历过起步、反思、应用、平稳、蓬勃发展五大阶段。而“人工智能”这一术语及学科的正式诞生,是在1956年的达特茅斯学院人工智能夏季研讨会上。
2011年以后,随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的技术鸿沟,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了重大的技术突破,迎来真正的爆发式增长。
尤其是在2015年,众多科技巨头纷纷下场,Microsoft Research的Kaiming He等人提出的残差网络(ResNet),谷歌开源TensorFlow框架等将人工智能的技术的应用迭代掀至高潮。同年,OpenAI也诞生了。它是一个非营利的研究组织,使命是确保通用人工智能 (即一种高度自主且在大多数具有经济价值的工作上超越人类的系统)将为全人类带来福祉。其发布的热门产品如:OpenAI Gym,GPT等。
直至2016年,AlphaGo与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜,人工智能才真正火爆全网,甚至实现了家喻户晓的盛况。
(图片来源:网络)
2020年,OpenAI开发了文字生成 (text generation) 人工智能GPT-3,它具有1,750亿个参数的自然语言深度学习模型,比以前的版本GPT-2高100倍,该模型经过了将近0.5万亿个单词的预训练,可以在多个NLP任务(答题、翻译、写文章)基准上达到最先进的性能。这也是chatGPT在聊天、答疑、以及语文学科上能力突出的核心基石。
2021年,OpenAI提出两个连接文本与图像的神经网络:DALL·E 和 CLIP。DALL·E可以基于文本直接生成图像,CLIP则能够完成图像与文本类别的匹配。一年后chatGPT正式上线。仅2个月用户量破亿,甚至引发了其系统“崩溃”,可见其深受程序猿、大学生、基层文字工作者等广大群体的喜爱,由此也刮起了一股“职业替代”的妖风。
人工智能有三个要素:数据、算力及算法,数据即是知识原料,算力及算法提供“计算智能”以学习知识并实现特定目标。由点及面,现在的chatGPT正暴露出数据量不足、算力不足支撑亿人用户量等短板,简单来说,它能取代的工作正是现在频繁登录chatGPT“抱大腿”的相关工作者,而不能取代涉及最前沿科技(如量子计算)、高级研究数据分析、跨学科多元创造力等高层次高水平工作者。
现在的人工智能就像一个5岁的孩子,以时间为尺,他和人类之间的差距会一直存在。
文:慕一
编辑:王珩