声明:本文已征得原作者:荔枝海豹,同意后转载。
原文链接:https://zhuanlan.zhihu.com/p/628494696
本文按照以下框架讲解,阅读时间大约15分钟,对技术要求能力为三颗星。
- 什么是GPT,GPT4出现之前的技术演变和发展。
- chatGPT-4官方技术文档讲解
- 关于未来的发展,作为技术从业者如何学习的建议。
1 GPT的兴起:无人不知,火遍全球
做AI的技术boy都知道,本质上来讲,模型一旦训练完成,这个模型一定没法知道最近发生的事情,而且模型也不知道时间,本质上就是模型没法获取除了训练集之外的信息,或者说,模型没法使用工具。
这里插一嘴:人和动物的主要区别是人类会开发和使用工具。
自然语言处理发展了这么多年,说实话一度我曾经认为,几乎在这个方向已经没有故事可以讲了。人工智能仿佛不符合历史发展规律,就在22年全面唱衰的情况下,23年春天3月份,由OPENAI开发的GPT模型,横空出世!
让我们把目光看到今年的时光轴
2023年03月08日:微软发布Visual ChatGPT,聊天时可以用图片,并可以根据文字对图片进行修改。
2023年03月09日:微软宣布将要发布大型多模态模型GPT4。
2023年03月09日:沉寂已久的GAN模型-10亿规模的模型GigaGAN推出。
2023年03月13日:斯坦福大学推出7B的Alpaca模型。
2023年03月14日:GPT模型推出!
2023年03月14日:谷歌公布PALM模型,API可以使用。
2023年03月14日:Anthropic介绍大型语言模型Claude,主打安全性。
2023年03月14日:Adapt.ai公布他们的模型也能够使用工具。
2023年03月14日:Midjourney推出第五代模型,可以完美处理手部细节。
2023年03月15日:pytorch2.0发布。
2023年03月16日:微软公布ChatGPT加持的Copilot。
(顺便说下,我现在编程也是非常喜欢Copilot
所以这个23年的三月,我们可以说是八仙过海各显神通!!!
普遍来讲,我们认为OpenAI发布了GPT-4,这是深度学习领域的最新里程碑。
让数据说话:
chatGPT达到1million的用户使用量,只用了不到5天,可以说是,爆火!!现象级!
那到底什么是GPT?
GPT-4是一个大型多模态模型(Large Multimodal Model),能够接受图像和文本输入,并输出文本。 OpenAI首先发布了GPT-4的文本输入功能,图像输入功能敬请期待。
实验表明,GPT-4 在各种专业和学术考试中表现出了与人类水平相当的性能(human-level performance)。例如,它通过了模拟律师考试,且分数在应试者的前 10% 左右;相比之下,GPT-3.5 的得分在倒数 10% 左右。
这个是官方解释,那么到这里,基本上我们就明白了,
GPT的基础知识框架,仍然在我们的理解范围之内。但是两个技术从此走进了我们的视角:
大语言模型与多模态。