文章目录
- 前言
- 一、openai 的API key 无法调用chatGPT
- 二、目前openai开放允许api调用的模型
- 三、chatGPT是什么
- 四、text-davinci-003模型也可以用
- 总结
前言
随着chatGPT火爆了这么久,网上也有了很多私有化部署chatGPT、微信集成chatGPT类型的文章,但是就截止目前看来,很多人的方法都只是在用openai官方推出的text-davinci系列的模型,而不是调用chatGTP模型!
一、openai 的API key 无法调用chatGPT
验证这个结论很简单,官方其实在Help中明确说了“It is not available in the API”。所以说所有通过api调用的方式部署“chatGPT”的那肯定不是的不是chatGPT。
而他们说的“chatGPT”其实是openai开放出来的,基于GPT3的davinci系列中综合能力最强的模型。
当然有些文章讲述的是使用acheong08大佬的开源的技术https://github.com/acheong08/ChatGPT,但是目前官方已经加上了cloudflare,通过web接口调用会被cloudflare拦截,这种方式实现几乎也不可能了。
二、目前openai开放允许api调用的模型
参照官方文档:https://platform.openai.com/docs/models/overview
文档上对于开放了哪些模型,每个模型的特效都已经说的非常清楚了,从头到尾也没提过chatGPT。这时候可能有人要说chatGPT可能是基于text-davinci系列的,或者说web端的chatGPT后面其实是有多个专业模型在支撑,把问题按专业分类后发给对应的模型,那我们就来探究下chatGTP到底是什么?
三、chatGPT是什么
先说结论,chatGTP是一个单独的模型。参考:
https://www.reddit.com/r/OpenAI/comments/zdrnsf/difference_between_chatgpt_and_the_new_davinci_3/
https://arxiv.org/abs/2203.02155
ChatGPT是基于InstructGPT微调而来的模型,而InstructGPT也是类似text-davinci-003的模型,InstructGPT虽然来源于GTP3,但他的训练方式是有所不同的,所以尽管参数少 100 倍参数,效果也是优于GTP3的。
所以ChatGPT和text-davinci-003可以说是走的完全2个不同的训练模式,自然更不用说存在继承关系了。所以web上的chatGPT后面的必然用的就是chatGPT模型,不可能是其他的模型。甚至你问chatGTP自己,它会强调它是独立的一个model,它甚至与InstructGPT划清了界限!
而当你问它如何调用它时,它会生成一段调用text-davinci-002的代码,有点哭笑不得~
四、text-davinci-003模型也可以用
本文也只是想说清楚text-davinci-003模型和chatGPT的区别,防止很多想要集成chatGPT,按照网上的文档一顿操作,然后发现效果为什么就没有web上的好呢?其实text-davinci-003模型也是比较好用的,但是还需要结合你的使用场景去调整启动参数,这样效果会比直接启动显得更聪明。
调参前:
调参后:
chatGPT:
总结
所以就目前而言,应该是没有现成的方法可以绕过web直接调用chatGTP模型的方法。(当然用模拟器就另说了,这种很麻烦)所以可以严谨一点,以防误导更多人。