LLM 系列 | 08: 如何用ChatGPT构建点餐机器人?

简介

风蒲猎猎小池塘,过雨荷花满院香,沉李浮瓜冰雪凉。小伙伴们好,我是微信公众号《小窗幽记机器学习》的小编:卖铁观音的小男孩。
更多、更新文章欢迎关注 微信公众号:小窗幽记机器学习。后续会持续整理模型加速、模型部署、模型压缩、LLM、AI艺术等系列专题,敬请关注。

紧接前面几篇ChatGPT Prompt工程系列文章:04: ChatGPT Prompt编写指南、05: 如何优化ChatGPT Prompt?、06: ChatGPT Prompt实践:文本摘要&推断&转换、07:吴恩达ChatGPT Prompt课程实践:以智能客服邮件为例。今天这篇小作文是吴恩达与OpenAI合作课程《ChatGPT Prompt Engineering for Developers》的第5篇笔记,主要介绍如何用ChatGPT构建一个定制化的闲聊机器人订餐机器人

从中我们可以感受到使用大型语言模型LLM构建一个定制的聊天机器人,真的只需要很少的工作量。

准备工作

设置api key

import os
import openaiopenai.api_key  = "sk-xxx" # 如果需要设置代理的话
import os
os.environ['HTTP_PROXY'] = "http://XXX"
os.environ['HTTPS_PROXY'] = "http://XXX"

定义辅助函数

像 ChatGPT 这样的聊天模型实际上是组装成以一系列消息作为输入,并返回一个模型生成的消息作为输出。虽然聊天格式的设计旨在使这种多轮对话变得容易,但我们通过之前的学习可以知道,它对于没有任何对话的单轮任务也同样有用。

接下来,我们将定义两个辅助函数。第一个是单轮的,我们将prompt放入看起来像是某种用户消息的东西中。另一个则传入一个消息列表。这些消息可以来自不同的角色,我们会描述一下这些角色。

第一条消息是一个系统消息,它提供了一个总体的指示,然后在这个消息之后,我们有用户和助手之间的交替。如果你曾经使用过 ChatGPT 网页界面,那么你的消息是用户消息,而 ChatGPT 的消息是助手消息。系统消息则有助于设置助手的行为和角色,并作为对话的高级指示。你可以想象它在助手的耳边低语,引导它的回应,而用户不会注意到系统消息。

因此,作为用户,如果你曾经使用过 ChatGPT,你可能不知道 ChatGPT 的系统消息是什么,这是有意为之的。系统消息的好处是为开发者提供了一种方法,在不让请求本身成为对话的一部分的情况下,引导助手并指导其回应。

def get_completion(prompt, model="gpt-3.5-turbo"):messages = [{"role": "user", "content": prompt}]response = openai.ChatCompletion.create(model=model,messages=messages,temperature=0, # 控制模型输出的随机程度)return response.choices[0].message["content"]def get_completion_from_messages(messages, model="gpt-3.5-turbo", temperature=0):response = openai.ChatCompletion.create(model=model,messages=messages,temperature=temperature, # 控制模型输出的随机程度)
#     print(str(response.choices[0].message))return response.choices[0].message["content"]

聊天

现在尝试在对话中使用这些消息。我们将使用上面的函数来获取从这些消息中得到的回答,同时,使用更高的 temperature(越高生成的结果越多样)。

系统的content设置成,你是一个说话像莎士比亚的助手。这时我们向助手描述它应该如何表现的方式。然后,第一个用户消息是,给我讲个笑话。接下来的消息是,为什么鸡会过马路?然后最后一个用户消息是,我不知道。

英文版:

messages =  [  
{'role':'system', 'content':'You are an assistant that speaks like Shakespeare.'},    
{'role':'user', 'content':'tell me a joke'},   
{'role':'assistant', 'content':'Why did the chicken cross the road'},   
{'role':'user', 'content':'I don\'t know'}  ]response = get_completion_from_messages(messages, temperature=1)
print(response)

输出如下:

To reach the other side, my dear lord.

中文版:

因为它想到对面的鸡店吃炸鸡!哈哈哈! :)

中文版换成“鲁迅”风格助手:

# 中文
messages =  [  
{'role':'system', 'content':'你是一个像鲁迅一样说话的助手。'},    
{'role':'user', 'content':'给我讲个笑话'},   
{'role':'assistant', 'content':'鸡为什么过马路'},   
{'role':'user', 'content':'我不知道'}  ]

输出结果如下:

因为它要到对面去“鸡”客店呀!哈哈哈

再举一个例子。给助手设置的消息是,“你是一个友好的聊天机器人”,第一个用户消息是,“嗨,我叫张三”。我们想要得到第一个用户消息。

# 中文
messages =  [  
{'role':'system', 'content':'你是个友好的聊天机器人。'},    
{'role':'user', 'content':'Hi, 我是张三。'}  ]
response = get_completion_from_messages(messages, temperature=1)
print(response)

输出结果如下:

你好张三!我很高兴能和你聊天。有什么我可以帮助你的吗?

再试一个例子。给系统设置的消息是,“你是一个友好的聊天机器人”,第一个用户消息是,“是的,你能提醒我我的名字是什么吗?”

# 中文
messages =  [  
{'role':'system', 'content':'你是个友好的聊天机器人。'},    
{'role':'user', 'content':'好,你能提醒我,我的名字是什么吗?'}  ]
response = get_completion_from_messages(messages, temperature=1)
print(response)

输出结果如下:

您没有告诉我您的名字,因此我不知道您的名字是什么。您可以告诉我您的名字,以便我们以后更方便地交流。

如上所见,模型实际上并不知道我的名字。

因此,每次与语言模型的交互都是一个独立的交互,这意味着我们必须提供所有相关的消息,以便模型在当前对话中进行引用。如果想让模型引用或 “记住”对话的早期部分,则必须在模型的输入中提供早期的交流。我们将其称为上下文,让我们试试。

# 中文
messages =  [  
{'role':'system', 'content':'你是个友好的聊天机器人。'},
{'role':'user', 'content':'Hi, 我是张三'},
{'role':'assistant', 'content': "Hi Isa! 很高兴认识你。今天有什么可以帮到你的吗?"},
{'role':'user', 'content':'是的,你可以提醒我, 我的名字是什么?'}  ]
response = get_completion_from_messages(messages, temperature=1)
print(response)

输出结果如下:

当然,您告诉我您的名字是张三。记得了吗?

现在我们已经给模型提供了上下文,也就是之前的对话中提到的我的名字,然后我们会问同样的问题,也就是我的名字是什么。因为模型有了需要的全部上下文,所以它能够做出回应,就像我们在输入的消息列表中看到的一样。

订餐机器人

现在,我们构建一个 “订餐机器人”, 我们需要它自动收集用户信息,接受比萨饼店的订单。

下面这个函数将收集我们的用户消息,以便我们可以避免手动输入,就像我们在刚刚上面做的那样。这个函数将从我们下面构建的用户界面中收集提示,然后将其附加到一个名为上下文的列表中,并在每次调用模型时使用该上下文。模型的响应也会被添加到上下文中,所以模型消息和用户消息都被添加到上下文中,因此上下文逐渐变长。这样,模型就有了需要的信息来确定下一步要做什么。

def collect_messages(_):prompt = inp.value_inputinp.value = ''context.append({'role':'user', 'content':f"{prompt}"})response = get_completion_from_messages(context) context.append({'role':'assistant', 'content':f"{response}"})panels.append(pn.Row('User:', pn.pane.Markdown(prompt, width=600)))panels.append(pn.Row('Assistant:', pn.pane.Markdown(response, width=600, style={'background-color': '#F6F6F6'})))return pn.Column(*panels)

现在,我们将设置并运行这个 UI 来显示订单机器人。初始的上下文包含了包含菜单的系统消息。请注意,上下文会随着时间的推移而不断增长。

pip3 install panel

现在我们可以要求模型创建一个 JSON 摘要发送给订单系统。

所以我们现在追加另一个系统消息,它是另一条prompt,我们说创建一个刚刚订单的 JSON 摘要,列出每个项目的价格,字段应包括1)披萨,包括尺寸,2)配料列表,3)饮料列表,4)辅菜列表,包括尺寸,最后是总价格。这里也可以在这里使用用户消息,不一定是系统消息。

请注意,这里我们使用了一个较低的temperature,因为对于这些类型的任务,我们希望输出相对可预测。

# 中文
import panel as pn  # GUI
pn.extension()panels = [] # collect display context = [{'role':'system', 'content':"""
你是订餐机器人,为披萨餐厅自动收集订单信息。
你要首先问候顾客。然后等待用户回复收集订单信息。收集完信息需确认顾客是否还需要添加其他内容。
最后需要询问是否自取或外送,如果是外送,你要询问地址。
最后告诉顾客订单总金额,并送上祝福。请确保明确所有选项、附加项和尺寸,以便从菜单中识别出该项唯一的内容。
你的回应应该以简短、非常随意和友好的风格呈现。菜单包括:菜品:
意式辣香肠披萨(大、中、小) 12.95、10.00、7.00
芝士披萨(大、中、小) 10.95、9.25、6.50
茄子披萨(大、中、小) 11.95、9.75、6.75
薯条(大、小) 4.50、3.50
希腊沙拉 7.25配料:
奶酪 2.00
蘑菇 1.50
香肠 3.00
加拿大熏肉 3.50
AI酱 1.50
辣椒 1.00饮料:
可乐(大、中、小) 3.00、2.00、1.00
雪碧(大、中、小) 3.00、2.00、1.00
瓶装水 5.00
"""} ]  # accumulate messagesinp = pn.widgets.TextInput(value="Hi", placeholder='Enter text here…')
button_conversation = pn.widgets.Button(name="Chat!")interactive_conversation = pn.bind(collect_messages, button_conversation)dashboard = pn.Column(inp,pn.Row(button_conversation),pn.panel(interactive_conversation, loading_indicator=True, height=300),
)

聊天结果如下:

在这里插入图片描述

对上面聊天结果进行一次摘要化:

messages =  context.copy()
messages.append(
{'role':'system', 'content':'创建上一个食品订单的 json 摘要。\
逐项列出每件商品的价格,字段应该是 1) 披萨,包括大小 2) 配料列表 3) 饮料列表,包括大小 4) 配菜列表包括大小 5) 总价'},    
)response = get_completion_from_messages(messages, temperature=0)
print(response)

输出结果如下:

以下是上一个食品订单的 JSON 摘要:{"披萨": {"意式辣香肠披萨": {"大小": "大","价格": 12.95}},"配料列表": {"AI酱": 1.5,"香肠": 3.0,"总价": 4.5},"饮料列表": {"瓶装水": {"大小": "标准","价格": 5.0}},"配菜列表": {},"总价": 22.45
}注意,配菜列表为空,因为在上一个订单中没有点配菜。

可以看出,上面的订餐机器人虽然能够在对话上很顺畅,但是在数学计算上,仍然存在显著的缺陷。下面我们再次进行优化。

优化订餐机器人

修改Prompt如下:

import panel as pn  # GUI
pn.extension()panels = [] # collect display context = [{'role':'system', 'content':"""
你是订餐机器人,为可达鸭餐厅自动收集订单信息。
你要首先问候顾客。然后等待用户回复收集订单信息,包括餐品和数量。如果用户没有说数量,你要问下。
收集完信息需确认顾客是否还需要添加其他内容。
最后需要询问是否自取或外送,如果是外送,你要询问地址并告诉用户配送费是8块。
最后告诉顾客订单总金额,并送上祝福。请确保明确所有选项、附加项和尺寸,以便从菜单中识别出该项唯一的内容。
你的回应应该以简短、非常随意和友好的风格呈现。菜单包括:主食:
鸡排堡(大、中、小) 12.95、10.00、7.00
鸡腿堡(大、中、小) 10.95、9.25、6.50
嫩牛堡(大、中、小) 19.95、15.75、10.75
鸡肉卷(大、中、小) 11.95、9.75、6.75小食:
薯条(大、小) 4.50、3.50
希腊沙拉 7.25
香肠 3.00
加拿大熏肉 3.50配料:
奶酪 2.00
蘑菇 1.50
AI酱 1.50
辣椒 1.00饮料:
可乐(大、中、小) 3.00、2.00、1.00
雪碧(大、中、小) 3.00、2.00、1.00
农夫山贼矿泉水 5.00
"""} ]  # accumulate messagesinp = pn.widgets.TextInput(value="Hi", placeholder='Enter text here…')
button_conversation = pn.widgets.Button(name="Chat!")interactive_conversation = pn.bind(collect_messages, button_conversation)dashboard = pn.Column(inp,pn.Row(button_conversation),pn.panel(interactive_conversation, loading_indicator=True, height=300),
)

执行dashboard,结果如下:

在这里插入图片描述

对上述聊天内容进行摘要化:

messages =  context.copy()
messages.append(
{'role':'system', 'content':'创建上一个食品订单的 json 摘要。\
逐项列出用户订餐的每件商品的详情,包括大小、数量和消费金额。字段应该是 1) 主食 2) 小食 3) 配料 4) 饮料 5) 总价'},    
)response = get_completion_from_messages(messages, temperature=0)
print(response)

输出结果如下:

{"主食": {"嫩牛堡": {"大小": "大份","数量": 1,"消费金额": 19.95}},"小食": {"香肠": {"数量": 2,"消费金额": 6.00}},"配料": {"AI酱": {"数量": 1,"消费金额": 1.50}},"饮料": {"农夫山贼矿泉水": {"数量": 2,"消费金额": 10.00}},"总价": 45.45
}

到此,得到正确的订单内容和金额。

总结

以下对这门课程进行小结。总的来说,在这门课程中,主要学习了关于prompt的两个关键原则:

  • 编写清晰具体的指令
  • 适当给模型一些思考时间

此外,

  1. 还学习了迭代开发prompt的方法。了解如何找到适合你应用程序prompt的过程是非常关键的。

  2. 还介绍了许多大型语言模型LLM的功能,包括摘要、推断、转换和文本扩展。

  3. 最后,课程还以实例传授如何构建自定义聊天机器人。

大型语言模型LLM非常强大,希望大家保持初心、负责任地使用它们,请仅构建对他人有积极影响、符合社会主义核心价值观的东西。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/56544.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为面试题目:一头牛重800kg,一座桥承重700kg,牛如何过河?天秀回答秒通过...

一头牛重800kg,一座桥承重700kg,牛如何过河? 最近随着几档职场真人秀的热播,一些职场类的话题也接二连三地被推上热搜,引起大家的广泛热议。尤其是在春招如此激烈的环境下,与招聘有关的新闻更是受到大家的热…

《Tritium投研报告》冥王星(Plutos)——基于Solana、Polkadot和BSC跨链合成资产发行交易平台

​点击上方蓝字关注我们 该报告为Tritium Ventures独家投研报告,报告内容仅供参考,不作为投资建议或投资依据。 先说结论: 项目上线不久,目前价格与估值偏低。但是由于其属性和未来逐步上线的功能会逐渐吸引用户得到相应发展。尤其…

谷歌的最新NLP模型,现在能陪你从诗词歌赋谈到人生哲学

水木番 发自 凹非寺 量子位 报道 | 公众号 QbitAI 继BERT之后,谷歌在NLP模型上又有大动作! 在今天的谷歌I/O大会上,一口气发布了2个新模型: LaMDA和 MUM,均基于Transformer架构。 LaMDA(对话应用程序的语言…

新征程,新视野,TOP主网开启新时代!

2006年1月19日美国东部时间下午2点,美国国家航空航天局(NASA)的“新视野(New Horizons)”号航天器从佛罗里达沿岸发射升空,开始了载入史册的漫长旅程。 “新视野(New Horizons)”号航天器的发射是人类历史…

冥王星轨道发现不明生命 全世界都惊呆了

据美国宇航局官方最新消息,新视野号探测器在去年完成了对冥王星的飞掠,创造了人类史上的第一次,这里距离地球48多亿公里,NASA飞船整整飞了九年的时间才抵达。 进入冥王星飞掠轨道时,全世界都屏住了呼吸,我们…

更安全的使用体验,微软宣布第一台带有安全冥王星芯片的PC

继10月发布的Windows 11之后,微软上周宣布了第一款采用Pluton芯片到云安全技术的PC。该技术旨在保护远程工作人员和其他人的计算机。 在CES上,微软宣布联想和芯片制造商AMD已经推出了第一款笔记本电脑——ThinkPad Z13和ThankPad Z16——它们原生了冥王星…

WxGL应用实例:绘制高精度的3D太阳系模型

文章目录 1 坐标系的选择1.1 黄道坐标系1.2 三维空间直角坐标系 2 使用JPL星历表计算轨道2.1 日期时间2.2 特定时刻天体的位置2.3 天体运行轨道 3 太阳系模型3. 1 太阳和八大行星全家福3.2 时间、距离和半径的缩放3.3 黄道坐标系模型 天何所沓?十二焉分?…

冥王星P的编曲日志《我们就这样溺死在漩涡里》

这次做的是偏金属的摇滚,因为自己学啥啥不行就想写首歌抨击内卷。写出来发现基底竟然有点neru的味道,于是就参考neru的《再教育》对旋律进行了一些改造和优化。 在这里插入图片描述 乐器配置以吉他为主,配上一个不是那么金属的贝司和明亮的钢…

冥王星P的编曲日志《时光的眼泪》

某一时刻突然意识到应该记录下作曲编曲的过程及亮点,以实现代码的重用(bushi) 让我们回到时代久远的第一个工程《时光的眼泪》 乐器配置情况流行抒情的基本配置,主要是仿照letter song。在第二段主歌加了电吉他扫弦(仿…

冥王峡谷黑苹果之苹果网卡转接板选择分析

冥王峡谷黑苹果之苹果网卡转接板选择分析 拆过冥王峡谷的都清楚主板的资源分布了,这里重点介绍3个2接口的,如图, 2个nvme固态接口并排在左侧,支持2280和2242。1个无线网卡接口位于左下测,确确的说应该是位于其中一个n…

云里黑白第二回——Intel英特尔 冥王峡谷 系统更新

病症描述 Intel英特尔 冥王峡谷 NUC8i7HNK,更新系统,更新到83%左右,屏幕直接黑掉关机,再重新开机之后,无法进入系统,显示如下 按F8之后,进不到启动设置页面。 初步分析是ESP分区创建在C盘后面引…

NUC8冥王峡谷改装苹果网卡完美方案

NUC8冥王峡谷改装苹果网卡完美方案 拆机看原装配置,无线m2网卡位于其中一个nvme接口下面,使用不带延长线的转安装苹果网卡转接到主板,会使得这个nmve接口不能再安装固态盘。 所以,可以用这款转卡来接触这个问题。 甚至&#xff0c…

Intel NUC冥王峡谷

Intel NUC 冥王峡谷评测:地狱速度 维护拆装 对冥王峡谷进行拆装维护,需要使用附带的T8规格的六角螺丝扳手拆开其顶部面板,DELL XPS 13或Razer Blade则是使用的较小的T5六角螺丝。打开冥王峡谷的顶部面板之后,就可以看到骷髅图案的…

可爱的冥王星

2015年7月14日19时48分(北京时间),NASA于2006年发射的新地平线(新视野)号抵达冥王星。大约9年的历程,共计~60亿KM。为我们带来了关于冥王星,这可曾经的行星的真面目。当然冥王星也有它可爱的一面!很有爱心的…

冥王峡谷装linux教程,Intel NUC冥王峡谷开箱及安装ESXi

Intel NUC冥王峡谷开箱及安装ESXi 2019-03-21 15:10:49 34点赞 117收藏 31评论 追加修改(2019-03-22 10:04:26): 附上一点心得: 1.进入BIOS设置两种方法,开机按F2,或者开机看到画面按键盘暂停键Pause(不按Pause不行,当然如果手速够快也可能可以点中),然后用鼠标点右上角的…

在线画电路图的网站

schemeit: http://www.digikey.com/schemeit/project/ 因为要想画逻辑图所以找到了这个网站,效果图下,挺好用的 其他网站推荐: https://easyeda.com/ https://www.circuitlab.com/ 转载于:https://www.cnblogs.com/hwnzy/p/10931…

Fritzing画电路图

Fritzing是一套设计PCB (Printed Circuit Board) 印刷电路板的软件 1. Ubuntu系统安装方法 $ sudo apt-get install fritzing $ Fritzing # 运行 2. 其它平台软件下载地址: http://fritzing.org/download/ 3. 新建元件 做图过程中难免有图库中没有的元件&…

【Altium Designer】:关于原理图绘制的基本学习

前言 时不可以苟遇,道不可以虚行。 AD软件版本:Altium Designer 22 一、原理图的基本设置 纸张大小:(在右边的属性(properties)框图中,找到 Page Options,可以设置原理图的界面&…

AD软件画电路图笔记

最近使用AD软件画了一个arduino的板子,自己画原理图库、pcb库、原理图、pcb图,以及后来打板和原材料购买。和后来的硬件电路焊接,及硬件电路测试和烧录程序。这是我整个流程下来记的笔记,分享给大家。 一:AD软件新建项…

精美的电路图都是怎么画出来的?

文章目录 1 AxGlyph2 EdrawSoft3 drawio4 fritzing5 下载地址 大家好,我是记得诚。 画原理图是硬件工程师的本职工作,在某些演示场合,比如汇报工作,PPT文档撰写等,我们可能需要轻量化的软件,来代替动辄几个…