说一千道一万,不如实地转一转。学了那么久的AI Agent的概念了,是时候该落地一个Agent看看自己的掌握程度了对不对,我们都理解大脑是自动节能的,但是知识的确需要倒逼自己一把才能真的掌握,不瞒大家说,笔者对于真正落地一个Agent一直有规划,但是就是苦苦没有动手,要么觉得没掌握什么知识要么觉得什么理解的还不够,说白了就是懒…但是今天真的逼着自己做出来一个Agent后真的是满满的成就感,除此之外也在过程中发现了自己的的确确理解不到位的地方,最最重要!做出来后,是真真切切感受到了AI时代的魔法,自己一点一点做出来的魔法,也有了很多对于之后日常工作提效和创意的好的想法,是不是很赚!赶紧来一起试试吧,10分钟,轻松搞出来你的第一个Agent!
创建知识库类目
知识库主要用于阿里云百炼的知识检索增强功能,可为大模型提供外部知识来源,扩大知识检索范围。
在创建知识库之前呢,我们要先进行数据的导入
https://bailian.console.aliyun.com/#/data-center
先来看一下非结构化的数据
单击导入数据,进入导入数据页面。选择导入方式。
导入方式包括本地上传、OSS导入模式。
本地上传模式:从本地上传文件进行导入,点击本地上传,选择本地文件,开始上传,文件格式需符合要求,支持PDF/Doc/Docx格式,单文档最大限制100MB或1000页,上传后的文件将显示在下方,最大支持上传200个文件,确认后将开始导入。
OSS导入模式:从OSS对象存储Bucket导入文件,选择OSS导入,在完成授权的前提下,选择OSS的存储区域和Bucket,导入文件夹或文件。
导入文件夹:选择Bucket下的文件夹,一次性导入当前文件夹下的所有文件,注意,导入文件夹不包括子文件夹中的文件,如需导入,请选中子文件夹。
导入文件:选择文件夹中的文档进行导入,单次最多选择5000文档,选择后可在右侧已选文档中查看。
ok,再回来看看结构化数据的上传流程
选择结构化数据页签,单击新增数据表,进入新增数据表页面。
选择自定义数据表结构,自定义数据表名称。
然后我们来配置表结构,其中,列名为必填参数,描述为选填参数。
注意!⚠️这里定义的数据表结构,必须和待导入的数据表的结构完全相同,否则会导入失败。例如,待导入的数据表有2列,这里的表结构必须配置2个字段,且列名一一对应。您可以通过单击新增字段或操作列的删除,来增加或删减字段。
配置好,导入数据后,它这个非常鸡肋的是,确定完没办法加列或者减列,甚至没办法复制T-T,没录入完不要手欠点确认啊…
导入后单击确定,完成配置!
结构化和非结构化数据完成配置后,我们就可以在数据表管理的导航树中查看新增的数据表。
初始化好数据后,我们进入到导入数据的步骤
知识库数据导入
在数据表管理的导航树中,单击新增的数据表。
单击导入数据。将Excel或CSV格式的文档拖拽至虚线框内,或单击
选择并上传文档。单击确认,完成导入。
单击确认,提交导入任务,系统将自动导入文档,文档导入数据显示存在延迟,需要等待一段时间后,导入的文档方可在类目中呈现。
数据导入完成后,可单击操作列的详情预览解析后的文档数据。
创建知识库
这个功能在知识库索引类目下,主要用于创建和管理用于RAG应用的知识库索引,基于对数据中心的统一引用。在百炼上配置Agent智能体应用的时候会用到这个
https://bailian.console.aliyun.com/#/knowledge-base
注意在添加索引前,我们前面讲的数据导入要先完成哦,然后我们开始创建知识索引
为了做出我们的领域Agent,我们再来一步一步创建一个知识库
这里逐步解释一下官方建议的配置中,每个参数的含义
多轮对话改写:通过细化和调整用户的原始输入query来提升检索结果的精确度和相关性,同时在多轮对话场景中,该模块能够适应上下文的变化,确保查询与当前对话的连贯性,从而提供更加连贯、一致且用户友好的交互体验,使得整个对话流程更加自然和高效。
Embedding模型:官方向量模型采用的是DashScope text-embedding-v2,商业化向量模型,除了中英双语,支持多语种,向量结果默认归一化处理
排序配置:Rank模型,对检索结果进行排序,提升检索效率、保持信息精确性、增强内容多样性,确保最终检索结果的满意度:
官方排序:GTE排序模型,通过深度学习和预训练语言模型的技术,提供高效、准确的排序解决方案
相似度阈值:设定最低分数标准,只有超过这个阈值的检索结果才会被考虑用于后续的生成过程
向量存储类型:内置
直观的看一下官方建议配置:
然后,下一步
选择数据,这里不能多选
然后到了索引配置
是否参与检索:开启后表示在此列数据中进行搜索。
是否参与模型回复:开启后表示被搜索到的数据行对应的本列数据提取出来给到大模型进行生成。如下图示例的配置中,开启“是否参与模型回复”后, 会在所有列数据中进行检索,但只对检索到的数据中“问题”、“答案”两列的内容给到大模型进行回答参考。
单击导入完成,完成知识库创建。
然后,就看到了我们创建好的知识库啦
数据导入需要一定时间执行,导入完成后页面自动展示相关数据。
如果用户在数据管理的结构化数据页签中新增了数据,知识索引中对应的知识库暂时无法自动同步。需要进入查看知识库页面,单击
按钮,再单击确定同步最新数据。
单击查看,在查看知识库页面可执行以下操作:
查看当前知识库中已导入的文件大小、状态等信息。
查看文档切分详情:单击操作列的查看。
删除单个文件:单击操作列的删除。
批量删除文件:单击批量管理,勾选单个或多个文件,单击批量删除。
在命中测试页面的输入框中,输入与已经导入的数据相关的问题,测试检索结果的相似值。只有达到或超过相似度阈值的检索结果才会被考虑用于后续的排序和生成过程。
删除知识库时,不会删除数据管理中已导入的数据。如果知识库正在被应用调用,解除关联后才可删除。
然后,我们就可以去构建Agent了!
创建智能体应用
这里官方是叫阿里云百炼应用,它是基于Assistant API技术架构,结合大语言模型(LLM)的推理、知识检索增强、插件调度等能力,构建应对各类复杂场景任务的场景应用。通过集成化、直观易用的产品界面,为开发者提供了丰富的应用配置选项,包括大型语言模型(LLM)选择、Prompt工程、知识检索增强、插件调度、流程调度等功能。其实就是我们说的Agent智能体
同时,阿里云百炼开放了Agent智能体所使用的Assistant API,这样我们就可以通过Assistant API搭建应用。
可以在这里新建应用,并将应用接入您的场景中。单击创建应用按钮。
可以在应用广场中选择系统默认应用模板进行创建。
我们选择第一种方式,来创建一个全新的
选择应用模型配置
单击设置按钮,选择模型,本次示例按照通义千问-Max为例。参数配置可以调整,本次展示为默认数值。
我们来看下参数配置:
温度系数:调控生成的多样性。
最长回复长度:模型生成的长度限制,不包含prompt。允许的最大长度因模型不同有所改变。
携带上下文轮数:设置输入模型的最大历史对话轮数,轮数越多,对话相关性越强。
点击左上角编辑按钮,可以修改应用名称。
再来看下应用内容配置说明:
prompt:可以用来为模型授予角色和技能。
prompt优化:针对输入的prompt进行专业优化,使模型更容易理解指令。
知识检索增强:开启后可通过指定知识库检索对应文档内容。
这里我们之前已经配置好了一个知识库,我们直接关联进来!让这个智能体可以结合我们的领域知识进行作答,这里可以多选!
长期记忆:长期记忆功能是针对终端用户提供的一项个性化功能,系统将根据对话历史自动生成终端用户画像,并根据用户画像回答最新问题,从而实现个性化回复。当您打开长期记忆功能后,系统自动将相应的system prompt添加到上方的Prompt编辑框中。
选择插件:官方提供4款预置插件,结合增强大语言模型的规划调度能力和生成能力,更好地在您的业务场景中落地。本次以插件能力为例,选择网友创作评论和夸克搜索
选择流程
这里为了更好地控制大模型应用的执行过程和生成结果,我们可以通过业务流程对每一步进行配置。在应用中,您可以选择配置好的业务流程(最多支持选择1个流程),在大模型需要的时候调用该流程执行相应的业务流程。流程组件配置请参考流程管理查看详情。
高级配置
快速干预
我们也可以通过快速干预功能调整应用的输出结果。该功能仅通过规则方式快速处理用户输入的违规话术或者大模型生成的风险内容,但是该工具无法替代内容安全检测类的专业产品。
创建干预话术规则
规则名称:支持中英文、数字,最多支持20字符;
规则条件:默认为空,点击“新增条件”按钮,选择所需的条件类型。
注意:
干预输入话术支持关键词、正则表达式、语义意图三种类型;
干预生成结果仅支持关键词一种类型;
关键词:新建条件后,默认为“包含”,最多支持输入50个关键词;
正则表达式:新建条件后,默认为“包含”,最多支持输入10个表达式;配置方法参考正则表达式配置。
语义意图:新建条件后,默认为“包含”,最多支持输入10个相似语句。
回复话术:支持干预回复内容,并调整为回复话术,支持中英文、数字,最多支持500字符。
规则新建完成默认为“已禁用”状态,需要用户手动开启该规则。
举个例子!
多轮对话
通过内置缓存支持多轮对话:该功能支持将对话内容缓存或做持久化处理。对于持久化处理,需要选择您的存储实例,系统会将数据存储到您的存储实例中。
通过ADB-PG备份会话记录:内置缓存的数据默认不会落盘存储,只在内存中存储1小时。打开此开关并选择已购买的ADB-PG实例,可自动将此应用的对话记录存储到对应的ADB-PG实例中(需要付费购买ADB-PG实例,如已购买可直接关联)。
终于到了测试!
以上内容配置完成后,点击保存并发布按钮,在页面右侧可以先简单地进行测试验证模型效果。在输入框中输入【测试内容】,验证模型回复的答案内容。
在右侧测试窗中测试问答:
如果想介入到自己的产品中(会点代码的),可以返回我的应用中,点击调用按钮,即可获取SDK调用文档。左上角可以查看API KEY。
支持多种调用方式哦
到此,整个流程就结束啦,笔者用自己的内部数据测试了一下,效果真的很好诶!我终于终有了自己的第一个智能体Agent!!!虽然百炼上还是有一些操作不太丝滑的地方,但是不影响最后的效果,学了这么久的Agent,终于成功的落地了一个,大家相信我,跟着文章耐心的操作一把,当理论知识化作真真正正的产品效果时,这种成就感真的太棒啦!
接下来笔者还会基于别的Agent平台操作试试,给大家更多的分享!敬请期待呀!
如何学习AI大模型?
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
四、AI大模型商业化落地方案
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。