上个月,我开始深入研究 AI 代理的世界。在探索这个领域时,我突然有了灵感:从现在开始我要研究 AI 代理。
最近,我一直在思考第二点。既然有很多可用的选项,为什么还要开发自己的 AI 代理库呢?
经过一番思考,我认为现在我可以清楚地阐述我构建自己的 AI 代理库的原因了。这篇文章将介绍我走这条路的 3 个主要原因。
尚无标准
目前有无数的库和 AI 代理框架。最受欢迎的包括 BabyAGI、CrewAI、LangChain(包括 LangGraph)和 AutoGPT。然而,对于如何开发代理,并没有标准。这个领域相当新,没有“领导者”来引领潮流。因此,应该鼓励更多的创新和实施代理的尝试。
在我引用的库和框架中,LangChain 可能是最知名的。但它也有不少问题和缺点。它感觉很臃肿:安装 LangChain 时,您还会安装许多其他依赖项。此外,开发人员还抱怨它在生产中运行时速度很慢。我也读过,并经历了必须剥离无数抽象层才能了解代码在后台做什么的挫败感。最后,其他人强调了使用 LangChain 的安全问题。
尽管一些开发者圈子对此持负面态度,我仍然打算在未来尝试 LangChain 并得出自己的结论。从我的角度来看,我相信它可以成为快速原型代理系统的有用库。
由于没有标准,我相信最好的方法是构建我自己的 AI 代理库,以熟悉该领域,根据自己的需要合并其他库和框架中的最佳部分,并不断尝试以确定什么有效,什么无效。
AI Agent 的现状 — 来自Yohei Nakajima
我想从头开始学习
我喜欢尽可能使用第一性原理方法来理解概念。在这种情况下,从头开始构建我自己的 AI 代理库是有意义的。
从头开始构建它意味着超越其他库和框架建立的抽象层,到达代理代码和工作流的联系。
理解代理系统的内部运作包括牢牢掌握以下要素:
- 有效提示
- 所使用的基础法学硕士 (LLM) 的能力
- 规划
- 工具
- 记忆
- 反射
AI 代理系统的组件 — 来自 NVIDIA
我正在构建的库可能还处于起步阶段,但我已经对上述元素有了不少了解。还有很多东西需要学习。我只是不相信如果我选择已经存在的库或框架,我会对这些代理系统组件有如此多的了解。
很有趣
代理商的势头和该领域的普遍兴奋具有感染力。就我个人而言,这让我想起了自己着迷于自动驾驶汽车的那段时间。当时我怀着这种热情,完成了 Udacity 的自动驾驶汽车纳米学位。我觉得我当时应该加倍努力,投入这种半不切实际的兴趣,加入一家有趣的自动驾驶汽车公司。但由于各种原因,我没有这样做:我刚刚在英国买了一套房产,最有前途的自动驾驶汽车公司都在美国,我和我的伴侣正计划组建一个家庭。
我下定决心不会错过 AI Agent 派对。我来这里是为了玩,而且我会一直在这里。
构建这个 AI 代理库并总体上了解 AI 代理对我来说就像在玩游戏一样。因此,尽管我有一份繁重的全职工作和父母的责任,但我可以玩困难模式。此外,我并不指望我的库成为构建代理系统的黄金标准,但能为开源社区做出一点贡献让我感到自豪。
结束语
虽然我现在正在构建自己的库,但我不排除将来采用更流行/标准/功能更强大的第三方库。一旦我决定使用 AI 代理构建产品并意识到我的库对于我所考虑的用例来说太有限了,这可能是有意义的。
而且由于速度对于初创企业来说至关重要,当已经有好的库可以帮助尽早快速地为客户提供价值时,陷入对库的修补可能不是明智之举。
我也不太可能构建自己的评估框架。我也不确定监控和编排。我认为对于大公司或向企业销售产品的人来说,构建自己的评估或至少确保数据/提示保留在他们的系统中可能更有意义。
这是一个年轻的领域,我很高兴能成为这个运动边缘的早期探索者之一。我希望我的一些兴奋能传递给你。你可以点击这个Github 链接了解有关我正在构建的 AI 代理库的更多信息。
欢迎前往我们的公众号,资讯
创作不易,觉得不错的话,点个赞吧!!!