MindSearch:用于增强网络搜索效率的开源人工智能

image.png

Web 信息查找与集成是搜索、检索、提取或集成 Web 资源以满足特定需求的活动,是实际生活中几乎所有领域中每个决策和解决问题的实体都必须执行的操作。

大型语言模型 (LLM) 与搜索引擎的集成重新定义了我们在网络上查找和使用信息的方式。因此,LLM 能够更好地理解自然语言查询,有助于提供更精确的搜索结果,同时考虑到适当的上下文。您能够组合的越多,可以形成的查询就越好,因为从不同来源提取和聚合信息的能力得到了很大的改善。即使在这些改进之后,诸如解决复杂查询、处理大量搜索结果以及集成到 LLM 的上下文长度限制等问题仍然存在。

一种新的人工智能模型将通过提高网络信息搜索和整合的效率和准确性来帮助解决这些问题。这种新人工智能模型背后的研究团队由中国科技大学的科学家以及上海人工智能实验室的学者组成。这项工作的动机是开发一个人工智能框架来模拟人类在网络信息搜索和整合中的基本认知过程。这种新的人工智能模型就是 Mindsearch。

MindSearch 是什么?

MindSearch 是一个开源项目,旨在通过网页模拟人类的信息检索、获取和整合行为。该框架利用多代理将复杂查询分解为子查询,并以巧妙的方式传递信息。这是一种强大而有效的提高相关性深度的方法,在基于主题的查询中具有直接应用。

MindSearch 的主要功能

image.png

  • 询问一切问题的最佳方式:MindSearch 专为主题查询而构建,它能够利用网络知识的力量回答任何问题。
  • 知识发现:它将浏览数百个网页,提供更长、更广泛的知识库答案。
  • 通过细节解决路径:MindSearch 将所有细节可视化,以便用户可以验证他们想要的一切,从而使响应更可信、更实用。
  • 优化的 UI 体验:这是通过 UI 体验进行优化的,它包括不同的界面,如 React、Gradio、Streamlit 和 Terminal,为用户提供灵活的选择。
  • 动态图形构建:MindSearch 将用户查询分解为对搜索有效的原子子问题,并使用当前搜索结果中的一些新顶点扩展图形分支。

MindSearch 的功能/用例

  • 快速文档搜索:MindSearch 使用 AI 在文档中搜索简短查询,提供更快的结果并节省检查多个文件的时间。
  • 运营效率:它最大限度地减少了文档搜索/检索过程,如果在专业环境中实施,则可以提高工作效率。
  • 科学研究:科学家可以访问其部门保存的大量文件中的相关信息。
  • 个人:无需翻阅页面即可快速找到您的个人文档和信息。
  • 聊天功能:提供不引人注目的聊天功能,用于系统的个人和专业交流。

这些步骤之后的特性和功能使 mindsearch 成为一个灵活的工具,为网络信息搜索和多个领域的集成提供支持。

MindSearch 如何工作?(架构/设计)

MindSearch 的工作原理是将复杂的用户查询分解为较小的子问题。这意味着 WebPlanner 将把此查询模拟为动态图。

见下图:MindSearch 的一般工作流程由两个关键组件组成:WebPlanner 和 WebSearcher。WebPlanner 负责与多个 WebSearchers 一起安排推理步骤,它充当顶级规划器。

image.png

图形构建过程:图形构建是将用户查询分解为原子子查询,以图形中的节点表示。这使得编写复杂查询和管理长上下文变得容易。WebSearcher 通过引擎上的关键字执行分层搜索,并产生有价值的结果,供另一个机器人收集,然后是 WebPlanner。MindSearch 将推理和检索过程拆分为专门的代理,以便整个框架也可以并行从单个网页中搜索更多信息。

MindSearch 建立在 JADE 之上,为高性能搜索引擎信息搜索和集成系统中的多代理应用程序提供了一个易于使用的框架。这种明确的上下文管理和角色分配使 MindSearch 能够在短时间内从多个网页收集和整合信息。这种架构设计使 MindSearch 能够与专有 AI 搜索引擎竞争;从而为即将到来的研究和开发提供了一个令人鼓舞的解决方案。

MindSearch 中使用的技术和方法

以下是构建最终 MindSearch 模型所使用的人工智能和机器学习技术:

  • 分层信息检索:使用分层信息检索来了解搜索引擎的工作原理,从搜索引擎中提取相关有价值的信息放入WebPlanner中。
  • 检索-增强-生成 (RAG):MindSearch 在 LLM 中采用基于 RAG 的搜索,将最新信息的检索与强大的解决方案生成相结合。
  • 代码生成:MindSearch 使用代码生成与图形交互并执行搜索,从而允许模型将复杂问题不断分解为可执行查询。
  • 有向无环图(DAG):这种表示形式传达了确定最佳执行路径的挑战,并且它通过具有易于理解的 LLM 性质的 DAG 正式表示。
  • Python解释器:MindSearch使用python解释器来解释和执行代码,为规划器实现多样化的搜索结果,从而可以通过统一调用与图形进行交互。
  • 零样本学习:MindSearch 在零样本设置下工作,这意味着即使在部署阶段没有使用下游(目标)任务的数据,它也可以应用于新任务或领域。
  • 长上下文管理:为了应对长上下文任务,MindSearch 使用上下文管理机制来帮助模型关注关键细节并减少噪音。

除上述内容外,前面几节已经介绍了一些内容,例如 LLM 的使用、图形构造、多智能体框架。所有这些技术和方法都真正提高了游戏水平,提供了比其他模型更好的响应质量和准确性。

绩效评估

上述过程是在 MindSearch 模型上执行的,它与其他模型 ChatGPT-Web、Perplexity.ai Pro 进行了竞争。深度、广度和事实性:对于下图所示的三种 2D 格式模型(没有任何知识掩码),MindSearch 与这些模型相比具有优越的性能。这一点很明显,因为 MindSearch 针对精细搜索生成详细的响应,而这些响应显然比其他模型更好。image.png

除了开放集 QA 任务外,MindSearch 还在一些封闭集 QA 任务(Bamboogle、Musique 和 HotpotQA)上进行了测试。总体而言,如下表所示,MindSearch 在这些任务上的表现明显优于其他模型,包括 ReAct Search 和没有搜索引擎的原始 LLM。不同 LLM 后端(例如 GPT-4o 和 InternLM2.5–7b-chat)的 perflist 相似。这些结果证明 MindSearch 在回答查询的复杂问题方面表现非常出色。

image.png

总体而言,性能测试表明,MindSearch 在响应质量和准确性方面优于其他模型。

如何访问和使用 MindSearch?

MindSearch 是 GitHub 上的一个开源项目。用户可以使用闭源 LLM(GPT、Claude)或开源 LLM(InternLM2.5–7b-chat)将其部署到自己的 perplexity.ai 风格搜索引擎中。该项目提供了有关设置 API、FastAPI 服务器和前端接口(React、Gradio、Streamlit、Terminal)的详细说明。许可结构为 Apache 2.0,可免费用于商业和非商业用途。

局限性和未来工作

虽然响应质量已经有了很大的改善,但 MindSearch 仍然有局限性。这里一个非常重要的问题是幻觉——在经过长时间的上下文对话后,模型可以得出任何与现实无关的答案。其次,搜索引擎可以并且经常会推广有偏见或过时的信息。虽然多代理设计能够处理复杂的查询,但如果操作不当,它可能会在管理这些迁移的上下文方面出现问题。

未来的研究可能会涉及事实核查机制、更好的上下文管理以及探索除搜索引擎之外的其他类型的信息源等任务。重新审视这些限制将使 MindSearch 等先锋解决方案发展成为更强大、更可靠的网络信息搜索/集成解决方案。

结论

MindSeach 是网络信息搜索和集成领域的一大进步。由于它与人类认知过程相似,因此还解决了该领域的许多其他问题。它构建为一个开源平台,提供高水平的性能,因此受到研究人员和商业受众的青睐。MindSearch — 未来可期!随着所有即将到来的进步,人工智能驱动的信息检索的未来,Mindsearch 正在占据重要地位。

关注我,每天带你开发一个AI应用。每周二四六直播,欢迎大家多多交流。

image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/395114.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

leetcode递归(203. 移除链表元素)

前言 经过前期的基础训练以及部分实战练习,粗略掌握了各种题型的解题思路。现阶段开始专项练习。 描述 给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val val 的节点,并返回 新的头节点 。 示例 1:…

将元组类型的日期时间转换为字符串格式time.asctime([t])

【小白从小学Python、C、Java】 【考研初试复试毕业设计】 【Python基础AI数据分析】 将元组类型的日期时间转换为 字符串格式 time.asctime([t]) [太阳]选择题 根据给定的Python代码,哪个选项是错误的? import time time_tuple (1993, 6, 30, 21, 49…

pytorch下载慢,如何下载到本地再去安装,本地安装pytorch

有时候按部就班的用指令去安装pytorch,网上很慢,并且往往最后可能还没有安装成功。 本次,介绍一下如何将这个文件先下载到本地,然后在去安装。 至于如何安装pytorch,先看一下我之前写的 深度学习环境-------pytorch…

什么是多模态大模型?为什么需要多模态大模型?

“ 多模态大模型,就是支持多种数据格式的模型**”** 很多人都听说过多模态,也知道多模态大模型,但如果让你介绍一下什么是多模态大模型,它有什么优点和缺点,以及为什么需要多模态,这时可能就有点傻眼了。‍…

jupyter项目使用Anaconda环境内核

1、创建虚拟环境 conda create --name myjupyter python3.7 2、进入虚拟环境 conda activate myjupyter 3、切换到自己jupyter notebook项目想在的目录 E: cd E:\first\project\jupyter\jupyter01 4、安装IPython内核包,这是Jupyter Notebook使用Python内核所必需的…

vlunstack-2(复现红日安全-ATT CK实战)

环境搭建 配置信息 DC IP:10.10.10.10 OS:Windows 2012(64) 应用:AD域 WEB IP1:10.10.10.80 IP2:192.168.47.131 OS:Windows 2008(64) 应用:Weblogic 10.3.6MSSQL 2008 PC IP1:10.10…

Chapter 30 多态

欢迎大家订阅【Python从入门到精通】专栏,一起探索Python的无限可能! 文章目录 前言一、基本概念二、抽象类 前言 多态(Polymorphism)是面向对象编程中的核心概念,本章将详细讲解 Python 中多态的实现方式以及如何应用…

科技驱动健康,景联文科技提供高质量高血压数据采集

当前,穿戴手表市场呈现出快速发展趋势,已成为可穿戴设备领域的一个重要组成部分。市场上智能手表的厂商包括小米、华为、苹果、步步高、vivo、努比亚、三六零、科大讯飞、等。 高血压数据采集可为高血压的预防提供支持,持续监测可以帮助用户及…

RabbitMQ高级特性 - 生产者消息确认机制

文章目录 生产者消息确认机制概述confirm 代码实现return 代码实现 生产者消息确认机制 概述 为了保证信息 从生产者 发送到 队列,因此引入了生产者的消息确认机制. RabbitMQ 提供了两种解决方案: 通过事务机制实现.通过发送确认机制(confi…

【第九节】python中xml解析和json编解码

目录 一、Python XML 解析 1.1 什么是XML 1.2 Python 对 XML 的解析方法 1.3 SAX解析xml 1.4 xml.dom解析xml 1.6 ElementTree解析XML 二、Python编解码json 2.1 什么是json 2.2 使用json 库 2.3 使用第三方库Demjson 一、Python XML 解析 1.1 什么是XML XML&#x…

Mouser中元件特性对比功能

搜索所需的元件,并点击比对 在比对界面里搜索所需比对的另外元器件,并比对3.得到的结果

从Vue到Postman全面验证API接口跨域问题

文章目录 1、前言2、跨域问题3、后端服务接口4、接口跨域测试4.1 Vue调用测试4.2 Postman测试 5、服务接口增加注解CrossOrigin解决跨域 1、前言 最近刚接手了一个新项目,业务还没了解全,让开发功能。做了俩接口,postman自测完能拿到数据就给…

影视解说中视频素材哪里找?

想做电影解说类视频,不知道哪里下载高清解说素材? 今天小编就带大家揭秘5大影视解说素材网站,赶紧进来看看吧!~ 1. 稻虎网 作为国内顶尖视频素材网站,稻虎素材网提供了丰富的电影解说视频素材,…

配置Mysql的慢查询日志

一、什么是Mysql慢查询日志 MySQL慢查询日志是MySQL数据库自带的一个功能,用于记录执行时间超过指定阈值的SQL语句,以便于后续的性能优化工作 帮助开发和DBA发现哪些SQL语句需要优化,在哪些地方需要修改,以提高数据库的性能 默认…

生成式AI,在中国工业找到新“活法”

生成式AI,正在经历一场关于落地前景的论战。 在德国中北部城市希尔德斯海姆,世界工业巨头博世已经把生成式AI技术用在了生产线上。他们以AI仿真绘制的方式合成出超过15000张关于产品缺陷的图片,然后将其应用于电机定子生产线的质检。借助生成…

MySQL中的索引——适合创建索引的情况

1.适合创建索引的情况 1、字段的数值有唯一性的限制 2、频繁作为 WHERE 查询条件的字段 某个字段在 SELECT 语句的 WHERE 条件中经常被使用到,那么就需要给这个字段创建索引了。尤其是在数据量大的情况下,创建普通索引就可以大幅提升数据查询的效率。 …

STM32基础篇:I2C通信协议

I2C总线 I2C(IIC---Inter Integrated Circuit 内部集成电路) 以上为I2C大体结构图,其中时钟线SCL用于传输时钟信号,数据线SDA来传输实际的数据。 主机与从机 1.主机的职责 假如由从机1和从机2,从机1想向SDA上发送一…

Java二十三种设计模式-桥接模式(10/23)

桥接模式:解耦抽象与实现的灵活设计 引言 桥接模式(Bridge Pattern)是一种结构型设计模式,用于将抽象部分与其实现部分分离,使它们可以独立地变化。它是一种对象结构型模式,又称为柄体(Handle and Body)模…

高翔【自动驾驶与机器人中的SLAM技术】学习笔记(五)卡尔曼滤波器一:认知卡尔曼滤波器;协方差矩阵与方差;

卡尔曼滤波器 为了研究卡尔曼,我阅读了大量博文。不敢说完全吃透,但是在做一件什么事,可以通过下面这文章来理解,我读了不下五遍。并整理标准重点,添加自己的一些见解。 自动驾驶传感器融合算法 - 自动驾驶汽车中的激…

电脑屏幕录制工具分享5款,附上详细电脑录屏教程(2024全新)

日月更迭,转眼间已经来到了2024年的立秋,在这个数字技术快速发展的时代,电脑录屏技术已经成为了一项不可或缺的技能,无论是用于工作汇报、在线教学、游戏直播还是个人娱乐。那么录屏软件哪个好用呢?接下来,…