它思科技CTO聂玮奇:消除“AI幻觉”,搭建高可靠对话云平台丨数据猿专访

a5601bf73a272f7832fe3763bef6de97.jpeg

bbbb544548e047030a5498995f1d8feb.png

6918f94c8ddbfc4d4e1dc6aff7d6b68a.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


近年来,大模型技术在全球范围内引起了广泛关注和应用热潮。

提到人工智能,很多人会想到它强大的运算能力和广泛的应用场景。如今,语言模型的发展如火如荼,但其中的“幻觉”问题却带来了诸多困扰。这一问题有哪些有效的应对策略?新的研究能为解决“幻觉”问题带来突破性进展吗?

在成都,有一家本土高新技术企业迅速崛起——成都它思科技有限公司(以下简称“它思科技”)。这家公司专注于高可靠对话云技术的研发,由一群清华大学的优秀校友组成的领导团队,致力于利用先进的大模型技术解决行业中的诸多难题。

它思科技的核心目标包括消除AI幻觉内容、解决数据稀缺问题、提高模型训练效率,并实现算力配置的国产化。这些目标不仅旨在提升技术能力,还致力于推动企业在人工智能领域的稳健发展。

近日,数据猿走访并采访了它思科技CTO聂玮奇,深入探讨了AI幻觉的概念以及公司在解决这一问题方面所采取的创新方法。通过这次采访,聂玮奇阐述了它思科技如何通过技术创新和团队合作,成功应对AI幻觉这一行业挑战。

解决“AI幻觉”问题,清华团队搭建高可靠对话平台

什么是AI幻觉?

“AI幻觉”是指人工智能在生成内容时出现的错误或不准确信息。通俗来说,我们在使用AI的时候,不知道哪句话是正确的,哪句话是瞎编的。采访中,聂玮奇解释说,常见的AI错误包括推理中断和逻辑偏差。推理中断是指,AI在推理过程中忘记了自己的论点,导致内容混乱。逻辑偏差则是指,AI的推理过程看似合理,但得出的结论却是错误的。

AI幻觉在行业内是一个重要的挑战。实际上,人类在记忆和处理信息时也会出现类似的问题。例如,当我们被要求回忆并详细描述今年发生了哪些事情时,人也可能会忘记一些细节,甚至记错。“这是因为人脑在处理信息时会进行压缩,并不是所有信息都能准确存储。类似地,AI模型在生成内容时也会因为数据压缩和抽象处理而出现不准确的情况。”

聂玮奇解释说:“我们希望AI模型能够在某些工作中替代人类,因此对模型的要求更高。如果要让AI模型替代人类的部分工作,必须解决其出现的幻觉问题。”

为了解决这一问题,它思科技专注研究高可靠对话云平台。它思科技即将发布的TasiChat人机对话产品,通过“检索增强生成”(RAG)和引用溯源技术,在大模型生成的内容中明确地标记出哪些部分的信息来自知识库中的文档,用户可以更好地评估生成内容的可信度和准确性,增强生成内容的可靠性。

具体来看,该平台依赖用户自己上传相关文件,通过大模型技术的应用,解决当前人工智能领域的AI幻觉问题。它思科技的平台允许用户上传各种类型的文件,如Pdf 文档、word 文档、excel表格、markdown 文档、txt文档等,并根据这些文件内容生成对话或其他文本输出。

“我们在产品中提供了参考来源功能,用户可以直接查看生成内容的出处。这在写论文等需要严谨引用的场景中尤为实用,因为用户可以轻松追溯到内容的原始来源。” 聂玮奇解释道。

据他介绍,解决AI幻觉问题并不能通过简单的算法调整来实现,而是需要通过改进算法和数据来源来缓解。例如,人类在撰写报告时,通常会参考外部数据来源,确保信息的准确性。同样,为了提升AI模型的可靠性,需要为模型提供可靠的数据来源,并进行严格的验证。

目前,公司正不断对产品进行迭代。尽管已经将大约50-60%的积累技术应用到产品中,但产品化的过程依然复杂,需要考虑使用场景、使用方法、用户习惯以及多端适配等多个因素,公司第一个版本已于去年3月启动。

据悉,目前公司的版本更新到1.1版本,并计划每两周发布一个新版本。据悉,目前公司大模型已经完成备案准备,已经提交国家网信办审核。在这段时间内,公司将继续进行内部测试和更新,目标是在11月正式上线运营。

高可靠性是件知易行难的“苦差事”

虽然高可靠性在AI领域被广泛提及,并成为行业共识,但真正投入资源和精力去实现高可靠性的企业却很少。这背后的原因主要集中在技术门槛和实际操作的复杂性上。

聂玮奇指出,解决AI幻觉问题是一个复杂且漫长的过程,可能需要数年的持续努力。尽管从业者们也在不断研究如何提高可靠性,但真正愿意投入资源去解决这些问题的企业却很少。这是因为实现高可靠性,不仅需要强大的技术能力和资金支持,还需要长期的投入和耐心。

据悉,目前它思科技是业内在解决幻觉问题上投入最多的企业。“高可靠性是一个知易行难的事情。”聂玮奇解释道,从理论上看,搭建一个简单的基于文档的大模型检索系统似乎很容易,只需要几分钟的时间写几行代码,就可以搭建一个看似运行良好的系统。然而,当尝试处理更复杂的任务,比如分析多个公司的财务报告之间的联系时,会发现系统无法提供更可靠的结果。

实际上,这背后的原因在于,各个环节都需要深入的工作。检索增强生成(RAG)技术虽然在理论上很简单,但实际操作起来却比较难。例如,模型需要从各种格式的文档中提取和理解信息,并在回答问题时高效地检索相关内容。这不仅需要强大的计算能力和高效的检索算法,还需要对各种文档格式进行预处理和转换。

此外,高可靠性的大模型开发需要大量的资金和人力资源。然而,这些投入在短期内可能看不到显著的回报,使得很多企业在投资时缺乏信心。市场对高可靠性模型的需求尚不明确,进一步增加了企业的投资风险。

总的来说,虽然高可靠性在AI领域的重要性毋庸置疑,但由于其技术复杂性和巨大的资源需求,很多企业选择避而不谈。

在技术复杂性中迎难而上,采用检索增强生成(RAG)技术

高可靠性技术的开发充满挑战,但其潜在价值和市场需求是不可忽视的。随着时间的推移,越来越多的重度用户,会逐渐认识到高可靠性的重要性。

它思科技的高可靠对话云平台,通过用户上传的各种文档,如PDF、DOC和TXT等格式,结合检索和生成两个步骤,提升了模型的可靠性。具体来看,用户上传的文档首先会被转换为模型可以理解的形式,随后模型在回答问题时,从大量文档中高效检索相关信息。

同时,平台采用了“检索增强生成”(RAG)技术,该技术能够根据知识库中的信息生成可靠的答案,降低了编造答案的可能性,从而降低了模型的幻觉。在这个过程中,需要企业一定量的标注数据对检索、生成等环节进行优化。

与同行相比,它思科技的独特之处在于其高可靠性解决方案的全面性和实用性。平台不仅提供参考来源功能,让用户可以直接查看生成内容的出处,还通过不断的迭代和改进,提升模型的性能和可靠性。

据了解,尽管它思科技于2024年才全面投入大模型的开发,但团队此前在技术积累上已有很多年时间。它思科技的总部位于清华大学附近,由清华团队孵化而成,自成立以来一直致力于语音识别和大模型的研究,依托清华大学语音与智能实验室(THU-SPMI)的深厚研究成果,它思科技拥有一流的语音与语言处理技术,涵盖人机对话系统、语音识别与理解、自然语言处理等多个前沿领域。自2017年起,团队成员开始转向大模型领域,并在这方面积累了丰富的经验,完成了诸多早期项目,在技术积累奠定了基础。

为什么要做高可靠性?

“我们认为确保信息的准确性至关重要,所以在成立之初就把解决幻觉问题当作头号问题,我们认为高可靠性的大模型是未来发展的重要方向。”如今,它思科技的云对话平台致力于解决三个问题:高可靠、高效益和国产化,尤其是高可靠性方面,从一开始就瞄准这一方向。尽管市场上有许多诱惑,但它思始终坚持在高可靠性技术上发力。

所有产品都值得用大模型重新做一遍,成都在我心中是国内城市前十

虽说做高可靠领域是件“苦差事”,但聂玮奇认为,做大模型是一件快乐的事情。他分享,在推出产品前,公司会去对大模型进行对话训练,在对话过程中,AI会触发很多很好玩的对话,团队在这个过程中也收获颇多。

实际上,成都本地涌现的大模型公司相比北上广要少一些,它思科技为什么会选择在成都发展呢?成都的独特环境对AI企业开展业务和研发活动有哪些影响?

在聂玮奇心中,成都是一个能够发展大模型公司的理想城市,并且在国内城市中排名前十。

聂玮奇笑着说:“我们这栋办公楼里,许多都是我们的客户。”一栋楼里都是潜在的客户和合作伙伴,这种紧密的产业链条使公司能够快速找到合作机会。在他看来,成都拥有良好的科技创新氛围。

目前,它思科技在成都的团队已经发展到20多人,成都是它思科技大模型研发的主要基地。虽然部分核心算法研发仍在北京进行,但公司新招聘的大部分人员都在成都开展工作。北京的团队主要负责核心技术的研究,而成都团队则专注于大模型的应用和优化。

相比北上广,成都的运营成本更低,无论是人力成本还是办公成本,成都都具备显著优势。“公司能够以较低的成本,吸引到高质量的人才,并为他们提供更好的生活和工作条件。我们发现,许多在北京、上海等一线城市工作的高端人才,愿意为更好的生活质量和较低的生活成本而选择来到成都。”据了解,它思科技的团队中,有很多是从外省来到成都的技术人才。

除此之外,算力也是吸引它思来到成都的原因。对于AI企业来说,算力是不可或缺的资源。成都的算力资源丰富,能够满足公司大规模模型训练和数据处理的需求,这一点对于依赖高性能计算的大模型公司尤为重要。

聂玮奇谈到,在政策方面,成都的政府政策对企业有不少的倾斜,几乎每一两周都会有新的政策出台,为企业的发展提供了丰富的资源和支持。政策红利也为在成都的发展的AI公司提供了坚实保障,也对企业的发展起到了积极的推动作用。

未来,它思科技计划是与更多本土的成都企业进行合作。“在我看来,所有的产品,都可以用大模型重新做一遍。”利用大模型技术为各类产品进行革新。未来,它思科技将深耕成都市场,利用大模型技术为各类产品进行革新。

文:梦芸 / 数据猿
责编:凝视深空 / 数据猿

ece26aa577004f60ec3d033250cecf34.jpeg

4e6fe7b6753055464d2f6a66b8549a87.png

d77aab33e72ca6b72b2904293ed47a17.png

4ef957764be98b631e49e7df9991d6db.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/448808.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

川字结构布局/国字结构布局

1.串字结构布局 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title><style&g…

S7-200 SMART 与 S7-1200 之间 TCP 通信— S7-200 SMART 作为服务器

TCP 协议通信 TCP 通信为面向连接的通信&#xff0c;需要双方都调用指令以建立连接及交换数据。S7-200 SMART 与 S7-1200 通过 TCP 通信&#xff0c;在 S7-1200 调用 T-block 指令 ( TCON, TDISCON, TSEND, TRCV ) &#xff0c;在 S7-200 SMART 调用 Open User Communication …

网络爬虫-数美滑块验证码

仅供研究学习使用。 今天带来的是数美滑块验证码的逆向 目标站 --> 传送门 解决此类验证码 首先要解决滑动距离的判定 无论是使用selenium还是使用协议的方式来破解 都绕不开滑动距离的识别 滑动距离可以参考以前我博客上的方式&#xff0c;或者找一找开源的一些算法&am…

Go基础知识:切片

数组 Go 数组的大小是固定的&#xff0c;其长度是其类型的一部分&#xff08;[4]int并且[5]int是不同的、不兼容的类型&#xff09; var a [10]intb : [2]string{"Penn", "Teller"} b : [...]string{"Penn", "Teller"}package maini…

2.4 STM32启动过程

目录 一,启动Flow 1.1 初始化MSP 1.2 初始化PC 1.3 设置堆栈大小 1.4初始化中断向量表 1.5 调用初始化函数(可选) 1.6 调用__main 二,Reset_Handler函数 一,启动Flow 下面是stm32在内部FLASH启动的启动建议流程图,在stm32复位到执行我们程序的main函数的过程中,…

深入理解Redis锁与Backoff重试机制在Go中的实现

文章目录 流程图Redis锁的深入实现Backoff重试策略的深入探讨结合Redis锁与Backoff策略的高级应用具体实现结论 在构建分布式系统时&#xff0c;确保数据的一致性和操作的原子性是至关重要的。Redis锁作为一种高效且广泛使用的分布式锁机制&#xff0c;能够帮助我们在多进程或分…

文章解读与仿真程序复现思路——电网技术EI\CSCD\北大核心《计及多重不确定性和时间相关性的虚拟电厂参与碳-绿证协同交易优化调度》

本专栏栏目提供文章与程序复现思路&#xff0c;具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

Gin框架操作指南07:路由与中间件

官方文档地址&#xff08;中文&#xff09;&#xff1a;https://gin-gonic.com/zh-cn/docs/ 注&#xff1a;本教程采用工作区机制&#xff0c;所以一个项目下载了Gin框架&#xff0c;其余项目就无需重复下载&#xff0c;想了解的读者可阅读第一节&#xff1a;Gin操作指南&#…

武汉正向科技|焦炉移动机车连锁控制系统的介绍

焦炉车辆连锁控制系统是采用格雷母线定位技术&#xff0c;无线数据传输技术以及计算机技术&#xff0c;实现推焦车、拦焦车、熄焦车、装煤车、导烟车的集中监控和系统管理&#xff0c;以及车间作业计划管理&#xff0c;作业实绩管理&#xff0c;作业联锁控制及安全控制等。 焦炉…

超详细的finalshell安装数据库以及数据库的基本操作

一、下载 MySQL Enterprise Edition Downloads | Oraclehttps://www.oracle.com/mysql/technologies/mysql-enterprise-edition-downloads.html 这边有不同的版本&#xff0c;要看你的操作系统&#xff08;centos7 / centos8&#xff09;安装的是哪个版本 我把连接提取出来了&…

JAVA中类和对象

一.类的创建&#xff1a; 比如我们创建狗类&#xff1a; public class Dog {public String name; //名字public int age; //年龄public double tall; //身高//狗的行为public void bark() {System.out.println("汪汪汪~~~");}public void wag() {System.out.printl…

揭秘提升3DMAX效率的6款必备神级插件!

对于3DMax新手来说,掌握一些高效、实用的插件能够大大提升工作效率和创作质量。以下是6个不能错过的神级插件推荐: 第1个:3DMAX造山地形插件Mountain是一款专为3dMax设计的插件,旨在帮助用户轻松快速地创建逼真的山脉地形。以下是对该插件的详细介绍: 一、插件概述 Mou…

手写模拟Spring的基本功能

文章目录 1. Spring的基本功能2. 容器启动 容器启动&#xff0c;即创建容器对象并赋予配置对象3. BeanDefinition扫描4. Bean的生命周期5. 单例Bean与多例Bean6. 依赖注入7. AOP8. Aware 回调9. 初始化10. BeanPostProcessor附录&#xff1a; 1. Spring的基本功能 2. 容器启动 …

VSCode图标的含义,以及DataLoader代码的使用

1 问题 vscode中的那些图标的含义分别是什么Dataloader代码怎么做 2 方法 去网站里面搜索各种图形代表的含义然后进行理解和记忆 长方体&#xff1a;变量 紫色立方体&#xff1a; 库中预定义的枚举&#xff1a; 两个矩形块&#xff1a;枚举 自定义的枚举 橙色树状结构&#xff…

LinkedList和链表(上)

1. 顺序表ArrayList的缺点和优点 优点: 1> 在给定下标进行查找的时候,时间复杂度是O(1) 缺点: 1> 插入数据必须移动其他数据,最坏情况下,插入到0位置,时间复杂度为O(N) 2> 删除数据也需要移动数据,最坏情况下,就是删除0位置.时间复杂度为O(N) 3> 扩容之后(1.5倍扩容…

SQL JOIN的学习

SQL JOIN (w3school.com.cn) 之前跟着老师学数据库的时候学过&#xff0c;最近又比较频繁的在使用。 再复习一下。 Id_P是主键 Id_O是主键 1. SELECT Persons.LastName, Persons.FirstName, Orders.OrderNo FROM Persons, Orders WHERE Persons.Id_P Orders.Id_P 2. SEL…

【JVM】—深入理解G1回收器——概念详解

深入理解G1回收器——概念详解 ⭐⭐⭐⭐⭐⭐ Github主页&#x1f449;https://github.com/A-BigTree 笔记链接&#x1f449;https://github.com/A-BigTree/Code_Learning ⭐⭐⭐⭐⭐⭐ 如果可以&#xff0c;麻烦各位看官顺手点个star~&#x1f60a; 文章目录 深入理解G1回收器…

保护企业终端安全,天锐DLP帮助企业智能管控终端资产

为有效预防员工非法调包公司的软硬件终端资产&#xff0c;企业管理员必须建立高效的企业终端安全管控机制&#xff0c;确保能够即时洞察并确认公司所有软硬件资产的状态变化。这要求企业要有一套能够全面管理终端资产的管理系统&#xff0c;确保任何未经授权的资产变动都能被迅…

Shiro认证 -- (Authentication)

Apache Shiro是一个功能强大的Java安全框架&#xff0c;提供了身份验证&#xff08;Authentication&#xff09;、授权&#xff08;Authorization&#xff09;、加密&#xff08;Cryptography&#xff09;、会话管理&#xff08;Session Management&#xff09;、与Web集成、缓…

【WEB应用安全测试指南–蓝队安全测试2】--超详细-可直接进行实战!!!亲测-可进行安全及渗透测试

安全基础理论入门知识参考上一篇《WEB应用安全测试指南蓝队安全测试1》 WEB应用安全测试指南2 一、文件 I/O 类1.1、任意文件上传1.2、任意文件下载1.3、文件包含 二、接口安全类2.1、短信炸弹2.2、邮件炸弹2.3、短信内容可控2.4、邮件内容可控 三、逻辑流程类3.1、越权3.2、未…