Talk | 北京航空航天大学王泽坤:在LLM之上还能创造哪些价值?百页综述梳理后 ChatGPT 技术链

本期为TechBeat人工智能社区515线上Talk!

北京时间7月20(周四)20:00北京航空航天大学硕士研究生—王泽坤的Talk已准时在TechBeat人工智能社区开播!

本次Talk中,他与大家分享了当下大模型的研究焦点,即如何建立更全面的框架,以改善大模型与人、与知识库、与模型、与工具和与环境的交互,并提出了“交互式自然语言处理。

Talk·信息

主题:在LLM之上还能创造哪些价值?百页综述梳理后 ChatGPT 技术链

嘉宾:北京航空航天大学硕士研究生 王泽坤

时间:北京时间 7月20日(周四)20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

点击下方链接,一键预约TALK!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=791

Talk·介绍

ChatGPT 对 NLP 产生了翻天覆地的影响,一时间,人们开始相信“NLP已经被解决”。然而,在大模型的实际应用中我们发现,大模型仍然具有一些难以克服的问题,如对齐、幻觉、长文本处理等。在这篇综述中,我们系统梳理了当下围绕着大模型的研究焦点,即如何建立更全面的框架,以改善大模型与人、与知识库、与模型、与工具和与环境的交互,并提出了“交互式自然语言处理”。一方面,通过大模型与外部实体的交互,可以缓解大模型自身的一些固有问题并扩展大模型的功能与特性;另一方面,通过将大模型视作广义环境中的智能体,交互特性是大模型通往通用人工智能的一把钥匙。

Talk大纲

1、背景和动机

2、相关工作

3、从交互对象的维度

(1)大模型与人交互

(2) 大模型与知识库交互

(3)大模型与模型、工具交互

(4)大模型与环境交互

4、从交互媒介的维度

(1)通过自然语言交互

(2)通过形式语言交互

(3) 通过编辑语言交互

(4)通过机器语言交互

(5)通过共享记忆交互

5、从交互方法的维度

(1)提示技术:上下文学习 (In-Context Learning)、思维链、提示级联等。

(2)微调技术:指令学习、持续学习、半监督学习、参数高效学习等。

(3)其他方法:主动学习、强化学习、模仿学习、交互信息融合等。

6、对交互的评测

7、交互特性的应用

8、伦理与安全

9、未来发展方向和挑战

Talk·预习资料

图片

论文链接:

https://arxiv.org/abs/2305.13246

机器之心推文:

https://mp.weixin.qq.com/s/qNKM_xyYJigSGtE4J3UXXQ

Paper list:

https://github.com/InteractiveNLP-Team/awesome-InteractiveNLP-papers

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

图片

王泽坤

北京航空航天大学 硕士研究生

王泽坤,北京航空航天大学一年级在读硕士生,师从许可教授。研究方向为自然语言处理与多模态。他的主要研究兴趣为多模态基础模型、思维链 (Chain of Thought) 、检索增强以及 Alignment 等。同时也在探索大型语言模型作为 agent 的技术链,比如工具使用、社会模拟、具身智能等。他曾在澜舟科技、北京智源人工智能研究院等进行科研实习。

个人主页: 

https://www.techbeat.net/grzytrkj?id=18749


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25465.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大模型 LLM 综述, A Survey of Large Language Models

大模型 LLM 综述, A Survey of Large Language Models 一、概述 一般认为NLP领域的大模型>10 Billion参数(也有人认为是6B、7B, 工业界用, 开始展现涌现能力); 经典大模型有GPT-3、BLOOM、Flan-T5、GPT-NeoX、OPT、GLM-130B、PaLM、LaMDA、LLaMA等; 大模型时间线, 图来自…

ChatGPT王炸更新!可以直接编译运行代码了!

OpenAI正式宣布:ChatGPT新增插件功能 借助插件功能可以使ChatGPT具备更多的能力: - 获取实时信息 - 检索自己的知识库数据 - 代替自己执行操作 目前官方首批开放使用的插件所支持的功能就有:酒店预订、航班预订、外卖服务、在线购物、法律知识…

ModaHub魔搭社区:AI原生云向量数据库Zilliz Cloud与 LlamaIndex 集成搭建文档问答系统

目录 准备工作 准备数据 主要参数 处理数据 开始提问 本文将演示如何与集成 LlamaIndex 从指定源获取信息。 在 ChatGPT 占领各大头条时,越来越多的企业在考虑如何在它们的产品中使用 ChatGPT。一个比较大的使用场景就是如何使用 ChatGPT 来改造产品文档孱弱的搜索能力。…

问了ChatGPT一个事务问题,然后被忽悠了

Hello 大家好, 这里是Anyin。 给大家说一个笑话:我被ChatGPT忽悠了。 引言 前两天在编码的时候遇到一个事务未生效的问题,当时感觉比较诡异。因为我一个方法注解了Transactional注解,但是事务未生效,而且这个方法是…

ChatGPT再闯大祸!OpenAI迎来首起AI诽谤起诉!

自ChatGPT问世以来,强大的理解力与信息总结能力便使得其快速成为了各行业从业者的得力助手,无论是程序员、作家、学生还是记者都能够依靠ChatGPT的帮助来提升实际的工作效率。 然而在硬币的另一面,幻觉问题却也始终困扰着这款诞生并不太久的…

让客户在微信上查看订单详情,【单据分享】让你省心又省力!

做生意的老板们可能经常会遇到这样的问题:客户打电话或者在微信上面下单订货后,需要把销售单打印出来给客户核对有无错漏。 我们常见的做法有两种: ①把销售单打印出来之后手机拍照发给客户核对。但这种方式有明显的弊端:如果照…

印度500万程序员饭碗不保?解雇90%技术支持团队后,印度CEO盛赞AI“干活又快又便宜”

来源 | AI前线 ID | aifront 整理 | 凌敏、核子可乐 AI 技术引发的失业潮来了? 印度 CEO 开始将工作外包给 AI 近日,一家印度初创软件开发商因难以负担客户支持团队的费用,决定将这项工作外包给 AI 聊天机器人,并表示这项决…

互联网晚报 | 周杰伦起诉网易不正当竞争案庭审结束;特斯拉中国工厂普通工人月薪1万块;SpaceX“星舰”发射计划推迟...

周杰伦起诉《天下3》不正当竞争案4月17日开庭 4月17日,杰威尔与网易旗下游戏《天下3》诉讼案在杭州市滨江区法院开庭审理。杭州市滨江区法院公布,在庭审中杰威尔方面称《天下3》免费赠送玩家周杰伦新专辑活动因未获官方正式授权,属于侵权及不…

“因使用 GitHub ,我们被取消了参赛资格”

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 说到 GitHub,相信每一个程序员都再熟悉不过。 作为全球最大的开发者社区,如今 GitHub 拥有 9400 万开发者,在开源热潮的席卷下,每年 GitHub 用户数仍在…

字节技术大牛跑步进入AIGC创业,聚焦视觉领域,搭建算法平台,还是多模态的那种...

衡宇 发自 凹非寺量子位 | 公众号 QbitAI 3月最后一天,王长虎在龙湖集团的last day。 这位字节跳动前视觉技术负责人、AI Lab总监辞职挂印,火速启程下一站:AIGC创业,成立新公司爱诗科技。 他拉团队自起炉灶,要打造一个…

华人高管加入OpenAI;富士通发布AI平台;成都为鼓励AI产业发展提出19项资金扶持措施丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 三六零参与编写中国大模型应用标准 6月1日,从公司处获悉,三六零将参与编写中国大模型应用标准,公司日前被授予《大规模预训练模型技术和应用评估方法第四部分:模型…

阿里巴巴集团告别 CTO?

整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 近日,据雪豹财经社、界面新闻等多个媒体报道,阿里内部开始了新一轮的组织架构调整,其中原先 CTO 线中的业务中台、供应链中台等核心团队并入 CDC(国内数字…

37岁程序员失业后摆摊卖饼,月入上万!网友:“再也不用解决 Bug 了”

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 失业不可怕,关键是思路打开重新赚钱养家! 近日,有网友发现,37 岁的程序员杨先生在失业之后,选择靠做小摊美食鲜肉饼重启他的职…

基于JAVA解决淘宝爬虫限制

不仅仅限于java 前言验证码识别工具分析编码 数据演示后记 前言 以前做过淘客开发,那时候高佣api很少,高佣的办法就是查询商品模拟转链为高佣,但是后来淘宝慢慢禁止了爬虫一直弹验证码,后来我就利用验证码识别成功扛过那段日子&a…

爬虫基本原理介绍、实现以及问题解决

文章目录 一、爬虫的意义1.前言2.爬虫能做什么3.爬虫有什么意义 二、爬虫的实现1.爬虫的基础原理2.api的获取3.爬虫实现 三、反爬解决方案1.反爬的实现方式2.反爬的解决方法3.反爬的实现代码4.IPIDEA还能做什么 四、总结 一、爬虫的意义 1.前言 最近拉开了毕业季的序幕&#…

图文并茂|AIGC的浪潮下,文本生成发展得怎么样了?

来自:机器之心和澜舟科技 1 月 12 日,在机器之心 AI 科技年会 AIGC 技术应用论坛上,澜舟科技创始人兼 CEO、中国计算机学会 CCF 副理事长、创新工场首席科学家周明发表了主题演讲《文本生成研究进展》。 进NLP群—>加入NLP交流群 以下为演…

prophet

用好小模型!这里提出了名为 Prophet 的框架,通过在 LLM 上游引入一个可学习的、任务相关的视觉问答小模型,来更好地激发大模型的潜力。 用小模型启发大语言模型解决外部知识图像问答 大规模语言模型(Large Language Model&#x…

通过LLM构建聊天机器人必备技巧

聊天机器人在AI领域并不稀奇,尤其是ChatGPT问世之后,很多人都把它当成一个可以随时对话随意提问的聊天机器人。而在实际应用领域,聊天机器人的场景也愈加丰富多样。 比如很多人熟知的客服聊天机器人,常用在电商领域,能…

基于PHP的招聘网站

摘要 在Internet高速发展的今天,我们生活的各个领域都涉及到计算机的应用,其中包括在线招聘的网络应用,在外国在线招聘已经是很普遍的方式,不过国内的在线招聘可能还处于起步阶段。招聘网站具有招聘信息功能的双向选择&#xff0c…

丘仕达:SEO资料站管理团队成员招募

管理团队终于要成立了,我以为我会很兴奋或激动,奇怪的是我没有. 一直都想组团队,但我自己走了很多弯路,一直都在问自己:你能给团队成员什么利益?你能保证团队成员之间利益分配合理不冲突吗? 答案是不能.所以我一直在犹豫,给了自己一个理由:多观察下,给多点时间彼此来磨合.磨到…