对话AI顶尖大牛周明老师:大模型的机遇和挑战?

 Datawhale学习 

分享人:周明老师,Datawhale 特邀嘉宾

58854f4a77eb647562043be3110572d2.jpeg

这次 Datawhale开源学习 特别邀请了周明老师分享:

周明,澜舟科技创始人兼CEO,中国计算机学会 CCF 副理事长、NLP和大模型领域的顶尖大牛。

1991年就从NLP重镇哈工大拿到了博士学位,其后进入清华任职任教,并在1999年被微软亚洲研究院创始院长李开复挖走,后来不久成为NLP研究组de负责人。直到2020年离开,周明已经是MSRA副院长多年。

周明也是当今NLP领域成就最高的华人之一。他不仅是中国第一个中英翻译系统的研制者、日本最著名中日翻译产品研制者,还在2019年成为了语言领域最高级顶会ACL(国际计算语言协会)主席。

学术维度看,周明在NLP领域的影响力也位居世界前列。他是过去十年来发表NLP论文最多的科学家之一。据谷歌学术最新数据,其文章被引用总量超过3.4万。

2020年12月,他从微软离职,随后加入创新工场担任首席科学家,2021年6月孵化出澜舟科技,7月就推出轻量化模型——「孟子」,在中文语言理解评测CLUE榜单的多项指标上登顶第一。

周老师在人才培养、学术、产业方面都有非常高的成就,这次分享是对话的形式,主要根据参与开源学习的学习者感兴趣的问题,进行探讨和答疑。

在这次学习中,周明老师亲自看了每一个学习者提的问题,并逐一提供了反馈。晚上将选出部分问题一起交流。

1.直播预约:4月26日晚20:00

后台回复“周明”可以获取录播分享

以下是学习者们提的问题,周明老师亲自分类(经师易遇,人师难遇,感谢周明老师),看看大家都关心什么:

教育类

  1. 您好周老师,您能谈谈NLP未来的可能的发展么,以及这一波大模型的热度对NLP的从业人员和科研人员和学生的影响?

  2. 周老师您好,请问您如何看待AIGC对教育的影响?您认为在AIGC技术下智慧教育的发展方向在哪里?

  3. 周老师,您好,目前的chatGPT可能已经比世界上任何一个人都聪明了,您觉得未来学历还重要么,考研还有必要么,因为社会变化这么快,学校的那一套越来越不适应社会的发展

  4. 周老师您好,LLM对于刚入门的学生应如何学习呢?

  5. 周老师,您好,请问您觉得chatgpt4能帮助考研学生大幅度提高学习效率吗?

  6. 周教授,大模型时代已经到来,您认为在这种背景下,如何才能做出创新?

  7. 老师您好,我想请问一下,您觉得在目前大模型背景下,nlp 方向的研究、就业是否会受到巨大影响以至于进入一个衰退区呢,因为大模型其实导致了很多nlp经典任务的消融。

  8. 周老师您好,请问一个文科生如何学习ai,尤其是ai 的数学基础。请为文科生规划一个学习路径。谢谢周老师。

  9. 周老师晚上好,我想请教一下关于在社科研究领域如何应用ChatGPT做研究,怎么发挥其LLM模型的优势,在社科领域中有哪些可以较好切入的研究点。谢谢老师!

  10. 周老师,您好,我想问下对于在从事别的行业的在职人员,本身对NLP感兴趣,现阶段学习哪方面的知识可以更好的利用这些大模型,不会别别人替代呢,方便后续谋求更好的职业发展(比如财务审计领域、金融行业)

  11. 周老师,这波大模型浪潮,对于个体而言意味着什么,有哪些重要影响和机会?是否能够为个体实现很大的赋能?主要体现在哪些方面?谢谢老师

  12. 周老师您好!作为一个刚毕业才入职的员工,我正在转型计算机视觉,单位有创新科研的要求,但感觉自己的创新能力有限,一方面是感觉有很多基础知识要学,另一方面又觉得ai发展那么快,感觉自己跟不上了,有种无能无力的感觉。请问老师我该怎么做才能赶上ai的浪潮,不被淘汰呢,感谢老师~

  13. 周老师您好,请问在如今ChatGPT高速发展的形式下,我们作为基层开发者,要如何调整发展才能保持住自己的价值呢?

  14. 周老师您好,在大模型当道的今天,初学者是否还需要学习传统的机器学习理论、方法?

  15. 老师你好,我想问一下如何在AI突起的时代背景下找到需求方向,如何找到自己的AI方向?

技术类

  1. 周老师,请问在大模型高速发展都情况下,知识图谱是否有必要继续发展?如果发展是否是llm+kg,你认为两者该如何结合?

  2. 周老师您好,请问您如何看待LLM的智能化程度,它离真正的具有自我思考创造的智能还有多远?以及未来NLP的发展方向?

  3. 您好周老师,我想请教一下:在传统的NLP任务(如抽取、生成、分类、问答等)中,大型语言模型现在能够达到什么样的效果?相对于小型模型,它们是否具有明显的优势?如果大型模型能够超越小型模型,那么是否意味着将来每个人都可以完成NLP任务,而不需要过多的NLP工程师了呢?

  4. 您好周老师,目前gpt的模型中,规模相对较小的4b,8b类型模型,在基于GPT4生成的训练素材进行训练似乎也能达到接近GPT4的效果。如果只需要特定场景的模型,比如代替人类写sql代码这个场景,是不是基于4b,8b规模的模型进行为微调,也能得到不错的效果?未来研究趋势是沿着GPT的路线越做越大,还是在保证准确率的情况下把大模型做小,让人人都可离线部署?

  5. 周老师您好,我有两个问题:现在越来越多的人提到传统的NLP技术已经不复存在了,这是否意味着以应用为主的NLP入门者该花费相交以往更少的时间在传统nlp理论的学习上?

  6. 请问当前大模型的潜力挖掘到什么程度了呢,如果增加更多数据和算力,模型性能还会有多大的增长?

  7. 老师您好,我想了解一下人工智能现在是否真的到了一个瓶颈期,开始需要像chatgpt那样开始从规模入手提升算法而不是从更优化的模型?

  8. 想问下周老师怎么看大模型对CV的影响,目前来看一般是以多模态的方式去完成对CV的任务。想问下您对于纯视觉的大模型怎么看。以及对于科研工作者,大模型感觉让很多科研工作者处于无科研可做的境地,您怎么看这个事?

  9. 老师您好,现在的大语言模型都有一个很严重的通病,就是会有严重的幻觉,会胡编乱造根本不存在的内容,目前有什么技术路线可以根据这个恶疾?

  10. 现在LLM应用在文本生成领域,怎么控制以及评测生成的数据质量?

  11. 似乎现在的各种类AGI应用,都是把所需的各种信息用旁门左道的方法转化为自然语言文本,再交给LLM进行API调用并自我迭代完成的,这显然是个笨办法,那有没有什么有前景的研究方向,可以取代LLM这个"胶水"模型?

  12. 周老师您好,问下GPT-4相比GPT-3.5,在训练阶段有变化吗,后续的指令微调过程和GPT-3.5有什么不同吗?

  13. 我是一名业务类AI算法工程师,但是面对AIGC一个大模型可以统一所有任务的情况,感到特别焦虑,担心被淘汰。您觉得算法工程师应该如何应对这样的变化呢?

  14. 周老您好,请问您目前对国内的大数据模型看法如何,您认为国内有什么大学或者公司的探索领域是值得关注的?您如何看待ai的安全问题?

  15. 周老师您好,向您请教,如何利用开源大语言模型,开展自己企业的个性化本地化大语言模型打造?

  16. 周老师好,LLM未来在人机对话领域有哪些科研发展方向?哪些前景值得研究?

  17. 周老师好,请问您对LLM的self-refine和self-improve的技术路径有何见解?

  18. ChatGPT及GPT4.0远远优于其他同类LLM的根本原因是什么?

  19. LLM的涌现能力出现的底层原因或数学原理是什么?ChatGPT在各项涌现能力上领先于同类产品吗?是否有具体指标衡量?

  20. 从大模型蒸馏减枝方式将参数减少到小模型之后,通过更高质量数据训练调优,能否一样产生涌现能力?

应用类

  1. 周老师您好,除了自然语言的模型,大模型还会对哪些产业的模型有本质的影响,大家会有意愿去共享自己私域的数据吗?如果会,是什么原因在驱动这个变化?

  2. 周老师,您好。请问对于LLM的finetune,您有什么理解,以后可能每个公司,甚至创业的小公司都能廉价地训练出自己业务领域的LLM吗?finetune需要多少数据量?

  3. 周老师你好,目前OpenAI对国内不开放,而且有合规问题,国内商用LLM效果还比较弱,很多开源的LLM都不允许商用,部分可以商用的中文效果都不好,请问对于国内的个人或者是中小企业,在这波变革之中如何不被落下

  4. 您好,现在各大公司和机构都在争相研究大模型作为基础模型,我们是否真的需要那么那么多相似的大模型,这是否会造成算力和能源的浪费?

  5. 自然语言处理的技术如何应用到基础科学上?比如材料、物理、生物等学科。

  6. 周老师您好,目前大模型在文本、图像等通用非结构化数据上表现良好,请问您觉得这种优势能否应用在结构化数据上,如交通、金融等时序数据,提升这些垂直领域上的模型推理能力吗?

  7. 老师您好,如何针对垂类领域进行数据标注?

  8. 周老师好,请问AI对传统软件的影响是什么样的,未来会大规模嵌入吗?

  9. 周老师您好!您能谈谈多模态大模型与机器人领域结合的发展么,AGI通用人工智能机器人如何实现?感谢老师

  10. 请问nlp目前在情感分析和心理咨询方面有什么突破性的进展?未来实现ai心理咨询是否是大势所趋?

  11. 周老师您好,这次AIGC的浪潮,我感觉开源生态起了很大的作用,像github、huggingface、colab、LLaMa等等,我们不仅依赖这些国外的生态学习,甚至越来越多付费了。想请问周老师,这类开源生态产品有没有推荐的国产替代?以及这类国产替代是否值得作为创业方向?

  12. 周老师您好!请问chatGPT与图技术结合在风控领域的应用有成功案例么?

  13. 周老师好,请问如何利用chatGPT更好赋能coding?

  14. 金融领域落地专用大模型的可能困难在什么地方?

  15. NLP发展历程的拐点有哪些,最新的或者下一次拐点会是什么呢?

参考:
1. 对话AI大牛周明:从科学家到企业家要迈过多少道坎

参与学习:AIGC 组队学习来了!

f36250ceb9d273fe02e04d51c441649f.png
点赞“分享就是一种支持↓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18737.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

对话李彦宏:AI 大模型时代,应用开发机会比移动互联网大十倍

AI 2.0 时代,ChatGPT 的出现,让大模型引发的诸神之战正式打响。百度作为中国首个推出真实应战“武器”的公司,其基于千亿量级数据炼就而成的“文心一言”背后,蕴藏哪些鲜为人知的故事?这种打破人类对过往 NLP 之智能对…

从大神Alex Smola与李沐离职AWS创业融资顺利,回看ChatGPT大模型时代“底层武器”演进...

图文原创:亲爱的数据 “Were building something big ... stay tuned. Talk to me if you want to work on scalable foundation models.” “我们正在建造一个大项目……请继续关注。如果你想在可扩展基础模型上工作,请告诉我。” “参数服务器之父” A…

单元测试编写最佳实践(ChatGPT+Mockito+JUnit)

背景 基于 springboot 微服务架构给单元测试带来的问题: springboot 单元测试启动家长过程非常缓慢,后期服务启动达到分钟级,非常影响效率服务之间相互依赖非常严重,单元测试的运行非常依赖其它服务稳定性第三方服务和中间件&am…

一种基于GOP改进的口语语音评测算法

最近在看语音评测的算法,看到2019年INTERSPEECH 2019 的的一篇paper。这篇主要是研究了 HMM transition probabilities对语音评测的影响。 测试后发现还是比原来的GOP语音评测算法有所改善。

微信版大语言模型来了:跨时空对话李白、教你高情商说话,API在线试玩全都有...

鱼羊 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 大规模语言模型,微信版,来了! 并且甫一登场,就没藏着掖着: 论文、API接口、在线试玩网站……一条龙全都齐备。 续写文本、阅读理解等常规任务就不说了,这个名…

元语AI(ChatYuan): ChatGPT中文版尝试?功能型对话大语言模型.beta版

元语AI是什么 我们训练了一个叫做元语AI(ChatYuan)的模型,它可以通过对话形式进行交互。它可以回答问题,具有联系上下文的能力;可以写文章、写作业、写诗歌、做中英文间的翻译;一些法律等特定领域问题也可以…

李宏毅HW01——新冠疫情数据的预测

目的:熟悉熟悉pytorch 导入数据 !gdown --id 1kLSW_-cW2Huj7bh84YTdimGBOJaODiOS --output covid.train.csv !gdown --id 1iiI5qROrAhZn-o4FPqsE97bMzDEFvIdg --output covid.test.csv/Users/missbei/miniforge3/envs/NLP_search/lib/python3.8/site-packages/gdo…

基于Spark对美国新冠肺炎疫情数据进行分析

2020年美国新冠肺炎疫情数据分析 基于Spark对美国新冠肺炎疫情数据进行分析一、实验环境二、数据集加载三、使用Spark对数据进行分析四、数据可视化 基于Spark对美国新冠肺炎疫情数据进行分析 此案例以2020年美国新冠肺炎疫情数据作为数据集,以Python为编程语言&am…

Chinese medical dialogue data 中文医疗对话数据集

Chinese medical dialogue data 中文医疗对话数据集 Data_数据中有6个文件夹分别是: <Andriatria_男科> 94596个问答对 <IM_内科> 220606个问答对 <OAGD_妇产科> 183751个问答对 <Oncology_肿瘤科> 75553个问答对 <Pediatric_儿科> 101602个问答…

Python爬取新冠肺炎实时数据及其可视化分析

点赞、关注再看&#xff0c;养成良好习惯 Life is short, U need Python 初学Python&#xff0c;快来点我吧 案例&#xff1a;Python爬取新冠肺炎实时数据及其可视化分析 作者&#xff1a;PyQuant 博客&#xff1a;https://blog.csdn.net/qq_33499889 慕课&#xff1a;https:…

北大研究团队面向新冠疫情的数据可视化分析与模拟预测

本次pythonday开发者日活动有幸请到北京大学的陈宝权教授做分享&#xff0c;以下是陈教授近期进行的面向新冠疫情的数据可视化分析与模拟预测项目&#xff0c;陈教授将会在本次活动上做分享与答疑&#xff0c;欢迎大家参与&#xff01; 指导教师&#xff1a;陈宝权教授&#xf…

利用Python获取新冠状病毒肺炎的疫情数据并进行可视化分析,看不懂你打我

文章目录 数据挖掘案例&#xff1a;利用Python获取新冠状病毒肺炎的疫情数据并进行可视化分析一、疫情数据报告网站地址1.1 pyecharts介绍1.2 要用到的库1.3 爬取数据1.3.1 方法11.3.2 方法2&#xff08;采用&#xff09;1.地址2.自己来获取试试看 二、爬取的数据初查看三、爬取…

大数据实战 --- 世界新冠疫情数据分析

目录 开发环境 数据描述 功能需求 数据准备 统计计算 Hbase Hive 分析数据 开发环境 HadoopHiveSparkHBase 启动Hadoop&#xff1a;start-all.sh 启动zookeeper&#xff1a;zkServer.sh start 启动Hive&#xff1a; nohup hiveserver2 1>/dev/null 2>&1 &…

【Python】2020年美国新冠肺炎疫情数据分析

2020年美国新冠肺炎疫情数据分析 一、 需求描述二、 环境介绍三、 数据来源描述四、 数据上传及上传结果查看五、数据处理过程描述1、数据集下载2、格式转换3、启动Hadoop集群4、将文件上传至HDFS文件系统中5、使用Spark对数据进行分析6、读取文件生成DataFrame8、数据可视化 六…

数据分享|函数型数据分析部分省市新冠疫情数据

作者&#xff1a;Mingji Tang 统计学中传统的数据类型有截面数据和时间序列数据。这两者都只能在某一纵向或横向上探究数据&#xff0c;且部分前提条件又很难满足。而函数型数据连续型函数与离散型函数长期以来的分离状态&#xff0c;实现了离散和连续的过度。它很少依赖于模型…

利用Python爬取新冠肺炎疫情实时数据,Pyecharts画2019-nCoV疫情地图

前言 博客是2年前写的&#xff0c;中间有好多网友私信我获取源码及指出部分bug&#xff0c;感谢支持&#xff01; 取不到数据的原因是数据接口发生较大变化&#xff0c;最近刚好有时间&#xff0c;所以重新整理了一下。 第一部分 网页分析 数据源 腾讯疫情实时追踪 今天重新整…

新冠肺炎国内外疫情数据爬取

环境说明 爬虫环境&#xff1a; Python3 IDE:Pycharm 爬虫工具包&#xff1a; requests BeautifulSoup json 从腾讯新闻网爬取 使用chrome浏览器对腾讯新闻网进行页面元素审查&#xff0c;进入network&#xff0c;刷新&#xff0c;查看response&#xff1a; 寻找到这三个js文…

[Pyhon疫情大数据分析] 四.微博话题抓取及新冠肺炎疫情文本挖掘和情感分析

思来想去,虽然很忙,但还是挤时间针对这次肺炎疫情写个Python大数据分析系列博客,包括网络爬虫、可视化分析、GIS地图显示、情感分析、舆情分析、主题挖掘、威胁情报溯源、知识图谱、预测预警及AI和NLP应用等。希望该系列线上远程教学对您有所帮助,也希望早点战胜病毒,武汉…

爬取WHO各国病例数据

还在为拿不到官方病例数据而发愁吗&#xff1f; WHO各国病例数据如下&#xff1a; https://experience.arcgis.com/experience/685d0ace521648f8a5beeeee1b9125cd 我们的目的就是爬出这个图中的数据&#xff1a; 审查元素 首先我们随便点开一个国家的疫情情况&#xff1a;…

Python数据分析高薪实战第十天 EDA实战-全球新冠肺炎确诊病例趋势分析

27 初识 EDA&#xff1a;全球新冠肺炎确诊病例趋势分析 从本讲开始&#xff0c;我们会通过四个具体的案例来将我们之前学习的 Python 数据分析方面的知识全都串起来。一方面能够融会贯通&#xff0c;另一方面也能帮你掌握数据分析基本的方法论。 本讲我们首先会介绍数据分析中…