干货!拥抱大模型,探寻新时代的科研范式

点击蓝字

f3adab15a450a14792be216061e314eb.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

随着ChatGPT、SAM为代表的大规模预训练模型的横空出世,对于人工智能、自然语言处理、计算机视觉以及软件开发等领域都带来了巨大的影响。2023年4月12日,AI TIME与上海交通大学人工智能研究院共同举办了CVPR 2023 预讲会,在panel环节,来自上海交通大学的王琦、任星宇、李逸轩、官同坤四位同学,围绕论文投稿、研究热点以及大模型时代下的科研等话题进行了思辨,以CVPR为例与观众分享了大模型新时代下的科研之路。

26b0b9de098562c6092fbb092ff2cc26.png

01

顶会论文投稿经验分享

● 投稿时间安排

任星宇:我认为论文投稿尽早准备比较好,留出更充裕的时间打磨文章,打磨的次数越多,论文的瑕疵就能相对越少。在第一次投稿的时候,经验不足,有很多问题是正常的,但需要留出足够的时间和导师一起修改,多次投稿熟悉写作套路之后,就能对整个流程比较清楚。

李逸轩:能早做的事情就尽可能在前期做完,比如画图、对比实验、写文章等等,给后面的文章润色留出更多时间。看文章与自己写文章是有差距的,如果是第一次写文章,最好在deadline一个月之前开始写,留出2周左右的时间修改文章是很重要的。

官同坤:对于顶会投稿,精度提升当然是必要的。还有很重要的一点是,写论文时想清楚任务的意义,如何打磨好整个故事。比如针对落地成熟的场景,应该具有有一定的实际意义,对真正落地起到一定的推动作用。

王琦:一开始不要过于追求完美,先让实验模型有个原型,论文有个初稿,在此基础上不断打磨、迭代。

● 如何Rebuttal?

任星宇:Rebuttal过程中最困难的两种情况,一是创新性不够,提出的观点难以让人信服;第二个是多个审稿专家对一个问题同时提出review,那说明论文中的某个点确实存在问题,这种情况会比较困难。如果提出的是实验细节问题或者理解不清的地方,这种会比较容易修改。在投稿过程中若遇到“创新性不足”问题,那就需要将整个故事重新给审稿专家讲一遍,把核心的观点和研究动机理顺,说清和前人工作中最主要的区别,阐明自己不同于别人的优势。若是遇到补充实验的要求,但是实验耗费时间较长,这种情况下我们需要实话实说,在最后的提交版本补充材料。但一般情况下我们会在交完初稿继续补实验,在Rebuttal环节补充。

李逸轩:针对创新性不足的问题,我的方法是给审稿人重新讲一遍整篇论文的故事,针对他的疑问和意见耐心解答,但要注意有所侧重,精简回答问题,尽量让他认可自己的想法。如果遇到特殊的情况(比如审稿人提出的问题不够专业),需要考虑其他的策略。

官同坤:在回答审稿人的意见之前,我们需要揣摩审稿人提出问题的动机,在问题之外他有什么疑惑,将这一点搞清楚,我们才能清楚如何更准确地回答问题。

王琦:当审稿人给出的评分非常不合理的时候,可以尝试给领域主席(AC)发邮件说明具体情况,一般是由AC决定论文是否录用。

02

科研经验分享

● 目前的研究方向及研究热点

任星宇:我目前的研究方向是三维人脸建模,它包括几何重建和纹理重建。该领域实践性更强,相关的文章更看重实际效果和落地性。在大模型的时代,现在的主流思路是与语言、文本大模型结合去提高特定任务的性能。CVPR的很多文章也都是这种范式,包括Stable diffusion视觉大模型的提出也促进了很多下游任务的优化,大家可以多多关注这方面的研究。但是学校中的算力条件有限,我们更应该关注应用层面,研究如何更好地使用大模型、结合多个大模型拓展更新的任务。

官同坤:我的研究方向是文本检测与识别,首先OCR目前的研究方向可以结合自监督,比如如何利用无标注的图像做自监督文本检测,自监督文本识别,面向检测与识别的自监督训练。其次,现有的语言模型在语义预测上错误率很高,较多的只是辅助视觉模型操作,可以在未来对语言模型进行深度优化,使语言模型具有语义矫正的功能。然后,端到端文本识别在目前仍需要一系列流程,还不够丝滑,未来的再突破也是一个问题。最后,OCR的应用场景很广泛,在一些场景下识别的精度还有待提升,比如工业场景,所以将研究聚焦到具体的任务当中也是值得研究的。

李逸轩:首先,现在的换脸算法与影视级别、游戏级别的应用是有差距的,如何将最新的技术与换脸结合并且达到很好的效果,并且如何与CG的方法系统地结合起来实现更好地落地是需要研究的。其次,3D换脸方面要解决的问题很多,比如目前使用3D GAN技术换脸的背景、头发效果并不理想且耗时长,与2D GAN的效果相比有差距,想要实现一些动态的驱动效果或者与下游任务结合也是非常值得探索的。

● CVPR中的idea来自哪里?

任星宇:总结日常生活中的直觉,将直觉提炼为一个规律,发现前人研究中的不足,对自己从日常生活中总结的经验加以探索研究。

官同坤:Idea的产生需要有任务引导,在实际任务中意识到存在的问题,并且现有研究中尚未解决,我们就可以继续研究。

李逸轩:首先出于自己的研究兴趣分析目标工作,找出与自己想实现的效果之间的差距。然后做出第一个demo之后重新理思路,加上一定的约束或者框架,讲好整个故事,让别人理解自己的想法。

● 对科研小白的忠告

任星宇:实践出真知。idea是通过实践得来的,抓紧时间动手,多做验证的工作才能知道有没有效,不要停留在空想的阶段。有实验结果之后,抓紧时间开始写论文,提前完成初稿才有更多时间打磨。其次选方向需要很慎重,不要太耗计算资源,选自己所在条件接受范围内的研究方向做起来会比较顺畅。

官同坤:首先科研小白初期可以将自己研究方向所有的研究工作看一遍,了解整个发展过程,记录重要的点,剖析前人未解决的问题。然后针对具体任务做实验,会发现不同的想法和问题,针对问题提出解决方案。有了想法和实验之后,写文章很重要,文章的打磨和修改也是需要锻炼的。多看论文,多动手实践,改进过程发现新的想法,并通过不断的实验验证有效性,在学习过程中不断成长。

李逸轩:最初的idea需要通过实践去验证,在尝试的过程中调整方向。写代码、配环境需要靠自己多动手实践,可以对照着代码看文章,理解思路和难点。多看新接触领域的文章,学会精读和泛读文章,要了解领域内大致的研究状况。

王琦:Get your hands dirty,理论要和实践相结合,有一个较为清晰的 idea,就可以动手实践了,通过实践得到反馈,不断地调整 idea。

03

大模型时代下的科研转变

任星宇:在大模型时代,我们可以将自己的方向与大模型结合匹配,将大模型作为先验提升自己任务的性能。对于遥感、医学等有具体物理意义的领域,针对其具体的物理场景做一个大数据集是很有意义的。如何将通用大模型与3D大模型以及其他更多的大模型更好地融合起来是值得思考的。

官同坤:第一,大模型对OCR的冲击是有的,但应该放平心态,积极想对策,拥抱大模型的到来,将自己的任务与其结合起来,做一些更有效果的工作;第二,技术工作可以被替代,但是大脑创造的鲜活性还是需要人类,我们要始终保持创造力。

李逸轩:找到合适的切入点将自己的领域与大模型做融合,将大模型作为工具,积极地拥抱新生事物。

王琦:我们可以将大模型结合到已有的任务上做改进,不断优化,将大模型作为工具来帮助我们更好地科研和生活。

整理:陈研

审核:王琦、任星宇、李逸轩、官同坤

点击“阅读原文”跳转可以查看回放哦!

往期精彩文章推荐

290c4ff44eb78f62386f4ebb49f7d238.jpeg

记得关注我们呀!每天都有新知识!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1000多位海内外讲者,举办了逾550场活动,超600万人次观看。

97158fc3fc20c4fdeca03680c1605ce1.png

我知道你

在看

~

d9b3bc267f27b15c8b43305fdc98f63e.gif

点击 阅读原文 查看回放!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/67022.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python开源项目周排行 2023年第12周

原文地址:https://www.python1989.com/github-python-weekly/202312/ #2023年第12周2023年4月8日1Public APIs一个通过 MaShape 市场整合的世界上最全的 API 接口目录,支持关键词搜索和添加 API 数据,方便开发者快速的找到自己想要的 API。2A…

BI界的ChatGPT,它有什么厉害之处

​ChatGPT火了,注册用户从0到1亿,仅用了2个月时间。ChatGPT的背后是大数据、大模型、大算力,是AI的能力集中化的典型场景。那么在BI界,是否也有一款像ChatGPT一样智能BI软件,只要告诉它我们想看啥数据,它噔…

Finetuner+:为企业实现大模型微调和私有化部署

如 ChatGPT、GPT4 这样的大型语言模型就像是你为公司请的一个牛人顾问,他在 OpenAI、Google 等大公司被预训练了不少的行业内专业知识,所以加入你的公司后,你只需要输入 Prompt 给他, 介绍一些业务上的背景知识,他就能…

Sealos 私有化部署完全指南

Sealos 用了五年的时间从一个 K8s 一键安装工具蜕变成了一个真正的云操作系统,将产品体验提升到了极致,也收获了 10w 的社区用户。 一个多月前,Sealos 正式发布了公有云托管版本,社区用户狂喜,纷纷寻找私有化部署教程…

带你搞懂人工智能、机器学习和深度学习!

不少高校的小伙伴找我聊入门人工智能该怎么起步,如何快速入门,多长时间能成长为中高级工程师(聊下来感觉大多数学生党就是焦虑,毕业即失业,尤其现在就业环境这么差),但聊到最后,很多…

AI 工具合辑盘点(十一)持续更新 之 AI 学术研究工具

许多学生和研究人员已经在利用人工智能进行研究。它可以让你更容易地了解最新研究成果,并帮助你组织和正确引用你最喜爱的研究论文。 从生成长篇研究论文摘要到通知你领域内的新趋势,研究中的AI工具节省了大量时间和精力。如果你在学术界,那…

一款全新的基于GPT4的Python神器,关键还免费

chartgpt大火之后,随之而来的就是一大类衍生物了。 然后,今天要给大家介绍的是一款基于GPT4的新一代辅助编程神器——Cursor。 它最值得介绍的地方在于它免费,我们可以直接利用它来辅助我们编程,真正做到事半功倍。 注意&#…

三网快速充值话费通道源码

话费充值 基于Vue2.0开发的话费充值APP,数据接口主要调用 聚合数据 提供的话费充值API实现。很关键的一点因为我聚合账户没有钱,所以没办法来真正的提交钱来测试,不过丝毫不影响,因为这里我前端已经模拟了下单成功后返回的数据(和…

小程序源码:社群微群人脉系统小程序版本源码下载带流量主功能实现广告效益

现在因为小编在实现新版本的功能添加与更新 所以小编就把这一款开源分享给大家吧! 分享出来考虑到大家服务器等等效益所以小编就把后台给砍掉了 所以大家就直接前端上传到微信开发者工具即可使用 本款小程序群二维码自动采集推送的,所以大家不用担心没有群难运营 小编运营…

一套ThinkPHP微信小程序商城源码带后台管理

ThinkPHP微信小程序商城源码带后台管理 源码类型:全开源免费分享,需要学习可私信 注意事项: 1、App/Common/Conf/db.php 数据库连接参数修改; 2、App/Api/Conf/config.php 微信小程序的appid、secret、mchid、key、notify_url&a…

开源的微信商城,含小程序端,后台管理系统,服务器后端,附完整源码

微信小程序商城 项目概述 一个完整的微信小程序商城,包含微信小程序,管理系统,服务端后台,项目预览如下: 微信小程序 -微信小程序包含主页、商品分类、商品详情、加购物车,微信授权登录,微信…

CRMEB全开源Java版微信小程序商城,附源码

CRMEB-JAVA版简介 CRMEB商城JAVA版,SpringBoot Maven Swagger Mybatis Plus Redis Uniapp Vue 包含移动端、小程序、PC后台、Api接口;有产品、用户、购物车、订单、积分、优惠券、营销、余额、权限、角色、系统设置、组合数据、可拖拉拽的form表单等…

小程序商城源码,小程序源码带前端+后台+数据库 ,免费分享

三勾商城是开发友好的微信小程序商城,框架支持SAAS,支持发布 iOS Android 公众号 H5 各种小程序(微信/支付宝/百度/头条/QQ/钉钉/淘宝)等多个平台,不可多得的二开神器, 为大中小企业提供极致的移动电子…

带分销小程序商城源码,完整代码分享

源码免费下载地址:https://github.crmeb.net/u/gitee **技术交流群:**116279623 包含功能: 1.商品: 能够对商品的状态分类管理 (出售中、待上架、库存中、已售馨、库存警戒、回收站)、添加产品、添加商品分类等功能 2.会员:站内会员的管…

集成一个以官网(微信,QQ,微博)为标准的登录分享功能

Hello,各位老铁,今天要分享的是一个老生常谈的一个功能,也是网上一搜一大片的技术点,没什么技术含量,就是整合一下,提供一下方便,相对于友盟,ShareSdk中夹杂着一些别的功能&#xff…

虹科案例 | 虹科HiveMQ助力实现百万辆汽车智能互联

一、应用背景 用户介绍 为顺应汽车技术和移动性的新兴趋势,Autonomic公司于2016年正式成立。公司致力于提供一个通用的平台,让汽车OEM可以利用此平台创建互联移动系统,为客户带来绝佳使用体验,并降低运营成本。2018年&#xff0c…

赋能创新,深开鸿发布面向金融行业KaihongOS发行版

3月28日, “开疆拓土,鸿鹄志远” 深圳开鸿数字产业发展有限公司(以下简称“深开鸿”)线上发布会成功举办。提炼前沿实践,聚焦金融科技,探索综合创新的金融数字化和智能化之路,深开鸿发布了面向金…

谷歌深夜王炸级更新!PaLM 2大模型震撼发布!Bard写代码,哪里不懂点哪里!

谷歌CEO桑达尔皮查伊:我们对AI的态度是又大胆又负责。 出品|网易科技智见焦点 作者|赵芙瑶 编辑|丁广胜 这回,谷歌急了! 他们这半年过得是真憋屈!近半年来AI的发展速度就像坐上了火箭&#xff0…

最简单的移动端pc端(解决苹果端的兼容问题)一键复制,保存到剪贴板

先上效果图: 为了用户体验更佳,对于公众号,手机号,物流单号,等需要一键复制而不是让用户一个一个的去选择。 demo链接: http://download.csdn.net/download/vlilyv/9970325 github下载地址 https://gi…

使用clipboard实现复制到剪切板功能(超详细~~)

先看看效果&#xff1a; 1.页面中使用 // html <Button type"primary" click"clickCopy">复制</Button>// js <script>import utils from /libs/utilsmethods: {clickCopy (){utils.copy2clipboard(LALALAALA)//复制的内容},} </s…