VALSE 2023 无锡线下参会个人总结 6月11日-2

VALSE 2023 无锡线下参会个人总结 6月11日-2

  • 6月11日会议日程安排
  • Workshop:目标检测与分割
    • 程明明:粒度自适应的图像感知技术
    • 张兆翔:基于多传感器融合的视觉物体检测与分割
  • Workshop:ChatGPT与计算机视觉
    • 白翔:再谈ChatGPT那些事儿
  • Workshop:视觉知识和多重知识表达
    • 王文冠:知识与数据双驱动的视觉感知
    • 谢伟迪:基于知识驱动的多模态表征学习
    • 孙奕帆:Exploring the Prototype and Scope of Visual Concept
  • Poster 环节
    • DETRs with Hybrid Matching
    • VoxelNeXt:Fully Sparse VoxelNet for 3D Object Detection and Tracking (CVPR 2023)
    • You Only Segment Once:Towards Real-Time Panoptic Segmentation
    • Understanding the Roubustness of 3D Object Detection with Bird's-Eye-View Representations in Autonomous Driving (CVPR 2023)
  • 现场海报展示
  • Workshop:大模型对CV/PR的挑战与机会
    • 田永鸿:国产E级智算平台上视觉大模型训练及应用
    • 田奇:在大模型背景下,重新审视计算机视觉的发展方向
    • 黄高:视觉数据多样性带来的机遇与挑战
  • Workshop:物联网与工业应用
    • 何源:从应用视角看物联网技术发展——射频计算初探
    • 杨树森:边云场景大数据计算:算法、平台与应用
    • 谢磊:“工业视觉与边缘智能”助力新型电力系统

写在前面

  今年 VALSE 2023 的举办地刚好在博主目前就读学校的所在地,江苏无锡,欢迎各方学者前来参会。先预告下,今年的确是大模型、多模态的主场了,ChatGPTA、AGI 等等百花齐放。

  会议持续 3 天(6月10-12日),7个特邀报告,12 个APR报告,20 场 Workshop,186 篇左右的顶会顶刊 Poster。报告对比去年更多了,论文少了 10 几篇。

第二天开始就是 Workshop 了,都是同时开展的,所以就是各大会场分开跑,这里的顺序按照我参加的 workshop 来排列。

每篇博文的内容太多消化不了,请移步以下链接分别浏览:

  • VALSE 2023 无锡线下参会个人总结 6月10日-1
  • VALSE 2023无锡线下参会个人总结 6月11日-2
  • VALSE 2023 无锡线下参会个人总结 6月12日-3

另外,VALSE 官方的微信文章也出来了:VALSE 2023 在无锡成功召开,5500 余人共舞学术华尔兹。

  PS:2023 年每周一篇博文阅读笔记,主页更多干货,欢迎关注。有问题私信或者留言都可,笔者看到后第一时间回复,期待 5 千粉丝有你呦 ~

6月11日会议日程安排

在这里插入图片描述

Workshop:目标检测与分割

请添加图片描述

程明明:粒度自适应的图像感知技术

程老师不用多说,南开大学的扛把子之一,主页:https://mmcheng.net/。
请添加图片描述
请添加图片描述
请添加图片描述

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
https://github.com/yuhuan-wu/P2T
https://github.com/yuhuan-wu/P2T
  

请添加图片描述
请添加图片描述
请添加图片描述

请添加图片描述
程老师的报告:从 ResNet 的引入到 ViT、PVT一系列模型,具体的还需要查看这些论文,最后是一个比赛,欢迎打榜。

张兆翔:基于多传感器融合的视觉物体检测与分割

  张老师演讲的内容和传感器相关,很多术语和控制相关,但又不是控制的内容,值得借鉴!

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

Workshop:ChatGPT与计算机视觉

2023 年 6 月 27 日更新: 谢凌曦发表的一篇知乎文章:【VALSE 2023】走向计算机视觉的通用人工智能:GPT和大语言模型带来的启发

白翔:再谈ChatGPT那些事儿

  白老师的这个 workshop 真是人多到爆满,放几张图感受下。

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
人太多,挤不上前,放张 PPT 吧,😅

请添加图片描述

Workshop:视觉知识和多重知识表达

王文冠:知识与数据双驱动的视觉感知

  因为要赶下一场谢伟迪老师的报告,所以提前看了会王老师的报告。

请添加图片描述
硬核广告之期刊推荐:

请添加图片描述
硬核广告之招生推荐:

请添加图片描述

谢伟迪:基于知识驱动的多模态表征学习

  温馨提示:谢老师 B 站有号:未来亦可期-CV,个人主页:https://weidixie.github.io。

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
最后一部分在B站有视频:(AI4Med Series) PMC-VQA: Visual Instruction Tuning for Medical VQA
请添加图片描述

另外,2023年 谢老师硬核招生:
在这里插入图片描述
  

孙奕帆:Exploring the Prototype and Scope of Visual Concept

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

请添加图片描述
请添加图片描述
不太懂,感兴趣的可以看下对应文章。

Poster 环节

这一环节分成两部分,一部分是在讲台上演讲,另一部分是以展报的形式展出。

DETRs with Hybrid Matching

列举了 DETR 一系列的工作,值得好好看看!

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

VoxelNeXt:Fully Sparse VoxelNet for 3D Object Detection and Tracking (CVPR 2023)

请添加图片描述

You Only Segment Once:Towards Real-Time Panoptic Segmentation

请添加图片描述

Understanding the Roubustness of 3D Object Detection with Bird’s-Eye-View Representations in Autonomous Driving (CVPR 2023)

请添加图片描述

现场海报展示

  这里只放出我感兴趣的一些,更多文章列表请见:VALSE 2023 POSTERS。PS:论文笔记有着落了啦~

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

Workshop:大模型对CV/PR的挑战与机会

田永鸿:国产E级智算平台上视觉大模型训练及应用

请添加图片描述
请添加图片描述
田老师的报告很有意思,不去卷 CV了,改卷蛋白质、疫苗等生物领域了😄。

田奇:在大模型背景下,重新审视计算机视觉的发展方向

  田老师没来,谢凌曦代讲。

请添加图片描述
请添加图片描述
请添加图片描述

黄高:视觉数据多样性带来的机遇与挑战

请添加图片描述

Workshop:物联网与工业应用

何源:从应用视角看物联网技术发展——射频计算初探

请添加图片描述

杨树森:边云场景大数据计算:算法、平台与应用

请添加图片描述
请添加图片描述

谢磊:“工业视觉与边缘智能”助力新型电力系统

  因为我本科专业电气工程及其自动化,所以对这块上点心。

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
写在后面

  第二天开始程老师报告很精彩,之后我是各个 Workshop 到处跑,尤其是 B6 和 B4 馆,其中 ChatGPT 那个真是火爆了。顺便说一下,这下半年要读的大量论文这不就来了嘛。

(优秀学生论坛现场签到照片)
请添加图片描述

快捷跳转链接:

  • VALSE 2023 无锡线下参会个人总结 6月10日-1
  • VALSE 2023无锡线下参会个人总结 6月11日-2
  • VALSE 2023 无锡线下参会个人总结 6月12日-3
  • VALSE 2023 在无锡成功召开,5500 余人共舞学术华尔兹

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/16443.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人脸属性分析--性别、年龄和表情识别

人脸属性指的是根据给定的人脸判断其性别、年龄和表情等,当前在github上开源了一些相关的工作,大部分都是基于tensorflow的,还有一部分是keras,CVPR2015曾有一篇是用caffe做的. CSDN 从0到1实现基于Tornado和Tensorflow的人脸、…

诸葛智能CTO文革:以自助式数据分析,帮助企业释放业务价值丨数据猿专访

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 进入数字经济时代,无论是数字产业化还是产业数字化的推进,数据分析都是整个链条的关键环节。尤其是在各个行业的数字化转型升级过程中,以数据分析释放业务价值,扮演至关重要的…

python详解(5)——类,类,还是类

目录 🏆一、前言 🏆二、类 🚩1、面向对象到底是什么 🚩2、数据成员and访问,汉堡店大升级(超难) 👍①、类变量(超难) 👍②、实例变量 &#x1f6a9…

数字孪生“独木难支”产业元宇宙

ChatGPT的耀眼光环下,还有多少人记得大明湖畔的“元宇宙”呢?科技圈凉薄如斯啊! 元宇宙概念大火之后,很快出现了各种“XX元宇宙”的产业级解决方案。 工业元宇宙,构建智能数字孪生体,实现生产运行可视化、数…

【探索 Kubernetes|作业管理篇 系列 7】探究 Pod 有什么用,为什么需要它

前言 大家好,我是秋意零。 前一篇,我们介绍了如何从 0 到 1 搭建 Kubernetes 集群。现在我们可以正式了解,Kubernetes 核心特征了。 今天我们来探究 Pod,为什么需要 Pod? 👿 简介 🏠 个人主页…

从零开始的steam独立游戏独自一人的开发生活

从零开始的steam游戏开发日志(鼓励自己不停更) 自己一个人做游戏自己做策划、美术、程序,会把一些涉及到的关键技术发到CSDN作为自己的博客记录,也算是一些积累,鼓励自己不停更。PS:自己一个人搞开发真的很…

语音合成概述

一、语音合成概述 语音合成,又称文语转换(Text To Speech, TTS),是一种可以将任意输入文本转换成相应语音的技术。 传统的语音合成系统通常包括前端和后端两个模块。前端模块主要是对输入文本进行分析,提取后端模块所需要的语言学信息&…

TTS | 语音合成常见数据集及数据格式详情

link 本文主要是介绍了语音合成中最常见的数据集(包含各个语种),及其格式等 外语数据集 1.LJSpeech 网址 : The LJ Speech Dataset (keithito.com) 数据集描述: 数据集大小:2.6GB 这是一个公共领域的语音数…

语音合成技术入门之Tacotron

语音合成TTS 学习李宏毅课程。 输入文字,输出语音。 端到端之前TTS 18世纪就有,能找到demo的是1939年VODER。 就像电子琴一样,用手控制发出不同声音。 到1960年,IBM计算机能合成出歌唱声。 波形拼接 过去最常用的商用语音合…

语音合成技术

关注52AI,做AI的行业领先者。QQ人工智能行业交流群:626784247. 01 本期分享的主题是语音合成技术,以下是本次分享的主要内容: 1.语音合成技术简介 1.1 什么是语音合成? 语音合成技术是将任意文本转换成语音的技术。是人…

语音合成技术简介

文章目录 前言一、传统语音合成系统1. 总体框架2. 基于统计参数的语音合成2.1 系统流程图2.2 模型算法 二、端到端的合成语音系统1. 总体框架2. 基于深度学习的语音合成2.1 系统流程图2.2 特征网络模型算法1. Tacotron2. DeepVoice3. DeepVoice24. DeepVoice3 & Tacotron25…

语音合成 - TTS gTTS

目录 1. 简单介绍 2. 代码示例 1. 简单介绍 https://gtts.readthedocs.io/en/latest/https://gtts.readthedocs.io/en/latest/ gTTS 是基于 Python 的文本转语音库,用于语音合成。 2. 代码示例 安装: pip install gTTS Python: from gtts import…

在线语音合成工具代码

语音合成软件语音合成助手免费版下载语音合成助手语音合成技术语音合成器语音合成工具下载语音合成软件哪个好用语音合成软件免费版语音合成网易有道智云语音合成网站 <div class"container mx-auto" id"app"><div class"card lg:card-side …

VITS 语音合成完全端到端TTS的里程碑

Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech&#xff08;ICML 2021&#xff09; KAKAO公司与KAIST韩国科学院&#xff0c;近年在TTS领域佳作频出&#xff0c;目前最主流的HiFiGAN声码器也是其成果。 目录 概览&#xff1…

MS-TTS:免费微软TTS语音合成工具(一键合成导出MP3音频)

声明 本工具是个免费工具&#xff0c;遇到问题&#xff0c;还请自行解决&#xff0c;下面有文字教程&#xff0c;B站有视频教程&#xff08;链接在文章末尾&#xff09;&#xff1b; 其次&#xff0c;微软接口卡顿&#xff0c;连接超时等问题下方有详细说明&#xff0c;请仔细…

某团mtgsig逆向学习

声明&#xff1a;本文仅限学习交流使用&#xff0c;禁止用于非法用途、商业活动等。否则后果自负。如有侵权&#xff0c;请告知删除&#xff0c;谢谢&#xff01;本教程也没有专门针对某个网站而编写&#xff0c;单纯的技术研究 目录 案例分析参数分析效果展示 案例分析 目标案…

高通量代谢组学四路筛选法,揭秘“神药”二甲双胍延长寿命的机制

百趣代谢组学分享—研究背景 目前据统计中国糖尿病患者人数达9700万以上&#xff0c;数量达到世界第一。这其中2型糖尿病占到了90%以上。二甲双胍是目前治疗2型糖尿病的一线“明星”药物&#xff0c;因其较少出现低血糖和体重增加副作用而受到广大患者和医生的青睐。代谢组学文…

推荐:ChatGPT指令大全(37个)

使用时&#xff0c;可参考这些语境。会问问题&#xff0c;才是最重要的。 AGI 时代必备&#xff1a;《提问的艺术——让ChatGPT导出高质量答案》38 赞同 7 评论文章 1. 写报告&#xff1a;我现在正在 [报告的情境与目的]。我的简报主题是 [主题]&#xff0c;请提供 [数字] 种…

启蒙教师周志华亲自讲解,机器学习视频课上线了

主讲&#xff1a;周志华&#xff0c;南京大学教授 人工智能从1956年正式成为一个学科&#xff0c;机器学习是人工智能的核心研究领域之一。今天的“人工智能热潮”正是由于机器学习等技术取得了巨大进展&#xff0c;并基于大数据、大算力发挥出巨大威力。 《机器学习初步》课…

斯坦福| ChatGPT用于生成式搜索引擎的可行性

文&#xff5c;智商掉了一地 随着 ChatGPT 在文本生成领域迈出了重要一步&#xff0c;Bing 浏览器也接入了聊天机器人功能&#xff0c;因此如何保证 Bing Chat 等搜索引擎结果的精确率和真实性也成为了搜索领域的热门话题之一。 当我们使用搜索引擎时&#xff0c;往往希望搜索结…