本文转载自微信公众号「计算机视觉工坊」,一个定期分享SLAM与自动驾驶干货知识的公众号,推荐大家关注。点击下方,即可。
众所周知,随着ChatGPT的爆火,AI全面进入大模型时代,NLP、CV大有统一之势,回顾发布的各种大模型,Google BARD,openAI的GPT,Meta的SAM,百度的文心一言等等,这些基本都是有实力有技术的大公司引领着来研究的,但是作为一名普通的高校科研工作者,我们大多数基本上是没有这么多资源算力去开发这样的大模型的,但是大模型在各个方向效果精度几乎是碾压,导致很多领域方向就消失了,很多研究生也是很焦虑,可能在申的论文以及毕业答辩时肯定会comment你的性能差距大模型这么多,还有研究的必要吗?
所以,大模型时代下,作为一名普普通通,没有很多资源算力的科研人如何继续研究呢?
最近在arXiv上刷到一篇文章,也许能提供一些思路。
论文名称:
AV-SAM: Segment Anything Model Meets Audio-Visual Localization and Segmentation
论文地址:
https://arxiv.org/abs/23