随着各个互联网大厂,新能源产业纷纷入场机器人赛道,各家几近明牌,都笃定未来十年具身智能将是最重要的科技革命之一。想起一句话“技术爆发的节点,就是入场的时机”。机器人是否能真正替代人类暂且不论,只谈谈个人的一些经历。
1 一些探索
跟随时代的大潮,2024年对各类机器人硬件、算法、仿真软件,落地部署等有了一定了解,也做了一些测试,当然多数是基于开源的资料做的仿真测试案例,一部分是基于开源做的适配。
- 包括机械臂,无人机,移动小车,移动机械臂,旋翼机械臂,四足+机械臂,6D抓取姿态预测,基于相机和VR的遥操作,主从臂遥操作等,基于大模型的机械臂任务生成,VLA模型微调。
- 算法涉及强化学习,模仿学习,深度学习,大模型,传统控制,基本通讯逻辑,
- 测试软件包括gazebo,mujoco,webots,Isaac gym,Isaac sim。
- 此外做了斗地主ai和掼蛋ai测试,基于文心和GPT的问答网站搭建。
总体上看,各方面都有所涉及,但并未深入,然而也算有一些经验,包括市场上各家各类机器人产品的优势,各类前沿方案的可复现情况,和改进逻辑。
2 一些看法
从硬件上看各家的硬件尚未收敛,或者说尚未有一个最优的硬件方案,当前的市场甚至未真正进入一个百家争鸣的态势,随着研发和竞争的的进一步加剧,成本会进一步降低,直到这个价格适合进入千家万户,各行各业,这个时候会才会真正呈现一个机器人革命,而现在仍是机器人时代来临的前夕,也是入场的好时机。
从算法上看,当前机器人领域同样希望做一个大模型,但在实际推理时需要较高的算力,如果远程部署会影响实时性,如果本地部署存在成本高,部署硬件大的问题。GPU小型化、高性能仍是需要解决的问题,在保证性能的前提下,减小模型也是一个重中之重。
但这两者解决之后最大的问题还是场景部署,尽管各家都在提倡通用场景,但目前看短期难以实现,当前的问题仍是机器人如何快速真正适应一个复杂多变的场景。
3 一些想法
具身智能这个赛道还很长,也很大,需要做的东西很多。我对这个方向很感兴趣,也正在参与其中,接下来主要是做端到端。欢迎感兴趣的朋友一块探索这片蓝海。