重大升级:Claude 3.5迎重磅升级
Anthropic发布了Claude 3.5的重大更新,其中最引人注目的就是Claude 3.5 Sonnet模型,可以像人类一样操控电脑。这一功能的实现,得益于Anthropic推出的一个API,它允许Claude感知并与计算机界面进行交互,开发者可以通过集成这一API,将用户的指令翻译成计算机可以执行的指令。
主要功能
- 屏幕坐标定位:Claude 3.5 Sonnet支持屏幕坐标定位,可以告诉你图中任何一个点的具体坐标。
- 多模态能力:Claude 3.5在视觉能力方面取得了显著提升,可以直接处理图片和视频。
- 推理能力:Claude 3.5在推理和逻辑能力上有了显著提升,可以解决复杂的数学和逻辑问题。
使用示例
推理能力示例
-
解释补集法的概念:
- 一家公司有两个部门,A部门3个男生,2个女生,B部门4个男生,6个女生,现在要派3个人去出差,要求每个部门至少出一人,那么至少有一个女生被派出的概率是多少?
-
物理题示例:
- 张三是一名推销员,她在绿房子卖掉了三分之一的吸尘器,在红房子多卖了2台,在橙房子卖掉了剩下吸尘器的一半。如果张三还剩下5台吸尘器,她一开始有多少台吸尘器?
多模态能力示例
- 图片处理:
- 给出一张照片,Claude 3.5可以识别照片中的物体并进行描述。
推理能力不足之处
- 数独游戏:
- 当让Claude玩玩数独游戏的时候,却惨遭失败。天啊,Claude的数独能力真的超糟糕的。
注意事项
- 信息核实:由于Claude的能力还在测试阶段,因此主要目的就是获取开发者的反馈,以便未来能够不断改进。
- 分辨率限制:Anthropic建议不要以高于XGA/WXGA的分辨率发送屏幕截图,以避免与图像大小调整相关的问题。
结论
Claude 3.5 Sonnet的发布标志着人工智能在操作和执行任务方面取得了重大突破。虽然在某些任务上仍存在不足之处,但其在推理和多模态能力上的提升使其成为当前最强大的大模型之一。