敲黑板,说重点,最近阿里推出的 Qwen2.5-max 和 Qwen Chat Web UI,将对AI生态又一次冲击。
说冲击,因为 DeepSeek R1的热潮还未散退的情况下,由于服务器压力不能注册新的API,然后价格涨价,服务有时也不稳定,说实话大家对DeepSeek还是颇有微词的,这个时候,阿里推出的 Qwen2.5-max ,在最权威的 测评中 几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B,无疑成为了 DeepSeek V3 和 R1的“最佳平替”!
而另外一个, Qwen Chat Web UI 的推出,将导致 ChatBox , AnythingLLM等众多做应用“壳”的公司面临压力,毕竟,如果大模型厂商直接下场做应用界面了,中介存在的价值似乎没有了。
所以,这一次,AI生态又一次被搅动了!
注意,要体验 Qwen2.5-max ,只能去 Qwen Chat Web UI ,或者去阿里的百炼平台申请API。
工具名称:Qwen 网页版
工具地址:https://chat.qwenlm.ai/
最新的UI如下
建议大家登录亲自体验。
一、工具介绍 ️
Qwen Chat 网页版是阿里通义团队推出的一个集成了多个 Qwen AI 大模型的网站,并且 Qwen Chat 是基于 Open WebUI 构建的。
大家感兴趣也可以看官方的推文:https://x.com/Alibaba_Qwen/status/1877426465349972113
二、核心功能
1.集成多个 QWen 旗舰模型
Qwen Chat 最让人惊喜的是集成了 QWen 大模型家族的大部分旗舰模型,完全免费使用,真是良心。目前模型包括:
- Qwen2.5-Plus:支持文本输入,能够处理复杂任务
- QVQ-72B-Preview:支持文本、图像输入,用于视觉推理
- QwQ-32B-Preview:支持文本输入,擅长思考和推理
- Qwen2.5-Coder-32B-Instruct:支持文本输入,擅长写代码
- Qwen2-VL-Max:持文本、图像输入,用于视觉理解任务
- Qwen2.5-Turbo:支持文本输入,长序列且快速的模型
- Qwen2.5-72B-Instruct:支持文本输入,聪明的大语言模型
- Qwen2.5-32B-Instruct:支持文本输入,强大的中等规模模型
2.同时选择多个模型对话比较
Qwen Chat 还支持同时选择多个模型进行对话,最多 3 个,用户可以用来比较每个模型生成的效果,使用时,需要在右上角选择多个模型即可:
3.支持预览模式,包括 HTML
Qwen Chat 也支持预览模式,对标 Claude 的 Artifacts 功能,对于生成的 HTML 代码,直接在右侧预览,使用时,需要打开输入框下的“预览模式 ”按钮:
不过实测这个功能还有待完善。
建议大家选择“Qwen2.5-Coder-32B-Instruct”模型,这个模型比较擅长写代码。
4.支持上传图片进行理解
Qwen Chat 支持图像理解,用户上传图片后,Qwen Chat 能够理解图片内容,并作出相应的回答,Chris 建议选择 QVQ-72B-Preview 或 Qwen2-VL-Max 模型:
三、即将推出
QWen Chat 接下来还会推出网页搜索、图像生成、语音模式等更多功能,期待中~
四、收费情况
目前 QWen Chat 完全免费,大家可以使用邮箱登录即可。
五、总结
Qwen Chat 是阿里通义团队推出的全新 Web UI,用于与 Qwen 模型交互。Qwen Chat 支持多种模型、上传文档和图片、支持 HTML 预览等,还有未来将推出的功能。
消息参考:
据通义官微,1月29日,Qwen2.5-Max正式发布。Qwen2.5-Max在知识(测试大学水平知识的MMLU-Pro)、编程(LiveCodeBench)、全面评估综合能力的(LiveBench)以及人类偏好对齐(Arena-Hard)等主流权威基准测试上,展现出全球领先的模型性能。通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行了评估测试。指令模型是所有人可直接对话体验到的模型版本,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
2025年1月29日,Qwen2.5-Max正式发布。开发者可在Qwen Chat平台免费体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型API服务。
2025年2月4日,三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单,Qwen2.5-Max以1332分位列全球第七名,也是非推理类的中国大模型冠军。同时,Qwen2.5-Max在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。
2025年2月6日,在“大模型竞技场”的最新榜单中,阿里巴巴的Qwen2.5-Max排名第7。