近日,国家超算互联网平台上线阿里巴巴开源推理模型QwQ-32B API接口服务,现在用户可获得免费的100万Tokens。基于国产深算智能加速卡以及全国一体化算力网,平台支持海量用户便捷调用QwQ-32B、DeepSeek-R1等国产开源大模型的接口服务。
了解QwQ-32B
QwQ-32B是阿里Qwen团队最新发布的推理模型,基于Qwen2.5-32B架构并融合了强化学习技术。该模型在数学能力和代码能力评测中表现优异,甚至超越了同尺寸的R1蒸馏模型,并在AIME24评测集和LiveCodeBench中展现了卓越的性能。
模型特点
参数规模:QwQ-32B拥有320亿参数,虽然参数量远小于DeepSeek-R1(6710亿参数,其中370亿被激活),但通过强化学习技术,其性能实现了显著提升。
强化学习:该模型在大规模强化学习的训练下,数学、代码及通用能力上实现了质的飞跃,整体性能与DeepSeek-R1相媲美。
集成Agent能力:QwQ-32B中集成了与Agent相关的能力,使其不仅能够使用工具,还能进行批判性思考,并根据环境反馈动态调整推理过程。
性能表现
数学推理:在测试数学能力的AIME24评测集上,QwQ-32B的表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。
代码生成:在评估代码能力的LiveCodeBench测试中,QwQ-32B同样表现出色,与DeepSeek-R1不相上下。
通用能力:在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,QwQ-32B的得分均超越了DeepSeek-R1。
如今国家超算互联网平台已经上线了QwQ-32B的API接口服务,用户无需下载本地模型,即可通过API接口进行调用,进一步降低了使用门槛。
国家超算互联网平台
国家超算互联网平台是一个由科技部指导建设的国家级平台,旨在通过互联网思维运营超算基础设施,实现全国算力资源的统筹调度和高效利用。该平台于2024年4月11日正式上线。
国家超算互联网平台通过高速网络连接全国各地区的超算中心,整合软硬件资源,支持算力、数据、软件、应用等资源的共享与交易。这种模式降低了超算应用的门槛,推动了计算技术向更高水平的发展。
此外平台采用市场化运营和服务体系,提供多样化的算力服务,涵盖科学计算、工业仿真、AI模型训练等多个领域。目前已有超过200家服务商入驻,提供超过3200款商品。平台不仅连接算力资源,还构建了面向应用的生态协作网络,促进产业生态的成熟与发展。
根据科技部的规划,到2025年底,国家超算互联网将形成技术先进、模式创新、服务优质、生态完善的总体布局。这一目标旨在支撑原始科学创新、重大工程突破和经济高质量发展,成为数字中国建设的“高速路”。
带来的影响
对 AI 技术发展
推动技术自主创新:QwQ-32B 作为国产开源推理模型,其接口服务上线国家超算互联网平台,显著提升了国产 AI 技术的自主性,降低对海外闭源模型的依赖,推动国内 AI 技术生态从 “跟跑” 向 “并跑” 乃至 “领跑” 转变。
加速技术普及应用:免费的 100 万 Tokens 以及平台便捷的使用方式,如一键启动 Notebook 功能,无需本地下载等,极大降低了中小企业和开发者的试错成本与技术部署门槛,能激发长尾市场需求,促使 AI 技术应用从头部企业向中小开发者广泛扩散。
对算力资源分配
优化算力调度模式:依托全国一体化算力网及国产深算智能加速卡,平台可实现跨区域算力的智能调度,突破传统单一算力中心的局限,显著提高算力利用率,据行业预估能使企业硬件投入成本降低 30%-50%。
推动算力服务市场发展:超算互联网平台的互联网化运营模式,连接了算力供需双方,构建起算力 “应用商店” 生态,催生新型算力经纪服务商,重构产业链的价值分配。
对行业应用场景
促进垂直领域应用落地:QwQ-32B 在数学与代码场景的卓越性能,将加快金融量化分析、工业代码生成等专业领域的 AI 应用落地。
推动长尾场景 AI 渗透:小微企业通过 API 调用和 Web 应用服务,能够快速开发定制化 AI 工具,如教育机构可开发数学辅导应用,医疗企业可结合私有数据训练问诊模型等,预计未来 3 年,超 70% 的行业专属模型将基于此类平台快速迭代。
结语
国家超算互联网QwQ-32B API接口服务的上线,为用户提供了免费100万Tokens的使用额度,这一举措极大地降低了用户调用先进AI模型的门槛,加速了AI技术的普及与应用。
它不仅丰富了国家超算互联网平台的算力服务生态,还促进了AI模型在科研、产业等领域的广泛应用,为推动我国数字经济的高质量发展注入了新的活力。