用户可免费体验!国家超算互联网平台上线阿里开源推理模型接口服

近日,国家超算互联网平台上线阿里巴巴开源推理模型QwQ-32B API接口服务,现在用户可获得免费的100万Tokens。基于国产深算智能加速卡以及全国一体化算力网,平台支持海量用户便捷调用QwQ-32B、DeepSeek-R1等国产开源大模型的接口服务。

图片

了解QwQ-32B

QwQ-32B是阿里Qwen团队最新发布的推理模型,基于Qwen2.5-32B架构并融合了强化学习技术。该模型在数学能力和代码能力评测中表现优异,甚至超越了同尺寸的R1蒸馏模型,并在AIME24评测集和LiveCodeBench中展现了卓越的性能。        

模型特点          

参数规模:QwQ-32B拥有320亿参数,虽然参数量远小于DeepSeek-R1(6710亿参数,其中370亿被激活),但通过强化学习技术,其性能实现了显著提升。    

强化学习:该模型在大规模强化学习的训练下,数学、代码及通用能力上实现了质的飞跃,整体性能与DeepSeek-R1相媲美。

集成Agent能力:QwQ-32B中集成了与Agent相关的能力,使其不仅能够使用工具,还能进行批判性思考,并根据环境反馈动态调整推理过程。

          

性能表现

数学推理:在测试数学能力的AIME24评测集上,QwQ-32B的表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。

代码生成:在评估代码能力的LiveCodeBench测试中,QwQ-32B同样表现出色,与DeepSeek-R1不相上下。

通用能力:在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,QwQ-32B的得分均超越了DeepSeek-R1。

如今国家超算互联网平台已经上线了QwQ-32B的API接口服务,用户无需下载本地模型,即可通过API接口进行调用,进一步降低了使用门槛。

图片

国家超算互联网平台

国家超算互联网平台是一个由科技部指导建设的国家级平台,旨在通过互联网思维运营超算基础设施,实现全国算力资源的统筹调度和高效利用。该平台于2024年4月11日正式上线。

国家超算互联网平台通过高速网络连接全国各地区的超算中心,整合软硬件资源,支持算力、数据、软件、应用等资源的共享与交易。这种模式降低了超算应用的门槛,推动了计算技术向更高水平的发展。

此外平台采用市场化运营和服务体系,提供多样化的算力服务,涵盖科学计算、工业仿真、AI模型训练等多个领域。目前已有超过200家服务商入驻,提供超过3200款商品。平台不仅连接算力资源,还构建了面向应用的生态协作网络,促进产业生态的成熟与发展。

根据科技部的规划,到2025年底,国家超算互联网将形成技术先进、模式创新、服务优质、生态完善的总体布局。这一目标旨在支撑原始科学创新、重大工程突破和经济高质量发展,成为数字中国建设的“高速路”。    

图片

带来的影响

对 AI 技术发展

推动技术自主创新:QwQ-32B 作为国产开源推理模型,其接口服务上线国家超算互联网平台,显著提升了国产 AI 技术的自主性,降低对海外闭源模型的依赖,推动国内 AI 技术生态从 “跟跑” 向 “并跑” 乃至 “领跑” 转变。

加速技术普及应用:免费的 100 万 Tokens 以及平台便捷的使用方式,如一键启动 Notebook 功能,无需本地下载等,极大降低了中小企业和开发者的试错成本与技术部署门槛,能激发长尾市场需求,促使 AI 技术应用从头部企业向中小开发者广泛扩散。

对算力资源分配

优化算力调度模式:依托全国一体化算力网及国产深算智能加速卡,平台可实现跨区域算力的智能调度,突破传统单一算力中心的局限,显著提高算力利用率,据行业预估能使企业硬件投入成本降低 30%-50%。    

推动算力服务市场发展:超算互联网平台的互联网化运营模式,连接了算力供需双方,构建起算力 “应用商店” 生态,催生新型算力经纪服务商,重构产业链的价值分配。

          

对行业应用场景

促进垂直领域应用落地:QwQ-32B 在数学与代码场景的卓越性能,将加快金融量化分析、工业代码生成等专业领域的 AI 应用落地。

推动长尾场景 AI 渗透:小微企业通过 API 调用和 Web 应用服务,能够快速开发定制化 AI 工具,如教育机构可开发数学辅导应用,医疗企业可结合私有数据训练问诊模型等,预计未来 3 年,超 70% 的行业专属模型将基于此类平台快速迭代。

图片

结语

国家超算互联网QwQ-32B API接口服务的上线,为用户提供了免费100万Tokens的使用额度,这一举措极大地降低了用户调用先进AI模型的门槛,加速了AI技术的普及与应用。    

它不仅丰富了国家超算互联网平台的算力服务生态,还促进了AI模型在科研、产业等领域的广泛应用,为推动我国数字经济的高质量发展注入了新的活力。    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32618.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大数据学习(63)- Zookeeper详解

&&大数据学习&& 🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一下博主哦🤞 &#x1f…

【蓝桥杯python研究生组备赛】003 贪心

题目1 股票买卖 给定一个长度为 N 的数组,数组中的第 i 个数字表示一个给定股票在第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易(多次买卖一支股票)。 注意:你不能同时参与多笔交易&…

mmdet3d.models.utils的clip_sigmoid理解

Sigmoid 函数 标准的 sigmoid 函数定义为: 容易得出结论: 取值范围(0, 1) clip_sigmoid 是在标准的 sigmoid 函数基础上进行 裁剪(clip),即对 sigmoid 输出的结果加以限制,避免其超出特定范围。 import …

侯捷 C++ 课程学习笔记:进阶语法之lambda表达式(二)

侯捷 C 课程学习笔记:进阶语法之lambda表达式(二) 一、捕获范围界定 1. 局部变量与函数参数 ​非静态局部变量:Lambda 所在作用域内定义的局部变量(如函数内部的 int x)会被完整复制其当前值。捕获后外部变…

有必要使用 Oracle 向量数据库吗?

向量数据库最主要的特点是让传统的只能基于具体值/关键字的数据检索,进化到了可以直接基于语义的数据检索。这在AI时代至关重要! 回到标题问题:是否有必要使用 Oracle 向量数据库? 这实际还要取决于你的具体应用需求。 客观来讲…

论文解读 | AAAI'25 CoRA:基于大型语言模型权重的协作信息感知用于推荐

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 点击 阅读原文 观看作者讲解回放! 个人信息 作者:刘禹廷,东北大学博士生 内容简介 将协作信息融入大型语言模型(LLMs)是一种有前景的适应推荐任务的技…

es扩容节点以后写入数据量增加1倍

背景: es扩容一倍的数据节点以后 写入数据量增加1倍 业务反馈业务访问量没增加。 最后定位是监控数据: PUT _cluster/settings {"persistent": {"xpack.monitoring.collection.enabled" : "false"} }这个索引记录的是 节…

G-Star 公益行 | 温暖相约 3.30 上海「开源×AI 赋能公益」Meetup

你是否曾想过,在这个数字化浪潮席卷的时代,公益组织如何突破技术瓶颈?当 AI 成为热门话题,它能为公益事业带来怎样的温度?开源的力量,如何让每一份善意都拥有无限可能? G-Star 公益行&#xff…

MySQL数据库复杂的增删改查操作

在前面的文章中,我们主要学习了数据库的基础知识以及基本的增删改查的操作。接下去将以一个比较实际的公司数据库为例子,进行讲解一些较为复杂且现时需求的例子。 基础知识: 一文清晰梳理Mysql 数据库基础知识_字段变动如何梳理清楚-CSDN博…

kafka-docker版

Kafka-docker版 1 概述 1.1 定义 Kafka传统定义: Kafka是一个分布式的基于发布/订阅模式的消息队列(MessageQucue),主要应用于大数据实时处理领域。它是一个开源的分布式事件流平台( Event Streaming Platform),被数千家公司用于高性能数据…

Zabbix 7.2 + Grafana 中文全自动安装ISO镜像

简介 ​ 基于Zabbix 官方的Alma Linux 8 作为基础镜像。 镜像源都改为国内大学镜像站,自动联网安装ZabbixGrafana。 安装中文字体、Zabbix和Grafana也配置默认中文。 Zabbix 也指定中文字体,绘图无乱码。 配置时区为东八区,Zabbix配置We…

使用pip在Windows机器上安装Open Webui,配合Ollama调用本地大模型

之前的文章分享过在 linux 服务器上安装,并使用Open-webui 来实现从页面上访问本地大模型的访问。也写了文章分享了我在家里 Windows Server 台式机上安装 Ollama 部署本地大模型,并分别使用 Chatbox 和 CherryStudio 来访问本地的大模型。今天我来分享一…

【python运行Janus-Pro-1B文生图功能】

前言 体验了一把本地部署Janus-Pro-1B实现文生图功能。 1、开源项目下载 官方开源项目代码直接从Github上下载。 2、模型下载 模型官方下载需要魔法 Janus-Pro-1B模型文件:Janus-Pro-1B模型文件 百度网盘: https://pan.baidu.com/s/16t4H4z-QZe2UDAg4…

18 | 实现简洁架构的 Handler 层

提示: 所有体系课见专栏:Go 项目开发极速入门实战课;欢迎加入 云原生 AI 实战 星球,12 高质量体系课、20 高质量实战项目助你在 AI 时代建立技术竞争力(聚焦于 Go、云原生、AI Infra);本节课最终…

宇树ROS1开源模型在ROS2中Gazebo中仿真

以GO1为例 1. CMakelists.txt更新语法 cmake_minimum_required(VERSION 3.8) project(go1_description) if(CMAKE_COMPILER_IS_GNUCXX OR CMAKE_CXX_COMPILER_ID MATCHES "Clang")add_compile_options(-Wall -Wextra -Wpedantic) endif() # find dependencies find…

LearnOpenGL-笔记-其三

在之前的章节中我们学习了基本的窗口构建方法、着色器的定义与使用以及摄像机的构建,而从今天这个大章节开始我们要来学习光照有关的知识。 颜色 现实世界中有无数种颜色,每一个物体都有它们自己的颜色。我们需要使用(有限的)数…

cfi网络安全 网络安全hcip

目录 RIP (路由信息协议) 算法 开销 版本 开销值的计算方式 RIPV1和RIPV2的区别 RIP的数据包 Request(请求)包 Reponse(应答)包 RIP的特征 周期更新 RIP的计时器 1,周期更新计时器 2,失效计时器 3,垃圾回收计时器 RIP的核心思…

RabbitMQ从入门到实战-2

文章目录 Java客户端快速入门WorkQueue(多消费)能者多劳配置 交换机fanout交换机案例 Direct交换机Topic交互机 声明队列和交互机(IDEA中)基于Bean声明队列和交换机基于注解声明(推) 消息转换器配置Json消息转换器 业务改造&#…

《苍穹外卖》SpringBoot后端开发项目核心知识点与常见问题整理(DAY1 to DAY3)

目录 一、在本地部署并启动Nginx服务1. 解压Nginx压缩包2. 启动Nginx服务3. 验证Nginx是否启动成功: 二、导入接口文档1. 黑马程序员提供的YApi平台2. YApi Pro平台3. 推荐工具:Apifox 三、Swagger1. 常用注解1.1 Api与ApiModel1.2 ApiModelProperty与Ap…

可编辑PPT解析数字化转型是什么意思,传统企业的数字化、数字转型数字化变革之路

《传统企业数字化转型之路》是一份43页的PPT,主要探讨了传统企业在数字化转型过程中面临的挑战和解决方案。文档从竞品分析、竞标分析、整体环境、客户需求、品牌效应、市场份额、技术架构和部门效率等方面进行了详细讨论,指出如果企业在这些方面都存在问…