免费在腾讯云Cloud Studio部署DeepSeek-R1大模型

2024年2月2日,腾讯云宣布DeepSeek-R1大模型正式支持一键部署至腾讯云HAI(高性能应用服务)。开发者仅需3分钟即可完成部署并调用模型,大幅简化了传统部署流程中买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等繁琐步骤。通过腾讯云HAI,开发者只需两步即可轻松调用DeepSeek-R1大模型,显著提升了开发效率。

fb3f4304d620250208232304

国内云端AI算力平台对比

在国内云端AI算力平台中,百度飞桨AI Studio仅支持部署运行PaddlePaddle深度学习框架,而腾讯Cloud Studio则没有这一限制,且每月免费提供10000分钟的使用时长,支持随用随开、即时关闭,成为轻量化部署DeepSeek-R1的理想平台。此外,有传闻称腾讯可能是DeepSeek背后的重要股东,进一步凸显了双方合作的深度。

主流云端算力平台免费配额对比

目前,提供免费配额的主流云端算力平台包括Google Colab、Amazon SageMaker Studio Lab、Kaggle、Gradient、阿里云天池、百度AI Studio和腾讯Cloud Studio等。以下是各平台的主要特点:

  1. Google Colab:无总计使用时间限制,单次连续使用时间不超过12小时,提供多种GPU选项。

  2. Amazon SageMaker Studio Lab:提供Tesla T4 GPU(16GB显存),持久化存储空间15GB,每天运行时间不超过8小时,单次使用限制4小时。

  3. Kaggle:提供16GB显存的P100 GPU,每周总运行时间不超过40小时,单次限制6小时,持久化存储空间20GB。

  4. Gradient:提供8vCPU、30GB RAM和Quadro M4000 GPU(8GB显存),持久化存储空间仅5GB。

  5. Azure 100/Student:Microsoft Azure学生账户提供100美元赠金,可用于购买GPU算力资源,支持16GB或更大显存的Tesla T4 GPU及50GB持久化存储空间。

  6. 阿里云天池:提供总计60小时GPU使用时间,显存16GB,单次连续使用时间不超过8小时。

  7. 百度AI Studio:提供多种GPU选项,但仅支持PaddlePaddle框架,吸引力有限。

腾讯Cloud Studio的优势

腾讯Cloud Studio在免费配额方面表现尤为突出,按月赠送体验时长(配额),非常良心。Cloud Studio提供两类工作空间:

  1. 通用工作空间:免费版规格为1核处理器、2G存储(突发可使用内存)、4G系统空间,不消耗配额。额外资源使用月度3000分钟体验时长兑换。

  2. 高性能工作空间(HAI):每月赠送10000分钟体验时长,可兑换免费基础型高性能工作空间的使用(T4 16GB显存、32GB内存)。多个空间同时运行会叠加计时,体验时长用完后自动关机。

DeepSeek-R1:14B模型部署实战

腾讯 Cloud Studio 免费基础型使用 HAI 基础型高性能工作空间,默认免费搭配 80GB 云硬盘,包括 30GB 系统盘和 不到 50GB 的数据盘,结合免费的 HAI 基础型 GPU 资源 16GB 的显存,最高可以部署、运行 deepseek-R1 14B,相比本地部署一般都是 7B、8B 的版本,性能、体验更好,10000 分钟/月体验时长可以完成不少零碎的推理任务。

1. 登录腾讯Cloud Studio

访问 腾讯Cloud Studio官网并登录您的账号。

进入控制台,选择高性能工作空间(HAI),创建一个新的实例,选择 DeepSeek R1,就可以直接 部署好完整的 deepseek r1:7b。如果需要部署 14b,则可删除已有的 7b,加载运行 14b 模型即可。这里示例选择 olama,默认预置的 llama3 可在部署完成后删除。

fe245c62cb20250208233328

等待实例启动,部署完成之后显示“运行中”的提示。部署失败(显示“失效”)的原因多由于资源有限, 过于火爆导致缺少库存,可以删除后再重新部署,一般多尝试几次都可以部署成功。

356b7f188620250208233754

2. 删除预置模型(可选)

腾讯Cloud Studio默认预置了一些模型(如deepseek-r1:1.5b,deepseek-r1:7b),如果您不需要这些模型,可以通过以下命令删除:

ollama list # 查看已安装的模型deepseek-r1:1.5b # 删除1.5b模型deepseek-r1:1.5b # 删除7b模型

326562389720250208234345

3. 下载并运行DeepSeek-R1:14B模型

打开 终端(快捷键 Ctrl+~),输入以下命令下载并运行DeepSeek-R1:14B模型: 

ollama run deepseek-r1:14b

53fc6b409320250208234028

1b0901136f20250208234028

9286de80ab20250208234705

等待模 型下载完成。下载速度取决于网络带宽,腾讯Cloud Studio提供最高100Mbps的带宽,通常可以在几分钟内完成。

54106914e820250208234738

下载完成后,模型 会自动运行,并进入交互式对话模式。

6dde04e5d320250209005538

4. 常用命令

以下是一些常用的命令,帮助您更好地管理模型和会话:

  • 退出对话
    /bye
  • 清除上下文
    /clear
  • 查看GPU信息
    nvidia-smi
  • 查看存储空间
    df -h
  • 查看内存使用情况
    free -m
5. 内网穿透与WebUI接入

腾讯Cloud Studio不支持Docker,且未配置公网IP,需通过内网穿透工具(如Cloudflared)将DeepSeek发布至公网,以便接入WebUI。以下是具体步骤:

安装内网 穿透工具:使用Cloudflared或其他内网穿透工具(如Ngrok),本次使用Cloudflared,因为超级简单,缺点就是网速有点慢,但是不影响使用。

 安装Cloudflared,执行命令:

## 下载安装包wget https://ghfast.top/https://github.com/cloudflare/cloudflared/releases/latest/download/cloudflared-linux-amd64.deb## 安装dpkg -i cloudflared-linux-amd64.deb## 查看是否安装成功cloudflared -v

6a161591d520250209003607

75076ed9ca20250209003607

查看 ollama  的端口号:

netstat -ntlp

 如果出现-bash: netstat: command not found错误时,需要安装netstat工 具:

sudo apt update # 更新软件包列表sudo apt install net-tools # 安装 net-tools 工具包

d8b2dfd63020250209001901

65fd4e60e320250209002031

内网穿透:

cloudflared tunnel --url http://127.0.0.1:8434

58c7904b0820250209003942

439233694620250209003959

配置WebUI:将生 成的公网URL配置到WebUI中,即可通过浏览器访问DeepSeek-R1。

 9b50d2017e20250209005347

58d7402c8320250209005347

6. 注意事项
  • 实例创建失败:由于DeepSeek-R1模型火爆,腾讯的计算资源可能有限。如果创建实例失败,建议多次尝试或更换时间重新部署。

  • 存储空间管理:腾讯Cloud Studio提供80GB持久化存储空间(包括30GB系统盘和50GB数据盘),请定期清理不必要的文件以避免超额收费。

  • 网络流量:每月免费提供500GB公网流量,超出部分按0.8元/GB计费,请合理使用。


7. 性能优化
  • 多GPU支持:如果您有更高配置的硬件,可以尝试部署70B模型,以获得更强的性能。

  • 批量任务处理:通过脚本自动化调用DeepSeek-R1,提高任务处理效率。

  • 上下文管理:使用/clear命令定期清除上下文,避免模型输出偏差。


总结

腾讯Cloud Studio凭借其免费配额、高性能工作空间和极简部署流程,成为国内云端AI算力平台的佼佼者。对于开发者而言,腾讯云HAI与DeepSeek-R1的结合不仅降低了部署门槛,还显著提升了开发效率,是轻量化AI模型部署的理想选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15673.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言-结构体

1.共用体: union //联合--共用体 早期的时候,计算机的硬件资源有限, 能不能让多个成员变量 公用同一块空间 //使用方式 类似 结构体 --- 也是构造类型 struct 结构体名 { 成员变量名 }; union 共用体名 { 成员变量名 }; //表示构造了一个共用体…

多头自注意力中的多头作用及相关思考

文章目录 1. num_heads2. pytorch源码演算 1. num_heads 将矩阵的最后一维度进行按照num_heads的方式进行切割矩阵,具体表示如下: 2. pytorch源码演算 pytorch 代码 import torch import torch.nn as nn import torch.nn.functional as Ftorch.set…

数据仓库和商务智能:洞察数据,驱动决策

在数据管理的众多领域中,数据仓库和商务智能(BI)是将数据转化为洞察力、支持决策制定的关键环节。它们通过整合、存储和分析数据,帮助组织更好地理解业务运营,预测市场趋势,从而制定出更明智的战略。今天&a…

C++ ——从C到C++

1、C的学习方法 (1)C知识点概念内容比较多,需要反复复习 (2)偏理论,有的内容不理解,可以先背下来,后续可能会理解更深 (3)学好编程要多练习,简…

半导体制造工艺讲解

目录 一、半导体制造工艺的概述 二、单晶硅片的制造 1.单晶硅的制造 2.晶棒的切割、研磨 3.晶棒的切片、倒角和打磨 4.晶圆的检测和清洗 三、晶圆制造 1.氧化与涂胶 2.光刻与显影 3.刻蚀与脱胶 4.掺杂与退火 5.薄膜沉积、金属化和晶圆减薄 6.MOSFET在晶圆表面的形…

Avnet RFSoC基于maltab得5G 毫米波 开发工具箱

使用 MATLAB 连接到 AMD Zynq™ RFSoC 评估板。使用 RF 附加卡执行 OTA 测试。使用 HDL Coder 部署算法 版本要求: 大于 2023b 需要以下支持包之一: 适用于 Xilinx 基于 Zynq 的无线电(R2023b 及更早版本)的通信工具箱支持包适…

第三节 docker基础之---Commit+Dockerfile制作

docker目前镜像的制作两种方法: 1,基于docker Commit制作镜像 2,基于dockerfile制作镜像,Dockerfile 为主流的制作方式 如果不制作镜像删除容器之后则里面配置的文件也随之删除: [rootdocker ~]# docker images 查看…

推荐一个免费的、开源的大数据工程学习教程

在当今信息爆炸的时代,每一个企业都会产生大量的数据,而大数据也已经成为很多企业发展的重要驱动力,然而如何有效得处理和分析这些海量的数据,却是一个非常有挑战的技术。 今天推荐一个免费的数据工程教程,带你系统化…

【文档智能多模态】英伟达ECLAIR-端到端的文档布局提取,并集成阅读顺序方法

笔者在前期一个系列分享了各种文档智能相关的技术方法,可以参考《文档智能系列栏目》,涵盖各种常见方法。 下面直接看看这个端到端的文档智能结构化方法,供参考。 方法 一、架构 ECLAIR 采用了一个较大的视觉编码器(657M 参数…

解锁Netty:Channel更替与HashMap管理的奇妙联动

个人CSDN博客主页: java之路-CSDN博客 ( 期待您的关注 ) 目录 Netty 的 Channel 机制探秘 HashMap 在 Netty 中的角色 创建新 Channel 时的操作步骤 新 Channel 的创建流程 确定老 Channel 的标识 移除老 Channel 的具体方法 从 HashMap 中移除 关闭和回收老…

小白零基础如何搭建CNN

1.卷积层 在PyTorch中针对卷积操作的对象和使用的场景不同,如有1维卷积、2维卷积、 3维卷积与转置卷积(可以简单理解为卷积操作的逆操作),但它们的使用方法比较相似,都可以从torch.nn模块中调用,需要调用的…

12.翻转、对称二叉树,二叉树的深度

反转二叉树 递归写法 很简单 class Solution { public:TreeNode* invertTree(TreeNode* root) {if(rootnullptr)return root;TreeNode* tmp;tmproot->left;root->leftroot->right;root->righttmp;invertTree(root->left);invertTree(root->right);return …

算法之 博弈问题

文章目录 巴什博弈292.Nim 游戏 尼姆博弈斐波那契博弈其他博弈1025.除数博弈 博弈问题,就是双方之间的PK,关注的重点是 谁先?以及A,B各自赢的条件 一般有数学问题,动态规划,搜索进行求解 巴什博弈 下面的这题Nim 游戏,…

Linux 安装 Ollama

1、下载地址 Download Ollama on Linux 2、有网络直接执行 curl -fsSL https://ollama.com/install.sh | sh 命令 3、下载慢的解决方法 1、curl -fsSL https://ollama.com/install.sh -o ollama_install.sh 2、sed -i s|https://ollama.com/download/ollama-linux|https://…

DDR原理详解

DDR原理详解 存储器主要分为只读存储器 ROM 和随机存取存储器 RAM两大类。 ROM:只读存储器 ROM 所存数据,一般是装入整机前事先写好的,整机工作过程中只能读出,ROM所存数据稳定,断电后所存数据也不会改变。 RAM:随机…

推荐一款 免费的SSL,自动续期

支持自动续期 、泛域名 、可视化所有证书时效性 、可配置CDN 的一款工具。免费5个泛域名和1个自动更新。 链接 支持:nginx、通配符证书、七牛云、腾讯云、阿里云、CDN、OSS、LB(负载均衡) 执行自动部署脚本 提示系统过缺少crontab 安装cro…

手写一个C++ Android Binder服务及源码分析

手写一个C Android Binder服务及源码分析 前言一、 基于C语言编写Android Binder跨进程通信Demo总结及改进二、C语言编写自己的Binder服务Demo1. binder服务demo功能介绍2. binder服务demo代码结构图3. binder服务demo代码实现3.1 IHelloService.h代码实现3.2 BnHelloService.c…

将 AMD Zynq™ RFSoC 扩展到毫米波领域

目录 将 AMD Zynq™ RFSoC 扩展到毫米波领域Avnet XRF RFSoC 系统级模块适用于 MATLAB 的 Avnet RFSoC Explorer 工具箱5G mmWave PAAM 开发平台突破性的宽带毫米波波束成形特征:OTBF103 Mathworks Simulink 模型优化毫米波应用中的射频信号路径 用于宽带毫米波上/下…

征程 6 相比征程 5 对算子支持扩展的具体案例讲解

引言 征程 6 相比于征程 5,在整体架构上得到了升级,相对应的,算法工具链的算子支持也得到了扩充,无论是算子支持的数量,还是 BPU 约束条件,征程 6 都有明显的加强,这就使得过去在征程 5 上无法…

蓝桥杯C语言组:博弈问题

概述 在编程的世界里,博弈问题就像是一场智力的“斗地主”,双方(或者多方)使出浑身解数,只为赢得最后的胜利。而蓝桥杯C语言比赛中的博弈问题,更是让无数参赛者又爱又恨的存在。它们就像是隐藏在代码森林中…