【大模型】硅基流动对接DeepSeek使用详解

目录

一、前言

二、硅基流动介绍

2.1 硅基流动平台介绍

2.1.1 平台是做什么的

2.2 主要特点与功能

2.2.1 适用场景

三、硅基流动快速使用

3.1 账户注册

3.2 token获取

3.2.1 获取token技巧

四、Cherry-Studio对接DeepSeek

4.1 获取 Cherry-Studio

4.2 Cherry-Studio配置DeepSeek

4.2.1 设置api密钥

4.2.2 模型检查

4.3 与DeepSeek对话

4.4 补充说明

五、应用程序基于硅基流动对接DeepSeek

5.1 获取API文档

5.2 代码对接硅基流动使用DeepSeek

5.2.1 python代码操作示例 - 对话模型能力

5.2.1 python代码操作示例 - 生图模型能力

六、写在文末


一、前言

近期,随着DeepSeek的热度越来越高,各大厂商和大模型平台开始支持对DeepSeek的部署或接入,可以预见在接下来的一段时间内,DeepSeek的关注度将会持续走高,对于开发者或用户来说,有幸见证了这一波时代的AI红利,如何能够快速应用DeepSeek,做第一波尝鲜的人,本文将先介绍如何基于硅流流动平台快速使用和对接DeepSeek过程。

二、硅基流动介绍

2.1 硅基流动平台介绍

硅基流动(SiliconCloud)是一家致力于打造大模型时代的AI基础设施的公司,主要提供高效、低成本且全面的生成式人工智能(GenAI)模型服务。硅基流动的核心目标是通过优化大模型使用体验,帮助用户实现“Token 自由”,即以更低成本和更高效率使用先进的大语言模型(LLMs)及其他生成式人工智能(AI)模型。

快速入口:硅基流动统一登录 ,注册登录进去之后默认进到模型广场

2.1.1 平台是做什么的

硅基流动是一家专注于大规模AI计算的技术公司,由清华大学高性能计算研究所孙广宇教授团队创立。公司核心团队来自清华大学、MIT等顶尖高校,在高性能计算和AI系统方面有深厚的技术积累。主要产品和服务包括:

  • SiliconLLM: 高性能LLM推理引擎,支持各种主流大语言模型的高效部署。

  • SiliconCloud: 一站式AI云计算平台,提供LLM训练推理等服务。

  • OneDiff: 开源的AI编译框架,可自动优化AI模型性能。

产品核心优势在于深厚的系统优化技术,能大幅提升AI模型的计算效率,帮助企业降低AI部署成本。目标市场主要面向有大规模AI计算需求的企业客户。

2.2 主要特点与功能

硅基流动具备如下特点:

  • 丰富的大模型支持

    • 平台集成多种主流开源大模型,包括文本生成模型如DeepSeek R1 & V3、Qwen2.5、GLM-4、Llama-3.X、Gemma-2、InternLM、Yi-1.5等,以及图片生成模型如Janus-Pro、Stable Diffusion(SDXL)、FLUX等。

  • 多模态模型支持

    • 支持文本生成语音、文本生成图像、文本生成视频等功能。代码生成模型包括Qwen2.5-Coder-32B-Instruct等。

  • 高性价比优势

    • 提供行业内较低的API调用价格,例如Qwen2-72B模型的调用费用仅为4.13元/百万Token。对于9B及以下的模型,平台提供永久免费API服务,适合个人开发者及小型项目使用。

  • 便捷的使用体验

    • 用户无需自建硬件或进行复杂配置,只需通过API调用模型。平台提供统一的API接口,支持多种模型的无缝切换,显著提升开发效率。

  • 推理加速与性能优化

    • 平台内置推理加速引擎(如SiliconLLM和OneDiff),显著提升模型的响应速度及生成效率。支持大模型的微调与托管,用户可根据自定义数据优化模型性能。

  • 免费体验与开发支持

    • 提供免费体验中心(Playground),用户可直接测试文本生成、图像生成、文本生成语音、文本生成视频等功能。提供详尽的文档和社区支持,降低开发门槛,促进开发者使用和创造。

  • 应用接入大模型简单

    • 在该平台上,针对一些主流的大模型,提供了快速便捷的对接入口,方便开发者快速进行接入使用。

2.2.1 适用场景

硅基流动适用于各种需要高效、低成本AI服务的场景,包括但不限于文本生成、图像生成、语音生成、视频生成等。其便捷的使用体验和高性价比的优势使得硅基流动成为开发者和企业在AI应用开发中的理想选择。

  • 企业级 AI 应用开发:

    • 通过低成本的 API 服务,迅速将大模型集成到企业产品中。

  • 个人开发者与 AI 爱好者:

    • 无需依赖昂贵的硬件支持,便可使用顶尖大模型进行实验和创新。

  • 多模态内容生成:

    • 支持文本、语音、图像和视频的生成,适用于内容创作者和设计师。

  • 模型微调与定制:

    • 企业可上传自有数据,对模型进行微调,从而满足特定业务需求。

硅基流动(SiliconCloud)致力于为开发者提供一个集成多种开源大模型并配备优化 API 服务的高效、灵活且经济高效的 AI 开发平台。它不仅支持个人开发者快速将创意转化为实际项目,也为企业用户提供了简化的途径来实现生成式 AI 应用的迅速落地。通过整合这些资源和服务,该平台有效地降低了技术实施的门槛与成本,使得更广泛的用户群体能够轻松接触和应用先进的大语言模型与生成式 AI 技术。

三、硅基流动快速使用

3.1 账户注册

正常注册并登录进去后,进入到展示模型列表页面,即模型广场,可以看到,这里提供了非常多的模型可供选择和使用

3.2 token获取

类似于使用其他的开源大模型,比如ChatGPT,文心一言等,如果你通过平台的方式使用,或者后续集成到代码中进行使用时,需要走token计费,典型的像我们在代码中调用ChatGPT的openai接口时,都是按照token进行计费的,在这里,硅基流动也类似,只不过目前新账号注册之后,官方会默认赠送一定的付费额度

3.2.1 获取token技巧

也可以通过邀请好友注册的方式获取一定额度的token,如下,在我的邀请这里,将邀请链接发送给好友,好友通过这个链接注册成功后,平台就会为你赠送一定的额度。比如在下面的个人邀请列表中可以看到邀请的用户注册信息。

四、Cherry-Studio对接DeepSeek

如何基于上述硅基流动平台在本地使用deepseek呢?这里推荐两个本地客户端工具Cherry-Studio,Chatbox,两个工具都可以作为本地管理AI大模型的工具使用,下面以Cherry-Studio为例进行说明。

4.1 获取 Cherry-Studio

Cherry-Studio下载地址:Cherry Studio - 全能的AI助手

网盘中提供了不同操作系统的安装包,根据你的操作系统进行选择下载即可

我这里选择windows版本的下载到本地之后,直接双击安装即可

安装成功后,启动工具主页如下图所示

4.2 Cherry-Studio配置DeepSeek

4.2.1 设置api密钥

点击右下方的设置按钮,拷贝硅基流动官网上面的那个你创建的apikey到这里

即下面这个密钥,如果还没有的话,点击新建API密钥即可,然后拷贝到上面的那个地方

4.2.2 模型检查

密钥贴进去之后,为了确保后续对接模型能够正常使用,点击后面的检查按钮,在弹出的下拉框中

上一步配置完成之后,在默认模型菜单栏中,将下面的三个选型全部选择为deepseek-v3的这个模型

4.3 与DeepSeek对话

在上面的配置都完成之后,回到消息对话窗口,在顶部就可以看到模型切换为deepseek-v3的模型了

然后你就可以在当前的对话窗口进行对话了,比如在下面我输入了一个早上好,模型就给了回复

  • 这里要注意的是,你在这个窗口与deepseek对话,消耗的是你在硅基流动平台的token额度,因此需要及时关注自己的账户额度情况。

更多的可以自己尝试,可以像使用其他大模型一样使用

费用账单检查,在硅基流动官网的费用账单那里实时关注自己的额度使用情况

4.4 补充说明

在硅基流动官网的文档中心中,从下面的入口点进去

在文档中心的左侧可以发现,除了上面推荐的两种工具,还有很多其他类型的客户端工具可以选择使用,包括怎么在工具中进行配置都有详细的说明

五、应用程序基于硅基流动对接DeepSeek

5.1 获取API文档

如何在应用程序中使用DeepSeek功能呢,如下在硅基流动官网展示的DeepSeek模型详情中,也提供了不同开发语言,以DeepSeek-R1模型为例,进去之后点击API文档

进入到当前模型的API文档对接中心,在这里提供了完善的对接说明,包括种主流开发语言的示例代码

5.2 代码对接硅基流动使用DeepSeek

在文档中心的左侧,可以提供了很多模型能力,比如推理能力,视频转换能力,文本转语音能力等,下面用代码体验下其中的模型能力。

5.2.1 python代码操作示例 - 对话模型能力

参考下面的代码示例,在python程序中使用deepseek,注意替换参数中的token为你自己的

import requestsurl = "https://api.siliconflow.cn/v1/chat/completions"payload = {"model": "deepseek-ai/DeepSeek-V3","messages": [{"role": "user","content": "中国大模型行业2025年将会迎来哪些机遇和挑战?"}],"stream": False,"max_tokens": 512,"stop": ["null"],"temperature": 0.7,"top_p": 0.7,"top_k": 50,"frequency_penalty": 0.5,"n": 1,"response_format": {"type": "text"},"tools": [{"type": "function","function": {"description": "<string>","name": "<string>","parameters": {},"strict": False}}]
}
headers = {"Authorization": "Bearer <token>","Content-Type": "application/json"
}response = requests.request("POST", url, json=payload, headers=headers)print(response.text)

运行上面的代码,在控制台输出了响应结果

5.2.1 python代码操作示例 - 生图模型能力

进入生图模型能力文档中心:创建图片生成请求 - SiliconFlow,可以参考其中的详细说明进行对接。

参考下面的示例代码

import requestsurl = "https://api.siliconflow.cn/v1/images/generations"payload = {"model": "deepseek-ai/Janus-Pro-7B","prompt": "an island near sea, with seagulls, moon shining over the sea, light house, boats int he background, fish flying over the sea","seed": 4999999999
}
headers = {"Authorization": "Bearer 你的apikey","Content-Type": "application/json"
}response = requests.request("POST", url, json=payload, headers=headers)print(response.text)

运行上面的代码,在控制台中输出了生成的图片的url链接,可以在浏览器中打开链接看看效果

六、写在文末

本文详细介绍了硅基流动这个平台的使用,以及如何基于硅基流动对接和使用DeepSeek大模型,最后通过本地客户端工具演示了如何像使用官方的DeepSeek一样去使用,以及如何在代码中集成和使用DeepSeek提供的相关的模型能力,希望对看到的同学有用,本篇到此结束,感谢观看。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14992.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

DeepSeek之Win10系统部署教程

一、下载并安装Ollama 1、为什么要安装Ollama的呢&#xff1f; Ollama 是一个用于本地部署和管理大型语言模型&#xff08;LLM&#xff09;的工具&#xff0c;支持多种模型格式和框架。 它可以帮助用户轻松下载、配置和运行模型&#xff0c;同时提供统一的接口和依赖管理。 …

DeepSeek-r1和O1、O3mini谁更强?

DeepSeek-r1和O1、O3mini谁更强&#xff1f; 题目&#xff1a;编写一个 js 程序&#xff0c;显示一个球在旋转的六边形内弹跳。球应该受到重力和摩擦力的影响&#xff0c;并且必须逼真地从旋转的墙壁上弹起 DeepSeek-r1 <!DOCTYPE html> <html> <body> &l…

我用AI做数据分析之数据清洗

我用AI做数据分析之数据清洗 AI与数据分析的融合效果怎样&#xff1f; 这里描述自己在使用AI进行数据分析&#xff08;数据清洗&#xff09;过程中的几个小故事&#xff1a; 1. 变量名的翻译 有一个项目是某医生自己收集的数据&#xff0c;变量名使用的是中文&#xff0c;分…

如何搭建DeepSeek R1的训推环境?

本篇文章主要介绍基于Linux系统的Tesla A30 GPU的硬件环境搭建深度学习环境&#xff0c;为训练和推理DeepSeek R1 提供必要的环境&#xff0c;篇幅最后也会介绍到MIG的一些常见报错解决方案。 Anaconda安装 进入 https://www.anaconda.com/download/success 选择Linux安装包。…

模型压缩 --学习记录2

模型压缩 --学习记录2 如何找到更好的权衡方式(模型量化)方法一:寻找更好的 range方法二:寻找更好的 X-fp32(浮点数)方法三:寻找更好的 scale 和 zp方法四:寻找更好的 roundPTQ 后训练量化(离线量化)QAT 量化感知训练(在线量化)量化为什么会带来加速?三、模型稀疏技…

Unity3D仿星露谷物语开发28之切换场景

1、目标 Player可以在Scene1_Farm和Scene2_Field之间自动切换。通过Trigger实现该功能。同时创建一个预设体绑定该功能&#xff0c;这样可以把预设体放到任何场景中&#xff0c;通过配置即可实现Player在Scene之间的自由切换。 2、创建场景切换的工具对象 在Hierarchy中&…

Maven插件—flatten-maven-plugin:工程模块统一版本依赖

文章目录 前言一、认识flatten-maven-plugin插件二、如何使用flatten-maven-plugin插件&#xff1f;未使用flatten-maven-plugin插件之前的情况描述配置flatten-maven-plugin插件步骤1&#xff1a;最外层父模块安装插件&配置版本变量步骤2&#xff1a;各个自模块使用版本使…

并查集题目

并查集题目 聚合一块&#xff08;蓝桥&#xff09;合根植物&#xff08;蓝桥&#xff09;等式方程的可满足性省份数量 并查集&#xff08;Union-Find&#xff09;算法是一个专门针对「动态连通性」的算法。双方向的连通。 模板&#xff1a; class UF {// 连通分量个数private …

【玩转 Postman 接口测试与开发2_019】第15章:利用 Postman 初探 API 性能测试(含实战截图)

《API Testing and Development with Postman》最新第二版封面 文章目录 第十五章 API 接口性能测试1 性能负载的类型2 Postman 负载配置3 Postman 性能测试实战3.1 Fixed 型负载下的性能测试3.2 基于数据驱动的 Postman 接口性能测试 4 性能测试的注意事项 写在前面 终于来到了…

Linux(20)——调度作业

目录 一、调度延迟的用户作业&#xff1a; 1、延迟的用户作业&#xff1a; 2、查看延迟的用户作业&#xff1a; 3、从计划中删除作业&#xff1a; 二、调度周期性用户作业&#xff1a; 1、周期性用户作业&#xff1a; 2、调度周期性用户作业&#xff1a; 3、用户作业格…

在 Visual Studio Code 与微信开发者工具中调试使用 emscripten 基于 C 生成的 WASM 代码

最近在尝试将一些 C/C、Lua 项目挪到 Web 上跑, 接触到了 emscripten. 这里会介绍下在 Visual Studio Code 与微信开发者工具中调试使用 emscripten 基于 C 生成的 WASM 代码 (WebAssembly) 的一些方法. Emscripten 与 WebAssebmly WebAssembly 是一种新的编码方式, 可以在现代…

deepseek API开发简介

1、申请deepseek api key&#xff1a; https://platform.deepseek.com/api_keys创建API Key&#xff0c;并复制Key 2、安装python、pip&#xff0c;然后安装requests pip install requests3、.示例代码 import requests import json# DeepSeek API 地址 API_URL "ht…

uniapp开发微信小程序请求超时设置【亲测有效】

在Hbuilderx中 使用uniapp开发微信小程序时 封装请求方法 请求代码如下 function requestFun(app) {// get请求app.config.globalProperties._get function(path, data, success, fail, complete) {data data || {};data.token uni.getStorageSync(token) || ;uni.request…

【03】 区块链分布式网络

3-1 P2P网络 传统中心化网络由中央服务器保存全量数据。客户端之间无法直接连接&#xff0c;必须通过中央服务器作为桥梁。客户端必须和中央服务器建立连接后访问资源。客户端之间并无连通。 在P2P网络中通过将数据资源分散在网络各个节点中存储以及节点间交互连接&#xff0…

DeepSeek-R1 论文解析——人工智能领域的 RL LLM 新时代?

简介 最近几年&#xff0c;AI领域真是突飞猛进&#xff0c;尤其是大型语言模型&#xff08;LLM&#xff09;&#xff0c;它们为通用人工智能&#xff08;AGI&#xff09;的发展打下了基础。OpenAI的o1模型就是个很好的例子&#xff0c;它用了一种创新的推理时间扩展技术&#…

第七节 文件与流

基本的输入输出&#xff08;iostream&#xff09; C标准库提供了一组丰富的输入/输出功能&#xff0c;C的I/O发生在流中&#xff0c;流是字节序列。如果字节流是从设备&#xff08;键盘、磁盘驱动器、网络连接等&#xff09;流向内存&#xff0c;叫做输入操作。如果字节流是从…

算法篇——动态规划

核心思想&#xff1a; 将问题分解为重叠的子问题&#xff0c;并储存子问题的解&#xff08;使用字典、数组或哈希表&#xff09;&#xff0c;避免重复计算&#xff0c;从而提高效率。 题目特点&#xff1a;重叠子问题&#xff08;特殊地&#xff0c;是最优子结构&#xff09; …

redis高级数据结构Stream

文章目录 背景stream概述消息 ID消息内容常见操作独立消费创建消费组消费 Stream弊端Stream 消息太多怎么办?消息如果忘记 ACK 会怎样?PEL 如何避免消息丢失?分区 Partition Stream 的高可用总结 背景 为了解决list作为消息队列是无法支持消息多播问题&#xff0c;Redis5.0…

ASP.NET Core WebSocket、SignalR

目录 WebSocket SignalR SignalR的基本使用 WebSocket WebSocket基于TCP协议&#xff0c;支持二进制通信&#xff0c;双工通信。性能和并发能力更强。WebSocket独立于HTTP协议&#xff0c;不过我们一般仍然把WebSocket服务器端部署到Web服务器上&#xff0c;因为可以借助HT…

多路文件IO

一、思维导图