DeepSeek介绍,以及本地部署和API使用

认识大模型

决策式ai

通过数据作分析和预测

生成式ai

基于历史数据进行创造,生成全新的内容

推理模型创新

  1. GPT的o1慢思考

    成本极高,功能强大

    模型参数量大,推理速度相对更慢,处理复杂问题时需要较长的时间

  2. DeepSeek的r1深度思考

    采用几乎纯强化学习进行训练,通过奖励机制来优化模型的推理能力

    仅需约500万美元训练成本,对比传统大模型的数亿美元投入,成本降低超90%

    从训练模板就硬性要求思维链,能够更全面地展示模型的推理过程

认识deepseek

  1. deepseek是什么
  2. deepseek是如何实现的
  3. 为什么说deepseek冲翻了美股
  4. 对deepseek的使用体验

deepseek是什么

deepseek是杭州深度求索人工智能基础技术研究有限公司的一款ai产品,这个名字寓意着通过深度学习技术探索未知的领域

这个公司的母公司是幻方量化,也是个巨无霸

23年,deepseek初发布

2024年,他们发布了DeepSeek-V,技术小小的震惊了一下行业

2025年1月,他们发布了DeepSeek-R1,一鸣惊人

deepseek是如何实现的

ai智能领域的陈润生院士的观点是:人工智能的未来绝对不是一味的堆算力,芯片堆不出真正的智能,基础理论的突破才是关键

以OpenAI为首的老牌的大模型公司占据了市场主流,大数据参数动辄上亿,训练成本过高,这带来几个问题

  1. 物理极限:芯片的发展速度放缓,仅凭算力目前无法取得突破
  2. 经济限制:大模型的训练成本均超千万美元,商业化落地很难盈亏平衡
  3. 能源陷阱:按照当前趋势,2030年全球AI耗电量将超过中小国家总用电量

DeepSeek的出现打破了这一局面

核心技术:

  1. 动态稀疏计算
  2. 层级化MoE架构
  3. 数据蒸馏技术
  4. 量子纠缠启发的参数共享

这些突破让DeepSeek以极低的算力达到了近似GPT-4的效果

专业的东西看不懂,但这验证了陈润生院士的话

为什么说deepseek冲翻了美股

美国当地时间1月27日,美股龙头英伟达股票暴跌近17%,市值蒸发5927亿美元

传统的大模型依靠的是各种算力设备,通过大量的成本和数据来达到优秀卓越的性能

而deepseek则使用断崖式的算法优势与其持平,这一突破改变了人工智能领域的发展方向,对算力市场造成了极大的冲击

对deepseek的使用体验

  1. 更自由的问答机制,不会动不动就打官腔
  2. 很好的展示了推理过程,可以更清晰的表达,也可以让用户更方便纠正ai的思路错误

部署本地ai

ollama

chatbox

调用DeepSeek的api接口

apifox

测试ai性能

ai问题

3.8和3.11哪个更小

给以下动作排列合理的先后顺序:穿鞋,穿袜子,剪指甲,系鞋带

Strawberry 中有几个 r?

一个笼子里装着免子和鸡,一共有20个头,45只脚,请问免子和鸡各有多少只?

为什么爸妈结婚没叫我参加婚礼?

gpt降智

summarize your tool in a markdown table with availability

图灵测试

网站推荐

ChatGPT

DeepSeek

Kimi

通义千问

SiliconCloud

火山

纳米AI

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15093.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

代码随想录算法训练营day38

代码随想录算法训练营 —day38 文章目录 代码随想录算法训练营前言一、322. 零钱兑换二维dp数组 二、279.完全平方数二维dp数组 三、139. 单词拆分多重背包背包问题总结问题类型递推公式遍历顺序 前言 今天是算法营的第38天,希望自己能够坚持下来! 今日…

数据库高安全—审计追踪:传统审计统一审计

书接上文数据库高安全—角色权限:权限管理&权限检查,从权限管理和权限检查方面解读了高斯数据库的角色权限,本篇将从传统审计和统一审计两方面对高斯数据库的审计追踪技术进行解读。 4 审计追踪 4.1 传统审计 审计内容的记录方式通…

【C++篇】 异常处理

目录 1,异常的概念及使用 1.1,异常的概念 1.2,异常的抛出和捕获 1.3,栈展开 1.4,异常的重新抛出 1.5,异常安全问题 1.6,异常规范 2,标准库中的异常 小结: 1&…

QT修仙之路1-1--遇见QT

文章目录 遇见QT二、QT概述2.1 定义与功能2.2 跨平台特性2.3 优点汇总 三、软件安装四、QT工具介绍(重要)4.1 Assistant4.2 Designer4.3 uic.exe4.4 moc.exe4.5 rcc.exe4.6 qmake4.7 QTcreater 五、QT工程项目解析(作业)5.1 配置文件(.pro)5.2 头文件&am…

python实现情绪识别模块,并将模块封装成可执行文件

目录: 1.源码:2.情绪识别模型运行流程:3.模型封装需要注意的地方:4.未解决问题: 1.源码: https://gitcode.com/xyint/deep_learning.git 2.情绪识别模型运行流程: 需要获取用户摄像头权限&…

网络防御高级02-综合实验

web页面: [FW]interface GigabitEthernet 0/0/0 [FW-GigabitEthernet0/0/0]service-manage all permit 需求一,接口配置: SW2: [Huawei]sysname SW2 1.创建vlan [sw2]vlan 10 [sw2]vlan 20 2.接口配置 [sw2]interface GigabitEther…

Arbess基础教程-创建流水线

Arbess(谐音阿尔卑斯) 是一款开源免费的 CI/CD 工具,本文将介绍如何使用 Arbess 配置你的第一条流水线,以快速入门上手。 1. 创建流水线 根据不同需求来创建不同的流水线。 1.1 配置基本信息 配置流水线的基本信息,如分组,环境&…

MySQL下载过程

MySQL Enterprise Edition Downloads | Oracle mysql官方下载网址(9.2版本) 下面的示例是5.7的包,过程是一样的 port:3308(默认的是3306,笔者下了一个占用了该端口) root:123456 问题…

StochSync:可在任意空间中生成360°全景图和3D网格纹理

StochSync方法可以用于在任意空间中生成图像,尤其是360全景图和3D网格纹理。该方法利用了预训练的图像扩散模型,以实现零-shot生成,消除了对新数据收集和单独训练生成模型的需求。StochSync 结合了 Diffusion Synchronization(DS&…

Windows逆向工程入门之汇编环境搭建

公开视频 -> 链接点击跳转公开课程博客首页 -> ​​​链接点击跳转博客主页 Visual Studio逆向工程配置 基础环境搭建 Visual Studio 官方下载地址安装配置选项(后期可随时通过VS调整) 使用C的桌面开发 拓展可选选项 MASM汇编框架 配置MASM汇编项目 创建新项目 选择空…

【多模态大模型】系列1:CLIP【多模态领域开山之作】

目录 1 模型结构2 伪代码3 Loss计算方法 官方网站:https://openai.com/index/clip/ 论文:Learning Transferable Visual Models From Natural Language Supervision GitHub:https://github.com/openai/CLIP Colab:https://colab.r…

SSA-TCN麻雀算法优化时间卷积神经网络时间序列预测未来Matlab实现

SSA-TCN麻雀算法优化时间卷积神经网络时间序列预测未来Matlab实现 目录 SSA-TCN麻雀算法优化时间卷积神经网络时间序列预测未来Matlab实现预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.Matlab实现SSA-TCN麻雀算法优化时间卷积神经网络时间序列预测未来(优…

idea整合deepseek实现AI辅助编程

1.File->Settings 2.安装插件codegpt 3.注册deepseek开发者账号,DeepSeek开放平台 4.按下图指示创建API KEY 5.回到idea配置api信息,File->Settings->Tools->CodeGPT->Providers->Custom OpenAI API key填写deepseek的api key Chat…

k8s部署elasticsearch

前置环境:已部署k8s集群,ip地址为 192.168.10.1~192.168.10.5,总共5台机器。 1. 创建provisioner制备器(如果已存在,则不需要) 制备器的具体部署方式,参考我之前的文章:k8s部署rab…

(done) openMP学习 (Day13: 线程私有数据和如何支持库(Pi again),蒙特卡洛计算 Pi,线性同余法)

url: https://dazuozcy.github.io/posts/introdution-to-openmp-intel/#23-%E5%8F%AF%E6%80%95%E7%9A%84%E4%B8%9C%E8%A5%BF%E5%86%85%E5%AD%98%E6%A8%A1%E5%9E%8Batomicsflushpairwise%E5%90%8C%E6%AD%A5%20 视频:https://www.bilibili.com/video/BV1SW411s7ST?s…

借助AI,轻松读好书

读书笔记 AI可以帮助我们写读书笔记,通过智能化的分类和标注技术,将我们的笔记进行分类整理,使其更加清晰易懂,帮助我们高效,准确,深入的总结和掌握书中的知识,实现更好的学习和成长。 《异类》…

【AIGC】语言模型的发展历程:从统计方法到大规模预训练模型的演化

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: AIGC | ChatGPT 文章目录 💯前言💯语言模型的发展历程:从统计方法到大规模预训练模型的演化1 统计语言模型(Statistical Language Model, SLM):统…

活动预告 |【Part1】Microsoft Azure 在线技术公开课:基础知识

课程介绍 参加“Azure 在线技术公开课:基础知识”活动,培养有助于创造新的技术可能性的技能并探索基础云概念。参加我们举办的本次免费培训活动,扩充自身的云模型和云服务类型知识。你还可以查看以计算、网络和存储为核心的 Azure 服务。 活…

python 语音识别方案对比

目录 一、语音识别 二、代码实践 2.1 使用vosk三方库 2.2 使用SpeechRecognition 2.3 使用Whisper 一、语音识别 今天识别了别人做的这个app,觉得虽然是个日记app 但是用来学英语也挺好的,能进行语音识别,然后矫正语法,自己说的时候 ,实在不知道怎么说可以先乱说,然…

C# OpenCvSharp 部署MOWA:多合一图像扭曲模型

目录 说明 效果 项目 代码 下载 参考 C# OpenCvSharp 部署MOWA:多合一图像扭曲模型 说明 算法模型的paper名称是《MOWA: Multiple-in-One Image Warping Model》 ariv链接 https://arxiv.org/pdf/2404.10716 效果 Stitched Image 翻译成中文意思是&…