2025-01-28 - 通用人工智能技术 - RAG - 本地安装 DeepSeek-R1对话系统 - 流雨声

摘要

2025年1月28号 周二(除夕) 杭州 惠风和畅

小记: 昨天在图书馆整理访谈案例,除了吃饭基本没有停下来直到晚上9点才勉强搞完。每份访谈在3-5万字,总结梳理后每个访谈的字数也在 5000 字左右,接下来如何组织又是一个让人头痛的事情。今早找点乐子干下。大早上的几乎所有的热搜都是 DeepSeek R1,真的有那么神吗?今天玩一下,去年把并行计算和事情暂时告一段落了,今年就要开始基于GPU算力干些事情了,比如玩。

心得: 部署流程走了一遍以后,确实速度很快,逻辑性校验的工作我没有展开,但是单凭速度就让我小激动了,不过我倒是不想人云亦云,幻方的确的优点高瞻远瞩,提前攒了那么多 GPU ,让人羡慕。不过个人觉得在大模型训练成本方面,OpenAI 和英伟达应该对公众撒了谎的,从一定角度来看,OpenAI 不计代价的进行大模型训练,并且故意吹嘘大模型训练成本的难度和成本,可以从一定程度让试图进入这个领域的从业者止步,英伟达也乐于看到训练大模型使用的大规模算力。所以一定程度上OpenAI和英伟达都会故意夸大大模型二次训练的难度和成本。就像美国登月和原子弹研制公布的数据等方面,美国人在忽悠整个世界方面一直在线的。可能美国怎么也想不到,中国人在降本增效方面极为擅长。另外一方面大模型的训练成本两个国家通胀和消费水平存在差异,因此DeepSeek在大模型训练通过深度学习算法的确降低了大模型训练成本,但是实际上算力的差距可能不会想报道的那样那么大。

人工智能发展的未来趋势肯定是不会强依赖GPU算力的,不然人工智能在诸多行业的落地和应用的确会变得困难,所以低成本的训练将是人工智能普遍应用生产的关键。

课程内容

1. DeepSeek 简介

DeepSeek 还开源了 6 个小模型,其中 32B 和 70B 模型性能对标 OpenAI o1-mini。
此次发布的 DeepSeek-r1模型,在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。可以在笔记本电脑上运行,而且运行速度飞快。

2. 安装部署

Ollama: https://ollama.com/
AnythingLLM: https://anythingllm.com/

说明: Ollama 可以帮助我们快速的下载 Ollama 的训练文件,类似容器镜像的方式进行统一的管理;AnythingLLM 为大模型提供了一个统一的访问前端,通过配置的方式实现 WEB 页面的对话系统。

  • 2.1 模型下载
# 根据模型大小运行适合的模型
ollama run deepseek-r1:7b

3. 对话配置

AnythingLLM: https://anythingllm.com/

说明: AnythingLLM 为大模型提供了一个统一的访问前端,通过配置的方式实现 WEB 页面的对话系统。

备注: LLM 提供者的意思是通过那种大模型管理工具启动的大模型,本地大模型启动后会自动加载的。

4. 对话评估
  • AnyLLM 对话评估
    AnyLLM 对 DeepSeek 或者 Ollam 兼容性存在一些问题

  • ollama-webui 对话评估

总结

AnyLLM 目前在 Windows 对 Ollama 的兼容性不是太好,但是足够用了。所以在 Windows 系统测试大模型的时候前端使用 ollama-webui 效果可能会更好一些。

目前,AGI的技术探索主要集中在以下几个方面:基于深度学习的模型优化强化学习在复杂任务中的应用神经符号系统的结合多模态数据处理技术自监督学习与计算增强尽管这些技术正在推动AGI的发展,但目前仍有许多未解决的问题和挑战。未来的研究需要在算法、硬件、理论等多个方面取得突破才能实现真正的通用人工智能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9181.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电路研究9.2.3——合宙Air780EP中FTP——FTPGET 命令使用方法研究

怎么说呢,之前也是看的,但是也很迷茫,感觉上虽然是对的,但是无法联系到应用里面,今天研究一下FTP 命令使用方法吧。 15.29 使用方法举例 这里发现下面那些看的不懂呢,于是就返回FTP的应用了。 9.5.4 FTP 应…

[A-29]ARMv8/v9-GIC-中断子系统的安全架构设计(Security/FIQ/IRQ)

ver0.1 前言 打开这篇文章的时候,我们已经为每一个中断信号规划一条路径,在外设和PE-Core之间建立了消息通道,外设有紧急的情况下可以给SOC中的大哥打报告了。下面就把接力棒就交到了CPU手里了,但是PE-Core要交给那个Exception Level以及Security下运行的软件处理呢?本文…

PWM频率测量方法

测量PWM(脉宽调制)信号的频率是嵌入式系统中的常见需求,尤其是在电机控制、LED调光、传感器信号处理等场景中。 在这里介绍两种测量PWM频率的方法:测频法与测周法。 1、测频(率)法 原理:在闸门…

c++多态

1.多态的概念 通俗来说,就是多种形态,具体点就是去完成某个行为,当不同的对象去完成时会产生出不同 的状态。 2.多态的定义及实现 2.1多态的构成条件 多态是在不同继承关系的类对象,去调用同一函数,产生了不同的行为…

MySQL分表自动化创建的实现方案(存储过程、事件调度器)

《MySQL 新年度自动分表创建项目方案》 一、项目目的 在数据库应用场景中,随着数据量的不断增长,单表存储数据可能会面临性能瓶颈,例如查询、插入、更新等操作的效率会逐渐降低。分表是一种有效的优化策略,它将数据分散存储在多…

Deepseek的RL算法GRPO解读

在本文中,我们将深入探讨Deepseek采用的策略优化方法GRPO,并顺带介绍一些强化学习(Reinforcement Learning, RL)的基础知识,包括PPO等关键概念。 策略函数(policy) 在强化学习中, a…

cent6.6安装rabbitmq

cent6.6安装rabbitmq 如果对运维课程感兴趣,可以在b站上、A站或csdn上搜索我的账号: 运维实战课程,可以关注我,学习更多免费的运维实战技术视频 1.在服务器192.168.231.128上安装rabbitmq 1)安装编译工具 [rootlocalhost ~]# …

ubuntu 更新24LTS中断导致“系统出错且无法恢复,请联系系统管理员”

22LTS to 24LTS 更新过程中手jian把更新程序controlC导致的。 解决 目前企图完成更新来恢复,重启后有软件包冲突,sudo apt upgrade报冲突。无法进行。 将原来source.list重新 sudo dpkg --configure -a sudo apt install -f 这些都不管用。还是显示gno…

Databend x 沉浸式翻译 | 基于 Databend Cloud 构建高效低成本的业务数据分析体系

「沉浸式翻译」是一个非常流行的双语对照网页翻译扩展工具,用户可以用它来即时翻译外文网页、PDF 文档、ePub 电子书、字幕等。它不仅可以实现原文加译文实时双语对照显示,还支持 Google、OpenAI、DeepL、微软、Gemini、Claude 等数十家翻译平台服务的自…

LabVIEW纤维集合体微电流测试仪

LabVIEW开发纤维集合体微电流测试仪。该设备精确测量纤维材料在特定电压下的电流变化,以分析纤维的结构、老化及回潮率等属性,对于纤维材料的科学研究及质量控制具有重要意义。 ​ 项目背景 在纤维材料的研究与应用中,电学性能是评估其性能…

哈工大:LLM高质量嵌入模型KaLM-Embedding

📖标题:KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Mode 🌐来源:arXiv, 2501.01028 🌟摘要 🔸随着检索增强生成在大型语言模型中的盛行,嵌入模型变得越来越重要。尽…

Baklib打造高效内容管理平台提升协作与创作体验

内容概要 随着信息化时代的迅猛发展,高效的内容管理已成为各类团队日常工作中不可或缺的一部分。Baklib的内容管理平台正是应运而生,旨在为团队提供一个集协作、创作与管理于一体的解决方案。该平台通过其直观的界面和一系列创新功能,帮助用…

通过高效的侦察发现关键漏洞接管整个IT基础设施

视频教程在我主页简介或专栏里 在这篇文章中, 我将深入探讨我是如何通过详细分析和利用暴露的端点、硬编码的凭据以及配置错误的访问控制,成功获取目标组织关键IT基础设施和云服务访问权限的全过程。 我们先提到目标网站的名称 https://*sub.domain*.co…

【Linux笔记】Day4

关机重启 登录注销 注意用户名只能是小写 用户管理 pwd显示当前在哪个目录下: 删除用户 连带着用户文件夹都删掉 高权限用户切换到低权限用户无需输入密码 clear能把当前屏幕显示清掉 如果之前加的用户没有指定组,它会创建一个和用户同名的组&a…

A7. Jenkins Pipeline自动化构建过程,可灵活配置多项目、多模块服务实战

服务容器化构建的环境配置构建前需要解决什么下面我们带着问题分析构建的过程:1. 如何解决jenkins执行环境与shell脚本执行环境不一致问题?2. 构建之前动态修改项目的环境变量3. 在通过容器打包时避免不了会产生比较多的不可用的镜像资源,这些资源要是不及时删除掉时会导致服…

一个简单的自适应html5导航模板

一个简单的 HTML 导航模板示例&#xff0c;它包含基本的导航栏结构&#xff0c;同时使用了 CSS 进行样式美化&#xff0c;让导航栏看起来更美观。另外&#xff0c;还添加了一些 JavaScript 代码&#xff0c;用于在移动端实现导航菜单的展开和收起功能。 PHP <!DOCTYPE htm…

Winform如何取消叉号,减号和放大(两种)

方法一: 找到窗体属性 MaximizeBoxFalse; MinimizeBoxFalse; ControlBoxFALSE; 方法二: 点击Form 在From里面找到Form-Closing 这个事件 写入 if(e.CloseReasonCloseReason.UserClosing) { MessageBox.Show("对不起,你不能关闭") e.Cancel true; }

OpenCV:开运算

目录 1. 简述 2. 用腐蚀和膨胀实现开运算 2.1 代码示例 2.2 运行结果 3. 开运算接口 3.1 参数详解 3.2 代码示例 3.3 运行结果 4. 开运算应用场景 5. 注意事项 6. 总结 相关阅读 OpenCV&#xff1a;图像的腐蚀与膨胀-CSDN博客 OpenCV&#xff1a;闭运算-CSDN博客 …

MIMIC-IV数据部署(博主较忙,缓慢更新)

1. 用到的数据准备 在下面的网站&#xff0c;注册、申请、推荐人从邮箱里帮忙确认。 通过后&#xff0c;拉到页面的最下面。把那个将近10个G的文件给下载下来。 可以在晚上睡觉的时候下载&#xff0c;第二天早上起来“收数据”。 MIMIC-IV v3.1 2. 用到的软件准备 7-zip …

二叉树-堆(补充)

二叉树-堆 1.二叉树的基本特性2.堆2.1.堆的基本概念2.2.堆的实现2.2.1.基本结构2.2.2.堆的初始化2.2.3.堆的销毁2.2.4.堆的插入2.2.5.取出堆顶的数据2.2.6.堆的删除2.2.7.堆的判空2.2.8.堆的数据个数2.2.9.交换2.2.10.打印堆数据2.2.11.堆的创建2.2.12.堆排序2.2.13.完整代码 3…