DeepSeek从入门到精通 学习总结
DeepSeek概述
DeepSeek是专注通用人工智能(AGI)的中国科技公司,致力于大模型研发与应用。其开源推理模型DeepSeek - R1性能卓越,在数学、代码、自然语言推理等任务上比肩OpenAI o1正式版,且可免费商用。该模型在后训练阶段借助强化学习技术,大幅提升推理能力,即便标注数据极少也能出色处理复杂任务。
DeepSeek应用场景
DeepSeek应用广泛,能为用户和开发者提供智能对话、文本生成、语义理解等多种服务。支持联网搜索、深度思考模式及文件上传,可读取文件和图片中的文字信息,在专业领域可辅助决策、进行风险评估等,还能处理编程任务、绘制多种图表。
- 文本生成与创作:可撰写文章、故事、诗歌、营销文案等,还能进行长文本摘要、文本简化、多语言翻译与本地化,以及结构化生成如表格、列表、代码注释和文档等。
- 自然语言理解与分析:实现语义分析、情感分析、意图识别、实体提取、知识推理、文本分类等功能,能解答逻辑问题、进行因果分析和主题标签生成等。
- 编程与代码相关:根据需求生成Python、JavaScript等代码片段,具备代码调试、错误分析修复、自动补全注释、性能优化提示等能力,还能处理技术文档,如生成API文档、解释代码库并提供示例。
- 绘图功能:支持绘制常规图形(如基础图形、图标、简单插图)、流程图、组织架构图,以及Mermaid图表(流程图、时序图等)和React图表(折线图、柱状图等)。
如何使用DeepSeek
用户可通过官网https://chat.deepseek.com访问DeepSeek。使用时需注意,由于技术原因,联网搜索可能暂不可用,且其知识截止日期为2024年7月。
推理模型与通用模型对比
- 推理模型:强化了推理、逻辑分析和决策能力,常采用强化学习等技术。代表模型如DeepSeek - R1、GPT - o3,擅长数学推导、逻辑分析、代码生成和复杂问题拆解,但在发散性任务(如诗歌创作)上表现较弱 。提示语更简洁,只需明确任务目标和需求,模型便能自动生成结构化推理过程。
- 通用模型:侧重于语言生成、上下文理解和自然语言处理,通过大量文本数据训练掌握语言规律。像GPT - 3、GPT - 4、BERT等,适用于文本生成、创意写作、多轮对话和开放性问答,但在处理需要严格逻辑链的任务(如数学证明)时存在不足。使用通用模型时,需显式引导推理步骤,依赖提示语补偿能力短板。
提示语设计
提示语是与AI交互的关键,合理设计能让AI生成更符合预期的内容。
- 提示语类型:包括指令型、问答型、角色扮演型、创意型、分析型、多模态提示语等,每种类型在不同场景发挥独特作用。
- 核心技能体系:涵盖问题重构、创意引导、结果优化、跨域整合、系统思维等能力,这些技能相互配合,有助于将复杂模糊的需求转化为高效的AI任务,提升提示语质量。
- 基本元素:由信息类(主题、背景、数据等)、结构类(格式、结构、风格等)和控制类(任务指令、质量控制、约束条件等)元素组成,不同元素组合可实现提高输出准确性、增强创造性思维等目标。
- 协同效应理论:元素间存在互补增强、级联激活、冲突调和和涌现属性,利用这些特性可优化提示语效果。
- 设计策略:包括精准定义任务、分解复杂任务、引入引导性问题、控制提示语长度、灵活运用开放式和封闭式提示等,可有效提升生成内容质量。
- 常见陷阱与应对:如缺乏迭代、过度指令和模糊指令、假设偏见、幻觉生成、忽视伦理边界等陷阱,需采用相应策略应对,确保提示语设计合理。
不同任务的提示语策略
- 任务需求与提示语示例:数学证明、创意写作、代码生成等不同任务,适用模型和提示语侧重点各异。例如数学证明适合推理模型,直接提问即可;创意写作中,推理模型可鼓励发散性,通用模型则需明确约束目标。
- 需求类型与表达公式:决策需求、分析需求、创造性需求等不同需求类型,有各自的特点和表达公式,适配不同的模型策略。如决策需求需权衡选项,表达公式为目标 + 选项 + 评估标准,推理模型要求逻辑推演和量化分析,通用模型则直接建议,依赖经验归纳。
提示语链
提示语链是引导AI生成内容的连续性提示语序列,能将复杂任务分解为可操作子任务,确保内容逻辑清晰、主题连贯。
- 核心特征:具有序列性、层级性、递进性、关联性和适应性,基于认知心理学等理论设计,在内容生成中发挥重要作用。
- 作用机制:通过任务分解、信息收集、结构构建等步骤,系统性引导AI生成高质量、创新性内容,并可进行结果整合、质量检查和优化。
- 设计原则:需遵循目标明确性、逻辑连贯性、渐进复杂性、灵活适应性、反馈整合机制和多样性思考等原则,确保有效性和连贯性。
- 设计模型与方法:可采用CIRS模型(Context, Instruction, Refinement, Synthesis)和SPECTRA模型(Segmentation, Prioritization, Elaboration, Connection, Temporal Arrangement, Resource Allocation, Adaptation),以及基于不同认知理论的思维拓展提示语链设计方法(如发散思维、聚合思维、跨界思维),提升提示语链设计效果。
多种内容生成策略
- 语用意图分析(PIA):基于语用学和言语行为理论,通过识别、分析语用意图,构建意图矩阵,为AI设定明确任务目标。如撰写关于“气候变化”的文章,可确定陈述型、指令型等意图及其强度,指导内容创作。
- 主题聚焦机制(TFM):借鉴认知语言学理论,通过构建主题原型、语义框架,设置重点梯度和主题引导符,锁定核心内容。以“气候变化”主题为例,明确关键特征、相关概念和重点,确保内容围绕主题展开。
- 细节增强策略(DES):整合认知叙事学和信息处理理论,通过多模态描述、数据可视化等策略,构建关键概念细节矩阵,深化内容质量。如描述“气候变化”时,为关键概念提供数据、案例、感官描述和对比信息。
- 跨域映射机制(CMM):基于认知语言学和认知科学理论,通过选择源域、识别映射点、生成类比并细化,激发创新思维。如探讨“现代网络安全策略”时,将人体免疫系统与网络安全系统类比,提出创新思路。
- 概念嫁接策略(CGS):借鉴认知科学理论,通过选择输入概念、分析特征、寻找共同点、创造融合点并构建提示语,实现创造性融合。如设计创新知识共享平台时,融合“社交媒体”和“传统图书馆”概念。
- 知识转移技术(KTT):基于迁移学习和组织学习理论,通过定义问题、寻找源域、提取知识、分析相似性、设计转移策略并构建提示语,实现跨域智慧应用。如改善在线教育平台学生参与度,可从游戏设计领域转移知识。
- 随机组合机制(RCM):基于创造性思维理论,通过构建元素库、随机抽取元素、强制联系并整合,打破常规思维。如设计咖啡连锁店营销活动时,随机组合咖啡、文化艺术等领域元素激发创意。
- 极端假设策略(EHS):借鉴逆向思维和假设性思考概念,通过识别常规假设、生成极端假设、构建场景、探索影响并提取创新点,突破思维界限。以“未来教育”主题为例,颠覆常规假设,提炼创新机会。
- 多重约束策略(MCS):基于创造性问题解决理论和有限性思维概念,通过设定约束条件、分析矛盾、探索创新解决方案并重构约束,激发创造性问题解决能力。如设计智能家居产品时,在体积、功能、价格等多重约束下创新。
- 语体模拟机制(RSM):基于语域理论和语体分析,通过确定目标语体、收集样本、分析特征、提取元素、构建指南并生成提示语,精准捕捉语言特征。如生成模仿莎士比亚风格的短文,可分析其语言特征并构建提示语。
- 情感融入策略(EIS):基于情感语言学和心理语言学研究成果,通过确定目标情感、创建词库、设计曲线、选择触发点、构建场景并生成提示语,增强文本感染力。如生成“离别”主题短文时,融入悲伤、不舍等情感元素。
- 修辞技巧应用(RTA):基于修辞学和文体学理论,通过确定目标、选择修辞、设计示例、安排分布、创建平衡策略并生成提示语,提升语言表现力。如描述城市夜景时,运用比喻、拟人等修辞技巧。
不同场景的提示语设计
- 文案写作:商业文案写作涵盖信息传递、情感共鸣和行动引导三个重要维度。在信息传递方面,需确保清晰、精准,可运用信息分层指令、关键词限定等技巧;情感共鸣要求触发情感反应,通过指定情感关键词、设定场景等方式实现;行动引导旨在促进决策和行动,明确行动目标、设置时间限制等。
- 营销策划:高质量营销策划提示语的设计核心在于创新、精准和可行。在创意概念方面,可通过跨领域联想、融入品牌DNA等激发创新思维;传播策略上,设定量化目标、详述受众画像等实现精准定位;执行方案则需明确行动步骤、合理分配资源等,确保可操作性。
- 品牌故事:品牌故事设计围绕品牌定位、价值主张和未来愿景展开。品牌定位要精准描述目标市场,塑造独特个性;价值主张需平衡情感和功能价值,解决客户痛点;未来愿景应与当前定位一致,描绘远大且可实现的目标。
- 年终总结:年终总结提示语设计包含业绩回顾、成就展示和未来规划。业绩回顾注重成果展示和数据支撑;成就展示突出团队贡献和创新突破;未来规划设定明确目标,制定行动计划和个人成长规划。
- 微信公众号:微信公众号具有私域流量、深度阅读、规范体系和互动机制的特性。选题规划需明确内容定位与读者价值;创作引导关注标题吸引力、内容结构和论述逻辑;同时要遵循平台规则,持续优化提示语。
- 微博:微博平台的实时性、社交属性、话题引导和多媒体融合的特征影响提示语设计。内容策略需把控时效性、设计互动性内容;话题引导要规范话题和标签使用;传播策略涵盖热点借力、内容节奏把控和互动策略设计。
- 小红书:小红书以种草生态、社区氛围和垂直专业为核心特征。种草文案提示语设计注重信任建设、风格调性塑造、场景化表达和文案创作的各个环节,提升内容吸引力和可信度。
- 抖音:抖音内容具有高度视觉化、短时吸引力、强互动性和娱乐性等特点。提示语设计应突出视觉冲击和情绪表达,引导参与互动,确保内容节奏明快、贴近热点,满足平台用户需求。
AI使用进阶
- 提示词工程技巧:设定明确目标与上下文,激活角色与思维模式,逐步拆解复杂任务,引导深入推理与思考,提供参考材料与外部资源,进行动态反馈与迭代优化,提升AI输出质量。
- 提示词框架:TASTE框架(Task、Audience、Structure、Tone、Example)和ALIGN框架(Aim、Level、Input、Guidelines、Novelty)为提示词设计提供逻辑结构和思维引导,使提示更具系统性和针对性。
- 三重概率内容生成体系:AIGC的三层概率交互体系包括初始生成概率(AI生成初步内容)、交互筛选概率(用户筛选优化)和主观优化概率(用户个性化优化),通过人机协同提升内容质量。
- 人机共生能力培养:培养AI思维(算法思维、数据洞察等)、整合力(跨域翻译、创意重组等)、引导力(提示工程、对话管理等)和判断力(真伪辨识、价值评估等),提升人机协作水平。
- AI使用层次与突破路径:AI使用分为基础使用层、进阶使用层和创新使用层,通过建立提示词体系、设计协作流程、发展创新方法和打造个人特色实现突破,提升AI应用能力。
- AI辅助知识生成:包括知识唤醒、知识整合和提示构建阶段,借助AI辅助头脑风暴、关联分析等,实现知识的深度调动和创新生成,建立个人知识管理系统,提升知识应用价值。
AI使用层次与知识唤醒
AI的使用分为基础使用层、进阶使用层和创新使用层。基础使用层主要是处理单一任务,使用简单提示词,属于被动应用;进阶使用层能够进行任务组合,运用结构化提示词并主动优化;创新使用层则聚焦流程再造、提示词艺术和创造性应用。突破路径包括建立提示词体系,设计协作流程,发展创新方法以及打造个人特色。
知识唤醒在AI辅助下,通过认知触发、系统激活和整体重构实现知识的深度调动和创新生成。其核心机制包括认知激活、经验映射和创造性重组。AI在知识唤醒中扮演认知催化剂、知识连接器和创新助推器的角色,通过情感唤醒、经验唤醒和关联唤醒,实现知识的螺旋式上升,将人的具身经验与AI的形式知识有机结合,产生高质量内容。
人机共生质量影响因素
在人机共生的内容生成过程中,输入质量对生成质量影响重大,其中人的因素占比约70% ,主要体现在提示词的准确性和完整性、需求描述的清晰度等方面。在提示工程环节,清晰的目标定义、准确的约束条件和结构化的需求描述至关重要;质量控制阶段,结果评估、方向调整和标准制定也依赖人的判断;创意引导方面,创意输入和风格定义同样由人主导。
机器的关键影响路径涉及基础生成能力,包括模型性能、训练质量和算法优化,以及理解准确度,如语义理解和上下文把握。不过,综合来看,人的主导作用更大,约占65%,原因在于提示工程的质量和迭代优化的精准度是决定最终输出质量的关键,而迭代优化中90%的影响来自人,如反馈的精准度和优化方向的把控 。
AIGC评测
为全面评估AIGC的性能,建立了包含26个细分指标的评测体系,涵盖领域知识、新任务学习、鲁棒性、可塑性、用户适用性等多个方面,如语法准确性、相关性、逻辑推理、实体识别、情感识别、创造性、时效性、多样性、可信度等。同时,依托两项国家级项目,即2023国家自然科学基金青年项目“面向人工智能生成内容的风险识别与治理策略研究”和2023国家资助博士后研究人员计划B档“AIGC意识形态安全评估”,以及大模型多学科自动化测评平台,对AIGC进行科学、系统的评测,以推动其不断发展和完善。
AI幻觉问题
AI幻觉是生成式人工智能模型的一个关键缺陷,指模型在生成文本或回答问题时,输出内容虽表面逻辑和语法正确,但可能包含虚构、不准确或与事实不符的信息。其产生原因主要是模型在缺乏相关信息时,基于概率性选择生成内容,而非依据真实知识库或逻辑推理。
AI幻觉可分为无中生有、推理错误、信息缺失、语境误解、数据误用五类,具有虚构信息、过度自信、语境误解、训练数据不足或偏差、指令模糊、知识检索失败、推理不一致这七类特征。例如在无数据支持下生成完全虚构的信息,或在逻辑推理中存在漏洞,以及对问题意图理解错误导致回答偏离主题等。为应对AI幻觉,可采取明确不确定性、进行事实核查提示、多源验证、要求引用信息来源等策略,以提高AI输出的可靠性。
提示语设计的创新方法
- 抽象 - 具体循环法:在不同抽象层次间灵活切换,先提出抽象问题引导AI思考,再根据AI的反馈具体化问题,通过不断迭代优化,使AI生成更符合需求的内容。例如在创作一篇关于科技发展对社会影响的文章时,先让AI从宏观角度阐述科技发展的趋势,再针对具体的科技应用,如人工智能在医疗领域的应用进行深入分析。
- 运用类比与隐喻:通过类比说明复杂概念,利用隐喻增强语言表达层次。选择具有启发性的类比,能帮助AI更好地理解任务,激发其创新思维。比如将互联网数据传输类比为高速公路上的车辆行驶,让AI更形象地理解数据传输的原理和特点,从而在相关内容创作中提供更生动的表述。
- 反向设计思维:从期望的生成结果倒推提示语,明确想要的最终内容,然后思考需要提供哪些信息和引导,才能使AI生成该结果。这种方法能使提示语更具针对性,提高内容生成的准确性和效率。
- 矛盾思维法:利用对立促进创新,将相互矛盾的概念或要求结合在提示语中,促使AI突破常规思维,产生独特的创意。例如在设计一款产品时,要求AI在保证产品高性能的同时,实现低能耗,这种矛盾的要求能激发AI探索新的设计思路和解决方案。
- 涌现思维模型:利用集体智慧进行提示语设计,通过分解与重组复杂问题,设定组件互动规则,并观察整体行为,让AI在多个任务或元素的交互中产生新的创意和思路。例如在策划一个大型活动时,将活动的各个环节分解,设定不同环节之间的互动规则,让AI模拟活动的运行过程,从而发现新的创意点和优化方向。
不同行业场景下的提示语应用案例
- 医疗行业:在医疗领域,提示语可用于辅助医生进行疾病诊断和治疗方案制定。例如,医生向AI输入患者的症状、检查结果等信息,并使用“根据这些症状和检查结果,分析可能的疾病,并提供相应的诊断依据和治疗建议”的提示语,AI可以利用其强大的数据分析和知识推理能力,为医生提供参考意见,帮助医生更准确地诊断疾病和制定个性化的治疗方案。
- 教育行业:在教育场景中,提示语可用于辅助教学和学生学习。教师可以使用提示语让AI生成教学课件、设计练习题等。例如,“以三角形的性质为主题,生成一份包含教学目标、教学重难点、教学过程和课后练习题的教学课件”,AI生成的课件可以为教师提供教学思路和素材,节省备课时间。对于学生,提示语可以引导他们进行自主学习和问题解决。如学生在学习数学时遇到难题,可向AI输入“这道数学题我不会做,请一步一步引导我解题,并解释每一步的思路”,AI可以为学生提供解题指导,帮助学生提高学习能力。
- 金融行业:在金融领域,提示语可用于风险评估、投资策略制定等方面。例如,投资者向AI输入某公司的财务数据、市场环境等信息,并使用“根据这些信息,评估该公司的投资风险,并提供相应的投资建议”的提示语,AI可以通过对大量金融数据的分析和模型计算,为投资者提供风险评估报告和投资策略建议,帮助投资者做出更明智的投资决策。
- 设计行业:设计师可以利用提示语让AI辅助进行创意设计。比如,在进行平面设计时,设计师向AI输入“以环保为主题,设计一款海报,要求包含绿色元素、简洁明了且具有视觉冲击力”的提示语,AI可以根据这些要求生成海报的设计草图或创意概念,为设计师提供灵感和参考,提高设计效率和质量。
DeepSeek在多行业的广泛应用案例
一、医疗领域
(一)临床诊断辅助
- 呼吸内科:在呼吸内科场景下,当输入“患者男,45岁,咳嗽、咳痰伴发热3天,体温最高39℃,伴有胸痛,血常规示白细胞升高,中性粒细胞比例85%,C反应蛋白50mg/L,胸部CT显示左肺下叶斑片状阴影,给出可能的诊断及鉴别诊断”时,DeepSeek能迅速列出肺炎、肺结核、肺癌等可能诊断,并详细阐述各诊断的鉴别要点。
- 消化内科:针对消化内科“患者女,32岁,反复上腹痛2年,空腹时加重,进食后缓解,伴反酸、嗳气,胃镜提示十二指肠球部溃疡”,询问治疗方案及复发预防措施的问题,它能提供包含质子泵抑制剂等药物的治疗方案,以及饮食生活方面的注意事项。
(二)治疗方案制定
- 心血管内科:心血管内科中,对于“患者70岁,男性,诊断为冠心病、不稳定型心绞痛,合并高血压、2型糖尿病,提供适合该患者的抗血小板、调脂、降压、降糖综合治疗方案”的需求,DeepSeek会依据相关指南给出具体的药物选择及剂量建议。
- 内分泌科:在内分泌科,输入“55岁女性,确诊为甲状腺功能亢进,伴有心慌、多汗、体重下降,制定放射性碘治疗前后的注意事项及随访计划”,它可以生成详细的计划内容。
(三)患者管理
- 肾内科:肾内科输入“为慢性肾衰竭患者制定一份低盐低脂优质低蛋白饮食的一周食谱”,DeepSeek可生成包含具体食物及摄入量的一周食谱。
- 血液内科:血液内科针对“为缺铁性贫血患者生成一份出院后康复指导手册,包括药物服用方法、饮食建议及复查时间”的需求,DeepSeek能输出完整的康复指导内容。
(四)科研工作助力
- 风湿免疫科:风湿免疫科输入“检索近5年类风湿关节炎发病机制的研究进展”,DeepSeek可快速检索并整理相关文献的核心要点,展示该领域的研究趋势。
- 感染科:感染科上传关于某新型病毒感染的临床研究数据表格,并指令“用统计学方法分析不同年龄段患者的病情严重程度及预后差异”,它能进行数据分析并输出结果及可视化图表。
(五)医学科普创作
- 神经内科:神经内科使用“用通俗易懂的语言向患者解释脑梗死的形成原因和预防方法”指令,DeepSeek会以简单易懂的方式进行解释。
- 老年病科:老年病科输入“创作一篇关于老年人如何预防骨质疏松的科普文章,适合在社区宣传栏张贴”,它能生成包含运动、饮食、日照等多方面预防建议的科普文章。
二、金融领域
(一)江苏银行
江苏银行本地化部署微调DeepSeek模型,将其运用于智能合同质检和自动化估值对账场景中,实现了金融语义理解准确率与业务效率的双突破。
(二)汇添富基金
汇添富基金私有化部署DeepSeek模型,应用于投资研究、产品销售、风控合规、客户服务等核心业务场景,提升了金融数据分析的深度与广度,提高了业务效率。
(三)诺安基金
诺安基金推出基于DeepSeek的“诺安AI助手”,搭建涵盖图片内容提取、语音转文本、文本转语音及文档摘要生成等功能的AI基础能力平台,在投研数据智能处理和客户标签动态分析等领域取得显著成效。
(四)九方智投控股
九方智投控股部署基于DeepSeek模型的聊天机器人,实现智能客服系统升级,能以极高准确率回答客户问题,降低人工服务成本,还利用智能投顾功能为投资者提供个性化投资方案。
(五)海安农商银行
海安农商银行通过DeepSeek生成的文本内容,向用户介绍银行的资本实力、市场份额、金融产品、社会责任等情况。
三、教育领域
(一)教学备课
教师输入课程主题、教学目标和期望的教学方法等信息,DeepSeek可生成教案框架。以初中语文《散步》课堂导入设计为例,优化指令后能给出具体且具可操作性的导入设计,结合学生生活实际并设计互动活动。
(二)课堂教学
- 人机协同双师课堂:打造“人机协同双师课堂”,真人教师负责主要教学活动,DeepSeek作为AI助手解答学生问题、提供个性化学习建议、整合教学资源。
- 实验教学互动:借助DeepSeek实现实验教学互动,如为化学老师设计研究氧化还原的交互展示网页,为物理老师设计研究单摆的交互展示网页。
- 个性化学习支持:通过本地化部署,DeepSeek可分析学生学习数据,为个性化学习提供支持。
(三)作业布置与批改
- 作业布置:作业布置环节,教师输入知识点、难度等级和题型要求,它可自动生成配套练习题并支持导出。
- 作业批改:作业批改环节,教师导入学生答题表,它能快速批改并生成正确率热力图。
(四)班级管理与家校沟通
- 体育锻炼分析:分析学生寒假期间体育锻炼跳绳记录数据,为新学期体育锻炼提供依据。
- 家校沟通:打造教师专属智能体,与家长进行有效沟通。
四、制造业
蒂姆维澳公司本地部署DeepSeek,结合煤矿知识安全库进行问答,为工业现场人员提供实时的维修、质检和故障排查指导,提升工业现场作业的安全性和效率。
五、软件开发领域
(一)Web开发
构建博客系统时,开发者输入需求或部分代码片段,DeepSeek Coder可自动生成后端逻辑和前端页面代码,缩短开发周期。
(二)遗留代码维护
处理遗留代码时,它可以自动生成注释和重构代码,帮助开发者理解项目逻辑,降低维护成本。
(三)提升编码效率
集成后,开发者在编码过程中能实时获取代码建议和自动完成功能,编码效率提升约30%。
(四)自动化代码生成与修复
某知名互联网公司将其集成到大型分布式系统开发项目中,通过指令生成代码、补全代码或修复错误。
(五)游戏开发
DeepSeek能根据用户输入生成可运行的游戏代码,如Python蛇形游戏和2048游戏,还能生成测试样例、修复bug和编写SQL代码。
六、法律行业
DeepSeek用于海量法律文档的分析、摘要以及合同审查等任务,能够快速提取条款风险点,提高法律检索和信息提取的效率。
七、媒体与娱乐领域
DeepSeek的多模态模型Janus - Pro在艺术设计、影视创作等领域有巨大潜力,可生成高质量的图片、视频等内容,为行业提供更多创意。