【四范式】浅谈NLP发展的四个范式

【四范式】浅谈NLP发展的四个范式

news/2024/11/23 18:54:03/文章来源:https://blog.csdn.net/kevinjin2011/article/details/142213418

自然语言处理（Natural Language Processing，NLP）是计算机科学，人工智能，语言学关于计算机和人类自然语言之间的相互作用的领域，是计算机科学领域与人工智能领域中的一个重要方向。NLP发展到今天已经进入到了LLM（大语言模型）的时代，学术界按发展时间线将NLP归纳到四个范式，即NLP四范式：

第一范式：基于「传统机器学习模型」的范式，利用特定的规则或数学、统计学的模型来对特征进行匹配和利用，进而完成特定的NLP任务，靠人工来进行大量的特征提取，依赖于大量的监督数据，并且需要专业知识和技能。如序列标注、朴素贝叶斯等算法。

第二范式：基于「深度学习模型」的范式，来到了深度学习时代，实现了自动获取特征来进行端到端的分类，从而减少了手动构建特征的需求，模型准确度有所提高，特征工程的工作量也有所减少。如CNN、RNN等神经网络模型。

第三范式：基于「预训练模型+fine-tuning」的范式，分为两个阶段，先利用大型语料库完成预训练模型的无监督学习，然后利用预训练好的模型在下游任务的特定数据集上进行fine-tuning，模型准确度得到显著提高。如GPT、Bert等模型。

第四范式：基于「预训练模型+Prompt+预测」的范式，prompt 将下游的输入输出形式改造成预训练任务中的形式（重构下游任务），使得小样本、零样本学习成为可能，模型训练所需的训练数据显著减少。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/426736.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

kubernetes架构

kubernetes架构

kubernetes cluster由master和node组成，节点上运行着若干kubernetes服务Master节点： master是kubernetes cluster的大脑，运行着的Daemon服务包括kube-apiserver，kube-scheduler,kube-controller-manager，etcd和Pod网络…

阅读更多...

Dify 中的讯飞星火平台工具源码分析

Dify 中的讯飞星火平台工具源码分析

本文主要对 Dify 中的讯飞星火平台工具 spark 进行了源码分析，该工具可根据用户的输入生成图片，由讯飞星火提供图片生成 API。通过本文学习可自行实现将第三方 API 封装为 Dify 中工具的能力。源码位置：dify-0.6.14\api\core\tools\provide…

阅读更多...

出厂非澎湃OS手机解BL锁

出厂非澎湃OS手机解BL锁

脚本作者：酷安mlgmxyysd 脚本项目链接：https://github.com/MlgmXyysd/Xiaomi-HyperOS-BootLoader-Bypass/ 参考 B站作者：蓝空穹 https://www.bilibili.com/read/cv33210124/ 其他参考：云墨清风、水墨青竹、Magisk中文网决定解BL…

阅读更多...

django学习入门系列之第十点《A 案例：员工管理系统10》

django学习入门系列之第十点《A 案例：员工管理系统10》

文章目录 12 管理员操作12.4 密码加密12.5 获取对象（防止id错误--编辑界面等）12.6 编辑管理员12.7 重置密码往期回顾 12 管理员操作 12.4 密码加密密码不应该以明文的方式直接存储到数据库，应该加密才放进去定义一个md5的方法&#xff…

阅读更多...

js | TypeError: Cannot read properties of null (reading ‘indexOf’) 【解决】

js | TypeError: Cannot read properties of null (reading ‘indexOf’) 【解决】

js | TypeError: Cannot read properties of null (reading ‘indexOf’) 【解决】描述概述在前端开发中，遇到TypeError: Cannot read properties of null (reading indexOf)这类错误并不罕见。这个错误通常表明你试图在一个null值上调用indexOf方法&#xff0c…

阅读更多...

飞睿智能UWB BLE Tag蓝牙防丢器模块，APP测距定位一键绑定，安全守护每一刻

飞睿智能UWB BLE Tag蓝牙防丢器模块，APP测距定位一键绑定，安全守护每一刻

我们总在不经意间与生活中的小物件擦肩而过——钥匙遗忘在咖啡厅的角落，钱包遗失在拥挤的地铁，甚至孩子的书包在人群中悄然消失……每一次的失而复得都是幸运的眷顾，但更多的是遗憾与不便。今天，就让我带你走进一个智能守护的新世…

阅读更多...

Linux驱动开发 ——架构体系

Linux驱动开发 ——架构体系

只读存储器（ROM） 1.作用这是一种非易失性存储器，用于永久存储数据和程序。与随机存取存储器（RAM）不同，ROM中的数据在断电后不会丢失，通常用于存储固件和系统启动程序。它的内容在制造时或通过…

阅读更多...

【算法】遗传算法

【算法】遗传算法

一、引言遗传算法（Genetic Algorithm, GA）是一种模拟生物进化过程的启发式搜索算法，它通过模拟自然选择、遗传、交叉和突变等生物学机制来优化问题的解决方案。遗传算法因其通用性、高效性和鲁棒性，在多个领域中得到了广泛应用&a…

阅读更多...

esp32核心跑分程序

esp32核心跑分程序

https://github.com/ochrin/coremark/tree/esp32 最近一直捣腾esp32s3 (Sense) 做微型摄像。过程中发现一款不错的跑分软件，特此记一笔。其中针对esp32s3各类参数设定（用idf.py menuconfig)，做个记录。 CPU Frequency去240MHz&#xff08…

阅读更多...

C语言 | Leetcode C语言题解之第413题等差数列划分

C语言 | Leetcode C语言题解之第413题等差数列划分

题目： 题解： int numberOfArithmeticSlices(int* nums, int numsSize) {if (numsSize 1) {return 0;}int d nums[0] - nums[1], t 0;int ans 0;// 因为等差数列的长度至少为 3，所以可以从 i2 开始枚举for (int i 2; i < numsSize; i…

阅读更多...

Java | Leetcode Java题解之第415题字符串相加

Java | Leetcode Java题解之第415题字符串相加

题目： 题解： class Solution {public String addStrings(String num1, String num2) {int i num1.length() - 1, j num2.length() - 1, add 0;StringBuffer ans new StringBuffer();while (i > 0 || j > 0 || add ! 0) {int x i > 0 ? n…

阅读更多...

通用四期ARM架构银河麒麟桌面操作系统V10【安装、配置FTP服务端】

通用四期ARM架构银河麒麟桌面操作系统V10【安装、配置FTP服务端】

一、操作环境服务端：银河麒麟桌面操作系统V10SP1 （服务端包链接：https://download.csdn.net/download/AirIT/89747026） 客户端：银河麒麟桌面操作系统V10SP1 （客户端包链接：https://downloa…

阅读更多...

keil里sprintf的用法

keil里sprintf的用法

代码： #include<stdio.h> int main(void) {float i-123.45;char zifu[10];sprintf(zifu,"%f",i);while(1);return 0; } 仿真结果代码： #include<stdio.h> int main(void) {float i123.45;char zifu[10];sprintf(zifu,"%f…

阅读更多...

【网络】传输层协议TCP

【网络】传输层协议TCP

TCP协议 TCP（Transmission Control Protocol，传输控制协议）是一种面向连接的、可靠的、基于字节流的传输层通信协议，由IETF的RFC 793定义。TCP在IP（Internet Protocol，互联网协议）网络层上提供…

阅读更多...

LeetCode004-两个有序数组的中位数-最优算法代码讲解

LeetCode004-两个有序数组的中位数-最优算法代码讲解

最有帮助的视频讲解【LeetCode004-两个有序数组的中位数-最优算法代码讲解】 https://www.bilibili.com/video/BV1H5411c7oC/?share_sourcecopy_web&vd_sourceafbacdc02063c57e7a2ef256a4db9d2a 时间复杂度 O ( l o g ( m i n ( m , n ) ) ) O(log(min(m,n))) O(log(min(…

阅读更多...

Flask-JWT-Extended登录验证

Flask-JWT-Extended登录验证

1. 介绍 """安装:pip install Flask-JWT-Extended创建对象初始化与app绑定jwt JWTManager(app) # 初始化JWTManager设置 Cookie 的选项:除了设置 cookie 的名称和值之外，你还可以指定其他的选项，例如：过期时间 (max_age)&…

阅读更多...

vue之 package.json和package-lock.json

vue之 package.json和package-lock.json

一、package.json 定义了当前项目所需要引用的各个模块，可以手工修改配置，也可以删除后，使用npm init命令重新自动生成。但是该文件只锁定大版本号，也就是版本号的第一位，所以你会发现两个文件中同一个包的版本号不一…

阅读更多...

项目实现：云备份②（文件操作、Json等工具类的实现）

项目实现：云备份②（文件操作、Json等工具类的实现）

云备份前言文件操作实用工具类设计文件属性的获取文件的读写操作文件压缩与解压缩的实现文件目录操作 Json 实用工具类设计编译优化前言如果有老铁不知道当前项目实现的功能是什么的话，可以先移步这篇文章内容： 云备份项目的介绍其中介绍了云备份项…

阅读更多...

[数据集][目标检测]无人机飞鸟检测数据集VOC+YOLO格式6647张2类别

[数据集][目标检测]无人机飞鸟检测数据集VOC+YOLO格式6647张2类别

数据集格式：Pascal VOC格式YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)：6647 标注数量(xml文件个数)：6647 标注数量(txt文件个数)：6647 标注…

阅读更多...

数据结构与算法——顺序表期末复习五大经典题型

数据结构与算法——顺序表期末复习五大经典题型

目录一：顺序表-移除元素二：顺序表-删除有序数组中的重复项三：顺序表-合并两个有序数组四：顺序表-旋转数组五：顺序表-数组形式的整数加法一：顺序表-移除元素题型链接：27. 移除元素 -…

阅读更多...

最新文章

推荐文章