山东大学软件学院2022-2023第二学期自然语言处理期末考试回忆版

山东大学软件学院2022-2023第二学期自然语言处理期末考试回忆版

前言

1、考试时间:2023/6/13 14:00 – 16:00
2、考试科目:自然语言处理(老师:SunYuQing)
3、考题语言:中文
4、考试形式:闭卷
5、题型:概念、算法、拓展
6、考后感悟: 平时作业题里有一部分是原题,还是要看看的。…………………然后。。。…………其他的……………………尽力吧。……算法………公式………真的很难背啊。。。。(还有CSDN上人工智能专业的NLP考试回忆大多是青岛校区的,参考意义不大。(怨种就是我了,看了很长时间。))
7、这里放个复习笔记吧, 仅供参考。
NLP期末复习
访问密码 hard

一、(15’)

描述Skip-gram模型训练过程,写出详细公式。
答:
在这里插入图片描述
在这里插入图片描述

二、(25’)

文本序列标注问题是什么?从模型假设和计算方式说明CRF 和HMM的不同。写出HMM的前向算法和后向算法的步骤,写出计算公式,并说明其中符号的意义。
答:
1、文本序列标注问题,即给定一个输入序列,使用模型对这个序列的每一个位置标注一个相应的标签,是一个序列到序列的过程。
2、不同:
模型假设:HMM有严格的独立性假设条件;而CRF没有,因而可以容纳任意的上下文信息,特征设计灵活。
计算方式:HMM求解过程可能是局部最优,CRF可以全局最优。
3、
在这里插入图片描述
在这里插入图片描述

三、(20’)

请写出分词任务的评价指标公式,给出正确情况和错误情况的详细说明。
写出基于最大概率的词典匹配算法。
答:
1、评价指标公式:
在这里插入图片描述
在这里插入图片描述
2、正确情况及错误情况说明:
在这里插入图片描述
针对上述例子“武汉市长江大桥”的分词结果 1,精准率和召回率均为 0,因为没有重合部分。对于分词结果 2 来说,算法预测样本中与真实标注一致,精准率和召回率均为 1。

3、基于最大概率的词典匹配算法:
步骤 1:基于前缀词典算法,实现高效的词图扫描,找出句子中所有可能成词情况,生成有向无环图 (DAG)。
步骤 2:采用动态规划查找最大概率路径, 即找出基于词频的最大切分组合。
在这里插入图片描述
在这里插入图片描述

四、(15’)

写出词法分析CYK算法的过程。
答:
在这里插入图片描述

五、(10’)

说明机器翻译中评价指标 METEORBERTScore 的计算公式 ,并说明其中符号的意义。
答:
1、METEOR:
在这里插入图片描述
chunk表示匹配的元组块集合;Penalt yi是惩罚项; Pi是精准率;Ri是召回率;C(g,yi) )表示元组g在参考⽂本yi 中的出现次数

2、BERTScore
在这里插入图片描述

六、(15’)

什么是语言模型?说明主流语言模型的训练方式,并说明缺点。
答:
1、语言模型是建模“预测一个语言样本/实例的能力”,也可以视为一个计算文本概率的系统。
2、chatgpt语言模型使用基于Transformer的结构,训练过程可以在不同的时间步并行化,加快训练过程。
3、缺点:模型可能缺乏对特定行业的深入了解,导致在某些任务上的表现不佳。同时,伦理和道德问题,如生成虚假信息和歧视性内容,也是需要关注的问题。

结尾

复习建议:平时作业题最好看看,可能会有几道原题。其他的……就尽力吧……考了很多 算法、公式 还有公式中每个符号的意义。
注:以上题目答案均个人见解,欢迎探讨。

~
~
~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9572.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ICLR 2023 | Self-Consistency: Google超简单方法改善大模型推理能力

大家好,我是HxShine。 今天分享一篇Google Research, Brain Team的一篇文章,SELF-CONSISTENCY IMPROVES CHAIN OF THOUGHT REASONING IN LANGUAGE MODELS[1]:利用自洽性提高语言模型中的思维链推理效果 这篇文章方法非常简单但是效果非常好…

【ChatGPT 翻译】Language Models are Few-Shot Learners

【ChatGPT 翻译】Language Models are Few-Shot Learners 摘要 Abstract1 引言 Introduction2 方法2.1 模型和体系结构2.2 训练数据集2.3 训练过程2.4 评估 3 结果3.1 语言建模、完形填空和完成任务3.1.1 语言模型3.1.2 LAMBADA3.1.3 HellaSwag3.1.4 StoryCloze 3.2 闭卷问答翻…

ChatGPT的今天,早已被这本书预言了|文末赠书

最近,ChatGPT大火了!推出之后,ChatGPT只用了两个月就积累了1亿用户,随着越来越多的人开始用ChatGPT,发现他能做的东西越来越多,写论文、写作业、写文案、写代码都不在话下。 于是,各种稀奇古怪的…

OpenAI ChatGPT 3.5模型和清华开源ChatGLM-6B模型的对比,到底ChatGPT强在哪里(内含几个国内GPT可用途径)

目录 前言: (1)环境 (2)比较用例 (a)中文提问:用java写冒泡排序算法 (b)中文提问:a10,b6,不新增变量,怎么交换a和b的值&#xff…

当ChatGPT的子弹射中知乎

题图|视觉中国 毫无疑问,ChatGPT 已然成为 2023 上半年最有影响力的商业话题。 ChatGPT 横空出世仅百余天便让整个互联网都为之躁动,心有猛虎的公司都在寻找向上攀爬的入口——“文心一言”之于百度、“通义千问”之于阿里、百川智能之于王小…

OpenAI Translator - 基于 ChatGPT的最强开源 AI 划词翻译工具

为啥要造这个轮子? 我开发了一个 Bob 的插件 bob-plugin-openai-translator 使用 ChatGPT API 在 macOS 上进行全局划词翻译。 但是由于很多用户并不是 macOS 用户,所以特此开发了一个浏览器插件方便非 macOS 用户使用 ChatGPT 进行划词翻译。 既是浏…

Mac最先进的API工具-RapidAPI for Mac

一、前言 当使用 Mac 进行接口测试的时候,一般都会想到接口测试工具 Postman、Jmeter。 Postman 以其页面友好,功能简单,可以快速上手进行接口测试。而 Jmeter 除了测接口外,还可以进行接口自动化测试、性能测试等。 本篇将介绍…

【接口工具ApiPost】Mac系统安装(1)

ApiPost目前提供Window64位,Window32位、Mac、Linux版本的安装包下载。 ApiPost下载页:https://www.apipost.cn/download.html Mac系统安装 流程如下: 升级安装 初次安装打开后的界面 登录 账户登录: 微信登录 所以最后…

Mac 获取 App store下载的文件包 pkg

因为某种原因,我需要搞到 App store 中的某个软件的 pkg 安装文件,百度了半天,没一个能用的。。。不多bb,自力更生,直接开搞 我的系统是Big Sur 访达按CommandShiftG,进入 /private/var/folders 目录 这时…

与ChatGPT合作解析《三体》数学

最近都在讨论爆火的ChatGPT可能会替代10大职业,其中小编所在的媒体工作者就是其中之一,顿时有种危机感……于是开始试探ChatGPT这个竞争对手的真实实力——让它写一篇《三体》中数学问题的文章: 【ChatGPT】 根据上面生成的文章,…

论文阅读和分析:Mathematical formula recognition using graph grammar

HMER论文系列 1、论文阅读和分析:When Counting Meets HMER Counting-Aware Network for HMER_KPer_Yang的博客-CSDN博客 2、论文阅读和分析:Syntax-Aware Network for Handwritten Mathematical Expression Recognition_KPer_Yang的博客-CSDN博客 3、论…

理解不同加密币的要点(一)—— 共识机制

一、加密货币分类 (一)价值层面 与实体资产绑定的代币 为了因应市场需求而生,与实体资产做挂钩的代币,也就是我们说的稳定币。例如与美元做挂钩的USDT、TUSD、PAX与USDC等。 仰赖网络共识的代币 代币价值仰赖网路上市场共识…

雅虎布局AI,台湾会议结束,cntm继续一飞冲天

开年以来,由ChatGPT激起的涟漪,已经变为汹涛骇浪。近日来,微软、谷歌、百度、阿里、京东先后加入战局。然而,就在互联网巨头群雄逐鹿的同时,记者注意到,一款同名虚拟货币也悄悄拿起了“镰刀”。 除此之外&a…

关于数字货币之间相互制衡的一场讨论|ChatGPT

注:本文由区视crypto与ChatGPT深度对话编辑生成,可转载 数字货币是一种利用密码学原理进行点对点传输的电子货币,它不依赖于中央银行或政府来发行、监管或控制。目前,数字货币市场上有许多不同的币种,其中最著名的是比…

App Store 新定价机制 - 2023年最全版

作者:iHTCboy 本文介绍了苹果 App Store 的新定价机制,是 App Store 在 15 周年之际推出的最重要价格升级。 文章通过“为什么,是什么,怎么办”的方法论,让读者从根本原理上理解新机制的意义、背后的原因以及应对方式。…

微信小程序实现多语言方案|中英互译

不管哪个系统,多语言方案套路都是一样的 1、建立多语言映射库 2、记录并存储用户选择的语言版本,下次进入直接进入对应语言版本 3、根据用户设置动态加载语言版本 4、前台调用 效果图 🐤 小程序代码片段(建议看代码片段&#xff…

多语种翻译互译,批量小语种翻译互译

多语种包括联合国通用语种(汉语、英语、俄语、阿拉伯语、法语、西班牙语)和其他不包括在内的小语种,例如日语、韩语、德语和意大利语等。多语种互译软件支持中外语言互译,可以将我们的中文翻译成以上所述的其他语种。 多语种互译软…

AI绘画太好玩了!哈哈哈哈哈~~

最近,AI绘画非常流行,只要输入一些关键词(prompt脚本),就可以AI帮你绘画出精美的图画,真的很有意思。小灰也对AI绘画爱不释手。 在百度上随便搜一下,就能搜出各种乱七八糟的AI绘画平台&#xff…

chatgpt赋能python:Python图画不出来真的会影响SEO吗?

Python图画不出来真的会影响SEO吗? Python是一种高级编程语言,被广泛应用于科学计算、数据挖掘和人工智能等领域。Python语言的简洁、易读易写的特点,让它成为了开发者的首选之一。然而,在SEO优化中,Python却有着一个…

如何与孩子聊ChatGPT:AI大时代的完整版家长指南

前言 ChatGPT和GPT-4迅速蹿红,一夜之间成为新一代人工智能的代言人。家长朋友们有没有发现,家里爱学习的小朋友突然多了很多关于AI的问题? 我是个五年级小朋友的家长,也长期做人工智能技术研发、项目孵化与投资。因为ChatGPT&…