美赛优秀论文阅读--2023C题

文章目录

  • 1.题目说明
  • 2.我对于这个题目信息的理解
  • 3.优秀论文学习
    • 3.1摘要
    • 3.2相关的算法模型
  • 4.总结

1.题目说明

今天阅读的这个文章来自于这个2023年的这个美赛的这个C题的论文;

我们的这个题目可以到网上去找,这个还是比较容易找到的,大致就是进行这个相关的预测吧

image-20241118184212119

我们的这个数据文件里面的这个内容就是我们的这个不同的模式下面的这个

image-20241118184317608

2.我对于这个题目信息的理解

首先就是下面的这个图片:我们的这个过程就展示了这个游戏的玩法,例如这个第一行里面的这个表示的就是这两个字母在我们的这个正确单词里面是存在的,这个位置不对;

接下来我们对于这个位置进行调整,这个位置是对的的时候这个字母快就会显示成为这个绿色的;

image-20241118185602484

其次就是下面的这个数据图:表示的就是这个数据结果在网上是存在多少份的,这个现实的案例就是42237份,但是这个困难模式的就是3685份;

下面的这个比率我没看的很明白,我觉得可能就是一次通关,2次通关的这个人数的比率,以及这个始终没通关的这个人数的百分比吧;

image-20241118185804619

下面的这个就是我们的这个题目的要求了:

1)开发模型对于这个现象结果进行解释,并使用我们的这个魔性对于这个具体的某一天里面的这个数据进行预测;

2)就是开发模型对于未来日期里面的这个数据报告,就是对于未来某一天的用户多少次猜出来这个单词的比例的数据报告结果进行预测;

3)然后就是根据这个难度进行划分,使用我们的这个模型对于这个分类的准确性进行判断;

image-20241118190046727

3.优秀论文学习

说实话,这个论文写的我自己没看的很懂:

3.1摘要

在数字时代,语言往往通过缩写、表情符号和语音消息传达。然而,《纽约时报》提供的Wordle游戏提供了一个回归语言基础的机会。因此,我们对Wordle的结果进行了数据分析。

首先,我们建立了一个GRU预测模型,以预测2023年3月1日报告结果的数量。该模型使用了有效的门控循环单元(GRU)算法。因此,训练集对测试集的预测相对误差率是2.1569%,相对RESE为6.4957%,表明模型预测具有较高的准确性。2023年3月1日报告结果数量的预测区间为20367 ± 2.01569%。

其次,我们对单词属性和分数进行了数据分析,分数定义为得分百分比。然后,我们定义了单词的四个属性词频、字母频率总和、字母重复模式(2/3或无),以及主要词性

对于前两个属性,我们进行了与变量“得分”的回归分析。fword与得分之间的皮尔逊相关系数为-0.3165,fletter与得分之间的相关系数为-0.4005。rep和pos可以用于对单词进行分类。箱线图结果显示,rep的中位数差异为0.13004,而pos仅为0.05973。因此,我们认为fword、fletter和rep可以影响得分百分比,而pos则不能。

第三,我们开发了GSRF预测模型,以预测2023年3月1日EERIE的1到X的得分百分比。网格搜索随机森林(GSRF)算法是通过使用最佳超参数组合改进的随机森林算法。我们选择了fword、fletter和rep作为模型的输入参数。模型的训练结果显示MSE为20.70641,MAE为3.24388,表明模型具有良好的预测性能。(表10)EERIE的预测结果为(1,7,23,30,23,13,3)。此外,我们通过分别向fword和fletter添加高斯噪声进行了敏感性分析,结果显示模型的敏感性较低,因此非常稳定。

第四,使用==K-Means++==进行了难度率分类模型。我们首先定义了每个单词的难度日期δ。EERIE的预测分布难度率为0.35916。然后,我们使用K-Means++分析每个单词的δ,并获得了五个难度级别(表11)。EERIE被归类为第三级。最后,我们将模型的分类与部分采样单词的手动难度评分进行了比较,匹配率为93.33%,确认了模型的准确性。

最后,我们探索了另外两个数据特征。之后,我们根据稳定的模型为《纽约时报》的填字游戏编辑撰写了一封信。

关键词:GRU;回归分析;箱线图分析;GSRF;K-Means++

3.2相关的算法模型

下面的这个论文内容里面的这个GRU我是没有听说过的,但是这个时间序列分析我略有了解,可能是一个著名的算法,可以了解一下,学学;

GRU(门控递归单元)是一种递归神经网络(RNN),通常用于时间序列分析
用于时间序列分析。它具有与 LSTM(长短期记忆)架构类似的特性,但计算速度通常更快。
GRU 架构背后的主要思想是有两个门:复位门和更新门、
这两个门控制网络中的信息流。重置门决定应遗忘多少之前的隐藏状态,而更新门则决定应向当前隐藏状态添加多少新输入。

下面的这个就是实现的这个方法使用的就是pytorch总金额个模型,划分这个测试集合训练集合,这个是常规操作,这个大致可以看懂;

在Python丰富库的支持下,我们选择使用PyTorch提供的GRU模型。PyTorch是一个基于Python的机器学习库,其独特之处在于动态计算图,这与静态计算图不同。动态计算图可以在运行时进行修改,这意味着模型可以根据我们的需求进行调整。这对于处理可变长度的序列数据非常有用,并且非常适合预测我们需要的报告结果数量。在PyTorch中,我们可以利用torch.nn.GRU类轻松构建和训练GRU模型,并使用该模型进行预测。我们使用了从2022年1月7日到2022年12月31日的每日“报告结果数量”时间序列数据的80%作为训练集,剩余的20%作为测试集用于我们的GRU模型。测试集上的预测结果可视化如图4所示。

下面的这个就是进行这个误差的分析,使用的是这个均方根误差,之前在这个机器学习里面略有了解,但是这个公式没讲过,这个对于图像的说明,也可以学习一下;

image-20241118195816947

下面的这个聚类的方法的这个具体的描述,这个和之前学习的这个二维空间里面划分的那个机器学习的思想是很像的;

K-Means聚类算法是一种常用的无监督机器学习算法,用于将数据划分成若干类别。它预先指定初始的聚类数量和初始聚类中心,并根据样本之间的距离大小将样本集划分为不同的聚类。使用欧氏距离作为数据对象之间相似性的度量,相似性与数据对象之间的距离成反比。相似性越大,距离越小。根据数据对象与聚类中心之间的相似性,不断更新聚类中心的位置,并持续减少聚类的平方误差和(SSE)。当SSE不再变化或目标函数收敛时,聚类结束并获得最终结果。

下面的这个就是进行的灵敏度的分析,分别对于这几个属性进行分析:最后就是一些这个参考文献和这个相关的这个模型的优缺点了;

image-20241118200625258

4.总结

我的这个第一次阅读这个英文的优秀论文,主要是为了这个亚太进行准备,确实这个英文的这个论文的阅读是有难度的,而且这个文章里面使用的这个相关的这个模型和算法,对我我目前的这个水平而言,还是遥不可及的,可能是这个论文选择的时候选的太高了,但是对于这个一些问题,常用的这个方法,可能也会为我的这个接下来的这个备战指明这个学习的方向吧;

例如这个聚类里面的这个kmeans我了解过,但是这个++不了解,可能就是一个改进的版本呢,还有这个灵敏度分析,以及这个模型的评价之类的都是我们的数学建模的传统思路,万变不离其宗;

例如这个聚类里面的这个kmeans我了解过,但是这个++不了解,可能就是一个改进的版本呢,还有这个灵敏度分析,以及这个模型的评价之类的都是我们的数学建模的传统思路,万变不离其宗;

路漫漫其修远兮,数学建模之路,任重而道远,通过这次的学习,可能会知道一些这个相关的论文写作格式之类的,但是这个论文目前对于我而言,跨度太大,后面可能会选择合适的论文进行深入学习,比赛的时候进行模仿;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/474126.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChromeDriver驱动下载地址更新(保持最新最全)

说明: ChromeDriver 是 Selenium WebDriver 用于控制 Chrome 的独立可执行文件。 为了方便下载使用,本文保持ChromeDriver的最新版本更新,并提供115.0.5763.0-133.0.6841.0版本的下载地址: 所有版本和下载地址: &am…

delphi fmx android 离线人脸识别

搜遍全网都没有找到delphi android 能用的 离线人脸识别,无需注册什么开发者 有这方面需求的可以用fsdk 这边用的luxand.FSDK8.0 android下的注册号要自己找下 1,用老猫的工具将android 下的sdk,FSDK.java 编译成FSDK.jar 老猫的工具 2,用上面的工具将FSDK.jar 生成de…

【模块一】kubernetes容器编排进阶实战资源对象之Configmap与Secret简介

kubernetes 资源对象详解及示例 kubernetes 的几个重要概念 资源对象:kubernetes基于声明式API,和资源对象进行交互。 yaml文件:为了方便后期管理,通过使用yaml文件通过API管理资源对象。 yaml必需字段: apiVersio…

游戏引擎学习第14天

视频参考:https://www.bilibili.com/video/BV1iNUeYEEj4/ 1. 为什么关注内存管理? 内存分配是潜在的失败点: 每次进行内存分配(malloc、new等)时,都可能失败(例如内存不足)。这种失败会引入不稳…

游戏引擎学习第12天

视频参考:https://www.bilibili.com/video/BV1yom9YnEWY 这节没讲什么东西,主要是改了一下音频的代码 后面有介绍一些alloc 和malloc,VirtualAlloc 的东西 _alloca 函数(或 alloca)分配的是栈内存,它的特点是: 生命周…

django——创建 Django 项目和 APP

2.创建 Django 项目和 APP 命令: 创建Django项目 django-admin startproject name 创建子应用 python manager.py startapp name 2.1 创建工程 在使用Flask框架时,项目工程目录的组织与创建是需要我们自己手动创建完成的。 在django中,…

OceanBase 分区表详解

1、分区表的定义 在OceanBase数据库中,普通的表数据可以根据预设的规则被分割并存储到不同的数据区块中,同一区块的数据是在一个物理存储上。这样被分区块的表被称为分区表,而其中的每一个独立的数据区块则被称为一个分区。 如下图所示&…

学习大数据DAY61 宽表加工

目录 模型设计 加工宽表 任务调度: 大表 - 把很多数据整合起来 方便后续的明细查询和指标计算 模型设计 设计 建模 设计: excel 文档去编写 建模: 使用建模工具 PowerDesigner Navicat 在线画图工具... 把表结构给绘 制出来 共享\项目课工具\pd 加工宽表 数…

uniapp微信小程序转发跳转指定页面

onShareAppMessage 是微信小程序中的一个重要函数,用于自定义转发内容。当用户点击右上角的菜单按钮,并选择“转发”时,会触发这个函数。开发者可以在这个函数中返回一个对象,用于定义分享卡片的标题、图片、路径等信息。 使用场…

Datawhale组队学习】模型减肥秘籍:模型压缩技术3——模型量化

模型量化的目的是通过将浮点运算转换为定点运算,以减少模型大小、内存和存储需求,同时加快推理速度,降低计算功耗,使得模型在低算力设备上运行更加高效,特别适用于嵌入式设备或移动端场景。 不同数据类型(…

arkUI:网格布局(Grid)

arkUI:网格布局(Grid) 1 主要内容说明2 网格布局的相关内容2.1 基本使用2.1.1 源码1 (Grid网格布局)2.1.2 源码1运行效果 2.2 设置排列方式2.2.1 核心布局参数2.2.2 网格单元格参数(GridItem)2.…

Cherno OpenGL(28 ~ 33)

批量渲染-介绍 在这里我们将在一个drawcall打包多个几何体。即 batch geometry。 我们在这里将聚焦于2d渲染,我们如何渲染一堆2d的quads或者说rectangles呢? 一种情况是比如一个2d游戏有很多个tile组成,要去渲染这些tile;另一种…

网络安全之国际主流网络安全架构模型

目前,国际主流的网络安全架构模型主要有: ● 信息技术咨询公司Gartner的ASA(Adaptive Security Architecture自适应安全架构) ● 美国政府资助的非营利研究机构MITRE的ATT&CK(Adversarial Tactics Techniques &…

游戏引擎学习第16天

视频参考:https://www.bilibili.com/video/BV1mEUCY8EiC/ 这些字幕讨论了编译器警告的概念以及如何在编译过程中启用和处理警告。以下是字幕的内容摘要: 警告的定义:警告是编译器用来告诉你某些地方可能存在问题,尽管编译器不强制要求你修复…

【Nginx从入门到精通】03 、安装部署-让虚拟机可以联网

文章目录 总结一、配置联网【Minimal 精简版】1.1、查看网络配置1.2、配置ip地址 : 修改配置文件 <font colororange>ifcfg-ens33Stage 1&#xff1a;输入指令Stage 2&#xff1a;修改参数Stage 3&#xff1a;重启网络Stage 4&#xff1a;测试上网 二、配置联网【Everyth…

【UGUI】背包的交互01(道具信息跟随鼠标+道具信息面板显示)

详细程序逻辑过程 初始化物品栏&#xff1a; 在 Awake 方法中&#xff0c;通过标签找到提示框和信息面板。 循环生成10个背包格子&#xff0c;并为每个格子设置图标和名称。 为每个格子添加 UInterMaager232 脚本&#xff0c;以便处理交互事件。 关闭提示框和信息面板&#…

MySQL45讲 第二十四讲 MySQL是怎么保证主备一致的?——阅读总结

文章目录 MySQL45讲 第二十四讲 MySQL是怎么保证主备一致的&#xff1f;——阅读总结一、MySQL 主备基本原理&#xff08;一&#xff09;主备切换流程&#xff08;二&#xff09;主备数据同步流程 二、binlog 格式及相关问题&#xff08;一&#xff09;binlog 的三种格式&#…

RSA算法原理

1、RSA加密算法介绍 2、RSA算法的基本原理 2.1、RSA密钥生成 2.2、RSA加密和解密 1、RSA加密算法介绍 简单介绍一下&#xff0c;RSA算法是现代密码学的基石之一&#xff0c;广泛应用与安全通信、数据加密和身份验证等领域。 RSA加密是一种非对称加密算法&#xff0c;由罗…

html 图片转svg 并使用svg路径来裁剪html元素

1.png转svg 工具地址: Vectorizer – 免费图像矢量化 打开svg图片,复制其中的path中的d标签的路径 查看生成的svg路径是否正确 在线SVG路径预览工具 - UU在线工具 2.在html中使用svg路径 <svg xmlns"http://www.w3.org/2000/svg" width"318px" height…

哋它亢SEO技术分析:如何提升网站在搜索引擎中的可见性

文章目录 哋它亢SEO技术分析&#xff1a;如何提升网站在搜索引擎中的可见性网站的基本情况SEO优化分析与建议1. 元数据优化2. 关键词优化3. URL结构4. 图像优化5. 移动端优化6. 网站速度7. 结构化数据&#xff08;Schema Markup&#xff09;8. 内链与外链9. 社交分享 哋它亢SEO…