论文阅读和分析:Mathematical formula recognition using graph grammar

HMER论文系列
1、论文阅读和分析:When Counting Meets HMER Counting-Aware Network for HMER_KPer_Yang的博客-CSDN博客
2、论文阅读和分析:Syntax-Aware Network for Handwritten Mathematical Expression Recognition_KPer_Yang的博客-CSDN博客
3、论文阅读和分析:A Tree-Structured Decoder for Image-to-Markup Generation_KPer_Yang的博客-CSDN博客
4、 论文阅读和分析:Watch, attend and parse An end-to-end neural network based approach to HMER_KPer_Yang的博客-CSDN博客
5、 论文阅读和分析:Multi-Scale Attention with Dense Encoder for Handwritten Mathematical Expression Recognition_KPer_Yang的博客-CSDN博客
6、 论文阅读和分析:Mathematical formula recognition using graph grammar_KPer_Yang的博客-CSDN博客
7、 论文阅读和分析:Hybrid Mathematical Symbol Recognition using Support Vector Machines_KPer_Yang的博客-CSDN博客
8、论文阅读和分析:HMM-BASED HANDWRITTEN SYMBOL RECOGNITION USING ON-LINE AND OFF-LINE FEATURES_KPer_Yang的博客-CSDN博客

Mathematical formula recognition using graph grammar

主要工作:

1、第一次实现Ofr(Optical Formula Recognition)系统,提取和识别数学表达式;

2、三个部分:OCR、构建图、解析图到语法树;

3、使用压缩子图成为一个节点的方法,自底向上解析图;

架构:

在这里插入图片描述

在ocr识别公式的字符后,得到字符的特征;

特征包括:符号、bounding box、baseline、size:

例如 x 2 + y 2 x^2+y^2 x2+y2

在这里插入图片描述

对图的定义

顶点vertex: V ( t , v , i ) V(t,v,i) V(t,v,i)三元组:

​ - t t t:lexical type 符号类型:例如"Operator" , "Variable’ , ‘Digit’,etc.

​ - v v v:值,代表数学表达式 例如 x , P l u s ( x , ( M u l t ( 2 , y ) ) ) , e t c x, Plus(x, (Mult(2, y))), etc x,Plus(x,(Mult(2,y))),etc.

​ - i i i:标识,区分同一个表达式中的相同符号但是出现在不同地方;

边edge: E ( t , v 1 , v 2 ) E(t,v_1,v_2) E(t,v1,v2):

​ - v 1 、 v 2 v_1、v_2 v1v2:顶点

​ - t t t:边的类型。二元组 L ( d , w ) L(d,w) L(d,w) d d d:图的方向:例如’Left". ‘Right’, ‘Top’, etc。 w w w:权重,使用在平面上的相关关系进行编码;

图graph:一些列边的集合
{ E ( t 1 , v 11 , v 2 , 1 ) , … , E ( t n , v 1 n , v 2 , n ) } . \{E(t_1,v_{11},v_{2,1}),\ldots,E(t_n,v_{1n},v_{2,n})\}. {E(t1,v11,v2,1),,E(tn,v1n,v2,n)}.

使用符号规则(Lexer rules)构建图;

定义符号的方向:left(l)、right®、top(t)、bottom(b)、top-left(tl)、bottom-left(bl)、top-right(tr)、bottom-right(br)、in(i)

规则1:符号的类型规则,对每种类型指定可以连接的类型;例如:

在这里插入图片描述

规则2:顺序规则,基于left->right的顺序,比如像top-left 或者 bottom-right是比较接近的,使用引力等势场来描述,如下图所示:(相当于计算节点的weight),可以看到横向的关系可能会很长。

a grid like structure to be able to have a good algorithm complexity

在这里插入图片描述

使用语法规则(grammar rules)解析图到语法树;

核心思路:自底向上将图进行压缩,不断把子图压缩到一个节点,最后得到公式的符号表示。

给一个公式的图表示(边、顶点),规则尝试通过使用顶点(顶点的值是被识别的子公式)重写它的子图(不断坍缩子图到节点)。过程使用匹配和替换方式。

图转换到节点的规则:

​ - V V V:节点,叫做规则的production;

​ - G G G:图,叫做规则的pattern;

​ - C C C:graphs的有限集合; 叫做规则的context;

grammer:一个规则rules的有限集合;

匹配和替换过程:

  • 替换是 T ( F , V ) T(F,V) T(F,V)的自同态(endomorphism),即 σ f ( t 1 , … , t n ) = f ( σ t 1 , … σ t n ) \sigma f(t_{1},\ldots,t_{n})=f(\sigma t_{1},\ldots\sigma t_{n}) σf(t1,,tn)=f(σt1,σtn)对于所有的 f f f和所有的terms: t 1 , … , t n t_1,\dots,t_n t1,,tn,一个 σ \sigma σ是唯一被确定的。
  • 一个 t t t匹配 t ′ t^{\prime} t,注意是 t ≤ t ′ t\leq t' tt,当且仅当替换 σ \sigma σ满足 σ t = t ′ \sigma t=t^{\prime} σt=t.

匹配有限集被定义成:
{ t 1 , … , t n } ≤ { t 1 ′ , … , t m ′ } ⇔ ∃ σ { σ t 1 , … , σ t n } = { t 1 ′ , … , t m ′ } \{t_1,\dots,t_n\}\leq\{t_1',\dots,t_m'\}\Leftrightarrow\exists\sigma\{\sigma t_1,\dots,\sigma t_n\}=\{t_1',\dotsc,t_m'\}\quad {t1,,tn}{t1,,tm}σ{σt1,,σtn}={t1,,tm}
一个规则 r = V ← G , r=V\leftarrow G, r=VG, C C C重写一个图 G 1 G_1 G1到一个图 G 2 G_2 G2 ,记作 G 1 → r G 2 G_1\rightarrow_r G_2 G1rG2,当且仅当存在替换 σ \sigma σ,一个 G G G的子图 G ′ G^{\prime} G,得:

  • σ G = G ′ . \sigma G=G^{\prime}. σG=G.

  • 对于contex C C C的所有图 H H H,没有替换 τ \tau τ such that τ ∣ V a r ( G ) = σ ∣ V a r ( G ) and τ H ⊂ G 1 . \tau_{|Var(G)}=\sigma_{|Var(G)}\text{and}\tau H\subset G_1. τVar(G)=σVar(G)andτHG1.

  • G 2 G_2 G2是由 G ′ G^{\prime} G坍缩得到的 σ V \sigma V σV,即是移除 G 1 G_1 G1属于 G ′ G^{\prime} G所有的边和使用 σ V \sigma V σV替换属于 G ′ G^{\prime} G顶点

注:消除歧义的情况,对于一个导致歧义的图语法,在其规则中添加上下文,尽可能自动地消除这些歧义。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9555.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

理解不同加密币的要点(一)—— 共识机制

一、加密货币分类 (一)价值层面 与实体资产绑定的代币 为了因应市场需求而生,与实体资产做挂钩的代币,也就是我们说的稳定币。例如与美元做挂钩的USDT、TUSD、PAX与USDC等。 仰赖网络共识的代币 代币价值仰赖网路上市场共识…

雅虎布局AI,台湾会议结束,cntm继续一飞冲天

开年以来,由ChatGPT激起的涟漪,已经变为汹涛骇浪。近日来,微软、谷歌、百度、阿里、京东先后加入战局。然而,就在互联网巨头群雄逐鹿的同时,记者注意到,一款同名虚拟货币也悄悄拿起了“镰刀”。 除此之外&a…

关于数字货币之间相互制衡的一场讨论|ChatGPT

注:本文由区视crypto与ChatGPT深度对话编辑生成,可转载 数字货币是一种利用密码学原理进行点对点传输的电子货币,它不依赖于中央银行或政府来发行、监管或控制。目前,数字货币市场上有许多不同的币种,其中最著名的是比…

App Store 新定价机制 - 2023年最全版

作者:iHTCboy 本文介绍了苹果 App Store 的新定价机制,是 App Store 在 15 周年之际推出的最重要价格升级。 文章通过“为什么,是什么,怎么办”的方法论,让读者从根本原理上理解新机制的意义、背后的原因以及应对方式。…

微信小程序实现多语言方案|中英互译

不管哪个系统,多语言方案套路都是一样的 1、建立多语言映射库 2、记录并存储用户选择的语言版本,下次进入直接进入对应语言版本 3、根据用户设置动态加载语言版本 4、前台调用 效果图 🐤 小程序代码片段(建议看代码片段&#xff…

多语种翻译互译,批量小语种翻译互译

多语种包括联合国通用语种(汉语、英语、俄语、阿拉伯语、法语、西班牙语)和其他不包括在内的小语种,例如日语、韩语、德语和意大利语等。多语种互译软件支持中外语言互译,可以将我们的中文翻译成以上所述的其他语种。 多语种互译软…

AI绘画太好玩了!哈哈哈哈哈~~

最近,AI绘画非常流行,只要输入一些关键词(prompt脚本),就可以AI帮你绘画出精美的图画,真的很有意思。小灰也对AI绘画爱不释手。 在百度上随便搜一下,就能搜出各种乱七八糟的AI绘画平台&#xff…

chatgpt赋能python:Python图画不出来真的会影响SEO吗?

Python图画不出来真的会影响SEO吗? Python是一种高级编程语言,被广泛应用于科学计算、数据挖掘和人工智能等领域。Python语言的简洁、易读易写的特点,让它成为了开发者的首选之一。然而,在SEO优化中,Python却有着一个…

如何与孩子聊ChatGPT:AI大时代的完整版家长指南

前言 ChatGPT和GPT-4迅速蹿红,一夜之间成为新一代人工智能的代言人。家长朋友们有没有发现,家里爱学习的小朋友突然多了很多关于AI的问题? 我是个五年级小朋友的家长,也长期做人工智能技术研发、项目孵化与投资。因为ChatGPT&…

脉脉疯传!2023年程序员生存指南;多款prompt效率加倍工具;提示工程师最全秘籍;AI裁员正在发生 | ShowMeAI日报

👀日报合辑 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 2023年程序员生存指南 不要在互联网公司做低代码项目 保证一定强度的刷题,不要用go刷题,用cpp或者java,性价…

【AI作画】使用DiffusionBee with stable-diffusion在mac M1平台玩AI作画

DiffusionBee是一个完全免费、离线的工具。它简洁易用,你只需输入一些标签或文本描述,它就能生成艺术图像。 DiffusionBee下载地址 运行DiffusionBee的硬性要求:MacOS系统版本必须在12.3及以上 DBe安装完成后,去C站挑选自己喜欢…

Midjourney8种风格极其使用场景(1)

目录 ​编辑 引言 等距动画 场景 分析性绘图 场景 着色书 场景 信息图画 场景 双重曝光 场景 图示性绘画 场景 二维插图 场景 图解式画像 场景 总结: 八种风格箴言: 引言 我相信大家都或多或少玩过Midjourney,但是要形…

手把手教你如何使用AI绘画:Stable-Diffusion本地化部署及使用教程

文章目录 前言一、安装AI模型软件stable-diffusion-webui1.环境安装2.配置中文包 二、配置算法模型1.配置底模型2.LoRA的使用3.配置精准控图模型 三、Prompt的魔法1.定向提升图画质量 总结 前言 最近随着ChatGPT的爆火,AI绘画也火得不行,这几天文心一言…

浅谈文心一言与ChatGPT

最近,随着谷歌研发的ai聊天机器人bard的测试,关于这方面的​​​​​​​讨论也是愈演愈烈 虽然与GPT与newbing相同,bard也有一些小小的门槛才能访问,而根据外媒的报道,bard在体验上似乎还略逊一筹 而让我们把目光转回…

ChatGPT:5. 使用OpenAI API创建自己的AI网站:4. flask框架网页界面上下载OpenAI API请求的图片

ChatGPT:5. 使用OpenAI API创建自己的AI网站:4. flask框架网页界面上下载OpenAI API请求的图片 如果你还是一个OpenAI的小白,有OpenAI的账号,但想调用OpenAI的API搞一些有意思的事,那么这一系列的教程将仔细的为你讲解…

GPT与Mdjourney绘图工具完美结合,让你轻松绘制精美图画

小念助手已经实现将GPT与Midjourney结合在一起使用啦!现在,你可以在绘图页直接输入你要绘制的主题,之后调用GPT生成适合绘画的描述,等待一会会,一张精致的图片就做好啦! 无需担心绘画技巧,小念助…

几个字就能生成画作,AIGC的时代即将到来

一、前言 最近AI绘画、聊天、代码生成可以说是刮起了一阵风,席卷了互联网。各大网站都在疯狂刷屏相关的内容,也收到了各界的热烈的关注。无论是AI绘画还是聊天这类的技术都属于同一个领域:人工智能生成内容(AIGC) 小伙…

智头条|欧盟达成《人工智能法》协议,全球前沿科技齐聚AWE 2023

行业动态 华为云联手多方推进数字化,软通动力深度参与 华为云宣布启动“‘百城万企’应用现代化中国行”,旨在推动应用现代化进程、助力数字中国高质量落地。软通动力是该行动的参与者之一,共同探索符合区域特点、产业趋势、政企现状的数字化…

数据驱动+AI引擎,为MarTech打开全新的想象空间

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 近年来,随着全球数字化、信息化进程不断提速,企业营销的战场也逐渐转移至线上。一方面,消费者行为的数字化使得企业营销活动更加依赖于线上数字营销;另一方面,包括…

解读陆奇博士的“大模型世界观”

腾讯科技频道记者张小珺一篇《陆奇最新演讲实录—我的大模型世界观》刷爆朋友圈。文章知识点丰富、字里行间处处流淌着创业方法论和AI应用商机,含金量极高! PS:一家之言、不求苟同。如有不爽之处,欢迎来 找我。 腾讯新闻原文&…