简历解析步骤(第一步)技术与实现(1)识文字,取信息

简历解析步骤(第一步)技术与实现(1)识文字,取信息

在上篇文章中,我们讲解了简历解析的理论。一般情况下,我们会以图片或文档的形式收到简历,为了实现解析,首先需要将其中的文本提取出来,然后对文本进行算法分析和人工智能训练,以提高解析准确率。

下面是我们整个解析和训练过程中需要使用的技术:

  1. 文字识别:OCR服务(如百度AI开放平台的通用文字识别)。
  2. 算法:可以使用伪代码,不限语言。
  3. AI机器学习:例如 ML.NET 或 Python 中的一些算法库。

步骤:

第一步:通过文字识别,提取出所有有价值的信息(对于中文简历,我们将提供一个简单的例子)。
第二步:通过算法进行分析,找到符合要求的信息,如姓名、性别、年龄、学历、工作经历等。
第三步:将识别出的信息进行本地存储,通过人工纠正错误,将其作为样本提供给机器学习算法进行学习和计算模型。
第四步:使用该模型重新识别简历,不断进行纠错和再次训练,直到准确率接近 100%。

步骤实现:

第一步:识文字,取信息

通过百度 AI 开放平台,识别文字,访问下面的网址,可以跳转到相关文档:

(https://ai.baidu.com/tech/ocr_general)

在这里插入图片描述
代码展示:

using System;
using System.Text;
using System.Web;
using System.IO;
using System.Net;namespace ORCGO
{public class Accurate{// 通用文字识别(高精度含位置版)public static string accurate(){var photoAddress = @"C:\Users\dao\Desktop\简历.png";return PhotoToString(photoAddress);}public static string PhotoToString(string photoAddress){string tokenStr = "此处填写token";string host = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate?access_token=" + tokenStr;Encoding encoding = Encoding.Default;HttpWebRequest request = (HttpWebRequest)WebRequest.Create(host);request.Method = "post";request.KeepAlive = true;// 图片的base64编码string base64 = getFileBase64(photoAddress);String str = "image=" + HttpUtility.UrlEncode(base64);byte[] buffer = encoding.GetBytes(str);request.ContentLength = buffer.Length;request.GetRequestStream().Write(buffer, 0, buffer.Length);HttpWebResponse response = (HttpWebResponse)request.GetResponse();StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.Default);string result = reader.ReadToEnd();Console.WriteLine("通用文字识别(高精度含位置版):");Console.WriteLine(result);return result;}public static String getFileBase64(String fileName){FileStream filestream = new FileStream(fileName, FileMode.Open);byte[] arr = new byte[filestream.Length];filestream.Read(arr, 0, (int)filestream.Length);string baser64 = Convert.ToBase64String(arr);filestream.Close();return baser64;}}
}

调用这个类里面的方法,就可以了 PhotoToString

Program.cs

using System;namespace ORCGO
{class Program{static void Main(string[] args){var photoAddress = @"C:\Users\dao\Desktop\简历.png";Accurate.SBZP(photoAddress);}}
}

我们写一个简历
在这里插入图片描述
获得结果:
在这里插入图片描述
上面就是通过 百度AI 接口识别出来的信息,我们可以感受到准确度还是很高的。

需要源码的,评论区留下邮箱

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/39472.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

实战简历编写,打造硬核敲门砖

实战简历编写,打造硬核敲门砖 1.自我介绍2. 技能描述3.工作经历4.项目经历4.1 商城4.2 进销存 自我评价教育经历 1.自我介绍 简历开篇就是介绍自己,忌长篇大论,那么点时间,相信你自己作为面试官,也不想去看阅读理解 …

1小时学会不打代码制作一个网页精美简历(1)

作者简介 作者名:1_bit 简介:CSDN博客专家,2020年博客之星TOP5,蓝桥签约作者。15-16年曾在网上直播,带领一批程序小白走上程序员之路。欢迎各位小白加我咨询我相关信息,迷茫的你会找到答案。系列教程将会在…

如何写好的前端简历

识别亮点? 亮点应该是那些能让你显得与众不同的经历,比如说: 做过一些深度的性能优化,并且有比较大的性能收益,能量化提升空间的。 做过一些业务逻辑特别复杂、业务影响力特别大的项目。 推进过一些制度、工具&#xf…

前端开发工程师简历

简历是什么 找工作之前投递的个人信息和工作能力----不全面 应该是:个人当前阶段的价值体现 前者:我能卖多少钱;后者:我现在值多少钱 建议:每隔半年/一年给自己做总结的时候写一份简历(相当于个人价值总结…

前端 100 问:能搞懂80%的请把简历给我

更新:目前已达到『1.2W』Star了,谢谢大家的支持,最近折腾了一个博客网站出来,方便大家阅读,后续会有更多内容和更多优化,猛戳这里查看 ------ 以下是正文 ------ 引言 半年时间,几千人参与&a…

前端工程师简历怎么写?

其实前端工程师并不少,但很多时候合适的前端工程师难找。可能是由于程序员比较内向,前端工程师都没有把自己最厉害的那一面表现出来。今天我们来聊聊前端工程师的简历怎么写,希望能够对大家有帮助。 简历的重要性 简历的作用其实一直被忽…

前端简历模板

个人资料 姓名:嘻嘻 性别:女 电话:12132323613 邮箱:12132143285163.com 现居地:上海市 工作年限:3年 求职意向 期望职位:前端开发工程师期望薪资:面议 工作性质:…

如何写简历,Web前端简历

面试官到底想看什么样的简历? 面试一直是程序员跳槽时期非常热门的话题,虽然现在已经过了跳槽的旺季,下一轮跳槽需要年底才会出现,但是当跳槽季的时候你再看这篇文章可能已经晚了,过冬的粮食永远不是冬天准备的,而是秋收的时候。 点个关注,点个收藏,需要的时候就防…

黑马程序员教你如何写出优秀的前端工程师简历

对于一名想找工作的前端开发工程师而言,简历直接关系到面试概率甚至薪资水平,其重要性已不用多说。在HR快速筛选简历的情况下,你的简历要脱颖而出,就得在短时间内将自己的亮点展示给招聘方。具体怎么做?黑马程序员前端…

教你如何写初/高级前端简历

进击的web前端开发 前端企鹅圈:784783012 分享学习方法和需要注意的细节 110 人赞同了该文章 1. 前言 本文仅是针对初高级技术岗位哈。 参与了部门的实习生招聘工作,收到了很多同学的简历。发现有一些同学的简历写得不是很好看。 但是,仔细…

前端程序员简历模板整理和下载

大家好,我是漫步 昨天分享了关于制作简历的一些建议,总的来说有这几个方面要点要记住: 排版工整:不要出现错别字,版面清晰,段落自然,字体适中,简洁工整。 突出重点:突出…

web前端简历个人技能该怎么写?

为一名web前端工程师要想找到一份高薪工作,总会面临各种大大小小的面试。这其中面试成功的关键莫过于一份吸引人的简历。 其实技术类的岗位一般都比较看中工作经历,web前端这个岗位可以说是在公司比较重要的,hr一般在初选简历的时候&#xf…

前端程序员简历制作建议

大家好,我是漫步,今天来分享一下前端程序员简历该怎么写 排版工整 好的简历,万里挑一,HR 每天要看上百份简历,一份排版工整、段落错落有致、文字简洁分明的简历映入眼帘,是不是特别的舒服,有了好…

学了HTML,快来试着做一份简历吧

HTML使用案例——简历 HTML使用案例案例一:展示简历信息案例二:填写简历信息实现步骤拆解 HTML使用案例 之前我们熟悉了HTML的一些基本操作,今天我们就用这些知识来尝试着做一份简历吧~ 案例一:展示简历信息 我们先来看一下完成…

php跑满CPU的问题终于发现原因了

为什么80%的码农都做不了架构师?>>> 之前发现一个问题,就是隔几天,cpu就会被phpcgi的几个进程跑满,频繁启动关闭,以至于我觉得机器被黑了,正在跑什么挖矿的东西。但重启一下nginx之后就好了。所…

深度学习新突破:AI大模型革命引领人工智能未来 —— AI大模型革命带来的思考

目录 深度学习新突破:AI大模型革命引领人工智能未来 —— AI大模型革命带来的思考 概述

【问题记录】postgreSQL使用默认密码导致kdevtmpfsi挖矿病毒注入

起因 postgreSQL我做错了这几件事情 开启了全部IP登陆权限postgreSQL用的是默认用户名和密码用户postgres也没有设置密码,直接用su - postgres就能登陆 不知道是什么原理,反正服务器被侵入,并且注入了病毒文件 1. 基本信息排查 linux服务器…

chatgpt赋能python:Python入侵代码:破坏性与防护

Python入侵代码:破坏性与防护 作为一名有10年Python编程经验的工程师,我深知Python作为一种强大的编程语言所带来的便利与效率,但也正因为如此,Python同样成了地下黑市中最受欢迎的编程语言之一。Python入侵代码借助Python引擎的…

CentOS上PHP源码安装和配置

CentOS上PHP源码安装和配置 此文是在CentOS 7上已经部署了Nginx的基础上进行的 关于CentOS7上安装Nginx,可参考我之前的文章: CentOS上Nginx安装记录 我们现在在这个基础上安装PHP 7。 PHP里面概念挺多的,没想到安装这个PHP需要花那么多时…

服务器遭遇挖矿脚本入侵,歪果仁玩的真花

1、服务器突然卡顿,CPU和内存均占用过高。调查发现一恶意脚本,名为"newinit.sh",翻开一看,歪果仁真会玩。 2、newinit.sh 源文件 #!/bin/sh ulimit -n 65535 chmod 777 /usr/bin/chattr chmod 777 /bin/chattr chattr …