关于XML解析报错问题(LF、CRLF)

报错内容的主要部分:

UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position
123: illegal multibyte sequence

问题产生

在做目标检测时,使用的数据集来自网络,在将xml和图片转换到特定格式时,有些xml文件解析出现了问题。像这样:
在这里插入图片描述
我发现,当我未使用labelImg工具,而直接通过记事本手动修改xml文件时,或者通过脚本批量修改xml文件时就会出现这个问题。

分析问题

以下为两个xml文件,里面的内容基本一样、格式完全相同,仔细观察发现:

可以正常解析的xml文件编码格式是LF
在这里插入图片描述

而不能正常解析的xml文件编码格式是CRLF
在这里插入图片描述

解释以下(参考)

  • CR:Carriage Return,对应ASCII中转义字符\r,表示回车
  • LF:Linefeed,对应ASCII中转义字符\n,表示换行
  • CRLF:Carriage Return & Linefeed,\r\n,表示回车并换行

众所周知,Windows操作系统采用两个字符来进行换行,即CRLF;Unix/Linux/Mac OS X操作系统采用单个字符LF来进行换行;另外,MacIntosh操作系统(即早期的Mac操作系统)采用单个字符CR来进行换行。

解决方法

1 首先我们需要下载一个强大的工具Dos2Unix,下载地址(可能被墙 ) ,百度云(提取码:e8cj)。
在这里插入图片描述
2 配置环境变量,步骤省略。
在这里插入图片描述
3 打开命令窗口,开始批量转换。

在命令窗口输入

for /R 文件路径 %G in (*.c *.cc *.h *.xml) do dos2unix "%G" # *.c *.cc *.h *.xml 表示任意匹配这些后缀名的文件

当出现以下内容,说明转换成功:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/50520.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《扬帆优配》新增21亿订单,海风龙头获多路资金抢筹!

今天仅三个职业获主力资金净流入。 证券时报数据宝计算,今天沪深两市主力资金净流出295.18亿元,其间创业板净流出76.61亿元,沪深300成份股净流出92.15亿元。 申万一级职业中,今天传媒、电子、有色金属等6个职业上涨。25个跌落职业…

通达海深交所上市:市值51亿 2022年净利降8%

雷递网 雷建平 3月20日 南京通达海科技股份有限公司(简称:“通达海”,证券代码:301378)今日在深交所创业板上市。 通达海本次发行1150万股,发行价为95元,募集资金10.93亿元。 通达海开盘价为110…

通达海:一直推进人工智能在法院具体业务场景应用方面的研究

导读:通达海近期接受投资者调研时称,公司也一直在推进人工智能在法院具体业务场景应用方面的研究,包括立案风险预警、要素信息抓… 通达海近期接受投资者调研时称,公司也一直在推进人工智能在法院具体业务场景应用方面的研究&…

马斯克“翻车”现场:“甩”不掉的推特

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 自上周五宣布终止对推特的收购以来,马斯克再次成为科技网站的首页“常驻嘉宾”。 面对马斯克意欲违约并想把责任推得干干净净后,推特显然也不是“吃素的”:仍将致力…

用nltk模仿海子写中文现代诗

文章目录 前言开始编程寻找素材处理语料一些类似的步骤 运行结果 前言 仅仅写英文诗还不够,我们又把主意打到了中文诗头上。不过要写古体诗还有一些困难,我们先尝试一下现代诗。 写中文现代诗的代码与英文诗类似,区别主要在语料的处理上&am…

OpenAI的ChatGPT、微软的New Bing、百度的文心一言、Google的Bard、阿里云的通义千问

随着 ChatGPT 热潮卷起来,微软发布New Bing、百度发布了文心一言、Google 发布了 Bard,阿里云官方终于也宣布了,旗下的 AI 大模型“通义千问”也正式开启测试! ChatGPT ChatGPT是一种由OpenAI训练的大型语言模型。它的原理是基于…

ControlNet仅靠一张照片完成“旧房改造” | GitHub热榜第一

Alex 发自 凹非寺量子位 | 公众号 QbitAI 这是同一个房间改装前后的样子: 一下子质感Up,从凌乱过时变成了有腔有调的现代风。 至于设计费嘛,其实是…一分钱都没花! 因为这并不是专业设计师做的方案,而全靠一只AI完成。…

chatgpt赋能python:Python怎么抢优惠券?优惠不再是梦想!

Python怎么抢优惠券?优惠不再是梦想! 在如今的消费社会,优惠券已成为人们购物时追逐的目标。而优惠券的数量有限且抢手,往往仅能在短时间内领取,因此初次抢到心仪的优惠券可谓令人欣喜不已。而对于程序员们而言&#…

第十八届全国大学生智能汽车竞赛-竞速比赛完全模型组规则

01 完全模型组 一、比赛构成 百度完全模型竞速赛分为线上资格赛、线下分区赛和全国总决赛三个阶段,组委会将综合考虑线上资格赛和线下分区赛成绩来进行全国总决赛名额的选拔,其中线上成绩占10%,线下成绩占90%。组委会将从报名参加线上资格赛的…

国赛来咯!第十八届全国大学生智能汽车竞赛百度竞速赛正式开启

「第十八届全国大学生智能汽车竞赛—百度完全模型组竞速赛」将于1月7日(本周六19:00)全面启航!大赛组委会秘书长、清华大学卓晴教授届时将亲临百度飞桨B站直播间,和同学们一起聊备赛,话今年。 竞赛介绍 「全国大学生智…

【智能汽车竞赛】极速越野组参赛总结

目录 第一章 引 言 第二章 机械结构的调整与优化 2.1 主板和驱动板板的固定及连接 2.2 模型车机械部分安装及改造 2.2.1 优化车身强度 2.2.2 前轮定位 2.3 传感器的设计安装 2.3.1 ICM-20602 安装 2.3.2 gps 传感器的安装 第三章:硬件电路设计 3.1 主控板模块 3.…

史上最强模型 GPT-4 上线:一张手绘草图能生一个网站、60 秒搞定一个游戏开发!...

整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 平地一声雷,GPT-4 重磅来袭。 3 月 14 日,OpenAI 正式上线新一代人工智能大模型 GPT-4,它是一个大型多模态模型,可以接受图像和文本输入,同时…

【12亿】微信月活11.12亿,抖音年赚200亿?中国最受欢迎五大社交平台

在互联网行业,社交一直都是巨头们的兵家必争之地。从QQ到微信,从微博到抖音,新的社交平台在不断出现和崛起,用户也从90后延伸到了00后,而社交时代的风云变幻,也映射了互联网发展趋势以及网友社交方式的变化…

让OpenAI GPT3替我写数据竞赛代码!

★★★ 本文源自AlStudio社区精品项目,【点击此处】查看更多精品内容 >>> 让OpenAI GPT3替我写数据竞赛代码! OpenAI与ChatGPT OpenAI是在美国成立的人工智能研究公司,核心宗旨在于实现安全的通用人工智能(AGI)。他们开发的ChatGP…

Github Copilot Chat申请,安装,及常见问题解决

文章目录 实际使用效果:申请使用常见问题 参考 Copilot Chat 是Copilot X 引入的预览功能,不但可以像Chatgpt一样聊天,也可以解释代码,bug 修复,也可以生成单元测试。是一个非常有吸引力的功能。 实际使用效果&#xf…

Android 科大讯飞 语音转文字

Android 科大讯飞 语音转文字 语音听写SDK适配安卓6.0需要手动申请权限,各位可以自信查询资料实现,关于语音听写SDK的开发,参考科大讯飞开放平台官网为准 第一,首先去科大讯飞官网注册一个账号:https://console.xfyun.cn/app/myap…

讯飞离线语音合成接入

讯飞离线语音合成接入: 文字转语音的方法 1.Google TextToSpeech 中文语音引擎 Google提供了原生的方法TextToSpeech,但是不支持中文,sad… 不过可以用第三方的语音引擎,eg,讯飞,百度… 详情参考&…

如何高效Prompt?

优先声明,本文来自转载,来源为稀土掘金的腾讯云开发者 的个人主页 - 动态 - 掘金 本文原文来自我问了鹅厂程序员:你们工作中怎么用ChatGPT?如何高效Prompt? - 掘金 如有侵权冒犯,联系立删。 &#x1f44…

解决Mac电脑连接校园网不弹出登陆窗口问题汇总

1.查看你的DNS有没有改过,把自己改过的DNS全部删除,变更为默认的就好。 2.有使用梯子的同学,记得把梯子暂时先关闭一下,然后在连接校园网Wi-Fi。 3.你有登录页面的网址吗?没有的话,让同学复制给你&#xf…

python毕业设计 基于django框架校园鲜花水果商城毕业设计设计与实现

商城功能概要 首页、分类、商品详情页面,包含加入购物车、收藏商品、立即购买、用户登录、订单管理、地址管理;完整的购物流程,商品的加入、编辑、删除、批量选择,收货地址的选择,下单、会员中心(订单、收…