01 问题描述
打开文件发现如下图等情况:
02 问题分析
2.1 普及一下编码格式的含义
列出五种常见的
-
ASCII编码:用来表示英文,它使用1个字节表示,其中第一位规定为0,其他7位存储数据,一共可以表示128个字符。
-
拓展ASCII编码:用于表示更多的欧洲文字,用8个位存储数据,一共可以表示256个字
-
GBK/GB2312/GB18030:表示汉字。GBK/GB2312表示简体中文,GB18030表示繁体中文。
-
Unicode编码:包含世界上所有的字符,是一个字符集。
-
**UTF-8:**是Unicode字符的实现方式之一,它使用1-4个字符表示一个符号,根据不同的符号而变化字节长度。
更多细节可跳转:字符编码笔记:ASCII,Unicode 和 UTF-8
2.2 编码格式需统一
举一个例子:如果刚好符合UTF-8的编码格式,所以就当做UTF-8存储了,但重新将字节转换为字符串的时候,是以ANSI格式转换的,肯定是乱码。
03 问题解决
以我自己的问题为例
3.1 VScode设置编码格式
- 目的是确保生成的
.sys
等文件编码格式是自己想要的
3.2 Notepad++设置编码格式
- 目的是打开的
.sys
等文件通过自己规定的编码格式进行解码
3.3 电脑自带的笔记本(常用)
- 想不到叭!小小笔记本也可以设置编码格式!
先是直接打开笔记本,另存为,设置编码格式