微信PC端各个数据库文件结构与功能简述 - 根目录

异想之旅:本人原创博客完全手敲,绝对非搬运,全网不可能有重复;本人无团队,仅为技术爱好者进行分享,所有内容不牵扯广告。本人所有文章仅在CSDN、掘金和个人博客(一定是异想之旅域名)发布,除此之外全部是盗文!


本文件针对 .../WeChat Files/wxid_xxxxxxxx/Msg下的各个文件解密后的内容进行概述。

未作特别说明的情况下,“聊天记录数据”指代的数据结构上都和Multi文件夹中的完整聊天记录数据相同或类似。

本文默认你已经获取并且解密了 SQLite 文件,关于这一步的具体方法,详见:微信PC端数据库文件解密_异想之旅的博客-CSDN博客

关于 Multi 文件夹内的数据库详见:微信PC端各个数据库文件结构与功能简述 - Multi文件夹_异想之旅的博客-CSDN博客

微信小程序相关

Applet

微信小程序的相关数据,包括但不限于:

  • 你使用过的小程序RecentWxApp
  • 星标的小程序StarWxApp
  • 各个小程序的基本信息WAContact

意义不大。

企业微信相关

BizChat

企业微信联系人数据,包括但不限于:

  • 在微信中可以访问的企业微信会话ChatInfo
  • 一部分会话的信息ChatSession(未确认与ChatInfo的关系;这其中的Content字段是最近一条消息,疑似用于缓存展示的内容)
  • 包括群聊在内的聊天涉及的所有企业微信用户身份信息UsrInfo
  • 该微信账号绑定的企业微信身份MyUsrInfo

特别说明的是,我目前还没有详细查证,这其中的聊天是否包含使用普通微信身份与企业微信用户发起的聊天,还是只包含使用绑定到普通微信的企业微信身份与其它企业微信身份发起的聊天。

BizChatMsg

企业微信聊天记录数据,包括所有和企业微信。

BizChat一样,我还没有确定涉及的范围究竟是只有企业微信-企业微信还是同时包含普通微信-企业微信。

另外,此处的消息与Multi文件夹中真正的微信消息不同的是在于没有拆分数据库。

OpenIM 前缀

这个也是企业微信的数据,包括联系人、企业信息、与企业微信联系人的消息等。

简单看了一下,觉得应该这个是普通微信-企业微信的数据,上面biz前缀的是企业微信-企业微信

这个不常用,而且也没有全新的数据结构,不再详细说了。

PublicMsg

看起来像是企业微信的通知消息,你也可以理解为企业微信的企业应用消息

微信功能相关

Emotion

顾名思义表情包相关,包括但不限于以下内容:

  • CustomEmotion:顾名思义用户手动上传的GIF表情,包含下载链接,不过看起来似乎有加密(内有aesKey字段但我没测试)
  • EmotionDes1 和 EmotionItem 应该也是类似的内容,没仔细研究
  • EmotionPackageItem:账号添加的表情包的集合列表(从商店下载的那种)

顺便吐槽一句,微信这些地方居然使用 http 而非 https

Favorite

顾名思义收藏的内容相关,包括但不限于:

  • FavItems:收藏的消息条目列表
  • FavDataItem:收藏的具体数据。没有自习去看他的存储逻辑,不过大概可以确定以下两点
    • 即使只是简单收藏一篇公众号文章也会在 FavDataItem 中有一个对应的记录
    • 对于收藏的合并转发类型的消息,合并转发中的每一条消息在 FavDataItem 中都是一个独立的记录
  • FavTags:为收藏内容添加的标签

Misc

BizContactHeadImgContactHeadImg1两张表,应该是二进制格式的各个头像

Sns

微信朋友圈的相关数据:

  • FeedsV20:朋友圈的XML数据
  • CommentV20:朋友圈点赞或评论记录
  • NotificationV7:朋友圈通知
  • SnsConfigV20:一些配置信息,能读懂的是其中有你的朋友圈背景图
  • SnsGroupInfoV5:猜测是旧版微信朋友圈可见范围的可见或不可见名单

FTS(搜索)

问了问 ChatGPT 并经过一点简单的尝试,我暂且认定前缀为 FTS 的数据库可能都和全文搜索(Full-Text Search)相关。

FTSContact

有一堆表,我能读懂的有 FTSChatroom15_contentFTSContact15_content 两个,分别对应的是微信“聊天”界面会展示的消息会话(包括公众号等)和“联系人”界面会出现的所有人(有的时候并不是所有联系人都会出现在“聊天”中),信息包含昵称、备注名和微信号,也和微信支持搜索的字段相匹配。

FTSFavorite

搜索收藏内容的索引,还是只能看懂 FavData1_content,不过那些看不懂的表也是和上面 FTSContact 存在的表命名方式一样。

还发现有意思的一点:对于收藏内容通过文字搜索,电脑版是把所有东西拼接成一个超长字符串来实现的。这对于文本、链接等没啥问题,但是对于合并转发消息,就会出现搜索 [图片] 这一关键词可以生效的奇怪事情。

FTSMsg

按照名字,这应该是用来搜索聊天记录的。然而显然他不可能把所有的聊天记录索引,打开之后FTSChatMsg2_content表中也只有几百条数据,暂且认为这个也没用吧。

MultiSearchChatMsg

这个数据库前缀不一样,但是看内容和结构应该还是一个搜索相关,搜索的是聊天记录中的文件,这里存储了文件名和其所在的聊天。不过FTSMsgSearch18_contentSessionAttachInfo两张表记录数量有显著差异,不确定是哪个少了或是怎样。

HardLink(文件在磁盘存储的位置)

将文件/图片/视频的文件名指向保存它们的文件夹名称(例如2023-04),有用但不多。

MicroMsg(核心之一)

严格来说这只是一个数据库,不应该和分类平级,但是我认为这是分析到目前以来最核心的,因此单独来说了。

AppInfo

一些软件的介绍,猜测可能是关于某些直接从手机APP跳转到微信的转发会带有的转发来源小尾巴的信息

Biz 前缀

与公众号相关的内容,应该主要是账号本身相关。

能确定的是 BizSessionNewFeeds 这张表保存的是订阅号大分类底下的会话信息,包括头像、最近一条推送等。

ChatInfo

保存“聊天”列表中每个会话最后一次标记已读的时间

ChatRoom 和 ChatRoomInfo

存储群聊相关信息

  • ChatRoom:存储每个群聊的用户列表(包括微信号列表和群昵称列表)和个人群昵称等信息
  • ChatRoomInfo:群聊相关信息,主要是群公告内容,与成员无关

顺便再吐槽一下,微信这个位置有一个命名出现异常的,别的表前缀都是ChatRoom,而突然出现一个ChatroomTool

Contact

顾名思义,联系人。不过这里的联系人并不是指你的好友,而是所有你可能看见的人,除好友外还有所有群聊中的所有陌生人。

  • Contact:这张表存储的是用户基本信息,包括但不限于微信号(没有好友的陌生人也能看!)、昵称、备注名、设置的标签等等,甚至还有生成的各种字段的拼音,可能是用于方便搜索的吧
  • ContactHeadImgUrl:头像地址
  • ContactLabel:好友标签 ID 与名称对照

PatInfo

存了一部分好友的拍一拍后缀,但是只有几个,我记得我电脑上显示过的拍一拍似乎没有这么少?

Session

真正的“聊天”栏目显示的会话列表,一个不多一个不少,包括“折叠的群聊”这样子的特殊会话;信息包括名称、未读消息数、最近一条消息等

TicketInfo

这张表在我这里有百余条数据,但是我实在没搞明白它是什么

未能确定分类或内容的

ChatMsg

该数据库包含多个表,然而大多数都是空白的。有明确内容的表主要包括以下:

  • ChatCRMsg:一部分聊天记录数据,没看明白究竟是符合什么条件的消息包含在里面
  • DelSessionInfo:被删除的好友列表(猜测可能聊天记录仍保留在本地?)
  • Name2ID_v1:ChatCRMsg的辅助数据表

补充:有评论区大佬指路如下,本人没有那段时间的数据无法验证,具体请自行判断

在这里插入图片描述

ClientConfig

根据名字猜测是客户端配置信息,然而其内部只有ConfigMmExptAppItem两张表且内容都很短(小于10行),无法确定其实际作用。

CustomerService

本人打开时这里面没有任何有效数据,表包括ChatCRMsg Name2ID Session TransCRTable四张,猜测可能是微信小程序等的客服聊天相关内容。

FunctionMsg

在我这里这个东西两张表只有一行有效数据,根据名称猜测这是公众号或小程序创建的一些奇怪聊天。

SyncMsg

其中有一个名为UnSupportedMsg的表,猜测内容是电脑端不支持的消息(例如微信红包等等),记录在这里以保证本地数据完整

未能分析出任何有效信息的

ImageTranslate

只有一张表ImageTranslateCache,在我这里其内部没有任何数据

LinkHistory

只有一张表LinkHistory,在我这里其内部没有任何数据

Media

只有两张表ChatCRVoiceMediaInfo,在我这里其内部没有任何数据

评论区有大佬说这是 ChatMsg 的语音信息

PreDownload

Voip

应该是海外微信的 Voip 通话功能,和我们没关系

xInfo

该数据库文件没有加密,可直接读取。

该文件主要字段为二进制字符串,无法分析。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22568.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

springboot+vue集成websocket实现聊天功能

1、添加pom依赖 <!-- websocket --> <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-websocket</artifactId> </dependency> 2、创建一个config文件夹&#xff0c;在config文件夹中创建…

广州租房房价分析

利用八爪鱼爬链家网上广州市租房房源数据&#xff0c;网址为https://gz.lianjia.com/zufang/&#xff0c;爬取字段为价格、租赁方式、房型、楼层、面积、朝向、地铁、小区、位置、经度、纬度等&#xff0c;保存到E盘数据分析课程设计文件夹下&#xff0c;存为“gz_zufang.csv”…

房价数据分析

文章目录 一、数据预处理1、删除多余列2、缺失值、异常值处理 二、 数据探索分析1、DistanceKM与房价关系2、14岁及以下比重与房价关系3、自驾实际值与房价关系4、65岁及以上比重与房价关系5、人口占比与房价关系 三、机器学习预测房价1、模型选择2、模型调参 四、总结 一、数据…

北京二手房房价分析(建模篇)

数据科学俱乐部 中国数据科学家社区 本篇将继续上一篇数据分析用Python分析北京二手房房价之后进行数据挖掘建模预测&#xff0c;这两部分构成了一个简单的完整项目。结合两篇文章通过数据分析和挖掘的方法可以达到二手房屋价格预测的效果。 下面从特征工程开始讲述。 特征工程…

我国主要城市2023年房价数据

房价是一个城市发展程度的重要体现&#xff0c;一个城市的房价越高通常代表这个城市越发达&#xff0c;对于人口的吸引力越大&#xff01;因此&#xff0c;房价数据是我们在各项城市研究中都非常常用的数据&#xff01; 本次我们为大家带来的是我国主要城市的房价数据&#xf…

分析天津市房价的空间因素影响

所有代码与解析 # -*- coding: utf-8 -*- """ Created on Thu Mar 4 16:23:30 2021author: 89344 """import numpy as np import pandas as pd import matplotlib.pyplot as plt import warnings warnings.filterwarnings(ignore) from bokeh.…

Python爬取天津房价并进行可视化

Python爬取天津房价并进行可视化 步骤代码 步骤 1.爬取网页信息 2.解析网页信息&#xff0c;获取需要的数据&#xff0c;存入CSV文件中 3.读取CSV文件&#xff0c;对数据进行处理&#xff0c;包括剔除异常值&#xff0c;空值等&#xff0c;进行可视化 代码 import requests …

房价概况:2013年2月26日天津各区县房价一览

2013年2月26日全市新建商品房交易373套、面积37502.8平方米&#xff0c;平均价格每平方米10504元。其中&#xff0c;住宅335套、面积34159.8平方米&#xff0c;平均价格每平方米9844元。二手住宅交易275套、面积22696.8平方米&#xff0c;平均价格每平方米8579元。

Spring实战----Taco Cloud(墨西哥煎玉米卷在线订购系统)

记录一下根据《Spring实战&#xff08;第五版&#xff09;》(人民邮电出版社)所学习的过程 目录 项目初始化 开发WEB应用 使用数据库 使用Spring Data JPA进行持久化数据 使用Spring Security保护Spring 自定义用户验证 项目初始化 New一个Project&#xff0c;选择Sprin…

C/C++字符串

一.C风格的字符串 1. char a[6] { h,e,l,l,o,\0 }; printf("%s", a);//hello#include<iostream> #include<string> using namespace std; int main() {char a[6] { h,e,l,l,o,\0 };char b[5] { h,e,l,l,o};//空间至少大一位留出\0位置char c[6] { h,e…

Qt输入窗口部件编程(一) QComboBox和QFontComboBox

文章目录 前言1、 Qt常用的输入窗口控件2、QFontComboBox 和 QComboBox控件编程2.1 控件简介2.1.1 QComboBox组合框2.1.2 QFontComboBox字体组合框 2.2 例程功能设计2.3 例程执行效果2.4 生成项目2.5 代码编辑2.5.1 修改项目文件_qcombobox.pro2.5.2 修改 main.cpp2.5.3 修改 w…

Xmind8 乱码问题解决(查看文件字体并下载安装相应字体)

每台电脑引起Xmind软件出现乱码的原因也不一样&#xff0c;本文仅适用于解决字体缺少或者字体版本不对而引发的乱码问题。每台电脑缺少的字体包也不一样&#xff0c;要通过“工具”-》“提取样式”菜单&#xff0c;具体分析自己的Xmind文件需要什么字体&#xff0c;然后搜索对应…

idea主题 插件 乱码 快捷键

idea样式网站 http://www.easycolor.cc/ http://www.riaway.com/ idea 乱码情况 中文乱码问题分类&#xff1a; 1.编码普通中文乱码 2.properties文件中文乱码 3.console控制台中文乱码 4.搜索框中文乱码 5.svn注释中文乱码 解决方法&#xff1a; 1、编码普通中文乱码 ①s…

基于声学模型共享的零资源韩语识别系统

声学模型共享方法是极低资源小语种语音识别一种解决方案&#xff0c;能够实现不需要任何语音数据的语音识别。本文介绍清华大学语音与音频技术实验室的零资源韩语语音系统&#xff0c;其在不使用任何韩语语音数据的情况下&#xff0c;在Zeroth韩语数据集上的测试CER达到了27.33…

韩语在线翻译图片识别_图片怎么转表格excel

图片转表格excel&#xff0c;快来免费用 ↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓ 相信大部分小伙伴选择拍图识字 是因为强大的ocr识别功能 图片文字一键提取导出 但是&#xff0c;有多少人知道 拍图识字还可以成为你的私人翻译&#xff01;1 多语言转换 拍图识字首页点击拍照/…

韩译中难吗,如何做好韩语翻译

我们知道&#xff0c;韩语是韩国的官方语言&#xff0c;由于长期和中国文化的接触&#xff0c;历史上曾用汉字标记&#xff0c;并且将汉语融入其词汇&#xff0c;基于这一特点&#xff0c;韩译中难吗&#xff0c;如何做好韩语翻译? 据了解&#xff0c;中韩文化交流的历史可以追…

韩语在线翻译图片识别_3个OCR文字识别工具,最后一个许多人都不知道!

在日常生活和工作中,经常有需要录入一张图片或实物内容的文字信息的时候,对于少量内容,你或许可以轻松完成。可是一旦内容多,而你打字速度又不快的情况下,那可真的是一件非常枯燥又费力的事情。 而一般遇到这种情况,大家就可以利用OCR文字识别工具,只需简单对着物体拍张…

韩语在线翻译图片识别_如何用扫描全能王将图片转成文字?

扫描君有个写材料的朋友&#xff0c;每次需要摘录书或宣传册里的内容&#xff0c;他总是一个字一个字地敲&#xff0c;效率不高&#xff0c;还容易出错&#xff0c;自己也很痛苦&#xff01;&#xff01; 扫描君也有这样的亲身体会&#xff1a; 在微博、朋友圈里看到一些图片或…

韩语翻译拍照怎么弄?分享几款拍照翻译软件

拍照翻译软件是一种基于人工智能技术开发的翻译工具&#xff0c;它可以通过拍照识别文字&#xff0c;然后将文字翻译成大家选择的语言。这种翻译方式比传统的输入文字翻译更加方便快捷&#xff0c;无需手动输入文字&#xff0c;提高了翻译的效率、准确性&#xff0c;也提供更好…

yandex的“Search queries” report(搜索查询报告)

上一篇提到了我们查询访客关键词的入口&#xff0c;需要从“搜索查询”报告中点击进入&#xff0c;那么我们好好的来了解一下其中数据的具体含义吧~ 首先&#xff1a;该报告包含来自投放您的广告的搜索平台的用户查询&#xff0c;包括与您的关键字在语义上匹配的搜索查询。这句…