图解《狂飙》人物关系

《狂飙》作为今年的开年大戏,一经播出就受到了大家的广泛关注,成为了全民热议的现象级剧集。作为一部扫黑剧,剧中的黑白两派的人物关系可谓错综复杂,不少小伙伴初看时经常搞不清楚出场人物的关系,看得一头雾水。那本期我们就用知识图谱的方式来探清狂飙中的人物关系。

一、知识图谱简介

知识图谱是以结构化的形式将节点通过关系相互连接起来,构成一张知识网络图。它可以把真实世界的各个场景抽象成图形,将信息表达成一种关系网络图。

举个例子,下图就是一个简单的图,节点(node)用红色标出,通过黑色的边(edge)连接。节点可以表示实体和属性,边可以表示为实体-实体和实体-属性之间的关系,这种形式对处理复杂的关联关系有着天然的优势,也更接近人类认知世界的形式,为数据处理提供了一种更好的组织和管理能力。

通常来说知识图谱的生命周期分为:构建、存储管理以及应用。下面我们用知识图谱一体化解决平台系统(简称KGS)逐一为大家演示介绍。

二、构建《狂飙》人物图谱

如何利用现有的数据构建知识图谱一直是知识图谱领域的一个难题。KGS知识图谱自动化构建平台(即原gBuilder工具)是通过结合NLP技术、机器学习、人工智能、知识图谱、图数据库等众多技术,打造的一个知识图谱自动化构建平台。我们可以利用知识图谱自动化构建平台将结构化数据通过D2RQ技术进行映射,无损转化成知识图谱。也可以通过编写数据抽取程序、抽取模型等方式对半结构化和非结构化的数据进行抽取。

此外,我们还提供了表单录入的方式,用户可通过填写表单便捷快速地构建知识图谱。首先,平台会根据schema自动生成每种实体类型的表单;然后,用户直接在页面上即可新增实体,通过填写表单的方式,录入实体属性及关系,最后生成RDF数据。

本次我们收集了互联网上有关狂飙剧中人物的信息,根据主要的人物信息,以人物、组织、事件为主要的实体类型,梳理了人物、组织、事件之间的关系,在KGS的知识图谱自动化构建平台中用拖拽连接等可视化的方式构建了狂飙人物关系schema。然后结合KGS的知识图谱自动化构建平台的非结构化数据抽取和表单录入两种方式,最终得到了狂飙人物关系的RDF文件(文件下载地址:http://file.gstore.cn/f/7cf1561d593745a8bebb/?dl=1)。

文件数据如下:

<王力> <属于> <组织/#政府相关>.
<安欣> <属于> <组织/#政府相关>.
<施伟> <徒弟> <安欣>.
<施伟> <属于> <组织/#政府相关>.
<姜超> <徒弟> <安欣>.
<姜超> <属于> <组织/#政府相关>.
<陆寒> <徒弟> <安欣>.
<陆寒> <属于> <组织/#政府相关>.
<小五> <下级> <安欣>.
<小五> <属于> <组织/#政府相关>.
<杨健> <属于> <组织/#政府相关>.
.......

RDF文件是构建知识图谱的基础,有了RDF文件之后,大家就可以构建知识图谱了。在实际项目中,也可以根据不同类型的数据选择不同的抽取方式,或多种方式结合的形式来构建知识图谱。

三、存储管理

在KGS中我们可以将生成的RDF数据无缝导入KGS存储与管理子模块(即原gStore)中进行存储与管理。

KGS存储与管理子模块是北京大学邹磊教授团队经过十年潜心研发的国产自主可控原生基于图数据模型的图数据库系统,支持数据库的增删改查、导入、导出、备份、还原、事务ACID等功能;支持横向动态扩展解决存储容量限制;在查询速度方面通过底层的源头创新可在百亿规模的数据集且包含六跳查询情况下做到秒级响应。KGS存储与管理子模块的开源地址为:https://github.com/pkumod/gStore欢迎大家下载试用。

四、图谱的应用

接下来我们就可以对狂飙的人物关系用图的方式进行探索啦。

1、整体人物关系图

我们在KGS图谱可视化模块中输入SPARQL查询语句对整体的人物关系进行查询。查询语句:

SELECT *
WHERE {?a ?b ?c .
}

查询结果:

2、实体探索

KGS图谱可视化模块可对实体类型等进行统计和展示。比如,我们点击实体类型为“组织”的实体,查询结果将隐藏其他类型的节点,我们可一目了然的看出剧中涉及的几大组织以及它们之间的关系。

点击单个实体,即可查看与之关联的其他实体。比如我们想查看政府单位有哪些关联节点,点击政府相关即可得到结果:

同样可以查看人物类型的关联节点。显示结果如下:

3、犯罪链溯源

KGS图谱可视化模块还支持最短路径、环路查询、K跳可达等高级查询功能,直接在页面进行输入节点名称即查询相关关系。

比如,我们想查剧中李宏伟贩卖的毒品的货源到底出自何处。我们可以以李宏伟为起点,查询他K跳以内的以拿货为关系的节点,K的取值可以根据情况调整,直至找到提供毒品的最终节点。查询结果如下,一条毒品链就这样在错综复杂的人物关系当中被找出。

在实际应用中,我们还可以通过对调查对象的同校、同宿、同程等多种关系的多跳查询来辅助公安进行案件侦查。在金融领域,也可以通过多跳查询来进行多层股权查询、资本系分析,目前KGS在金融行业的应用中已实现43跳查询。

4、线索分析

知识图谱还具有推理能力。比如在高晓晨的绑架案件中,绑架者李青当场被击毙,如何快速分析其作案动机呢?知识图谱可以从大量的人员、案件等数据中深度挖掘关联关系,支撑公安机关挖掘线索、快速侦破案件。

在上面例子中,我们可以利用KGS中的高级查询——K跳路径查询,就是找到两个节点k-hop以内的路径,用于挖掘两点的之间的关系。输入“高晓晨”和“李青”,查询他们之间的5跳连接路径,结果如下:

根据查询结果,推测李青可能是因为其父亲的死报复绑架。我们进一步查询K跳所有路径,查询“高晓晨”和“李青”之间其他的多跳路径,结果如下:

查询结果中显示,本次绑架事件当中的关联人物都属于莽村和强盛集团这两个组织,且这两个组织之间还存在多件犯罪事件,可以分析出莽村和强盛集团之间可能存在矛盾关系,那么可以进一步调查两个组织之间是否有利益纠葛。

知识图谱从大数据中深度挖掘关联关系,可实时分析多至千亿级海量关系数据,转化为关系图谱数据,支撑公安机关展开情报研判分析、犯罪团伙跟踪以及重大事情预警等。

5、图分析

除了查询功能,KGS还支持Personalized PageRank、紧密中心度、三角形计数等图分析功能。

  • Personalized PageRank

Personalized PageRank是KGS的自定义函数,可用于计算实体间的相关度。例如要查询与高启强相关度最高的五人,输入以下SPARQL查询语句:

SELECT (PPR(<人物/#高启强>, -1, {}, 5) as ?y) WHERE {}

查询结果如下(为方便阅读,省略了字符串最外层的双引号和内部双引号转义):

{"paths":[{"src":"<人物/#高启强>","results":[{"dst":"<人物/#高启强>","PPR":0.41004},{"dst":"<人物/#陈书婷>","PPR":0.0383974},{"dst":"<人物/#谭思言>","PPR":0.034593},{"dst":"<人物/#高晓晨>","PPR":0.0341354},{"dst":"<人物#黄老>","PPR":0.0335114},]}]
}
  • 紧密中心度

紧密中心度分析用于分析某节点到达其他节点的难易程度,节点的紧密中心度越大,其在所在图中的位置越靠近中心。我们查询人物关系图中每一个节点的紧密中心度,将结果从高到低进行排序,结果如下(仅显示排序前五的节点):

{ "paths": [{ "src": "<人物/#高启强>","result": 0.569343},{"src": "<人物/#安欣>","result": 0.553191},{"src": "<人物/#赵立冬>","result": 0.527027},{ "src": "<人物/#陈金默>","result": 0.516556},{ "src": "<人物/#高晓晨>","result": 0.506494}]
}

我们可以看出高启强、安欣、赵立冬等人是整个人物关系网络的中心人物,那么扫黑指导组就可以从这几个关键人物入手,开展扫黑行动。

知识图谱的图分析功能已经在检测电商虚假交易、电信诈骗、侦查传销组织等多方面发挥重要作用。

我们已经将《狂飙》、《人民的名义》、西方哲学等相关数据集分享至KGS云平台(http://cloud.gstore.cn/),欢迎大家登录云平台探索更多知识图谱的应用。

内容来源:电视剧《狂飙》

文字:代雪佩

UI:唐莹婷、荣悦斯

免责声明:本文封面及插图来源于网络开放信息,如有侵权,请联系删除

欢迎关注北京大学王选计算机研究所数据管理实验室微信公众号“图谱学苑“
实验室官网:https://mod.wict.pku.edu.cn/
微信社区群:请回复“社区”获取

实验室开源产品图数据库gStore:
gStore官网:http://www.gstore.cn/
GitHub:https://github.com/pkumod/gStore
Gitee:https://gitee.com/PKUMOD/gStore

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/58413.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[小森数据结构]看电影-顺序表技术精讲

故事前研(言) 小森去看电影<<流浪地球2>>的时候买电影票的场景. 突然一个叫高启强的人买电影票 拉了两个Hei友,来看电影 <<流浪地球2>> 当场就害怕极了&#xff0c;我也知道他想干什么&#xff0c;于是乎就让他到我这里&#xff0c;“高启强”:你小…

【分享贴】项目中为啥总是项目经理一人干着急?

看完了《狂飙》才发现&#xff0c;高启强才是咱项目经理的模范。前段时间身边同事都疯狂安利这部电视剧&#xff0c;但我哪有空余时间刷剧&#xff0c;直到最近才断断续续的追完。这才发现“高启强”这个人物身上有很多闪光点&#xff0c;值得学习借鉴。 他能从一个鱼贩逆袭成…

手捏Java知识点

今天开始面向对象了 面向对象基础 类&#xff1a;由属性和行为组成属性&#xff1a;在类中通过成员变量来体现行为&#xff1a;在类中通过成员方法来体现public class 类名{//成员变量变量1的数据类型 变量1;变量2的数据类型 变量2;...//成员方法方法1;方法2;...}有几个重要的概…

如何优雅地修改同事的代码

前言 互联网开发多以团队协同的方式为主&#xff0c;在实际的开发过程中&#xff0c;我们经常会面对在同事的代码的基础上重新开发的需求。然而由于人员的迭代、需求的变更、文档的缺失等原因&#xff0c;我们贸然修改同事的代码往往需要承担一些额外的开发风险&#xff0c;比如…

Java8 map.getOrDefault()你真的了解吗

大家好&#xff0c;我是三叔&#xff0c;很高兴这期又和大家见面了&#xff0c;一个奋斗在互联网的打工人。 map.getOrDefault()方法 在Java编程中&#xff0c;Map是一种非常常用的数据结构。Map通常用于存储键值对&#xff0c;其中每个键映射到一个值。当我们尝试访问一个不…

同是打工人,学Python搞副业的朋友跟高启强一样实现逆袭了?

年过完了&#xff0c;现在已经回归工作岗位&#xff0c;接着拧自己的螺丝钉&#xff0c;不过&#xff0c;假期也不算寂寞&#xff0c;追了大热的电视剧《狂飙》。卖鱼小贩高启强的逆袭让我这种打工人太羡慕了&#xff0c;当他坐在白金瀚的办公室里美滋滋的喝着红酒的时候&#…

张杰清唱高启强专属BGM简直就是天作之合,千万别点进来看

张杰清唱高启强专属BGM简直就是天作之合&#xff0c;千万别点进来看&#xff0c;#张杰#BGM#音乐 张杰演唱的《听》狂飙高启强自从出现在抖音上更是火得不可思议&#xff0c;它成为了不少年轻人喜爱的BGM&#xff0c;尤其是用它作为专属BGM的抖音视频更是受到网友的一致好评。 …

老默我想吃鱼了(抽象艺术)

目录 指针地位 代码示例 人物关系 代码分析 总结 指针地位 在C语言中 指针的地位可以说是王中王 代码示例 如下 #define _CRT_SECURE_NO_WARNINGS 1#include<stdio.h>int main() {int a 15;printf("老默出手前鱼的值:%d\n", a);int* pa &a;*pa 30;p…

冯雷老师:为什么大嫂陈书婷让高启强终生难忘?

高启强对大嫂陈书婷的感情非常深&#xff0c;大嫂死后高启强终生未娶&#xff0c;那为什么大嫂陈书婷让高启强终生难忘呢&#xff1f; 第一、既能助力男人&#xff0c;又识大体懂分寸。在帮助高启强拜泰叔当干爹后&#xff0c;就回归家庭当一个贤妻良母。从不插手老公的生意。…

学术汇报(academic presentation)/PPT应该怎么做?

已经上了研究生两年了&#xff0c;但是一直没有规范过PPT应该怎么做&#xff1f;都是瞎做的&#xff0c;也没有注意过排版什么的&#xff0c;前一段时间被老师批评后&#xff0c;才开始想怎么做好学术汇报&#xff0c;下面将我整理的一些规范和步骤记录下来 一些琐碎的事情&…

阿里、腾讯御用PPT设计师:让你在年终汇报中做最靓的仔!

你知道现在年轻人靠什么赚钱吗&#xff1f; 前几天&#xff0c;知乎上一篇关于“副业”的回答吓我一跳&#xff0c;一个大三学生&#xff0c;只靠副业赚够14W。 14万什么概念&#xff0c;是一个普通白领不吃不喝至少2年的工资。 干什么能一下赚这么多&#xff1f; 他一没抢钱二…

ChatGPT中的提示工程(Prompt Engineering)怎么做?50页最新PPT下载

整理自&#xff1a;专知 在公众号后台回复 Prompt Engineering 即可获取PPT。 ChatGPT爆火之后&#xff0c;也逐渐衍生出一大堆新的概念和机会。提示工程&#xff08;Prompt Engineering&#xff09;便是其中之一。据笔者所知&#xff0c;国内外目前已有提示工程相关的工程师岗…

用 ChatGPT 将 Excel 工作效率提高 10 倍!离做PPT还远吗

源&#xff5c;机器之心 在未来&#xff0c;精通 Excel 或许不再是简历亮点了。 ChatGPT 自去年 11 月 30 日 OpenAI 重磅推出以来&#xff0c;这款 AI 聊天机器人迅速成为 AI 界的「当红炸子鸡」。一经发布&#xff0c;不少网友更是痴迷到通宵熬夜和它对话聊天&#xff0c;就为…

招银网络科技 笔试、面试

1. 笔试 1.1 题目 有16种状态码分别是1-16&#xff0c;本来应该记为{1, 1, 1, 3}&#xff0c;但是由于粗心记为{1113}&#xff0c;题目&#xff1a;求出给定的输入如{1113}能够构成不同状态码的个数。{1113}可以构成{1, 1, 1, 3}, {11, 1, 3}, {1, 11, 3}, {1, 1, 13}, {11, …

招商银行网点管理系统

目录 功能一&#xff1a;查询所有展示 1.根据城市来进行条件查询 2.当进入首页后显示所有网点信息 3.根据城市进行条件查询 功能二&#xff1a;新增网点 功能三&#xff1a;修改网点 功能四&#xff1a;删除功能 功能一&#xff1a;查询所有展示 1.根据城市来进行条件查…

独家 | 招商银行:玩转校园招聘新方式 挖掘金融科技新人才

数字经济时代&#xff0c;金融科技人才队伍的引进与培养是招商银行人才体系建设的关键任务。 01.金融科技校招2大核心课题 招商银行数字化转型过程中&#xff0c;线上化、生态化、平台化、智能化、数据化全面加速发展&#xff0c;对人才队伍能力提出新要求。 2大核心课题&am…

【招商银行数据方向笔试题】—— 信用卡推荐客户列表

题目&#xff1a; 现在信用卡开展营销活动&#xff0c;持有我行信用卡客户推荐新户办卡&#xff0c;开卡成功后可获得积分奖励。规定每个客户最多可推荐两个新户且一个新户只能被推荐一次。但允许链接效应&#xff0c;即若客户A推荐了新户B&#xff0c;新户B推荐新户C&#xff…

金融银行测试面试题分享

1、网上银行转账是怎么测的&#xff0c;设计一下测试用例。 回答思路&#xff1a; 宏观上可以从质量模型&#xff08;万能公式&#xff09;来考虑&#xff0c;重点需要测试转账的功能、性能与安全性。设计测试用例可以使用场景法为主&#xff0c;先列出转账的基本流和备选流。…

CNAPS Code 查询(招商银行)

招商银行的妹子实在太傻了&#xff0c;根本不知道什么是CNAPS Code、联行号&#xff0c;完全答非所问。 最后还是自己搞定了&#xff0c;如图: 最后再看看招行人员的英语水平&#xff0c;真是不知道什么是东西&#xff1a; 我的群&#xff1a;1、Cocos2D&Unity&Java程序…

性能超越GPU、FPGA,华人学者提出软件算法架构加速AI实时化

作者 | 王言治&#xff0c;美国东北大学电子与计算机工程系助理教授 出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09; 近年来&#xff0c;机器学习(Machine Learning)领域的研究和发展可谓是与日俱新&#xff0c;各式各样与机器学习相关的研究成果与应用层出不穷&…