如何用Rdkit计算MACCS密钥以及每个指纹位点代表什么

1.MACCS密钥是什么
MACCS(分子访问系统)键是最常用的结构键之一,有时也被称为 MDL 密钥,MDL来源于开发它的公司的名称(MDL 信息系统,现为 BIOVIA)。 虽然有两组 MACCS 密钥(一组包含 960 个密钥,另一组包含 166 个密钥的子集),但只有包含 166 个密钥的MACCS可供公众使用。 这 166 个密钥可以通过流行的开源化学信息学软件包(RDKit 、OpenBabel、CDK等)计算。

在结构键中,分子结构被编码为二进制位串(即 0 和 1 的序列),每个位对应于“预定义的”结构特征(例如,子结构或片段)。 如果分子具有预定义的特征,则对应于该特征的位位置设置为 1 (ON)。 否则,将其设置为 0 (OFF)。 需要注意的是,结构键不能对片段库中未预定义的结构特征进行编码。

2. 如何计算MACCS密钥
以该化合物结构为例计算该结构的MACCS密钥
以该化合物结构为例计算该化合物的MACCS密钥

from rdkit import Chem
mol = Chem.MolFromSmiles('CC(C)C1=C(C(=C(N1CC[C@H](C[C@H](CC(=O)O)O)O)C2=CC=C(C=C2)F)C3=CC=CC=C3)C(=O)NC4=CC=CC=C4')
from rdkit.Chem import MACCSkeys
fp = MACCSkeys.GenMACCSKeys(mol)
print(type(fp))   #<class 'rdkit.DataStructs.cDataStructs.ExplicitBitVect'>
for i in range(len(fp)):print(fp[i], end='')
#将其转换为位串
#00000000000000000000000000000000000000000010000000000100000000100100000000110000100101010111100011001000100110110000011001110100110111111101101011111111111111111111110
fp.ToBitString()    
#将其转换为位串的另一种更简单的方法
#打印位串形式的MACCS密钥00000000000000000000000000000000000000000010000000000100000000100100000000110000100101010111100011001000100110110000011001110100110111111101101011111111111111111111110
len(fp)
#167
#请注意,MACCS 密钥是 166 位长的,但 RDKit 会生成一个 167 位长的指纹。 这是因为许多编程语言(包括 python)中列表/向量的索引从 0 开始。为了使用 MACCS 键的原始编号(1-166)(而不是 0-165),MACCS 键被实现为 长度为 167 位,位 0 始终为零。 因为所有化合物的位 0 都设置为 OFF,所以它不会影响分子相似性的评估。
fp_bits = tuple(fp.GetOnBits())
print(fp_bits)
#含有1的密钥位点(42,53,62,65,74,75,80,83,85,87,89,90,91,92,96,97,104,107,108,110,111,117,118,121,122,123,125,128,129,,,,165)
print(fp.GetNumBits())
#167
print(fp.GetNumOffBits())
# 105 
#位点为0的位数
print(fp.GetNumOnBits())
#62
#位点为1的位数
print(fp.ToBinary())
#b'\xe0\xff\xff\xff\xa7\x00\x00\x00>\x00\x00\x00T\x14\x10\x04\x10\x00\x08\x04\x02\x02\x02\x00\x00\x00\x06\x00\x04\x06\x04\x00\x02\x00\n\x00\x04\x00\x00\x02\x04\x00\x02\x00\x00\x00\x00\x00\x00\x02\x00\x02\x02\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x02'

3.MACCS的每个密钥位点代表什么
MACCS 166 个密钥的片段定义如参考链接2所示,这些密钥是基于SMARTS 编辑的。要想了解SMARTS,我们先要了解一下SMILES。

SMILES是简化分子线性输入的方法(Simplified molecular input line entry specification),用字符串来描述分子结构,**一个SMILES代表一个唯一的化学结构。**详细介绍可以参考https://www.jianshu.com/p/8c915de5ad4d

SMARTS(Smiles Arbitrary Target Specification,Smiles任意目标规范)是另一种描述分子结构的语言,是在SMILES基础上的改进版,SMARTS编码允许使用符号表示原子和化学键,一个SMARTS代表一类化学结构。

SMARTS的具体语法,其中的原子属性、键属性详见如下博客:
https://blog.csdn.net/dreadlesss/article/details/105739826

另外,我们可以基于rdkit将SMILES转化为SMARTS,具体教程见如下链接:
https://blog.csdn.net/recher_He1107/article/details/115213129

这里以化合物85这个位点为例,解释每个位点代表了什么结构。
85、87、89、90、91、92位点
85位点:
(‘[#6]~[#7](~[#6])~[#6]’)
‘#6’代表’C’
‘#7’代表’N’
[#6]~[#7]代表C和N由任意键相连
~代表表示通配键
因此,85位点代表的结构为CN( C)C

引用:

  1. https://blog.csdn.net/u012325865/article/details/101697880
    2.https://github.com/rdkit/rdkit/blob/master/rdkit/Chem/MACCSkeys.py
    3.https://blog.csdn.net/u012325865/article/details/101697880

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/71319.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

5分钟让你知道什么是PKI 密钥

译者博客 原文出处 前言 Public Key Infrastructure&#xff08;PKI)&#xff0c;中文叫做公开密钥基础设施&#xff0c;也就是利用公开密钥机制建立起来的基础设施。但是如果这么解释起来&#xff0c;到底是个什么东西&#xff0c;大家想必是没办法理解的。 现在大家的很多重要…

公钥、密钥和数字证书

转自 我理解的数字证书-1-公钥&#xff0c;私钥和数字证书 英文原文地址&#xff1a; http://www.youdzone.com/signature.html 若下文有任何错误&#xff0c;请告知我&#xff0c;谢谢。79996286qq.com 主角介绍&#xff1a;Bob and Alice 提起RSA加密算法&#xff0c;公…

一文看懂公钥、私钥、数字签名、数字证书

好文章&#xff0c;记录下来&#xff01;源文地址&#xff1a;What is a Digital Signature? (youdzone.com) 1. 鲍勃有两把钥匙&#xff0c;一把是公钥&#xff0c;另一把是私钥。 2. 鲍勃把公钥送给他的朋友们----帕蒂、道格、苏珊----每人一把。 3. 苏珊要给鲍勃写一封保密…

密钥对,密钥,公钥,私钥的 区分!!!

密钥对&#xff0c;密钥&#xff0c;公钥&#xff0c;私钥的区分&#xff1a; 一、概念 1、密钥对&#xff1a;在非对称加密技术中&#xff0c;有两种密钥&#xff0c;分为公钥和私钥。 公钥是密钥对所有者持有&#xff0c;公布给他人的&#xff1b;私钥也是密钥对所有者持有…

数字签名是什么?公钥和私钥是什么

数字签名是什么&#xff1f;公钥和私钥是什么 数字签名 这里参考阮一峰的数字签名解释&#xff0c;详细 请看: 数字签名是什么&#xff1f; - 阮一峰的网络日志 1.鲍勃有两把钥匙&#xff0c;一把是公钥&#xff0c;另一把是私钥。 2.鲍勃把公钥送给他的朋友们----帕蒂、道格…

公钥,私钥和数字签名这样最好理解

一、公钥加密 假设一下&#xff0c;我找了两个数字&#xff0c;一个是1&#xff0c;一个是2。我喜欢2这个数字&#xff0c;就保留起来&#xff0c;不告诉你们(私钥&#xff09;&#xff0c;然后我告诉大家&#xff0c;1是我的公钥。 我有一个文件&#xff0c;不能让别人看&…

告别晦涩难懂的物理,《张朝阳的物理课》了解一下

马斯克的飞船和我国神舟十二号的速度和运行状态是怎样的&#xff1f;如何用能量守恒定律解释台球撞击问题&#xff1f;朝霞晚霞的颜色又是怎么回事&#xff1f;细究这些日常&#xff0c;大多数人心里充满大大的问号。可能在高中学过这些知识&#xff0c;但现在都还给了老师&…

张朝阳:走出焦虑,不再焦虑

在前不久的乌镇互联网大会上&#xff0c;张朝阳和丁磊坐在步步莲花咖啡馆外有一个长聊&#xff0c;其间&#xff0c;马云、周鸿祎和张平安也有加入&#xff0c;他们聊了大学的时光、金庸的江湖、永生的2029&#xff0c;也有互联网行业。跟正襟危坐的沙龙不同&#xff0c;大佬们…

张朝阳的物理课:他现在真的很快乐

我是卢松松&#xff0c;点点上面的头像&#xff0c;欢迎关注我哦&#xff01; 没想到我这辈子还能听到麻省理工大学毕业的博士的课。张朝阳这快60岁了&#xff0c;还能把物理课程记得这么清楚&#xff0c;不愧是麻省理工的博士。 最近看到搜狐的张朝阳在讲顶尖的物理课&#…

Android Studio源码学习记录_01

一、HashMap<String, String> /* * HashMap:是基于哈希表的Map接口实现。 * 哈希表的作用是用来保证键的唯一性的。 * * HashMap<String,String> * 键&#xff1a;String * 值&#xff1a;String */ package cn.itcast_02;import java.util.HashMap; impor…

张朝阳不再狂妄,搜狐的艰难复苏路

来源&#xff5c;连线Insight 作者&#xff5c;王古锋 编辑&#xff5c;子夜 “我曾经什么都拥有&#xff0c;当时站在世界的中心&#xff0c;有名有钱很狂妄。现在已经没有在舞台中心的感觉了。现在我要做一个好的管理者&#xff0c;把一个企业做扎实。”近期&#xff0c;搜狐…

谁是下一个向海龙?

https://www.toutiao.com/a6693147614591844876/ 2019-05-21 00:31:07 5月17日&#xff0c;百度发布了2019Q1财报&#xff0c;百度自2005年上市以来出现首个季度亏损&#xff0c;这也让百度重臣向海龙的离职和百度前COO陆奇的离开一样&#xff0c;具有欲说还休的悲壮色彩。 19…

世界互联网大会前夜:丁磊马云雷军周鸿祎张朝阳等亮相,将会探讨什么?

关注网易智能&#xff0c;聚焦AI大事件&#xff0c;读懂下一个大时代&#xff01; 11月6日晚间&#xff0c;小桥流水&#xff0c;华灯初上&#xff0c;丁磊、马云、雷军、程维、张一鸣、张朝阳、周鸿祎等大佬纷纷亮相乌镇。在众多媒体的关注下&#xff0c;各位大佬悉数到场&…

张朝阳留不住的人

文|熔财经 作者|Alex Chiang &#xff08;封面图&#xff09; 张朝阳&#xff0c;再一次站上了风口浪尖。 “我每天只睡四个小时&#xff0c;并且已经坚持三年多了”&#xff0c;张朝阳在接受一次采访时如是说道&#xff0c;这番与时代多少有些格格不入的话语&#xff0c;在…

颠覆者-读周鸿祎新书

周鸿祎一直是我喜欢的偶像&#xff0c;他身上所体现出来的程序员改变世界、产品经理的执着与见解&#xff0c;还有对互联网的热爱和折腾一直给予我力量。之前读过一本老周的书《我的互联网方法论》&#xff0c;里面讲述了他对互联网的一些核心思想&#xff0c;还有常见的一些方…

破圈的《张朝阳的物理课》,开启“知识突围”的搜狐视频

在互联网耕耘二十多年的搜狐&#xff0c;正在焕发出新的活力。 从搜狐最近公布的2022年第三季度财报来看&#xff0c;营收1.85亿美元&#xff0c;其中在线游戏业务实现收入1.49亿美元&#xff0c;广告收入环比增长3%达到2600万美元。同时&#xff0c;净亏损好于此前预期。 对…

张朝阳的心境,搜狐的武器

乌镇互联网大会第六年&#xff0c;张朝阳连续几年参加&#xff0c;而今天又可以新的角度去写张朝阳&#xff0c;剖析搜狐。 心情&#xff1a;他乡遇故知 刚抵达乌镇放下行李&#xff0c;张朝阳就拿起手机做起直播&#xff0c;站在乌镇小桥上&#xff0c;向网友直播小桥流水。…

张朝阳夜跑33公里:直播聊物理 揭示“超级月亮”成因

雷递网 乐天 7月15日报道 7月13日晚&#xff0c;伴着本年度最大的“超级月亮”亮相夜空&#xff0c;搜狐创始人、董事局主席兼CEO张朝阳夜跑33KM&#xff0c;用脚步丈量北京二环&#xff0c;同时一边跑步一边聊物理&#xff0c;再次创新知识科普直播的新场景。本次夜跑活动持续…

周鸿祎:江湖最后一个大佬

这篇文章并不写人&#xff0c;也其实并不是写周鸿祎&#xff0c;而是周鸿祎这个人的经历代表着中国互联网的一些本质规律&#xff0c;值得梳理。这些本质规律&#xff0c;通过案例、历史演变&#xff0c;反而可以让人们更加能易于理解。 &#xff08;1&#xff09;通信&#xf…

AIGC分布式联盟动态:北京AIGC青年酒会引领年轻人“AI”新风尚!

HELLO&#xfe62; ARE YOU READY&#xfe62; AIGC 北京AIGC青年社交酒会 北京AIGC青年社交酒会 创新激荡 引领年轻人“AI”新风尚 北京AIGC分布式创新联盟 ARE YOU READY ? TIME IS UP ! ARE YOU READY? HELLO AIGC SUMMER 夏日狂欢 北京AIGC分布…