基于tldextract提取URL里的子域名、主域名、顶级域

基于tldextract提取URL里的子域名、主域名、顶级域

news/2025/2/22 6:50:03/文章来源:https://blog.csdn.net/lilongsy/article/details/145284578

TLD是TopLevel Domain的缩写。‌tldextract‌ 是一个用于从URL中提取子域、主域名和顶级域（TLD）的Python库。它利用公共后缀列表（Public Suffix List）来确保即使是复杂或不常见的URL结构也能被正确解析。tldextract能够处理包括ICANN管理的公共TLD以及可选的私有域名，帮助开发者准确地分离出URL的各个部分，尤其是在处理多层子域时，避免了简单的字符串分割带来的错误‌。

安装

pip install tldextract

示例

import tldextractresult = tldextract.extract("https://baijiahao.baidu.com/s?id=1821824643075404089")
print(result)
print(result.subdomain)  # 输出子域名
print(result.domain)    # 输出主域名
print(result.suffix)    # 输出顶级域# ExtractResult(subdomain='baijiahao', domain='baidu', suffix='com', is_private=False)
# baijiahao
# baidu
# com

命令行模式

$tldextract
usage: tldextract [-h] [--version] [-j] [-u][--suffix_list_url SUFFIX_LIST_URL] [-c CACHE_DIR] [-p][--no_fallback_to_snapshot][fqdn|url ...]$tldextract "http://www.baidu.com"
www baidu com

相关链接

https://github.com/john-kurkowski/tldextract

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/5211.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

音频入门（一）：音频基础知识与分类的基本流程

音频入门（一）：音频基础知识与分类的基本流程

音频信号和图像信号在做分类时的基本流程类似，区别就在于预处理部分存在不同；本文简单介绍了下音频处理的方法，以及利用深度学习模型分类的基本流程。目录一、音频信号简介 1. 什么是音频信号 2. 音频信号长什么样二、音频的深度学习分…

阅读更多...

数据结构之堆排序

数据结构之堆排序

文章目录堆排序版本一图文理解版本二向下调整建堆向上调整建堆排升/降序升序堆排序版本一基于已有数组建堆取堆顶元素并删除堆顶元素重新建大根堆，完成排序版本。图文理解版本二前提：必须提供有现成的数据结构堆数组建堆，首尾…

阅读更多...

小菜鸟系统学习Python第三天

小菜鸟系统学习Python第三天

1.优先级问题: 结论: 幂运算>正负号>加减乘除和整除>比较运算符>逻辑运算符 2.三元运算符 3.assert断言:抛出AssertionError异常 4.for循环 4. 5.break和continue

阅读更多...

常用排序算法之插入排序

常用排序算法之插入排序

目录前言一、基本原理 1.算法步骤 2.动画演示 3.插入排序的实现代码二、插入排序的时间复杂度 1. 时间复杂度 1.最优时间复杂度 2.最差时间复杂度 3.平均时间复杂度 2. 空间复杂度三、插入排序的优缺点 1.优点 2.缺点四、插入排序的改进与变种五、插入排…

阅读更多...

数据分析及应用：经营分析中的综合指标解析与应用

数据分析及应用：经营分析中的综合指标解析与应用

目录 1. 市场份额（Market Share） 2. 客户获取成本（Customer Acquisition Cost, CAC） 3. 客户生命周期价值（Customer Lifetime Value, CLV） 4. 客户留存率（Customer Retention Rate, CRR） 5. 净推荐值（Net Promoter Score, NPS） 6. 转化率（Conversion Rate） …

阅读更多...

工业相机 SDK 二次开发-Halcon 插件

工业相机 SDK 二次开发-Halcon 插件

本文介绍了 Halcon 连接相机时插件的使用。通过本套插件可连接海康的工业相机。一. 环境配置 1. 拷贝动态库在用户安装 MVS 目录下按照如下路径 Development\ThirdPartyPlatformAdapter 找到目录为 HalconHDevelop 的文件夹，根据 Halcon 版本找到对…

阅读更多...

【Vim Masterclass 笔记25】S10L45：Vim 多窗口的常用操作方法及相关注意事项

【Vim Masterclass 笔记25】S10L45：Vim 多窗口的常用操作方法及相关注意事项

文章目录 S10L45 Working with Multiple Windows1 水平分割窗口2 在水平分割的新窗口中显示其它文件内容3 垂直分割窗口4 窗口的关闭5 在同一窗口水平拆分出多个窗口6 关闭其余窗口7 让四个文件呈田字形排列8 光标在多窗口中的定位9 调节子窗口的尺寸大小10 变换子窗口的位置11…

阅读更多...

Linux TCP 之 RTT 采集与 RTO 计算

Linux TCP 之 RTT 采集与 RTO 计算

我们来看看 Linux TCP 采集 RTT 的函数 tcp_rtt_estimator，看注释，充满了胶着。但在那个谨慎的年代，这些意味着什么？ RTT 最初仅用于 RTO 的计算而不是用于调速，RTO 的计算存在两个问题，如果过估&#x…

阅读更多...

如何使用CRM数据分析优化销售和客户关系？

如何使用CRM数据分析优化销售和客户关系？

嘿，大家好！你有没有想过为什么有些公司在市场上如鱼得水，而另一些却在苦苦挣扎？答案可能就藏在他们的销售策略和客户关系管理（CRM）系统里。今天我们要聊的就是如何通过有效的 CRM 数据分析来提升你的销售额…

阅读更多...

《Effective Java》学习笔记——第2部分对象通用方法最佳实践

《Effective Java》学习笔记——第2部分对象通用方法最佳实践

文章目录第2部分所有对象通用方法一、前言二、最佳实践内容1. equals()方法2. hashCode()方法3. toString() 方法4. clone() 方法5. finalize() 方法6. compareTo()方法（实现 Comparable 接口） 三、小结第2部分所有对象通用方法一、前言《Effect…

阅读更多...

前沿技术趋势洞察：2024年技术的崭新篇章与未来走向！

前沿技术趋势洞察：2024年技术的崭新篇章与未来走向！

引言时光飞逝，2024年已经来临，回顾过去一年，科技的迅猛进步简直让人目不暇接。在人工智能（AI）越来越强大的今天，我们不再停留在幻想阶段，量子计算的雏形开始展示它的无穷潜力，Web …

阅读更多...

图的基本概念

图的基本概念

一、图二、顶点的度三、图的同构四、完全图五、子图六、补图

阅读更多...

【游戏设计原理】75 - 最小最大化

【游戏设计原理】75 - 最小最大化

一、理解与分析最小/最大化的核心是玩家在角色扮演类游戏中使用的一种策略，旨在通过把角色的某些不利特性最小化、而有利特性最大化来增强角色在特定领域的优势。这种策略通常表现为以下几种形式： 角色单一化：玩家通过极端优化角色的某一项…

阅读更多...

【K8S系列】K8s 领域深度剖析：年度技术、工具与实战总结

【K8S系列】K8s 领域深度剖析：年度技术、工具与实战总结

引言 Kubernetes作为容器编排领域的行业标准，在过去一年里持续进化，深刻推动着云原生应用开发与部署模式的革新。本文我将深入总结在使用K8s特定技术领域的进展，分享在过去一年中相关技术工具及平台的使用体会，并展示基于K8s的技术…

阅读更多...

PyCharm+RobotFramework框架实现UDS自动化测试- (四)项目实战0x10

PyCharm+RobotFramework框架实现UDS自动化测试- (四)项目实战0x10

1.环境搭建硬件环境：CANoe、待测设备（包含UDS诊断模块） 2.pythonPyCharm环境 pip install robotframework pip install robotframework-ride pip install openpyxl pip install udsoncan pip install python-can pip install can-isotp3…

阅读更多...

mybatis（19/134）

mybatis（19/134）

大致了解了一下工具类，自己手敲了一边，java的封装还是真的省去了很多麻烦，封装成一个工具类就可以不用写很多重复的步骤，一个工厂对应一个数据库一个environment就好了。 mybatis中调用sql中的delete占位符里面需要有字符&#xf…

阅读更多...

学习ASP.NET Core的身份认证（基于JwtBearer的身份认证7）

学习ASP.NET Core的身份认证（基于JwtBearer的身份认证7）

本文验证基于请求头中传递token信息的认证方式，webapi项目的控制器类中新建如下函数，仅通过验证的客户端能调用，需要客户端请求在Header中添加’Authorization’: Bearer token’的键值对且通过token验证后才能调用。 [Authorize] [HttpGet]…

阅读更多...

Linux：进程(三)

Linux：进程(三)

1. 进程创建补充 fork之后父子两个执行流分别执行，fork之后谁谁先执行由调度器来决定。一般，父子代码共享。当父子不再写入时，数据也是共享的，但是当有一方要写入，就触发写时拷贝。 fork调用失败的原因 1. 系统中有…

阅读更多...

一、vue智能Ai对话（高仿通义千问）普通版。

一、vue智能Ai对话（高仿通义千问）普通版。

如需源码：请私信。普通版视频地址：普通版视频流式进阶版视频地址：流式进阶版视频流式进阶版：流式进阶版源码 html结构和js方法： <!DOCTYPE html> <html lang"zh"><head><meta …

阅读更多...

Taro+Vue实现图片裁剪组件

Taro+Vue实现图片裁剪组件

cropper-image-taro-vue3 组件库介绍 cropper-image-taro-vue3 是一个基于 Vue 3 和 Taro 开发的裁剪工具组件，支持图片裁剪、裁剪框拖动、缩放和输出裁剪后的图片。该组件适用于 Vue 3 和 Taro 环境，可以在网页、小程序等平台中使用。源码 https:…

阅读更多...

最新文章

推荐文章