Python 中的字符串分割函数 split() 详解

070697e65dbae97a6877877e1f9bb03e.jpeg

更多Python学习内容:ipengtao.com

在 Python 编程中,处理字符串是一项常见的任务。字符串分割是其中的一个常见操作,而 Python 提供了强大的 split() 函数,用于将字符串拆分成多个部分。本文将详细介绍 split() 函数的用法、参数和示例代码,以帮助大家充分利用这个功能。

基本用法

split() 函数是 Python 字符串的内置方法,用于将一个字符串按照指定的分隔符拆分成多个子字符串,并将这些子字符串存储在列表中。

函数的基本语法如下:

str.split([separator[, maxsplit]])
  • separator(可选参数):指定用于分隔字符串的分隔符,默认为所有空白字符(包括空格、制表符、换行符等)。可以是字符串或字符。

  • maxsplit(可选参数):指定最大分割次数。如果提供了此参数,函数将执行最多 maxsplit 次分割。

下面是一个简单的示例,演示如何使用 split() 函数将字符串分割成列表:

# 基本用法示例
text = "Hello,World,Python"
words = text.split(",")  # 使用逗号作为分隔符
print(words)  # 输出:['Hello', 'World', 'Python']

在上述示例中,使用逗号 , 作为分隔符将字符串 text 分割成了一个包含多个单词的列表 words

使用默认分隔符

默认情况下,split() 函数会使用所有空白字符作为分隔符,包括空格、制表符、换行符等。

以下是一个示例:

# 使用默认分隔符分割字符串
text = "Hello   World\tPython"
words = text.split()  # 不提供分隔符,默认使用空白字符分割
print(words)  # 输出:['Hello', 'World', 'Python']

在上述示例中,字符串中的多个连续空白字符被视为一个分隔符。

使用 maxsplit 参数

可以使用 maxsplit 参数来限制分割的次数。这对于只想分割字符串的前几部分很有用。

以下是一个示例:

# 使用 maxsplit 参数限制分割次数
text = "apple,banana,grape,orange"
fruits = text.split(",", 2)  # 最多分割两次
print(fruits)  # 输出:['apple', 'banana', 'grape,orange']

在上述示例中,使用 maxsplit=2,将字符串 text 最多分割为两部分,结果列表中有三个元素。

使用自定义分隔符

除了使用逗号 , 作为分隔符,split() 函数还可以使用任何其他字符或字符串作为分隔符。

以下是一个示例,使用分号 ; 分割字符串:

# 使用分号作为分隔符
text = "apple;banana;grape;orange"
fruits = text.split(";")  # 使用分号作为分隔符
print(fruits)  # 输出:['apple', 'banana', 'grape', 'orange']

分割换行符

处理文本文件时,常常需要根据换行符来分割文本的不同行。split() 函数可以轻松应对这种情况。

以下是一个示例:

# 使用换行符分割文本
text = "Line 1\nLine 2\nLine 3"
lines = text.split("\n")  # 使用换行符分割
print(lines)  # 输出:['Line 1', 'Line 2', 'Line 3']

处理连续分隔符

有时,字符串中可能包含连续的分隔符。默认情况下,split() 函数会将连续的分隔符视为一个分隔符并忽略中间的空字符串。

以下是一个示例:

# 处理连续分隔符
text = "apple,,banana,,grape,,orange"
fruits = text.split(",")  # 使用逗号作为分隔符
print(fruits)  # 输出:['apple', '', 'banana', '', 'grape', '', 'orange']

在上述示例中,由于字符串中存在连续的逗号 ,,split() 函数将其视为一个分隔符,并在结果列表中包含了空字符串 ''

分割指定次数

如果只希望分割字符串的前几部分,可以使用 maxsplit 参数来限制分割次数。

以下是一个示例:

# 分割指定次数
text = "apple,banana,grape,orange"
fruits = text.split(",", 2)  # 最多分割两次
print(fruits)  # 输出:['apple', 'banana', 'grape,orange']

在上述示例中,使用 maxsplit=2,将字符串 text 最多分割为两部分,结果列表中有三个元素。

注意事项

在使用 split() 函数时,需要注意以下几个方面:

  1. 分隔符可以是任何字符串,包括多个字符的字符串。

  2. 如果不提供分隔符,则默认使用所有空白字符,包括空格、制表符、换行符等。

  3. 默认情况下,连续的分隔符会被视为一个分隔符,并且中间的空字符串会包含在结果列表中。

  4. 使用 maxsplit 参数可以限制分割的次数,但不能指定从字符串的末尾开始分割。

示例应用场景

当处理字符串时,有许多情况下需要使用字符串分割函数 split() 来解析和提取数据。

1.CSV 文件解析

CSV 文件通常由逗号分隔的值组成,使用 split() 函数可以轻松解析 CSV 行并提取数据。

csv_line = "John,Doe,30,New York"
csv_data = csv_line.split(",")
first_name, last_name, age, city = csv_data
print(f"First Name: {first_name}, Last Name: {last_name}, Age: {age}, City: {city}")

2.URL 解析

从 URL 中提取域名、路径、查询参数等信息。

url = "https://www.example.com/page?param1=value1&param2=value2"
parts = url.split("://")[1].split("/")
domain = parts[0]
path = "/".join(parts[1:])
print(f"Domain: {domain}, Path: {path}")

3. 配置文件解析

解析配置文件中的键值对。

config_str = "username=admin\npassword=secret\ndatabase=appdb"
config_data = {}
for line in config_str.split("\n"):key, value = line.split("=")config_data[key] = value
print(config_data)

4.日志文件处理

从日志文件中提取日期、时间、日志级别等信息。

log_entry = "2022-01-15 10:30:15 [INFO] This is an informational message."
log_parts = log_entry.split(" ")
log_date = log_parts[0]
log_time = log_parts[1]
log_level = log_parts[2]
log_message = " ".join(log_parts[3:])
print(f"Date: {log_date}, Time: {log_time}, Level: {log_level}, Message: {log_message}")

5.数据清洗和处理

在数据处理中,分割字符串是一种常见的方式,特别是在清洗和准备数据时。

data = "10,20,30,40,50"
values = [int(x) for x in data.split(",")]
average = sum(values) / len(values)
print(f"Average: {average}")

6.文件路径解析

从文件路径中提取目录和文件名。

file_path = "/path/to/some/file.txt"
parts = file_path.split("/")
directory = "/".join(parts[:-1])
file_name = parts[-1]
print(f"Directory: {directory}, File Name: {file_name}")

总结

Python 中的 split() 函数是一个强大且灵活的工具,用于将字符串按照指定的分隔符拆分成多个子字符串。无论是简单的文本处理还是复杂的数据解析,split() 函数都能提供便捷的解决方案。通过熟练掌握 split() 函数的用法,可以更轻松地处理各种字符串操作任务。

如果你觉得文章还不错,请大家 点赞、分享、留言 下,因为这将是我持续输出更多优质文章的最强动力!

更多Python学习内容:ipengtao.com

干货笔记整理

  100个爬虫常见问题.pdf ,太全了!

Python 自动化运维 100个常见问题.pdf

Python Web 开发常见的100个问题.pdf

124个Python案例,完整源代码!

PYTHON 3.10中文版官方文档

耗时三个月整理的《Python之路2.0.pdf》开放下载

最经典的编程教材《Think Python》开源中文版.PDF下载

634290f1a5067865a5fcdd9fb5f997f9.png

点击“阅读原文”,获取更多学习内容

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/237072.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Openstack组件glance对接swift

2、glance对接swift (1)可直接在数据库中查看镜像存放的位置、状态、id等信息 (2)修改glance-api的配置文件,实现对接swift存储(配置文件在/etc/glance/glance-api.conf,建议先拷贝一份&#x…

黑马python就业课

文章目录 初级中级高级初级课程分享 初级 中级 高级 初级课程分享 链接:https://pan.baidu.com/s/1aiJHaThezv_mSI1rnV3d7g 提取码:xdpc

嵌套的CMake

hehedalinux:~/Linux/multi-v1$ tree . ├── calc │ ├── add.cpp │ ├── CMakeLists.txt │ ├── div.cpp │ ├── mult.cpp │ └── sub.cpp ├── CMakeLists.txt ├── include │ ├── calc.h │ └── sort.h ├── sort │ ├── …

Mnajora 使用deb包安装软件

说明 Mnajora 安装deb软件包主要有两种方式 可以使用dpkg 直接安装也可是使用debtap将deb软件包转换成 使用dpkg sudo pacman -S dpkg #安装dpkgsudo dpkg -i ###.deb #使用dpkg安装deb软件包和在ubuntu上是一样的 安装成功 使用debtap debtap是一个用于将.deb包转换为A…

im6ull学习总结(三-3)freetype

1、Freetype简介 FreeType是一个开源的字体渲染引擎,主要用于将字体文件转换为位图或矢量图形,并在屏幕上渲染出高质量的字体。它提供了一组API,使开发者能够在自己的应用程序中使用和呈现字体。 FreeType最初是作为一个独立项目开发的&…

07-Tomcat运行Jenkins并实现链路追踪

4.3.1:部署skywalking java agent ~# apt install openjdk-11-jdk -y ~# cd /apps/ ~# wget https://archive.apache.org/dist/skywalking/java-agent/9.0.0/apache-skywalking-java-agent-9.0.0.tgz ~# tar xf apache-skywalking-java-agent-9.0.0.tgz ~# vim /ap…

Git的安装

1、下载 官网地址: https://git-scm.com/或https://github.com/git-for-windows/git/releases 百度网盘链接:链接:https://pan.baidu.com/s/13_asGO-XQb5KWWH_V7rq6g?pwd0630 2、安装 ①查看GNU协议,可以直接点击下一步。 ②…

橘子学Spring01之spring的那些工厂和门面使用

一、Spring的工厂体系 我们先来说一下spring的工厂体系(也称之为容器),得益于大佬们对于单一职责模式的坚决贯彻,在十几年以来spring的发展路上,扩展出来大量的工厂类,每一个工厂类都承担着自己的功能(其实就是有对应的方法实现)…

Linux 期末复习

Linux 期末复习 计算机历史 硬件基础 1,计算机硬件的五大部件:控制器、运算器、存储器、输入输出设备 2,cpu分为精简指令集(RISC)和复杂指令集(CISC) 3,硬件只认识0和1,最小单位是bit,最小存储单位是字…

【论文阅读】Non-blocking Lazy Schema Changes in Multi-Version

Non-blocking Lazy Schema Changes in Multi-Version Database Management Systems 1. Intro 1.1 Motivation 一个是online能够提供不停机的更新的能力,在很多业务系统里面是必要的。第二个是满足高可用,SaaS、PaaS要提供高可用的系统给用户&#xff…

【Linux实用篇】Linux常用命令(1)

目录 1.1 Linux命令初体验 1.1.1 常用命令演示 1.1.2 Linux命令使用技巧 1.1.3 Linux命令格式 1.2 文件目录操作命令 1.2.1 ls 1.2.2 cd 1.2.3 cat 1.2.4 more 1.2.5 tail 1.2.6 mkdir 1.2.7 rmdir 1.2.8 rm 1.1 Linux命令初体验 1.1.1 常用命令演示 在这一部分中…

openssl3.2 - 官方demo学习 - cms - cms_ver.c

文章目录 openssl3.2 - 官方demo学习 - cms - cms_ver.c概述运行结果笔记END openssl3.2 - 官方demo学习 - cms - cms_ver.c 概述 CMS验签, 将单独签名和联合签名出来的签名文件都试试. 验签成功后, 将签名数据明文写入了文件供查看. 也就是说, 只有验签成功后, 才能看到签名…

如何在你的网站接入QQ登录?

文章目录 准备阶段申请QQ登录的权限创建应用最后上传qqlogin.php代码 准备阶段 国内服务器和备案域名需要你有张独一无二本人的身份证你正面手持身份证的图片一张100px*100px的网站图标 申请QQ登录的权限 首先访问qq互联,点击我直接访问 登陆完成后我们点击面的…

常用计算电磁学算法特性与电磁软件分析

常用计算电磁学算法特性与电磁软件分析 参考网站: 计算电磁学三大数值算法FDTD、FEM、MOM ADS、HFSS、CST 优缺点和应用范围详细教程 ## 基于时域有限差分法的FDTD的计算电磁学算法(含Matlab代码)-框架介绍 参考书籍:The finite…

代码随想录算法训练营第四天 | 24. 两两交换链表中的节点、19.删除链表的倒数第N个节点、面试题 02.07. 链表相交、142.环形链表II

代码随想录算法训练营第四天 | 24. 两两交换链表中的节点、19.删除链表的倒数第N个节点、面试题 02.07. 链表相交、142.环形链表II 文章目录 代码随想录算法训练营第四天 | 24. 两两交换链表中的节点、19.删除链表的倒数第N个节点、面试题 02.07. 链表相交、142.环形链表II1 Le…

软件测试|教你使用Python绘制正多边形

简介 绘制正多边形是Python图形编程的基本任务之一。在本文中,我将为你提供一个使用Python绘制正多边形的详细教程,并提供一个示例代码。我们将使用Python的Turtle库来进行绘制。 步骤1:导入Turtle库 我们需要先安装好Python环境&#xff…

【信息安全】深度分析邮件安全及钓鱼攻击防范

本博文共计3100余字,预计需阅读20分钟 【邮件安全建设】 一、前言 邮件系统作为企业办公网络架构中重要的组成部分,同时也是业务高频使用的办公应用,一旦出现安全问题,业务将会被严重干扰甚至中断,本篇博客通过攻守两…

软件测试|Python数据可视化神器——pyecharts教程(十)

使用pyecharts绘制漏斗图 简介 漏斗图(Funnel Chart)是一种用于可视化数据流程或转化率的图表类型。它通常由一系列阶段组成,每个阶段都有一个名称和一个值,表示在该阶段的转化量或数据流程的进展情况。漏斗图的名称来源于其外观…

浅析五种 React 组件设计模式

作为一名 React 开发者,你可能会面临下面几个问题: 如何构建一个高复用度性的组件,使其适应不同的业务场景?如何构建一个具有简单 API的组件,使其易于使用?如何构建一个在 UI 和功能方面具有可扩展性的组件…

[C#]使用winform部署PP-MattingV2人像分割onnx模型

【官方框架地址】 https://github.com/PaddlePaddle/PaddleSeg 【算法介绍】 PP-MattingV2是一种先进的图像和视频抠图算法,由百度公司基于PaddlePaddle深度学习框架开发。它旨在提供更精准和高效的图像分割功能,特别是在处理图像中的细微部分&#xf…