目录
一、用法精讲
341、pandas.Series.str.startswith方法
341-1、语法
341-2、参数
341-3、功能
341-4、返回值
341-5、说明
341-6、用法
341-6-1、数据准备
341-6-2、代码示例
341-6-3、结果输出
342、pandas.Series.str.strip方法
342-1、语法
342-2、参数
342-3、功能
342-4、返回值
342-5、说明
342-6、用法
342-6-1、数据准备
342-6-2、代码示例
342-6-3、结果输出
343、pandas.Series.str.swapcase方法
343-1、语法
343-2、参数
343-3、功能
343-4、返回值
343-5、说明
343-6、用法
343-6-1、数据准备
343-6-2、代码示例
343-6-3、结果输出
344、pandas.Series.str.title方法
344-1、语法
344-2、参数
344-3、功能
344-4、返回值
344-5、说明
344-6、用法
344-6-1、数据准备
344-6-2、代码示例
344-6-3、结果输出
345、pandas.Series.str.translate方法
345-1、语法
345-2、参数
345-3、功能
345-4、返回值
345-5、说明
345-6、用法
345-6-1、数据准备
345-6-2、代码示例
345-6-3、结果输出
一、用法精讲
341、pandas.Series.str.startswith方法
341-1、语法
# 341、pandas.Series.str.startswith方法
pandas.Series.str.startswith(pat, na=None)
Test if the start of each string element matches a pattern.Equivalent to str.startswith().Parameters:
pat
str or tuple[str, …]
Character sequence or tuple of strings. Regular expressions are not accepted.na
object, default NaN
Object shown if element tested is not a string. The default depends on dtype of the array. For object-dtype, numpy.nan is used. For StringDtype, pandas.NA is used.Returns:
Series or Index of bool
A Series of booleans indicating whether the given pattern matches the start of each string element.
341-2、参数
341-2-1、pat(必须):字符串或元组,指定用于匹配字符串开头的模式,如果传入的是字符串,则检查每个字符串是否以该字符串开头;如果传入的是元组,则检查每个字符串是否以元组中的任意一个字符串开头。
341-2-2、na(可选,默认值为None):布尔值或None,处理缺失值(NaN)的策略。如果为True,则将缺失值视为匹配成功;如果为False,则视为匹配失败;如果为None(默认值),缺失值会保留为NaN。
341-3、功能
用于检查Series中每个字符串是否以给定的模式开头,该方法常用于文本数据的筛选或条件判断。
341-4、返回值
返回一个pandas.Series对象,包含布尔值(True或False),表示每个字符串是否匹配指定模式,如果na参数设置为None,则Series中的缺失值会保留为NaN。
341-5、说明
无
341-6、用法
341-6-1、数据准备
无
341-6-2、代码示例
# 341、pandas.Series.str.startswith方法
import pandas as pd
# 示例数据
data = pd.Series(['apple', 'banana', 'cherry', None, 'apricot'])
# 检查是否以 "ap" 开头
result1 = data.str.startswith("ap")
# 检查是否以 "ba" 开头,并将 NaN 视为 False
result2 = data.str.startswith("ba", na=False)
# 检查是否以 "ap" 或 "ch" 开头
result3 = data.str.startswith(("ap", "ch"))
print("Result1 (startswith 'ap'):")
print(result1)
print("\nResult2 (startswith 'ba', na=False):")
print(result2)
print("\nResult3 (startswith 'ap' or 'ch'):")
print(result3)
341-6-3、结果输出
# 341、pandas.Series.str.startswith方法
# Result1 (startswith 'ap'):
# 0 True
# 1 False
# 2 False
# 3 None
# 4 True
# dtype: object
#
# Result2 (startswith 'ba', na=False):
# 0 False
# 1 True
# 2 False
# 3 False
# 4 False
# dtype: bool
#
# Result3 (startswith 'ap' or 'ch'):
# 0 True
# 1 False
# 2 True
# 3 None
# 4 True
# dtype: object
342、pandas.Series.str.strip方法
342-1、语法
# 342、pandas.Series.str.strip方法
pandas.Series.str.strip(to_strip=None)
Remove leading and trailing characters.Strip whitespaces (including newlines) or a set of specified characters from each string in the Series/Index from left and right sides. Replaces any non-strings in Series with NaNs. Equivalent to str.strip().Parameters:
to_strip
str or None, default None
Specifying the set of characters to be removed. All combinations of this set of characters will be stripped. If None then whitespaces are removed.Returns:
Series or Index of object.
342-2、参数
342-2-1、to_strip(可选,默认值为None):字符串或None,指定需要移除的字符,如果没有指定(即为None),则默认移除空白字符(包括空格、换行符\n和制表符\t),如果传入一个字符串,那么该字符串中所有的字符都会被移除。
342-3、功能
用于删除Series中每个字符串开头和结尾的指定字符,默认情况下,它会删除空白字符。
342-4、返回值
返回一个pandas.Series对象,其中包含已移除指定字符的字符串。
342-5、说明
无
342-6、用法
342-6-1、数据准备
无
342-6-2、代码示例
# 342、pandas.Series.str.strip方法
import pandas as pd
# 示例数据
data = pd.Series([' apple ', 'banana\n', '\tcherry\t', ' apricot ', 'mango'])
# 默认移除空白字符
result1 = data.str.strip()
# 移除指定字符'a', 'b'
result2 = data.str.strip("ab")
# 移除换行符'\n'和制表符'\t'
result3 = data.str.strip("\n\t")
print("Result1 (default strip):")
print(result1)
print("\nResult2 (strip 'a' and 'b'):")
print(result2)
print("\nResult3 (strip '\\n' and '\\t'):")
print(result3)
342-6-3、结果输出
# 342、pandas.Series.str.strip方法
# Result1 (default strip):
# 0 apple
# 1 banana
# 2 cherry
# 3 apricot
# 4 mango
# dtype: object
#
# Result2 (strip 'a' and 'b'):
# 0 apple
# 1 nana\n
# 2 \tcherry\t
# 3 apricot
# 4 mango
# dtype: object
#
# Result3 (strip '\n' and '\t'):
# 0 apple
# 1 banana
# 2 cherry
# 3 apricot
# 4 mango
# dtype: object
343、pandas.Series.str.swapcase方法
343-1、语法
# 343、pandas.Series.str.swapcase方法
pandas.Series.str.swapcase()
Convert strings in the Series/Index to be swapcased.Equivalent to str.swapcase().Returns:
Series or Index of object.
343-2、参数
无
343-3、功能
将Series中每个字符串的大小写互换,也就是说,大写字母变成小写,小写字母变成大写。
343-4、返回值
返回一个pandas.Series对象,其中包含已进行大小写互换的字符串。
343-5、说明
无
343-6、用法
343-6-1、数据准备
无
343-6-2、代码示例
# 343、pandas.Series.str.swapcase方法
import pandas as pd
# 示例数据
data = pd.Series(['Apple', 'bAnAnA', 'ChErry', 'apricot', 'MANGO'])
# 大小写互换
result = data.str.swapcase()
print("Result (swapcase):")
print(result)
343-6-3、结果输出
# 343、pandas.Series.str.swapcase方法
# Result (swapcase):
# 0 aPPLE
# 1 BaNaNa
# 2 cHeRRY
# 3 APRICOT
# 4 mango
# dtype: object
344、pandas.Series.str.title方法
344-1、语法
# 344、pandas.Series.str.title方法
pandas.Series.str.title()
Convert strings in the Series/Index to titlecase.Equivalent to str.title().Returns:
Series or Index of object.
344-2、参数
无
344-3、功能
将Series中每个字符串中的每个单词的首字母转换为大写,而其他字母则转换为小写。
344-4、返回值
返回一个pandas.Series对象,其中包含已转换为标题格式的字符串。
344-5、说明
无
344-6、用法
344-6-1、数据准备
无
344-6-2、代码示例
# 344、pandas.Series.str.title方法
import pandas as pd
# 示例数据
data = pd.Series(['apple pie', 'BaNana Split', 'cherry tart', 'apricot jam', 'MANGO salad'])
# 转换为标题格式
result = data.str.title()
print("Result (title):")
print(result)
344-6-3、结果输出
# 344、pandas.Series.str.title方法
# Result (title):
# 0 Apple Pie
# 1 Banana Split
# 2 Cherry Tart
# 3 Apricot Jam
# 4 Mango Salad
# dtype: object
345、pandas.Series.str.translate方法
345-1、语法
# 345、pandas.Series.str.translate方法
pandas.Series.str.translate(table)
Map all characters in the string through the given mapping table.Equivalent to standard str.translate().Parameters:
table
dict
Table is a mapping of Unicode ordinals to Unicode ordinals, strings, or None. Unmapped characters are left untouched. Characters mapped to None are deleted. str.maketrans() is a helper function for making translation tables.Returns:
Series or Index.
345-2、参数
345-2-1、table(必须):一个翻译表,用于定义字符的替换规则,可以使用该方法创建一个翻译表。
345-3、功能
根据给定的转换表,将Series中的每个字符串的字符按照表中的映射进行替换,如果转换表将某些字符映射为None,那么这些字符会在结果字符串中被删除。
345-4、返回值
返回一个pandas.Series对象,其中包含了根据翻译表进行字符替换后的字符串。
345-5、说明
无
345-6、用法
345-6-1、数据准备
无
345-6-2、代码示例
# 345、pandas.Series.str.translate方法
import pandas as pd
# 示例数据
data = pd.Series(['hello world', 'goodbye moon', '123456'])
# 创建翻译表:将 'h' 替换为 'H',将 'o' 替换为 '0',删除 'e'
translation_table = str.maketrans({'h': 'H', 'o': '0', 'e': None})
# 使用translate进行字符替换
result = data.str.translate(translation_table)
print("Result (translate):")
print(result)
345-6-3、结果输出
# 345、pandas.Series.str.translate方法
# Result (translate):
# 0 Hll0 w0rld
# 1 g00dby m00n
# 2 123456
# dtype: object