第一次见这样的语法
本人之前一直是Java工程师,最近接触了一个Python项目,第一次看到如下的代码:
i = sum(letter in target_arr for letter in source_arr)
这条语句是计算source 与 target 数组中有几个单词是相同的。
当我第一眼看到这样的写法的时候,我的第一感觉是这样的。
我读书少,见识少,那是真不懂,于是赶紧孤狗一下,想要一探究竟。
原来这叫:生成器表达式
生成器表达式语法
生成器表达式(Generator Expression)是一种简洁高效地创建迭代器(Iterator)的方式。它类似于列表推导式(List Comprehension),但生成器表达式使用圆括号 () 而不是方括号 []。
生成器表达式的语法
(expression for item in iterable if condition)
-
expression:对每个元素进行的操作,生成迭代器中的值。
-
item:迭代变量,表示可迭代对象 iterable 中的每个元素。
-
iterable:可迭代对象,例如列表、元组、字符串等。
-
condition:可选的过滤条件,只有满足条件的元素才会被处理。
生成器表达式的特点 -
惰性求值: 生成器表达式不会一次性计算所有元素,而是按需生成。这样可以节省内存,特别是在处理大量数据时。
-
返回迭代器: 生成器表达式返回一个迭代器对象,可以通过 for 循环或 next() 函数来遍历其中的元素。
-
不可索引: 迭代器不支持索引操作,不能像列表那样通过下标访问元素。
生成器表达式的应用 -
过滤数据:
even_numbers = (x for x in range(10) if x % 2 == 0) # 偶数 -
映射数据:
squares = (x**2 for x in range(5)) # 平方数 -
组合数据:
pairs = ((x, y) for x in [1, 2] for y in [3, 4]) # [(1, 3), (1, 4), (2, 3), (2, 4)] -
传递给函数:
sum(x for x in range(100) if x % 3 == 0) # 3 的倍数之和
生成器表达式 vs. 列表推导式
特点 | 生成器表达式 | 列表推导式 |
---|---|---|
返回值 | 迭代器对象 | 列表 |
惰性求值 | 是 | 否 |
内存占用 | 低 | 高 |
适用场景 | 处理大量数据、只需遍历一次的数据 | 需要多次访问数据、需要索引操作的数据 |
案例分析
回到我们的案例中来,我们根据语法解释对我们文章开始的案例进行拆解。
i = sum(letter in target_arr for letter in source_arr)
(expression for item in iterable if condition)对应关系
语法元素 | 生成器表达式中的元素 | 解释 |
---|---|---|
expression | letter in target_arr | 对于每个 letter,判断它是否存在于target_arr 中,返回布尔值 |
item | letter | 迭代变量,表示 source_arr 中的每个元素 |
iterable | source_arr | 可迭代对象,源字符串数组 |
condition | (无) | 此处没有过滤条件,所有 letter 都会被处理 |
总结
- 生成器表达式会遍历 source_arr 中的每个 letter。
- 对于每个 letter,计算 letter in target_arr,得到一个布尔值(True 或 False)。
- sum 函数将这些布尔值相加,得到匹配的总次数,即 match_score。
注意事项
- 这里没有使用 if condition 部分,表示不对元素进行过滤,所有元素都会参与计算。
- 由于 Python 中 True 被视为 1,False 被视为 0,所以 sum 函数可以直接对布尔值求和。
希望这个详细的语法讲解能帮助您更好地理解生成器表达式的语法和用法!
关注我的公众号
欢迎大家关注、点赞、转发,一起交流软件开发、架构设计、云原生技术。