Filter()函数用于过滤可迭代对象中满足条件的元素,语法为filter(function, iterable);当function为None时,自动保留真值元素;可通过自定义函数或Lambda表达式筛选数字、字符串、字典等数据;常用于数据清洗,如筛选偶数、长字符串或年龄大于18的用户;结合lambda使用更简洁,虽可被列表推导式替代,但在函数式编程中仍有优势。

python 中的 filter() 函数是一个内置函数,用来过滤可迭代对象中的元素。它会根据指定的条件,保留满足条件的元素,生成一个新的迭代器。这个函数在数据清洗、筛选等场景中非常实用。
filter函数的基本语法
filter() 函数的语法如下:
filter(function, iterable)
- function:一个函数,用来判断每个元素是否符合条件。返回 True 表示保留,False 表示过滤掉。
- iterable:要过滤的可迭代对象,比如列表、元组、字符串等。
注意:如果 function 为 None,则 filter 会直接保留所有“真值”元素(即非空、非0、非None等)。
使用自定义函数进行过滤
我们可以通过定义一个函数,然后将其作为第一个参数传入 filter()。例如,从列表中筛选出所有的偶数:
立即学习“Python免费学习笔记(深入)”;
def is_even(x):
return x % 2 == 0
numbers = [1, 2, 3, 4, 5, 6, 7, 8]
evens = list(filter(is_even, numbers))
print(evens) # 输出: [2, 4, 6, 8]
这里 is_even 函数判断一个数是否为偶数,filter 将其应用到 numbers 的每个元素上,最终返回满足条件的元素。
使用 lambda 表达式简化代码
对于简单的判断逻辑,可以直接用 lambda 表达式,让代码更简洁:
numbers = [1, 2, 3, 4, 5, 6]
evens = list(filter(lambda x: x % 2 == 0, numbers))
print(evens) # 输出: [2, 4, 6]
lambda x: x % 2 == 0 相当于一个匿名函数,功能和上面的 is_even 一样。
过滤字符串或复杂数据类型
filter() 不仅适用于数字,也可以用于字符串或其他类型的数据。例如,从字符串列表中筛选出长度大于3的字符串:
words = [‘cat’, ‘dog’, ‘python‘, ‘js‘, ‘hello’]
long_words = list(filter(lambda w: len(w) > 3, words))
print(long_words) # 输出: [‘python’, ‘hello’]
还可以用于字典列表的筛选。比如筛选年龄大于18的用户:
users = [
{‘name’: ‘Alice’, ‘age’: 25},
{‘name’: ‘Bob’, ‘age’: 17},
{‘name’: ‘Charlie’, ‘age’: 20}
]
adults = list(filter(lambda u: u[‘age’] > 18, users))
print(adults) # 输出: [{‘name’: ‘Alice’, ‘age’: 25}, {‘name’: ‘Charlie’, ‘age’: 20}]
filter与None函数的用法
当第一个参数为 None 时,filter 会自动过滤掉所有“假值”元素:
data = [0, 1, ”, ‘hello’, None, [], [1, 2], False, True]
truthy_values = list(filter(None, data))
print(truthy_values) # 输出: [1, ‘hello’, [1, 2], True]
这在清理数据时特别有用,比如去除空字符串、None 或 0 值。
基本上就这些。filter 函数结合函数或 lambda 使用,能高效地完成元素筛选任务。虽然现在很多人也用列表推导式替代 filter,但在处理大型数据流或与其他函数式编程工具配合时,filter 依然有它的优势。掌握它的用法,能让代码更清晰、更具表达力。不复杂但容易忽略细节,多练习几次就能熟练使用了。