案例学Python：filter()函数的用法，高级！

2024 年 05 月 08 日

39 次浏览

1824字数

Python的 filter()函数是一种内置的高级迭代器，它能够根据提供的函数对序列（如列表、元组等）进行过滤操作，从而生成一个包含符合条件元素的新迭代器。filter()函数在处理大量数据时尤为有用，因为它仅保留满足条件的项目，从而帮助减小内存占用并提高程序效率。下面，我们通过实例来深入理解 filter()函数的用法及其背后的高级概念。

基本语法

filter(function, iterable)

function: 这是一个可调用对象（通常是函数），它接受一个元素并返回一个布尔值（True 或 False）。如果该函数返回 True，则对应的元素会被保留在结果中；反之，则被过滤掉。
iterable: 这是一个可迭代对象（如列表、元组、字符串等），filter()将会遍历这个对象。

示例与解析

简单示例：筛选偶数

假设我们有一个整数列表，想要筛选出所有的偶数。

numbers = [1, 2, 3, 4, 5, 6]
even_numbers = filter(lambda x: x % 2 == 0, numbers)

# 输出结果
print(list(even_numbers))  # 输出: [2, 4, 6]

在这个例子中，我们使用了匿名函数 lambda x: x % 2 == 0作为 filter()的第一个参数，它检查每个元素是否为偶数。filter()遍历 numbers列表，并应用这个函数，最终生成一个只包含偶数的迭代器。

实际应用：过滤空字符串

在处理用户输入或从文件读取数据时，经常需要去除空字符串或空白项。

data = ["apple", "", "banana", " ", "cherry", ""]
non_empty_items = filter(None, data)

# 输出结果
print(list(non_empty_items))  # 输出: ['apple', 'banana', ' ', 'cherry']

这里，我们没有提供一个显式的函数，而是直接传递了 None作为 filter()的第一个参数。这实际上等价于使用了 bool函数作为筛选条件，即只有非零、非空的元素才会被保留。注意，这个例子中字符串" "（一个空格）也被视为非空元素。

高级用法：结合自定义函数

假定我们有一个学生分数列表，需要找出所有及格（分数≥60）的学生。

def is_pass(score):
    return score >= 60

scores = [55, 62, 78, 45, 90, 38]
passing_scores = filter(is_pass, scores)

# 输出结果
print(list(passing_scores))  # 输出: [62, 78, 90]

通过定义一个独立的函数 is_pass()，我们不仅使代码更加清晰易读，也增强了代码的重用性。filter()函数利用这个外部定义的函数来决定哪些分数应该被保留。

性能与内存考虑

filter()返回的是一个迭代器而非列表或其他具体容器，这意味着它不会立即计算所有结果，而是在需要时逐个产生。这对于处理大规模数据集尤为重要，因为它可以有效减少内存占用。然而，一旦转换为列表或其他不可变序列（如通过 list()），所有元素将被一次性计算并存储，此时会消耗相应的内存资源。

总结

filter()函数是Python中处理序列数据的强大工具，它允许我们高效地根据条件过滤元素。通过结合匿名函数、常规函数或直接利用Python的内置逻辑，filter()提供了灵活且高效的过滤机制，尤其在大数据处理和内存敏感的应用中展现出其价值。掌握 filter()的使用，不仅能提升代码的可读性和效率，还能更好地适应Python的函数式编程风格。

案例学Python：filter()函数的用法，高级！