Python 中的 defaultdict 有什么用的？

2023年 12月 13日开发运维贤蛋大眼萌

在 Python 的标准库中，有一个非常有用的数据结构工具叫做 defaultdict。它是 collections 模块的一部分，提供了一种特殊的字典类型，可以在访问不存在的键时返回一个默认值。本文将介绍 defaultdict 的用法，包括其基本语法、常见用例。

1. 基本语法

defaultdict 类的构造函数与普通字典的构造函数类似，但需要传入一个默认工厂函数作为参数。默认工厂函数用于在访问不存在的键时返回一个默认值。以下是 defaultdict 的基本语法：

from collections import defaultdict

d = defaultdict(default_factory)

在上述代码中，default_factory 是一个函数对象，用于定义默认值的生成规则。

2. 常见用例

a. 计数器

一个常见的用例是使用 defaultdict 实现计数器。假设我们有一个列表，想要统计每个元素出现的次数。可以使用 defaultdict 来简化代码：

from collections import defaultdict

counter = defaultdict(int)
data = [1, 2, 3, 1, 2, 3, 4, 5, 4, 3, 2, 1]

for num in data:
   counter[num] += 1

print(counter)

输出：

defaultdict(, {1: 3, 2: 3, 3: 3, 4: 2, 5: 1})

解析：在上述代码中，我们创建了一个 defaultdict 对象 counter，并将 int 函数作为默认工厂函数。在遍历列表 data 时，我们对 counter[num] 进行自增操作，由于初始时 counter 中不存在键 num，defaultdict 会自动使用 int 函数生成一个默认值 0，然后执行自增操作。最终，我们得到了每个元素出现次数的统计结果。

b. 分组

另一个常见的用例是使用 defaultdict 进行分组。假设我们有一个包含学生姓名和对应班级的列表，想要按班级将学生分组。可以使用 defaultdict 来实现：

from collections import defaultdict

students = [('Alice', 'A'), ('Bob', 'B'), ('Charlie', 'A'), ('Dave', 'B')]

grouped_students = defaultdict(list)

for name, group in students:
   grouped_students[group].append(name)

print(grouped_students)

输出：

defaultdict(, {'A': ['Alice', 'Charlie'], 'B': ['Bob', 'Dave']})

解析：在上述代码中，我们创建了一个 defaultdict 对象 grouped_students，并将 list 函数作为默认工厂函数。在遍历学生列表 students 时，我们将每个学生的姓名 name 添加到对应班级 group 的列表中。由于初始时 grouped_students 中不存在键 group，defaultdict 会自动使用 list 函数生成一个空列表，然后将学生姓名添加到列表中。最终，我们得到了按班级分组的学生列表。