关于Python collections.defaultdict()与dict的使用和区别

collections.defaultdict()的用法和同普通dict的区别以及示例

dict.setdefault()

在说明collections.defaultdict()之前，我们首先要提一下setdefault()方法。

Python 字典 setdefault() 函数和get()方法类似, 如果键不存在于字典中，将会添加键并将值设为默认值。

1	dict.setdefault(key, default=None)

key – 查找的键值
default – 键不存在时，需要设置的默认值
返回值：如果字典中包含有给定键，则返回该键对应的值，否则返回为该键设置的值。

>>> dict = {'name':'Alex','age':23}
>>> print("Value : %s" %dict.setdefault('name',None))
Value : Alex
>>> print("Value : %s" %dict.setdefault('sex','man'))
Value : man
>>> dict
{'name': 'Alex', 'age': 23, 'sex': 'man'}

##collections.defaultdict()

Python中通过Key访问字典，当Key不存在时，会引发‘KeyError’异常。为了避免这种情况的发生，可以使用collections类中的defaultdict()方法来为字典提供默认值。

语法格式：

1	collections.defaultdict([default_factory[, …]])

该函数返回一个类似字典的对象。defaultdict是Python内建字典类（dict）的一个子类，它重写了方法 missing(key)，增加了一个可写的实例变量default_factory,实例变量default_factory被missing()方法使用，如果该变量存在，则用以初始化构造器，如果没有，则为None。其它的功能和dict一样。

第一个参数为default_factory属性提供初始值，默认为None；其余参数包括关键字参数（keyword arguments）的用法，和dict构造器用法一样。

list

使用list作第一个参数，可以很容易将键-值对序列转换为列表字典。collections.defaultdict(list)使用起来效果和我们上面提到的dict.setdefault()比较相似，这种方法会和dict.setdefault()等价，但是要更快。

from collections import defaultdict
s=[('yellow',1),('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d=defaultdict(list)
for k, v in s:
    d[k].append(v)
a=sorted(d.items())
print(a)

运行结果为

1	[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

当字典中没有的键第一次出现时，default_factory自动为其返回一个空列表，list.append()会将值添加进新列表；再次遇到相同的键时，list.append()将其它值再添加进该列表。

dict.setdefault()的用法：

s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d={}
for k, v in s:
    d.setdefault(k,[]).append(v)
print('\n',d)
a=sorted(d.items())
print('\n',a)

运行结果：

1
2
3

{'yellow': [1, 3], 'blue': [2, 4], 'red': [1]}

[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

int

将default_factory设为int时，可以被用来计数

defaultdict(int) 这里的d其实是生成了一个默认为0的带key的数据字典。你可以想象成 d[key] = int default ，d[k]所以可以直接读取 d[“m”] += 1 就是d[“m”] 就是默认值 0+1 = 1

from collections import defaultdict
s = 'mississippi'
d = defaultdict(int)
for k in s:
    d[k] += 1
print('\n',d)
a=sorted(d.items())
print('\n',a)

结果:

1
2
3

defaultdict(<class 'int'>, {'m': 1, 'i': 4, 's': 4, 'p': 2})

[('i', 4), ('m', 1), ('p', 2), ('s', 4)]

字符串中的字母第一次出现时，字典中没有该字母，default_factory函数调用int()为其提供一个默认值0,加法操作将计算出每个字母出现的次数。

set

default_factory设为set时，可以用defaultdict建立集合字典（a dictionary of sets）。

from collections import defaultdict
s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]
d = defaultdict(set)
for k, v in s:
    d[k].add(v)
print('\n',d)
a=sorted(d.items())
print('\n',a)

运行结果：

1
2
3

defaultdict(<class 'set'>, {'red': {1, 3}, 'blue': {2, 4}})

[('blue', {2, 4}), ('red', {1, 3})]