collections.defaultdict()的用法和同普通dict的区别以及示例
在说明collections.defaultdict()
之前,我们首先要提一下setdefault()
方法。
Python 字典 setdefault() 函数和get()方法类似, 如果键不存在于字典中,将会添加键并将值设为默认值。
1 | dict.setdefault(key, default=None) |
1 | >>> dict = {'name':'Alex','age':23} |
##collections.defaultdict()
Python中通过Key访问字典,当Key不存在时,会引发‘KeyError’异常。为了避免这种情况的发生,可以使用collections类中的defaultdict()方法来为字典提供默认值。
语法格式:
1 | collections.defaultdict([default_factory[, …]]) |
该函数返回一个类似字典的对象。defaultdict是Python内建字典类(dict)的一个子类,它重写了方法 missing(key),增加了一个可写的实例变量default_factory,实例变量default_factory被missing()方法使用,如果该变量存在,则用以初始化构造器,如果没有,则为None。其它的功能和dict一样。
第一个参数为default_factory属性提供初始值,默认为None;其余参数包括关键字参数(keyword arguments)的用法,和dict构造器用法一样。
使用list作第一个参数,可以很容易将键-值对序列转换为列表字典。collections.defaultdict(list)使用起来效果和我们上面提到的dict.setdefault()比较相似,这种方法会和dict.setdefault()等价,但是要更快。
1 | from collections import defaultdict |
运行结果为
1 | [('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])] |
当字典中没有的键第一次出现时,default_factory自动为其返回一个空列表,list.append()会将值添加进新列表;再次遇到相同的键时,list.append()将其它值再添加进该列表。
dict.setdefault()的用法:
1 | s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)] |
运行结果:
1 | {'yellow': [1, 3], 'blue': [2, 4], 'red': [1]} |
将default_factory设为int时,可以被用来计数
defaultdict(int) 这里的d其实是生成了一个默认为0的带key的数据字典。你可以想象成 d[key] = int default ,d[k]所以可以直接读取 d[“m”] += 1 就是d[“m”] 就是默认值 0+1 = 1
1 | from collections import defaultdict |
结果:
1 | defaultdict(<class 'int'>, {'m': 1, 'i': 4, 's': 4, 'p': 2}) |
字符串中的字母第一次出现时,字典中没有该字母,default_factory函数调用int()为其提供一个默认值0,加法操作将计算出每个字母出现的次数。
default_factory设为set时,可以用defaultdict建立集合字典(a dictionary of sets)。
1 | from collections import defaultdict |
运行结果:
1 | defaultdict(<class 'set'>, {'red': {1, 3}, 'blue': {2, 4}}) |