字典

字典是 Python 语言中唯一的映射类型。一个字典对象是可变的,它是一个容器类型,能存储任意个数的 Python 对象,其中也包括其他容器类型。字典类型和序列类型容器类(列表、元组)的区别是存储和访问数据的方式不同。序列类型只用数字类型的键(从序列的开始起按数值顺序索引)。映射类型可以用其他对象类型做键;一般最常见的是用字符串做键(keys)。和序列类型的键不同,映射类型的键(keys)直接,或间接地和存储的数据值相关联。但因为在映射类型中,我们不再用"序列化排序"的键(keys),所以映射类型中的数据是无序排列的。

字典的条目被包含在大括号( { } ) 里,字典的创建如下所示:

>>> d1 = {}
>>> d2 = {"name": "huoty", "email": "sudohuoty@163.com"}
>>> d1, d2
({}, {'name': 'huoty', 'email': 'sudohuoty@163.com'})
>>> d3 = dict((['x', 1], ['y', 2]))
>>> d3
{'y': 2, 'x': 1}

访问字典中的值需要用字典的键,并用键查找操作符([])进行访问,如下所示:

>>> d = {"name": "huoty", "email":"sudohuoty@163.com"}
>>> d["name"]
'huoty'
>>> d["email"]
'sudohuoty@163.com'

如果要遍历字典,则需要用 for 进行迭代:

>>> for key in d:
...     print "key = %s, value = %s" % (key, d[key])
...
key = name, value = huoty
key = email, value = sudohuoty@163.com
>>> for key, val in d.items():
...     print "key = %s, value = %s" % (key, val)
...
key = name, value = huoty
key = email, value = sudohuoty@163.com

要更新(添加或修改)字典,如下所示:

>>> d
{'name': 'huoty', 'email': 'sudohuoty@163.com'}
>>> d["name"] = "Konghy"  # 更新
>>> d["addr"] = "beijing"  # 增加元素
>>> d
{'addr': 'beijing', 'name': 'Konghy', 'email': 'sudohuoty@163.com'}

删除字典元素或者字典本身:

>>> d
{'addr': 'beijing', 'name': 'Konghy', 'email': 'sudohuoty@163.com'}
>>> del d["addr"]  # 删除指定元素
>>> d
{'name': 'Konghy', 'email': 'sudohuoty@163.com'}
>>> d.clear()  # 删除所有条目
>>> d
{}
>>> del d  # 删除字典
>>> d
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'd' is not defined

映射类型操作符

字典可以与所有的标准类型操作符一起工作,但并不像序列那样支持拼接和重复,而比较运算符和成员关系运算符是可以应用于字典的。如下所示:

>>> d1 = {"abc": 123}
>>> d2 = {"abc": 456}
>>> d3 = {"abc": 123, 12.18: 25}
>>> d4 = {"xyz": 123}
>>> d1 > d2
False
>>> (d1 < d2) and (d3 < d4)
False
>>> (d2 < d3) and (d2 < d4)
True
>>> d3 < d4
False
>>> "abc" in d1
True
>>> "abc" in d4
False

字典的比较:

  • (1)首先比较字典的长度
  • (2)然后比较字典的键
  • (3)如果长度和键都相同,则再比较字典的值

映射类型的内建函数和工厂函数

基本函数:

函数 说明
type(obj) 工厂方法,会返回字典类型
str(obj) 工厂方法,返回该字典的字符串表示形式
cmp(boj) 比较字典大小,Python3已废弃
dict([container]) 创建字典的工厂函数。如果提供了容器类 (container) , 就用其中的条目填充字典,否则就创建一个空字典。
len(mapping) 返回映射的长度(键-值对的个数)
hash(obj) 返回 obj 的哈希值

内建方法:

方法 说明
dict.clear() 删除字典中所有元素
dict.copy() 返回字典(浅复制)的一个副本
dict.fromkeys(seq, val=None) 创建并返回一个新字典,以 seq 中的元素做该字典的键,val 做该字典中所有键对应的初始值(如果不提供此值,则默认为 None)
dict.get(key, default=None) 对字典 dict 中的键 key,返回它对应的值 value,如果字典中不存在此键,则返回 default 的值(注意,参数 default 的默认值为 None)
dict.has_key(key) 如果键(key)在字典中存在, 返回 True, 否则返回 False. 在 Python2.2 版本引入 in 和 not in 后,此方法几乎已废弃不用了,但仍提供一个可工作的接口
dict.items() 返回一个包含字典中(键, 值)对元组的列表
dict.keys() 返回一个包含字典中键的列表
iteritems(), iterkeys(), itervalues() 与它们对应的非迭代方法一样,不同的是它们返回一个迭代器,而不是一个列表
dict.pop(key[, default]) 和方法 get()相似,如果字典中 key 键存在,删除并返回 dict[key],如果 key 键不存在,且没有给出 default 的值,引发 KeyError 异常
dict.popitem() 删除并返回字典中任意的一个(key,value)对,如果字典为空会抛出 KeyError
dict.setdefault(key, default=None) 和方法 set()相似,如果字典中不存在 key 键,由 dict[key]=default 为它赋值
dict.update(dict2) 将字典 dict2 的键-值对添加到字典 dict
dict.values() 返回一个包含字典中所有值的列表

字典的键

  • 不允许一个键对应多个值

  • 键必须是可哈希的

集合类型

数学上, 把 set 称做由不同的元素组成的集合,集合(set)的成员通常被称做集合元素(set elements)。 Python 把这个概念引入到它的集合类型对象里。 集合对象是一组无序排列的可哈希的值。是的, 集合成员可以做字典中的键。 数学集合转为Python的集合对象很有效, 集合关系测试和union、intersection 等操作符在 Python 里也同样如我们所预想地那样工作。

和其他容器类型一样,集合支持用 in 和 not in 操作符检查成员, 由 len() 内建函数得到集合的基数(大小), 用 for 循环迭代集合的成员。但是因为集合本身是无序的,你不可以为集合创建索引或执行切片(slice)操作,也没有键(keys)可用来获取集合中元素的值。

集合(sets)有两种不同的类型,可变集合(set) 和 不可变集合(frozenset)。如你所想,对可变集合(set),你可以添加和删除元素,对 不可变集合(frozenset)则不允许这样做。请注意,可变集合(set)不是可哈希的,因此既不能用做字典的键也不能做其他集合中的元素。不可变集合(frozenset)则正好相反,即,他们有哈希值,能被用做字典的键或是作为集合中的一个成员。

集合与列表( [ ] )和字典( { } ) 不同,没有特别的语法格式。列表和字典可以分别用他们自己的工厂方法 list() 和 dict() 创建,这也是集合被创建的唯一方法 - 用集合的工厂方法 set() 和 frozenset():

>>> s = set("Hello World")
>>> s
set([' ', 'e', 'd', 'H', 'l', 'o', 'r', 'W'])
>>> t = frozenset("Hello Python")
>>> t
frozenset([' ', 'e', 'H', 'l', 'o', 'n', 'P', 't', 'h', 'y'])
>>> type(t)
<type 'frozenset'>
>>> type(s)
<type 'set'>
>>> len(s)
8
>>> len(t)
10
>>> s == t
False
>>> "k" in s
False
>>> "k" in t
False
>>> for i in s:
...     print i
...

e
d
H
l
o
r
W