首页 > 代码库 > 第4章 字典:当索引不好用时

第4章 字典:当索引不好用时

  通过名字引用值的数据结构,这种结构类型称为映射(mapping)。字典是Python中唯一内建的映射类型。字典中的值并没有特殊的顺序,但是都存储在一个特定的键(key)里。键可以是数字、字符串甚至是元组。

4.1 字典的使用

  现实中的字典及在Python中的字典都进行了构造,从而可以轻松查到某个特定的词语(key),从而找到它的定义(值)。

  某些情况下,字典比列表更加适用,比如:

  1.表征游戏棋盘的状态,每个键都是由坐标值组成的元组;

  2.存储文件修改次数,用文件名作为键;

  3.数字电话/地址簿

  使用列表实现根据人名查找电话号码的需求:

>>> names = ["Alex","Beth","Cecil","Earl"]
>>> numbers = ["2341","9102","3158","5551"]
>>> numbers[names.index("Cecil")]
3158

  这样做虽然可行,但是并不实用。假如phonebook是一个字典,Cecil是一个key,就会如下查询:

>>> phonebook["Cecil"]
3158

4.2 创建和使用字典

  字典可以通过下面的方式创建:

>>> phonebook = {"Alex":"2341","Bech":"9102","Cecil":"3158"}

  字典由多个键及与其对应的值构成的对组成(键key/值values)。例子中,名字是键,电话号码是值。每个键和它的值之间用冒号(:)隔开,项之间用逗号(,)隔开,而整个字典是由一对大括号括起来。空字典(不包括任何项)由两个大括号组成,{}。字典中的键是唯一的,而值并不唯一。

4.2.1 dict函数

  可以用dict函数,通过其他映射(比如其他字典)或者(键,值)这样的序列对建立字典。

>>> items = [("name","alex"),("age","23")]
>>> d = dict(items)
>>> d
{name: alex, age: 23}
>>> d["name"]
alex

  dict函数也可以通过关键字参数来创建字典,如下列所示:

>>> d = dict(name="alex",age=23)
>>> d
{name: alex, age: 23}

4.2.2 基本字典操作

  字典的基本行为在很多方面与序列(sequence)类似:

  1.len(d)返回字典d中项(键-值对)的数量;

  2.d[k]返回关联到键k上的值;

  3.d[k]=v将值v关联到键k上;

  4.del d[k]删除键k的项;

  5.k in d检查d中是否含有键k的项。

  尽管字典和列表有很多特性相同,但也有下面一些重要的区别。

  1.键类型:字典的键不一定为整数类型(但也可能是),也可能是其他不可变类型,比如浮点型(实型)、字符串或者元组。

  2.自动添加:即使键在字典中不存在,也可以为它分配一个值,建立新的项。而列表(不使用append或其他类似操作的情况下)不能将值关联到列表范围之前的索引上。

  3.成员资格:表达式k in d(d为字典)查找的是键,而不是值。表达式v in l(l为列表)则用来查找值,而不是索引。

>>> x = []
>>> x[42] = "Foobar"
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
IndexError: list assignment index out of range
>>> x = {}
>>> x[42] = "Foobar"
>>> x
{42: Foobar}
>>>

  代码清单4-1是电话本例子的代码:

技术分享
#简单的名称、电话、地址数据库,根据输入的人名,查找对应的电话号码或者地址
people = {
    "alex":{
        "phone":"1234",
        "addr":"BeiJing"
},
    "john":{
        "phone":"3456",
        "addr":"HeBei"
},
    "smith":{
        "phone":"2504",
        "addr":"FuNan"
}
}
#设置电话或地址的标签
labels = {
    "phone":"phone number",
    "addr":"address"
}
name = input("Name:")
#查找电话还是地址
request = input("phone number(p) or address(a)?")
#关联用户的输入到相应的标签上
key = request
if request == "p":key = "phone"
if request == "a":key = "addr"

#如果名字是字典中有效键才打印信息
if name in people:
    print("%s‘s %s is %s."%(name,labels[key],people[name][key]))
View Code

4.2.3 字典的格式化字符串

  在第3章,已经见过如何使用字符串格式化功能来格式化元组中的所有值。如果使用(只以字符串作为键的)字典而不是元组来做这个工作,会使字符串格式化更酷一些。在每个转换说明符中的%字符后面,加上(用圆括号括起来的)键,,后面跟上其他说明元素。

>>> phonebook = {"Alex":"2341","Bech":"9102","Cecil":"3158"}
>>> "Cecil‘s phone number is %(Cecil)s." % phonebook
"Cecil‘s phone number is 3158."
技术分享
>>> template = ‘‘‘<html>
<head><title>%(title)s</title></head>
<body>
<h1>%(title)s</h1>
<p>%(text)s</p>
</body>‘‘‘
>>> data = http://www.mamicode.com/{"title":"My Home Page","text":"Welcome to my home page!"}
>>> print(template % data)
<html>
<head><title>My Home Page</title></head>
<body>
<h1>My Home Page</h1>
<p>Welcome to my home page!</p>
</body>
View Code

4.2.4 字典方法

  字典的方法有:

  1.clear

  clear方法清除字典中所有的项。无返回值(或者返回None)。

>>> d = {}
>>> d["name"] = "alex"
>>> d["age"] = 23
>>> d
{name: alex, age: 23}
>>> returned_values = d.clear()
>>> d
{}
>>> print(returned_values)
None

  考虑一下两种情况。下面是第一种

>>> x = {}
>>> y = x
>>> x["key"] = "values"
>>> x
{key: values}
>>> x = {}
>>> y
{key: values}
>>>

  然后是第2种情况:

>>> x = {}
>>> y = x
>>> x["key"] = "values"
{key: values}
>>> x.clear()
>>> y
{}
>>>

  两种情况中,x和y最初对应同一个字典。情况1中,通过将x关联到一个新的空字典来"清空"它,这对y一点影响也没有,它还关联到原先的字典。这可能是所需要的行为,但是如果真的想清空原始字典中所有的元素,必须使用clear方法。正如情况2所示,y随后也被清空了。

  2.copy

  copy方法返回一个具有相同键-值对的新字典(这个方法实现的是浅复制(shallow copy),因为值本身就是相同的,而不是副本)。

>>> x = {"username":"admin","machines":["foo","bar","baz"]}
>>> y = x.copy()
>>> y
{machines: [foo, bar, baz], username: admin}
>>> y["username"] = "mth"
>>> y["machines"].remove("bar")
>>> y
{machines: [foo, baz], username: mth}
>>> x
{machines: [foo, baz], username: admin}

  可以看到,当在副本中替换值的时候,原始字典不受影响,但是,如果修改了某个值(原地修改,而不是替换),原始的字典也会改变,因为同样的值也存储在原字典中。为避免这个问题的一种方法就是使用深复制(deep copy),复制其包含所有的值。可以使用copy模块的deepcopy函数来完成操作:

>>> from copy import deepcopy
>>> d = {}
>>> d["names"] = ["alex","john"]
>>> c = d.copy()
>>> dc = deepcopy(d)
>>> d["names"].append("tenglan")
>>> c
{names: [alex, john, tenglan]}
>>> dc
{names: [alex, john]}

  3.fromkeys

  fromkeys方法适用给定的键建立新的字典,每个键默认对应的值为None。

>>> {}.fromkeys(["name","age"])
{name: None, age: None}
>>>

>>> dict.fromkeys(["name","age"])
{‘name‘: None, ‘age‘: None}
>>>

  第一个例子是先构造了一个空字典,然后调用它的fromkeys方法,建立另外一个字典。也可以直接在所有字典的类型dict上面调用方法。如果不想使用None作为默认值,也可以自己提供默认值。

>>> dict.fromkeys(["name","age"],"unknown")
{name: unknown, age: unknown}
>>>

  4.get

  get方法是个更宽松的访问字典项的方法。一般如果试图访问字典中不存在的项时会出错:

>>> d = {}
>>> print (d["name"])
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: name

  而用get就不会:

>>> print (d.get("name"))
None
>>>

  当使用get访问一个不存在的键时,没有任何异常,而得到了None值。自己也可以定"默认"值,替换None:

>>> d.get("name","N/A")
N/A

  如果键值存在,get就和普通的字典查询一样:

>>> d["name"] = "alex"
>>> d.get("name")
alex

  下面代码演示使用get访问的示例,是4-1程序的修改版本。

技术分享
#简单的名称、电话、地址数据库,根据输入的人名,查找对应的电话号码或者地址
people = {
    "alex":{
        "phone":"1234",
        "addr":"BeiJing"
},
    "john":{
        "phone":"3456",
        "addr":"HeBei"
},
    "smith":{
        "phone":"2504",
        "addr":"FuNan"
}
}
#设置电话或地址的标签
labels = {
    "phone":"phone number",
    "addr":"address"
}
name = input("Name:")
#查找电话还是地址
request = input("phone number(p) or address(a)?")
#关联用户的输入到相应的标签上,如果输入的信息不是p或者a
key = request
if request == "p":key = "phone"
if request == "a":key = "addr"
#使用get()提供默认值
person = people.get(name,{})
label = labels.get(key,key)
result = person.get(key,"not available")

print("%s‘s %s is %s."%(name,label,result))

输出结果:
Name:Gumby
phone number(p) or address(a)?weigth
Gumbys weigth is not available.
View Code

  6.items

  items方法将所有的字典项以列表方式返回,这些列表项中的每一项都来自于(键,值)。

>>> d = {"title":"Python Web Site","url":"www.python.org","spam":0}
dict_items([(url, www.python.org), (title, Python Web Site), (spam, 0)])

  7.keys

  keys方法将字典中的键以列表形式返回。

>>> info = {stu1102: LongZe Luola, stu1103: XiaoZe Maliya}
>>> info.keys()
dict_keys([stu1102, stu1103])

  8.values

  values方法以列表的形式返回字典中的值。

>>> info = {stu1102: LongZe Luola, stu1103: XiaoZe Maliya}
>>> info.values()
dict_values([LongZe Luola, XiaoZe Maliya])

  9.pop

  pop方法用来去除指定的键值。

>>> info = {stu1102: LongZe Luola, stu1103: XiaoZe Maliya}
>>> info.pop("stu1102")
>>> info
{stu1103: XiaoZe Maliya}

  10.popitem

  随机移除字典中的项

  11.setdefault

  setdefault方法在某种程度上类似于get方法,就是能够获得与给定键相关的值,除此之外,setdefault还能在字典中不含有给定键的情况下设定相应的键值。

>>> d = {}
>>> d.setdefault("name","N/A") #当键值不存在,更新字典
N/A
>>> d
{name: N/A}
>>> d["name"] = "Gumby"
>>> d.setdefault("name","N/A") #当键值存在,返回对应的值
Gumby
>>> d
{name: Gumby}

  当键不存在的时候,setdefault返回默认值并相应的更新字典,如果键存在,就返回与其对应的值,但不改变字典。如果不设定,默认值是None。

  12.update

  update方法可以利用一个字典项更新另外一个字典:

>>> d = {"title":"Python Web Site","url":"http://www.python.org"}
>>> x = {"title":"Python Language Website","changed":"Mar 14 22:02:15 MET 2016"}
>>> d.update(x)
>>> d
{url: http://www.python.org, title: Python Language Website‘, ‘changed‘:‘Mar 14 22:02:15 MET 2016‘}

  新字典中的项会被添加到旧的字典中,若有相同的键则会进行覆盖。

4.3 小结

  本章主要有以下内容:

  映射:映射可以使用任何不可变对象标识元素。最常用的类型是字符串和元组。Python唯一内建的映射类型是字典。

  利用字典格式化字符串:可以通过在格式化说明符中包括名称(键)来对字典应用字符串格式化操作。当在字符格式化中使用元组时,还需要对元组中一个元素都设定"格式化说明符"。

  字典的方法:update,values,key,pop等

4.3.1 本章的新函数

  新函数如表4-1所示。

                    技术分享

 

第4章 字典:当索引不好用时