【免费】字典和集合1资源-CSDN文库

python

需积分: 0 33 浏览量 2022-08-03 13:56:17 上传评论收藏 251KB PDF 举报

资源详情

资源评论

资源推荐

字典和集合

字典和集合的实现都依赖于散

表

泛映射类型

collections.abc 模块中有

Mapping 和 MutableMapping

这两个抽象基类

为 dict 和其他类似的类型定义形

式接

然󰖳，󰴬抽象映射类型般会

直接继承这些抽象基类，它们会

直接对 dict 或是

collections.User.Dict 进󰢩扩

展。

这些抽象基类的主要作󰉁是作为

形式化的档，它们定义构建

个映射类型所需要的最基本的

接。

标准库󰮟的所有映射类型都是

󰉁 dict 来实现的，因此它们有个

共同的限制，即只有可散的数

据类型才能󰉁作这些映射󰮟的键

（只有键有这个要求，值并需

要是可散的数据类型）。

如果个对象是可散的，那么

在这个对象的󰈿命周期中，它的

散值是变的，󰖳且这个对象

需要实现 __hash__() 法。

另外可散对象还要有 __qe__()

法，这样才能跟其他键做

较。

字典推导

字典推导（dictcomp）可以从任

何以键值对作为元素的可迭代对

象中构建出字典。

常󰤁的映射法

通过查找来插新值

update 法处󰇹参数 m 的

式，是典型的“鸭类型” 。

可以󰉁个映射对象来新建个

映射对象，也可以󰉁包含 (key,

value) 元素的可迭代对象来初始

化个映射对象。

󰉁setdefault处󰇹找到的键

可以󰉁 d.get(k, default) 来代替

d[k]，给找到的键个默认的

返回值（这处󰇹 KeyError 要

少）

dict.get 并是处󰇹找到的键

的最好法

dict.setdefault

映射的弹性键查询

单纯地查找取值

有时候为起󰤁，就算某个

键在映射󰮟存在，我们也希望

在通过这个键读取值的时候能得

到个默认值。

defaultdict：处󰇹找到的键的

个选择

在实化个 defaultdict 的时

候，需要给构造法提供个可

调󰉁对象，这个可调󰉁对象会在

__getitem__ 碰到找到的键的

时候被调󰉁，让 __getitem__ 返

回某种默认值。

dd = defaultdict(list)，键’new-

key’存在时，dd[‘new-key’]会

进󰢩：

(1) 调󰉁 list() 来建󰐩个新

表。

(2) 把这个新表作为值，'new-

key' 作为它的键，放到 dd 中。

(3) 返回这个表的引󰉁。

如果在创建 defaultdict 的时候

没有指定 default_factory，查询

存在的键会触发KeyError。

特殊法 __missing__。它会在

defaultdict 遇到找到的键的时

候调󰉁 default_factory

所有的映射类型在处󰇹找到的

键的时候，都会牵扯到

__missing__ 法。

__missing__ 法只会被

__getitem__ 调󰉁（如在表达

式 d[k] 中）。

重写__missing__法时要注意

__getitem__和__contains__

法，以免被递归调󰉁。

字典的变种

collections.OrderedDict

这个类型在添加键的时候会保持

顺序，因此键的迭代次序总是

致的。

collections.ChainMap

该类型可以容纳数个同的映射

对象，然后在进󰢩键查找操作的

时候，这些对象会被当作个整

体被逐个查找，直到键被找到为

。

这个功能在给有嵌套作󰉁域的语

󰤛做解释的时候很有󰉁，可以

󰉁个映射对象来代表个作󰉁

域的上下。

collections.Counter

这个映射类型会给键准备个整

数计数。

每次新个键的时候都会增加

这个计数。所以这个类型可以

󰉁来给可散表对象计数，或者

是当成多重集来󰉁

colllections.UserDict

把标准 dict 󰉁纯 Python 实现

遍。

类化UserDict

就创造󰙵定义映射类型来说，以

UserDict 为基类，总以普通的

dict 为基类要来得。

倾向于从 UserDict 󰖳是从

dict 继承的主要原因是，后者有

时会在某些法的实现上󰨔些

捷径，导致我们得在它的

类中重写这些法，但是

UserDict 就会带来这些问题。

UserDict 并是 dict 的类，

但是 UserDict 有个叫作data

的属性，是 dict 的实，这个属

性实际上是 UserDict 最终存储

数据的地。

UserDict 的类就能在实现

__setitem__ 的时候避免必要

的递归，也可以让 __contains__

󰮟的代码简洁。

因为 UserDict 继承的是

MutableMapping，所以

StrKeyDict 󰮟剩下的那些映射类

型的法都是从 UserDict、

MutableMapping 和 Mapping

这些超类继承󰖳来的。

MutableMapping.update

Mapping.get

可变映射类型

types 模块中引个封装类

名叫 MappingProxyType

如果给这个类个映射，它会返

回个只读的映射视图。虽然是

个只读视图，但是它是动态的。

集合论

集合的本质是许多唯对象的聚

集。因此，集合可以󰉁于去重

集合中的元素必须是可散的，

set 类型本身是可散的，但

是 frozenset 可以。

速度极快的查找功能（这也得归

功于它背后的散表）

集合还实现很多基础的中缀运

算符

a | b 返回的是它们的合集

a & b 得到的是交集

a - b 得到的是差集

集合字󰴯󰮢

除空集之外，集合的字󰴯󰮢——

{1}、{1, 2}，等等

如果是空集，那么必须写成 set()

的形式。

如果只是写成 {} 的形式，跟以前

样，你创建的其实是个空字

典。

像 {1, 2, 3} 这种字󰴯󰮢法相

于构造法（set([1, 2, 3])）要

快且读。

󰉁 dis.dis（反汇编函数）来看看

两个法的字节码的同

Python 󰮟没有针对 frozenset

的特殊字󰴯󰮢法，我们只能采

󰉁构造法。

集合的操作

有些运算符和法会对集合做就

地修改（像 &=、

diﬀerence_update，等等）

frozenset 也会实现这些操作

dict和set的背后

字典中的散表

散表其实是个稀疏数组（总

是有空󰋏元素的数组称为稀疏数

组）。

散表󰮟的单元通常叫作表元

（bucket）。在 dict 的散表

当中，每个键值对都占󰉁个表

元，每个表元都有两个部分，

个是对键的引󰉁，另个是对值

的引󰉁。

所有表元的致，所以可以

通过偏移󰮢来读取某个表元。

如果要把个对象放散表，

那么󰶳先要计算这个元素键的散

值。Python 中可以󰉁hash()

法来做这件事情

1. 散值和相等性

内置的 hash() 法可以󰉁于所

有的内置类型对象。如果是󰙵定

义对象调󰉁 hash() 的话，实际

上运󰢩的是󰙵定义的

__hash__。

如果两个对象在较的时候是相

等的，那它们的散值必须相

等，否则散表就能正常运󰢩

。

为让散值能够胜任散表索

引这󰤐󰚬，它们必须在索引空

间中尽󰮢分散开来。

在最󰇹想的状况下，越是相似但

相等的对象，它们散值的差

别应该越。

2. 散表算法

为获取 my_dict[search_key]

背后的值，Python 󰶳先会调󰉁

hash(search_key) 来计算

search_key 的散值，把这个值

最低的位数字当作偏移󰮢，在

散表󰮟查找表元（具体取

位，得看当前散表的）。

若找到的表元是空的，则抛出

KeyError 异常。

若是空的，则表元󰮟会有对

found_key:found_value。这时

候 Python 会检验 search_key

== found_key 是否为真，如果

它们相等的话，就会返回

found_value。

如果 search_key 和 found_key

匹配的话，这种情况称为散

冲突。

因为，散表所做的其实是把随

机的元素映射到只有位的数字

上，󰖳散表本身的索引只依

赖于这个数字的部分。

为解决散冲突，算法会在散

值中另外再取位，然后󰉁特

殊的法处󰇹下，把新得到的

数字再当作索引来寻找表元。

添加新元素和新现有键值的操

作乎跟上󰴯样

只过对于前者，在发现空表元

的时候会放个新元素

对于后者，在找到相对应的表元

后，原表󰮟的值对象会被替换成

新值。

另外在插新值时，Python 可

能会按照散表的拥挤程度来决

定是否要重新分配内存为它扩

容。

如果增加散表的，那散

值所占的位数和󰉁作索引的位

数都会随之增加，这样做的󰋴的

是为减少发󰈿散冲突的概

率。

dict的实现及其导致的结果

1. 键必须是可散的

个可散的对象必须满󰨤

(1) 持 hash() 函数，并且通过

__hash__() 法所得到的散值

是变的。

(2) 持通过 __eq__() 法来检

测相等性。

(3) 若 a == b 为真，则 hash(a)

== hash(b) 也为真。

所有由󰉁户󰙵定义的对象默认都

是可散的，因为它们的散值

由 id() 来获取，󰖳且它们都是

相等的。

如果你实现个类的 __eq__

法，并且希望它是可散的，

那么它定要有个恰当的

__hash__ 法，保证在 a == b

为真的情况下 hash(a) ==

hash(b) 也必定为真。

2. 字典在内存上的开销巨

由于字典使󰉁散表，󰖳散

表必须是稀疏的，这导致它在

空间上的效率低下。

如果你需要存放数󰮢巨的记

录，那么放在由元组或是具名元

组构成的表中会是较好的选

择；最好要根据 JSON 的󰵻

格，󰉁由字典组成的表来存放

这些记录。

󰉁元组取代字典就能节省空间的

原因有两个

避免散表所耗费的空间

需把记录中字段的名字在每个

元素󰮟都存遍

3. 键查询很快

dict 的实现是典型的空间换时

间：字典类型有着巨的内存开

销，但它们提供视数据󰮢

的快速访问——只要字典能被

装在内存󰮟。

4. 键的次序取决于添加顺序

有相同键值对的字典进󰢩较时

是相等的，但键的顺序可能

样。

当往 dict 󰮟添加新键󰖳发󰈿散

冲突的时候，新键可能会被安

排存放到另个位置。

5. 往字典󰮟添加新键可能会改变

已有键的顺序

论何时往字典󰮟添加新的键，

Python 解释都可能做出为字

典扩容的决定。

结果就是要新建个的散

表，并把字典󰮟已有的元素添加

到新表󰮟。

可能会发󰈿新的散冲突，导致

新散表中键的次序变化。

如果你在迭代个字典的所有键

的过程中同时对字典进󰢩修改，

那么这个循环很有可能会跳过

些键——甚󰙸是跳过那些字典中

已经有的键。

如果想扫描并修改个字典，最

好分成两步来进󰢩

󰶳先对字典迭代，以得出需要添

加的内容，把这些内容放在个

新字典󰮟

迭代结束之后再对原有字典进󰢩

新。

set的实现以及导致的结果

set 和 frozenset 的实现也依赖

散表，但在它们的散表󰮟存

放的只有元素的引󰉁（就像在字

典󰮟只存放键󰖳没有相应的

值）。

特点

集合󰮟的元素必须是可散的。

集合很消耗内存。

可以很󰷼效地判断元素是否存在

于某个集合。

元素的次序取决于被添加到集合

󰮟的次序。

往集合󰮟添加元素，可能会改变

集合󰮟已有元素的次序。

结

多数映射类型都提供两个很

强的法：setdefault 和

update。

setdefault 法可以󰉁来新字

典󰮟存放的可变值（如

表），从󰖳避免重复的键搜

索。

update 法则让批󰮢新成为

可能，它可以󰉁来插新值或者

新已有键值对，它的参数可以

是包含(key, value) 这种键值对

的可迭代对象，或者关键字参

数。

collections.abc 模块提供

Mapping 和 MutableMapping

这两个抽象基类，󰉁它们，我

们可以进󰢩类型查询或者引󰉁。

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余0页未读，立即下载

评论收藏

内容反馈

优游的鱼

粉丝: 73
资源: 316

字典和集合1

评论0

最新资源

字典和集合1

评论0

python实验三、字典和集合 .doc

Python程序基础：字典和集合综合案例.pptx

Python基础教程字典和集合.pptx

第7章-python字典和集合-python基础-快速入门-课件教程.pptx

python容器:列表，元组，字典，集合的思维导图

02-python-字典-集合-不可变集合-赋值机制

C++数据结构 集合与字典.zip

python字符串, 列表, 字典, 集合方法说明

实验6字典和集合.zip

字典与集合1.py

EWSA字典集合（破解必备）

python字典与集合.pdf

第7章 python字典和集合-python入门 python基础课件.pptx

python字典和集合 Python教学设计.docx

Excel VBA 字典 集合 查找 代码

精品课件 Python从入门到精通 第6章 字典与集合（共8页）.ppt

第11周 字典和集合(线上学习).ipynb

Python3.9字典集合.pptx

列表、字典、元组、集合的特点

基于Python+pytorch的图像处理+附完整代码图像处理，能够轻松实现图像的读取、显示、裁剪等还有机器学习等操作

python大作业 含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

《点燃我温暖你》中李峋的同款爱心代码

Python金融量化的高级库：TA-Lib-0.4.24（包含python3.7、3.8、3.9、3.10的32位和64位版本）

第十五届蓝桥杯大赛软件赛省赛-PythonB组题目

大麦网抢票脚本【Python脚本】

Python数据分析项目实践，包括数据读取、评估、清洗、分析、可视化机器学习相关内容等

YOLOv8-火焰识别（火焰数据集+代码+GUI界面+内置训练好的模型文件）

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计 项目源码 毕业设计

Python学习笔记(干货) 中文PDF完整版.pdf

最新资源

C++数据结构集合与字典.zip

Excel VBA 字典集合查找代码

精品课件 Python从入门到精通第6章字典与集合（共8页）.ppt

第11周字典和集合(线上学习).ipynb

python大作业含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

人脸识别系统OpenCV+dlib+python（含数据库）Pyqt5界面设计项目源码毕业设计