Python中的哈希结构【python中可哈希的数据类型】

581次阅读

在对哈希结构的讨论上，我们对于已经在数组中有所使用，简单的来说就是通过下标定位某一种数据的方法。那么，我们学习的一些python知识点，也会体现出一些哈希结构。本篇所要讲的是字典和集合这两种，关于具体的哈希结构会就这两个方面分别展开介绍，大季家一起来看看内容。

1、字典

PyDictKeysObject定义了字典哈希表的一些字段。其中有两个数组 dk_indices[] 和 dk_entries[]，这两个便是真正的存储数据的数组。kv 数据保存在dk_entries[]数组中，dk_indices[]来存储 kv 数据在dk_enties数组中保存的索引。其中每个 kv 数据以entry的数据结构来存储，如下：

typedef struct {
    /* Cached hash code of me_key. */
    Py_hash_t me_hash;
    PyObject *me_key;
    PyObject *me_value; /* This field is only meaningful for combined tables */
} PyDictKeyEntry;

me_hash缓存存 key 的哈希值，防止哈希值的重复计算。me_key和me_value便是 key 和 value 的真正数据了。

2、集合

集合和字典一样，底层也是哈希结构，和字典相比，可理解为只有 key，没有 values。

相比字典，集合简单了不少。在PySetObject中直接保存了存储数据的数组。

根据集合的底层数据结构分析，它解决哈希冲突也是使用的「开发寻址法」。

集合的一些常用操作：

# 初始化
s1 = {'1', '2', '3'}  # 不推荐，当元素中有字典时，会报错
s2 = set(['1', '4', '5'])
print(s1)  # {'3', '1', '2'}
print(s2)  # {'3', '1', '2'}
 
# 交集
print(s1&s2)  # {'1'}
# 并集
print(s1|s2)  # {'3', '5', '4', '2', '1'}
# 差集
print(s1 - s2)  # {'3', '2'}
# 判断子集和超集
s2.issubset(s1)   # s2 是否为s1 的子集
s1.issuperset(s2)  # s1 是否为 s2 的超集
 
# 集合的一些内建方法
# set.add(obj) 添加集合元素
# set.remove(obj) 删除集合元素
# set.update(set) 合并集合
# set.pop() 随机删除一个元素，并返回该元素

以上就是Python中哈希结构的两种讲解，对于字典和集合的学习，大家可以结合哈希结构的内容进行深入探索，学会后可以就代码部分进行练习。

神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

发表于：Python基础教程

2021-05-07

# 数据类型

复制链接

赏

Python中的哈希结构【python中可哈希的数据类型】

相关文章：

HTTP代理设置详解：一步步配置指南

什么是Socks5代理IP及其优势

Socks5代理配置教程及注意事项

什么是代理服务器IP：如何选择合适的

国外代理服务器的优势及选择建议

如何找到可靠的免费代理服务器

在线代理服务器的使用与推荐

HTTP代理服务器的设置及应用实例

静态代理IP怎么填写：步骤与示例

海外静态IP的代理选择与配置

HTTP代理服务器的设置及应用实例

什么是代理服务器IP：如何选择合适的

HTTP代理设置详解：一步步配置指南

静态代理IP怎么填写：步骤与示例

在线代理服务器的使用与推荐

什么是Socks5代理IP及其优势

Socks5代理配置教程及注意事项

如何找到可靠的免费代理服务器

海外静态IP的代理选择与配置

动态与静态代理IP的区别解析