mirror of
https://github.com/krahets/hello-algo.git
synced 2025-02-02 22:43:50 +08:00
Update the summary of hashing chapter.
This commit is contained in:
parent
d62156fb58
commit
73372ad35a
@ -221,7 +221,7 @@ $$
|
|||||||
|
|
||||||
## 数据结构的哈希值
|
## 数据结构的哈希值
|
||||||
|
|
||||||
我们知道,哈希表的 `key` 可以是整数、小数或字符串等数据类型。编程语言通常会为这些数据类型提供内置的哈希算法 `hash()` ,用于计算哈希表中的桶索引。以 Python 为例:
|
我们知道,哈希表的 `key` 可以是整数、小数或字符串等数据类型。编程语言通常会为这些数据类型提供内置的哈希算法,用于计算哈希表中的桶索引。以 Python 为例,我们可以调用 `hash()` 函数来计算各种数据类型的哈希值,包括:
|
||||||
|
|
||||||
- 整数和布尔量的哈希值就是其本身。
|
- 整数和布尔量的哈希值就是其本身。
|
||||||
- 浮点数和字符串的哈希值计算较为复杂,有兴趣的同学请自行学习。
|
- 浮点数和字符串的哈希值计算较为复杂,有兴趣的同学请自行学习。
|
||||||
|
@ -1,11 +1,15 @@
|
|||||||
# 小结
|
# 小结
|
||||||
|
|
||||||
- 哈希表能够在 $O(1)$ 时间内将键 key 映射到值 value,效率非常高。
|
- 输入 `key` ,哈希表能够在 $O(1)$ 时间内查询到 `value` ,效率非常高。
|
||||||
- 常见的哈希表操作包括查询、添加与删除键值对、遍历键值对等。
|
- 常见的哈希表操作包括查询、添加键值对、删除键值对和遍历哈希表等。
|
||||||
- 哈希函数将 key 映射为数组索引(桶索引),从而访问对应的值 value 。
|
- 哈希函数将 `key` 映射为数组索引,从而访问对应桶并获取 `value` 。
|
||||||
- 两个不同的 key 可能在经过哈希函数后得到相同的索引,导致查询结果出错,这种现象被称为哈希冲突。
|
- 两个不同的 `key` 可能在经过哈希函数后得到相同的数组索引,导致查询结果出错,这种现象被称为哈希冲突。
|
||||||
- 缓解哈希冲突的方法主要有扩容哈希表和优化哈希表的表示方法。
|
- 哈希表容量越大,哈希冲突的概率就越低。因此可以通过扩容哈希表来缓解哈希冲突。与数组扩容类似,哈希表扩容操作的开销很大。
|
||||||
- 负载因子定义为哈希表中元素数量除以桶数量,反映了哈希冲突的严重程度,常用作触发哈希表扩容的条件。与数组扩容类似,哈希表扩容操作也会产生较大的开销。
|
- 负载因子定义为哈希表中元素数量除以桶数量,反映了哈希冲突的严重程度,常用作触发哈希表扩容的条件。
|
||||||
- 链式地址通过将单个元素转化为链表,将所有冲突元素存储在同一个链表中,从而解决哈希冲突。然而,过长的链表会降低查询效率,可以通过将链表转换为 AVL 树或红黑树来改善。
|
- 链式地址通过将单个元素转化为链表,将所有冲突元素存储在同一个链表中。然而,链表过长会降低查询效率,可以进一步将链表转换为红黑树来提高效率。
|
||||||
- 开放寻址通过多次探测来解决哈希冲突。线性探测使用固定步长,缺点是不能删除元素且容易产生聚集。多次哈希使用多个哈希函数进行探测,相对线性探测不易产生聚集,但多个哈希函数增加了计算量。
|
- 开放寻址通过多次探测来处理哈希冲突。线性探测使用固定步长,缺点是不能删除元素,且容易产生聚集。多次哈希使用多个哈希函数进行探测,相较线性探测更不易产生聚集,但多个哈希函数增加了计算量。
|
||||||
- 不同编程语言采取了不同的哈希表实现策略。例如,Java 的 HashMap 使用链式地址,而 Python 的 Dict 采用开放寻址。
|
- 不同编程语言采取了不同的哈希表实现。例如,Java 的 `HashMap` 使用链式地址,而 Python 的 `Dict` 采用开放寻址。
|
||||||
|
- 在哈希表中,我们希望哈希算法具有确定性、高效率和均匀分布的特点。在密码学中,哈希算法还应该具备抗碰撞性和雪崩效应。
|
||||||
|
- 哈希算法通常采用大质数作为模数,以最大化地保证哈希值的均匀分布,减少哈希冲突。
|
||||||
|
- 常见的哈希算法包括 MD5, SHA-1, SHA-2, SHA3 等。MD5 常用语校验文件完整性,SHA-2 常用于安全应用与协议。
|
||||||
|
- 编程语言通常会为数据类型提供内置哈希算法,用于计算哈希表中的桶索引。通常情况下,只有不可变对象是可哈希的。
|
||||||
|
Loading…
Reference in New Issue
Block a user