聚集下推 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Hello 算法 1.0.0b1 TypeScript 版

线性探测存在以下缺陷： ‧ 不能直接删除元素。删除元素会导致桶内出现一个空位，在查找其他元素时，该空位有可能导致程序认为元素不存在（即上述第 2. 种情况）。因此需要借助一个标志位来标记删除元素。 ‧ 容易产生聚集。桶内被占用的连续位置越长，这些连续位置发生哈希冲突的可能性越大，从而进一步促进这一位置的“聚堆生长”，最终导致增删查改操作效率的劣化。 6. 散列表 hello‑algo.com 88 多次哈希查找元素：以相同的哈希函数顺序查找，存在两种情况： 1. 找到目标元素，则返回之； 2. 到空位或已尝试所有哈希函数，说明哈希表中无此元素；相比于「线性探测」，「多次哈希」方法更不容易产生聚集，代价是多个哈希函数增加了额外计算量。 � 工业界方案 Java 采用「链式地址」。在 JDK 1.8 之后，HashMap 内数组长度大于 64 时，长度大于 8 的链表会被转化为「红黑树」，以提升查找性能。链表过长会导致查询效率变低，可以通过把链表转化为 AVL 树或红黑树来解决。 ‧ 开放寻址通过多次探测来解决哈希冲突。线性探测使用固定步长，缺点是不能删除元素且容易产生聚集。多次哈希使用多个哈希函数进行探测，相对线性探测不容易产生聚集，代价是多个哈希函数增加了计算量。 ‧ 在工业界中，Java 的 HashMap 采用链式地址、Python 的 Dict 采用开放寻址。 89 7. 树

0 码力 | 186 页 | 14.71 MB | 1 年前
3
Hello 算法 1.1.0 TypeScript版

据此哈希函数，最后两位相同的 key 都会被映射到相同的桶。而通过线性探测，它们被依次存储在该桶以及之下的桶中。图 6‑6 开放寻址（线性探测）哈希表的键值对分布然而，线性探测容易产生“聚集现象”。具体来说，数组中连续被占用的位置越长，这些连续位置发生哈希冲突的可能性越大，从而进一步促使该位置的聚堆生长，形成恶性循环，最终导致增删查改操作效率劣化。值得注意的是，我们不能在开放寻定的步数，而是跳过“探测次数的平方”的步数，即 1, 4, 9, … 步。平方探测主要具有以下优势。 ‧ 平方探测通过跳过探测次数平方的距离，试图缓解线性探测的聚集效应。 ‧ 平方探测会跳过更大的距离来寻找空位置，有助于数据分布得更加均匀。然而，平方探测并不是完美的。 ‧ 仍然存在聚集现象，即某些位置比其他位置更容易被占用。 ‧ 由于平方的增长，平方探测可能不会探测整个哈希表，这意味着即使哈希表中有空桶，平方探测也可能，以此类推，直到找到空位后插入元素。 ‧ 查找元素：在相同的哈希函数顺序下进行查找，直到找到目标元素时返回；若遇到空位或已尝试所有哈希函数，说明哈希表中不存在该元素，则返回 None 。与线性探测相比，多次哈希方法不易产生聚集，但多个哈希函数会带来额外的计算量。 Tip 请注意，开放寻址（线性探测、平方探测和多次哈希）哈希表都存在“不能直接删除元素”的问题。 6.2.3 编程语言的选择各种编程语言采取了不同的哈希表实现策略，下面举几个例子。

0 码力 | 383 页 | 18.49 MB | 1 年前
3
Hello 算法 1.2.0 简体中文 TypeScript 版

据此哈希函数，最后两位相同的 key 都会被映射到相同的桶。而通过线性探测，它们被依次存储在该桶以及之下的桶中。图 6‑6 开放寻址（线性探测）哈希表的键值对分布然而，线性探测容易产生“聚集现象”。具体来说，数组中连续被占用的位置越长，这些连续位置发生哈希冲突的可能性越大，从而进一步促使该位置的聚堆生长，形成恶性循环，最终导致增删查改操作效率劣化。值得注意的是，我们不能在开放寻定的步数，而是跳过“探测次数的平方”的步数，即 1, 4, 9, … 步。平方探测主要具有以下优势。 ‧ 平方探测通过跳过探测次数平方的距离，试图缓解线性探测的聚集效应。 ‧ 平方探测会跳过更大的距离来寻找空位置，有助于数据分布得更加均匀。然而，平方探测并不是完美的。 ‧ 仍然存在聚集现象，即某些位置比其他位置更容易被占用。 ‧ 由于平方的增长，平方探测可能不会探测整个哈希表，这意味着即使哈希表中有空桶，平方探测也可能，以此类推，直到找到空位后插入元素。 ‧ 查找元素：在相同的哈希函数顺序下进行查找，直到找到目标元素时返回；若遇到空位或已尝试所有哈希函数，说明哈希表中不存在该元素，则返回 None 。与线性探测相比，多次哈希方法不易产生聚集，但多个哈希函数会带来额外的计算量。 Tip 请注意，开放寻址（线性探测、平方探测和多次哈希）哈希表都存在“不能直接删除元素”的问题。 6.2.3 编程语言的选择各种编程语言采取了不同的哈希表实现策略，下面举几个例子。

0 码力 | 383 页 | 18.49 MB | 10 月前
3
Hello 算法 1.2.0 繁体中文 TypeScript 版

據此雜湊函式，最後兩位相同的 key 都會被對映到相同的桶。而透過線性探查，它們被依次儲存在該桶以及之下的桶中。圖 6‑6 開放定址（線性探查）雜湊表的鍵值對分佈然而，線性探查容易產生“聚集現象”。具體來說，陣列中連續被佔用的位置越長，這些連續位置發生雜湊衝突的可能性越大，從而進一步促使該位置的聚堆積生長，形成惡性迴圈，最終導致增刪查改操作效率劣化。值得注意的是，我們不能在開放定的步數，而是跳過“探測次數的平方”的步數，即 1, 4, 9, … 步。平方探測主要具有以下優勢。 ‧ 平方探測透過跳過探測次數平方的距離，試圖緩解線性探查的聚集效應。 ‧ 平方探測會跳過更大的距離來尋找空位置，有助於資料分佈得更加均勻。然而，平方探測並不是完美的。 ‧ 仍然存在聚集現象，即某些位置比其他位置更容易被佔用。 ‧ 由於平方的增長，平方探測可能不會探測整個雜湊表，這意味著即使雜湊表中有空桶，平方探測也可能，以此類推，直到找到空位後插入元素。 ‧ 查詢元素：在相同的雜湊函式順序下進行查詢，直到找到目標元素時返回；若遇到空位或已嘗試所有雜湊函式，說明雜湊表中不存在該元素，則返回 None 。與線性探查相比，多次雜湊方法不易產生聚集，但多個雜湊函式會帶來額外的計算量。 Tip 請注意，開放定址（線性探查、平方探測和多次雜湊）雜湊表都存在“不能直接刪除元素”的問題。 6.2.3 程式語言的選擇各種程式語言採取了不同的雜湊表實現策略，下面舉幾個例子。

0 码力 | 384 页 | 18.80 MB | 10 月前
3
Hello 算法 1.0.0b5 TypeScript 版

然而，线性探测存在以下缺陷。 ‧ 不能直接删除元素。删除元素会在数组内产生一个空位，当查找该空位之后的元素时，该空位可能导致程序误判元素不存在。为此，通常需要借助一个标志位来标记已删除元素。 ‧ 容易产生聚集。数组内连续被占用位置越长，这些连续位置发生哈希冲突的可能性越大，进一步促使这一位置的聚堆生长，形成恶性循环，最终导致增删查改操作效率劣化。以下代码实现了一个简单的开放寻址（线性探测）哈希表。，以此类推，直到找到空位后插入元素。 ‧ 查找元素：在相同的哈希函数顺序下进行查找，直到找到目标元素时返回；或遇到空位或已尝试所有哈希函数，说明哈希表中不存在该元素，则返回 None 。与线性探测相比，多次哈希方法不易产生聚集，但多个哈希函数会增加额外的计算量。 6.2.3 编程语言的选择 Java 采用链式地址。自 JDK 1.8 以来，当 HashMap 内数组长度达到 64 且链表长度达到 8 时，链表会被转 … } 值得说明的是，如果能够保证 key 是随机均匀分布的，那么选择质数或者合数作为模数都是可以的，它们都能输出均匀分布的哈希值。而当 key 的分布存在某种周期性时，对合数取模更容易出现聚集现象。总而言之，我们通常选取质数作为模数，并且这个质数最好足够大，以尽可能消除周期性模式，提升哈希算法的稳健性。 6.3.3 常见哈希算法不难发现，以上介绍的简单哈希算法都比较“脆弱”

0 码力 | 378 页 | 30.70 MB | 1 年前
3

共 5 条前往

页

Hello 算法 1.0 0b1 TypeScript 1.1 1.2 简体中文简体中文繁体繁体中文 0b5

分类

语言

格式

Hello 算法 1.0.0b1 TypeScript 版

Hello 算法 1.1.0 TypeScript版

Hello 算法 1.2.0 简体中文 TypeScript 版

Hello 算法 1.2.0 繁体中文 TypeScript 版

Hello 算法 1.0.0b5 TypeScript 版