日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 軟件

看圖聊算法:為什么排序算法還是不夠快?

來源: 責編: 時間:2024-02-01 12:50:50 225觀看
導讀排序是一種組織數據的方式,目的是確保數據元素之間的相對順序正確。當我們提到比較排序,意味著我們通過兩兩比較來確定元素之間的順序。理論上,一個最優的比較排序算法應該在每次比較后盡量減少剩余的可能性。為了理解這

排序是一種組織數據的方式,目的是確保數據元素之間的相對順序正確。當我們提到比較排序,意味著我們通過兩兩比較來確定元素之間的順序。PGm28資訊網——每日最新資訊28at.com

理論上,一個最優的比較排序算法應該在每次比較后盡量減少剩余的可能性。PGm28資訊網——每日最新資訊28at.com

為了理解這點,考慮一個 N 個元素的所有 N! 種排列方式。在最優的方法中,每次比較都能使剩下的可能性減半,從 N!/2,N!/4,N!/8,...,N!/(2^k),……,1。PGm28資訊網——每日最新資訊28at.com

所以,對于 N 個元素的序列,為了確定一個特定的排列,最下限的情況下,我們需要進行 log(N!) 次比較。這是因為當 2^k = N! 時,k = log(N!)。PGm28資訊網——每日最新資訊28at.com

PGm28資訊網——每日最新資訊28at.com

三個元素 a,b,c 序列的排序PGm28資訊網——每日最新資訊28at.com

但為什么現有的排序算法還不能達到這種理想狀態呢?PGm28資訊網——每日最新資訊28at.com

為什么堆排序(HEAPSORT)不夠快

首先,讓我們回顧一下堆排序的實現:PGm28資訊網——每日最新資訊28at.com

  1. 建立最大堆: 將任意數組轉化為最大堆。
  2. 找到最大元素并交換: 最大的元素始終位于數組的第一個位置,將數組的第一個元素與最后一個元素交換。
  3. 重建最大堆: 排除最后一個元素,并在剩余的元素中重新構建最大堆。
  4. 重復上述過程: 繼續交換、排除和重建。

詳情可以閱讀之前的文章:堆排序的原理與實現。PGm28資訊網——每日最新資訊28at.com

問題出在第二步,根據最大堆的定義,底部元素較小。堆排序將較小的元素從堆的底部提升到頂部,然后再讓它們逐漸下沉,與較大的元素交換位置。PGm28資訊網——每日最新資訊28at.com

動圖 重建最大堆示意圖動圖 重建最大堆示意圖PGm28資訊網——每日最新資訊28at.com

你可以在我的 github 倉庫中查看堆排序源代碼:PGm28資訊網——每日最新資訊28at.com

https://github.com/dingtingli/algorithm/blob/main/Code/heapsort01.pyPGm28資訊網——每日最新資訊28at.com

這種操作在堆排序中似乎違反了直覺:為什么要將底部可能較小的元素提升到更高的位置,然后觀察其下沉的過程?PGm28資訊網——每日最新資訊28at.com

當底部元素被提升為父節點時,它幾乎總是小于其中一個子節點,而大于另一個子節點的機會相對較少。因此,重建最大堆時進行的比較具有不均等的概率。這種概率不均等的比較是低效的,因為它不能保證每次比較都能將可能性減半。PGm28資訊網——每日最新資訊28at.com

這種操作效率的問題是堆排序速度較慢的主要原因。PGm28資訊網——每日最新資訊28at.com

然而,我們可以嘗試以下優化方法:PGm28資訊網——每日最新資訊28at.com

優化方法的思想,就好比一個公司的老板離職需要被組織中最優秀的人替代,我們顯然需要比較兩位副總裁;問題是,我們是否期望這將是一場勢均力敵的競爭?PGm28資訊網——每日最新資訊28at.com

在沒有先驗信息的情況下,我們沒有充分的理由押注任何一位副總裁。情況中只有一種不對稱性:這兩個部門的總人數可能不等。副總裁"A"可能是比"副總裁"B"稍多的人中的佼佼者;一個大部門的最優秀者更有可能擊敗一個小部門的最優秀者。PGm28資訊網——每日最新資訊28at.com

優化后的 HEAPSORT:PGm28資訊網——每日最新資訊28at.com

  1. 將所有元素放入有效的最大堆中
  2. 刪除堆頂,創建一個空缺 "V"
  3. 比較 V 正下方的兩個子堆首領,將最大的那個提升到空缺中。
  4. 遞歸重復第 3 步,重新定義 V 為新的空缺,直到堆的底部。
  5. 轉到步驟 2

你可以在我的 github 倉庫中查看快速堆排序源代碼:PGm28資訊網——每日最新資訊28at.com

https://github.com/dingtingli/algorithm/blob/main/Code/heapsort03.pyPGm28資訊網——每日最新資訊28at.com

這種方法的優勢在于,我們實際上是將一個已知較大的元素提升至堆頂,無需額外的比較操作。此時,兩種比較結果的概率是均等的。我們將這種優化版本稱為 "快速堆排序"(FAST HEAPSORT)。PGm28資訊網——每日最新資訊28at.com

經過優化后的 "快速堆排序"很有可能是最接近理論極限的排序算法。PGm28資訊網——每日最新資訊28at.com

快速堆排序快速堆排序PGm28資訊網——每日最新資訊28at.com

橫坐標:要排序的項目數 N。縱坐標:二分比較次數。PGm28資訊網——每日最新資訊28at.com

理論曲線顯示了快速堆排序的漸近結果(2NlnN)和極限 log_2 N! 近似。PGm28資訊網——每日最新資訊28at.com

為什么快速排序(QUICKSORT)不夠快

快速排序的核心分為兩個過程:PGm28資訊網——每日最新資訊28at.com

  1. 選擇數組中的一個元素為支點(pivot),將小于等于支點的元素移到左側,將大于支點的元素移動到右側。這一步稱為劃分(partition)。
  2. 通過遞歸對左右兩側的子數組繼續劃分,直到數組排序完成。

劃分遞歸執行劃分遞歸執行PGm28資訊網——每日最新資訊28at.com

詳情可以閱讀之前的文章:快速排序的原理與實現。PGm28資訊網——每日最新資訊28at.com

為了進一步說明,假設有一個由三個元素組成的序列:pivot, a1 和 a2。PGm28資訊網——每日最新資訊28at.com

在快速排序的劃分階段,首先,我們會將 a1 與 pivot 進行比較。顯然,(a1 < pivot) 和 (a1 > pivot) 可能性各占一半,這使得第一次比較達到了理想的效果。PGm28資訊網——每日最新資訊28at.com

然而,第二次的比較并不像第一次那樣完美。PGm28資訊網——每日最新資訊28at.com

假設第一次比較已經確定 (a1 < pivot) ,此時我們需要進一步判斷 a2 與 pivot 之間的關系。PGm28資訊網——每日最新資訊28at.com

考慮所有的組合可能性:基于 a1、a2 和 pivot 的相對順序,總共存在 3! 即 6 種可能的排列:PGm28資訊網——每日最新資訊28at.com

  1. (a1 < a2 < pivot)
  2. (a1 < pivot < a2)
  3. (a2 < a1 < pivot)
  4. (a2 < pivot < a1)
  5. (pivot < a1 < a2)
  6. (pivot < a2 < a1)

由于已知 (a1 < pivot),第 4、第 5 和第 6 種情況可以直接排除,這使得我們只考慮:PGm28資訊網——每日最新資訊28at.com

  1. (a1 < a2 < pivot)
  2. (a1 < pivot < a2)
  3. (a2 < a1 < pivot)

在這三種情況中,(a2 < pivot) 的可能性有 2 種,而 (a2 > pivot) 的情況僅有 1 種。PGm28資訊網——每日最新資訊28at.com

所以 (a2 < pivot) 的概率是 2/3,而 (a2 > pivot) 的概率是 1/3。PGm28資訊網——每日最新資訊28at.com

這就是快排也不那么快的原因,因為它并不總能確保每次比較都將可能性減半。PGm28資訊網——每日最新資訊28at.com

為什么基數排序(RADIXSORT)很快

基數排序之所以高效,是因為它脫離了傳統比較排序的框架,不再通過兩兩元素的比較來決定排序順序。PGm28資訊網——每日最新資訊28at.com

想象一下這樣一個任務:整理一副撲克牌中同一花色的牌。假設手中有 N(N≤13)張牌,要如何迅速地給它們排好序呢?可以想象桌上已經預留出了 13 個特定的位置,每張牌會根據其點數被精準地放在對應位置。PGm28資訊網——每日最新資訊28at.com

比如,2 點的牌會放在第二個位置,而 Q 則被放置在第 12 個位置。所有牌放好后,按照位置順序收集,你就得到了有序的撲克牌。PGm28資訊網——每日最新資訊28at.com

這個例子揭示了基數排序的核心效率。每張新牌的放置位置實際上是在前 i 張牌所定義的 i+1 個區間中選擇的。PGm28資訊網——每日最新資訊28at.com

例如,如果我們已經放置了 2,5,8 這三張牌,那么我們就有四個區間來放置下一張牌:2 之前、2 和 5 之間、 5 和 8 之間,以及 8 之后。PGm28資訊網——每日最新資訊28at.com

當你放置第 i+1 張牌時,你實際上是在這些 i+1 個區間中選擇一個位置放置它。一旦選擇了一個區間放置新牌,其他的 i 個區間都被排除了。PGm28資訊網——每日最新資訊28at.com

因此,每放置一張新牌,你都減少了大約 i/i+1 的排序可能性。而基于比較的排序方法,每次操作最多只能減少排序可能性的一半。PGm28資訊網——每日最新資訊28at.com

比較排序的本質就像我們之前介紹的二分法游戲,然而除了二分法,我們還介紹了三分法游戲。基數排序更進一步,本質就像是 N 分法。PGm28資訊網——每日最新資訊28at.com

看圖聊算法:一個游戲讓你理解二分法的本質PGm28資訊網——每日最新資訊28at.com

看圖聊算法:還是一個游戲,讓你理解三分法的本質PGm28資訊網——每日最新資訊28at.com

這就是基數排序之所以高效的原因,它擺脫了比較的排序算法復雜度上限只能是 O(NlogN) 的命運。PGm28資訊網——每日最新資訊28at.com

然而,基數排序有其局限性。比如需要知道數據的范圍或寬度,而且主要適用于整數和字符串。對于浮點數和復數,基數排序也不太合適。PGm28資訊網——每日最新資訊28at.com

結論

在算法中,我們通常使用大O記號來描述復雜度。但這種表示并非完美無缺。當我們使用"O"符號強調“對于大N的漸進性能”,這似乎暗示我們對 O(4NlogN) 和 O(1NlogN) 兩種算法之間的差異不甚關心。PGm28資訊網——每日最新資訊28at.com

然而,這種常數因子的差異仍然是眾多研究者追求和努力的焦點。即使排序算法的時間復雜度已達到理論上的界限 O(NlogN),其演進仍在繼續。PGm28資訊網——每日最新資訊28at.com

參考資料:PGm28資訊網——每日最新資訊28at.com

[1] http://www.inference.org.uk/mackay/sorting/sorting.htmlPGm28資訊網——每日最新資訊28at.com

[2] http://mindhacks.cn/2008/06/13/why-is-quicksort-so-quickPGm28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-26-70444-0.html看圖聊算法:為什么排序算法還是不夠快?

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 十個人見人愛的Intellij IDEA主題

下一篇: 近期,幾個典型 Elasticsearch 8.X 問題及方案探討

標簽:
  • 熱門焦點
  • MIX Fold3包裝盒泄露 新機本月登場

    小米的全新折疊屏旗艦MIX Fold3將于本月發布,近日該機的真機包裝盒在網上泄露。從圖上來看,新的MIX Fold3包裝盒在外觀設計方面延續了之前的方案,變化不大,這也是目前小米旗艦
  • 一加Ace2 Pro真機揭曉 鈦空灰配色質感拉滿

    終于,在經過了幾波預熱之后,一加Ace2 Pro的外觀真機圖在網上出現了。還是博主數碼閑聊站曝光的,這次的外觀設計還是延續了一加11的方案,只是細節上有了調整,例如新加入了鈦空灰
  • 5月安卓手機好評榜:魅族20 Pro奪冠

    性能榜和性價比榜之后,我們來看最后的安卓手機好評榜,數據來源安兔兔評測,收集時間2023年5月1日至5月31日,僅限國內市場。第一名:魅族20 Pro好評率:97.50%不得不感慨魅族老品牌還
  • 0糖0卡0脂 旭日森林仙草烏龍茶優惠:15瓶到手29元

    旭日森林無糖仙草烏龍茶510ml*15瓶平時要賣為79.9元,今日下單領取50元優惠券,到手價為29.9元。產品規格:0糖0卡0脂,添加草本仙草汁,清涼爽口,富含茶多酚,保留
  • Rust中的高吞吐量流處理

    作者 | Noz編譯 | 王瑞平本篇文章主要介紹了Rust中流處理的概念、方法和優化。作者不僅介紹了流處理的基本概念以及Rust中常用的流處理庫,還使用這些庫實現了一個流處理程序
  • SpringBoot中使用Cache提升接口性能詳解

    環境:springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架從 3.1 開始,對 Spring 應用程序提供了透明式添加緩存的支持。和事務支持一樣,抽象緩存允許一致地使用各
  • 虛擬鍵盤 API 的妙用

    你是否在遇到過這樣的問題:移動設備上有一個固定元素,當激活虛擬鍵盤時,該元素被隱藏在了鍵盤下方?多年來,這一直是 Web 上的默認行為,在本文中,我們將探討這個問題、為什么會發生
  • 華為開發者大會2023日程公開:開設鴻蒙HarmonyOS 4體驗區

    IT之家 7 月 31 日消息,華為今日公布了 HDC.Together 開發者大會 2023 的詳細日程。整場大會將于 8 月 4 日-6 日之間舉行,屆時將發布最新一代鴻蒙 H
  • 電博會與軟博會實現"線下+云端"的雙線融合

    在本次“電博會”與“軟博會”雙展會利好條件的加持下,既可以發揮展會拉動人流、信息流、資金流實現快速交互流動的作用,繼而推動區域經濟良性發展;又可以聚
Top 主站蜘蛛池模板: 蒙阴县| 嵊泗县| 乐陵市| 东乌珠穆沁旗| 五家渠市| 萨嘎县| 阳新县| 柞水县| 桐柏县| 湖州市| 晋江市| 莫力| 老河口市| 博爱县| 江孜县| 新绛县| 庐江县| 蕉岭县| 会泽县| 尖扎县| 无锡市| 缙云县| 固安县| 阳新县| 宝清县| 松阳县| 彰化县| 刚察县| 资阳市| 谷城县| 宁海县| 柳林县| 延安市| 南岸区| 兴化市| 汉阴县| 蒙城县| 景德镇市| 历史| 大庆市| 中牟县|