1. 程式人生 > >利用最小堆找出10億個數中最大的10000個數

利用最小堆找出10億個數中最大的10000個數

AS 如果 算法 最小值 分治 但是 空間 找出最大值 根節點

最小堆

最小堆是一種完全二叉樹,特點是根節點比兩個子節點都小(或者根節點比子節點都大)

過程

  • 先找10000個數構建最小堆
  • 依次遍歷10億個數,如果比最小堆的最小值大,則替換這個最小值,並重新構建最小堆
  • 最後輸入10000個值
  • 時間復雜度
    構建最小堆的復雜度為 logn,求出最大m個數會構建m次最小堆,時間復雜度為 m logm, 這裏m為10000
    進行n次時間復雜度為n,這裏n為10億,總時間復雜度為 n m logm,即10億 10000 log 10000

其他算法

  • 將十億個數排序,找出最大值,但是占用空間比較大,做了很多無用功
  • 分治法:將10億個數分成10份,求出每份的前10000個數 ,然後在這個10 * 10000 個數中找出最大的10000個數
  • hash去重復,將這10億個數的Hash值進行比較,去除重復的

利用最小堆找出10億個數中最大的10000個數