找中位數，找第k小,還存在問題

阿新 • • 發佈：2018-12-17

找第k小

上次介紹了找第二大使用的方法時，使用錦標賽的方法，找到最大，在最大的手下敗將裡找第二大，也就是亞軍在冠軍的手下敗將裡產生，亞軍只敗給過冠軍，這種方法比較次數時(n-1) + (logn-1),這個時間複雜度最優的方案了為O(n)
那麼怎麼找第k大了，季軍只能在冠軍和亞軍的手下敗將裡產生，第四名只能在前三名手下敗將裡產生。。。。這個方法也是O(n)，但是需要記錄每個選手的手下敗將名單

還有一種分治的方案，思路來源於快排，快排每次劃分子問題，劃分成3個部分，小於pivot,等於pivot,大於pivot,假如我們要找的k，小於pivot的標號，那k肯定在左邊，等於就就是pivot,大於就在右邊，那麼每次都排除了一邊，問題規模縮小了一半，範圍一步步縮小，最後就找到一個pivot他的index就為k。

前面講了，快排在最壞的情況下，每次選擇的都是邊緣上的元素，每次問題規模只縮小了1，那他的時間複雜度還是n^2

隨機快排在一定程度上可以避免最壞的情況，通過隨機選取pivot，可以儘可能讓每次劃分子問題，差不多時均分的，假如我們找第k小的話，下一階段就會落在左邊或者右邊或者pivot,問題規模就會等比縮減。所以這種方法平均時間複雜度是可以達到O(n)

隨機快排的實現方法

import random        
def randomizedPartition(arr,low,high):
    def partition(arr,low,high):
        # 這時另外一種考慮方式，而且他是不需要額外空間的，他只使用一個指標來區分小於基準和大於基準的 

        # pointer_less_than代表這個指標的左邊全部都是小於基準的（包括自己，不包括首元素）
        # 然後從左往右掃描，遇到小於基準的元素，就把小於基準元素區域的後面緊接著的一個元素和他交換
        # 那麼小於基準元素區域就多了一個元素，。。。就這樣小於基準的元素就連在了一起
        # 首元素是基準元素，小於基準元素區域塊，大於基準元素區域塊，現在分成了三個部分
        # 把首元素和小於基準元素區域塊最後一個元素交換，那三部分就變成，小於的，基準，大於的
        
        # 剛開始小於基準的元素為0，暫且指向首位值 

        pointer_less_than = low
        # 然後一次掃描後面所有元素
        for i in range(pointer_less_than +1,high+1):
            # 遇到小於基準的，就把小於基準元素區域的後面緊接著的一個元素和他交換，小於的塊相當於也更新了
            if arr[i] < arr[low] :
                pointer_less_than +=1
                arr[pointer_less_than],arr[i]=arr[i],arr[pointer_less_than]
        #  把首元素和小於基準元素區域塊最後一個元素交換，那三部分就變成，小於的，基準，大於的       
        arr[low],arr[pointer_less_than] = arr[pointer_less_than],arr[low]
        
        return pointer_less_than
    
    index = random.randint(low,high)
    arr[low],arr[index]=arr[index],arr[low]
    return partition(arr,low,high)

def randomizedQuicksort_for_medium(arr,low,high,k):
     
    if low <= high:
        index = randomizedPartition(arr,low,high)
        if k == index:
            return arr[index]
        elif k < index :            
            return randomizedQuicksort_for_medium(arr,low,index-1,k)
        else:
            return randomizedQuicksort_for_medium(arr,index+1,high,k)


arr3 = [7,3,66,33,22,66,99,0,1]
print(arr3)
print(sorted(arr3))
print(randomizedQuicksort_for_medium(arr3,0,len(arr3)-1,4))

[7, 3, 66, 33, 22, 66, 99, 0, 1]
[0, 1, 3, 7, 22, 33, 66, 66, 99]
22

還有一種思路，就是那個pivot也不是隨機選擇的，怎麼來了，他應該是在中位數附近，那麼我們是不是可以，計算的來pivot了

下面有一種失敗的方法，參考一下：

# 簡單的插入排序
def insert_sort(arr,low,high):
    
    for i in range(low+1,high+1):
        temp = arr[i]
        j = i
        
        while arr[j-1] > temp and j >low:
            arr[j] = arr[j-1]
            j -=1
        arr[j] = temp

# 針對已分組的資料塊排序
def insert_sort_node(arr,low,high):
    
    for i in range(low+1,high+1):
        temp = arr[i]
        j = i
        
        while arr[j-1][0] > temp[0] and j >low:
            arr[j] = arr[j-1]
            j -=1
        arr[j] = temp

#  規約子問題的方法：
# 按照每5個一組，在每組中位數裡取中位數，然後把小於中位數的元素放在左邊，大於的放在右邊
def partion_group_sort_size_5(arr,left,right):
    
    # 我們是在arr上原地操作的
    # 下面是每5個一組
    low =left
    high = left +4
    
    # 儲存一下中位數陣列，便於求中位陣列的中位數
    # 此法相對於快排的規約，選擇首元素或者隨機選擇，這個pivot是通過計算得出
    # 每5個分成一組，最後5的餘數，特殊處理
    medium =[]
    if right -left > 4:
        while high <= right:
            insert_sort(arr,low,high)
            medium.append((arr[low+2],low+2))
            low +=5
            high +=5
    
    # 假如輸入剛好為5個或者少於5個，直接插入排序，返回最中間的index
    # 插入排序對已有序大的序列，效率高，在次情況下，比較次數很少
    # 這種情況下直接返回中位數的標號
    else:
        insert_sort(arr,low,high)
        return (low+high)//2 -1
    

    # 對中位數陣列排序，取得中位數，也就是分解子問題的pivot
    insert_sort_node(medium,0,len(medium)-1)

    # 把小於pivot的資料放左邊，把大於pivot資料放右邊
    # 分組裡面的左上角可以直接放在前後和右下角的資料可以直接放在後面
    # 左下角和右上角，以及最後的餘數需要比較之後，再決定放左邊還是右邊
    medium_num = (len(medium) -1)//2
    # 現在中位數為medium[medium_num],把小於medium[medium_num]放到左邊
    
    # 因為沒有足夠的空位，所以臨時放在list裡，然後最後複製回去
    list = [-1]*(right-left +1)
    # 小於pivot的指標，大於pivot的指標
    i =0
    j =right-left
    
    # 先處理左邊的資料，處理左上角
    for k in range(medium_num):
        #左上角可以直接放進左邊
        # 理論上是直接把左上角放在head,右下角放在end,然後再處理左下角和右上角，以及最後的餘數
        # 這樣可以儘量保證有序，減少插入排序的工作量
        list[i]=arr[medium[k][1]-2]
        i +=1
        list[i]=arr[medium[k][1]-1]
        i +=1
        list[i]=arr[medium[k][1]]
        i +=1

    # 處理中位數後面的分組，處理右下角
    for k in range(len(medium)-1,medium_num,-1):
        # 從最後面開始處理，因為這裡的數都比較大
        list[j]=arr[medium[k][1]+2]
        j -=1
        list[j]=arr[medium[k][1]+1]
        j -=1
        list[j]=arr[medium[k][1]]
        j -=1

    # 處理中位數那一組上邊，上面的放左邊
    list[i]=arr[medium[medium_num][1]-2]
    i +=1
    list[i]=arr[medium[medium_num][1]-1]    
    i +=1

    # 處理中位數那一組，下面的放右邊，為什麼在這裡了，因為他在大於pivot裡面算是較小的，
    # 為了保證劃分之後的子問題儘量有序，先下後上
    list[j] = arr[medium[medium_num][1] +2]
    j -=1
    list[j] = arr[medium[medium_num][1] +1]
    j -=1  
    
    # arr[medium[medium_num][1] 位置還不清楚最後新增
    
    # 處理左下角
    for k in range(medium_num):        
        # 左下角需要比較之後才能決定放左邊還是右邊，先上後下，上面的比較小
        if arr[medium[k][1] + 1] > medium[medium_num][0]:
            list[j] = arr[medium[k][1] +1]
            j -=1
        else:
            list[i]=arr[medium[k][1] +1]
            i +=1
            
        if arr[medium[k][1] + 2] > medium[medium_num][0]:
            list[j] = arr[medium[k][1] +2]
            j -=1
        else:
            list[i]=arr[medium[k][1] +2]
            i +=1            
        
    # 處理右上角        
    for k in range(len(medium)-1,medium_num,-1):        
        if arr[medium[k][1] - 1] > medium[medium_num][0]:
            list[j] = arr[medium[k][1] -1]
            j -=1
        else:
            list[i]=arr[medium[k][1] -1]
            i +=1 
            
        if arr[medium[k][1] - 2] > medium[medium_num][0]:
            list[j] = arr[medium[k][1] -2]
            j -=1
        else:
            list[i]=arr[medium[k][1] -2]
            i +=1 

    # 處理最後的餘數
    for k in range(low,right+1):

        if arr[k] > medium[medium_num][0]:
            list[j] = arr[k]
            j -=1
        else:
            list[i]=arr[k]
            i +=1
            
    # 把最後的中位數放入       
    list[i] = medium[medium_num][0]
    # 把臨時結果放回原來的陣列
    arr[left:right+1] = list[:]
    # 返回中位數的index
    return(left+i)

# 使用分治獲取中位數
def partion_group_sort_size_5_for_medium(arr,low,high,k):
        
    # 遞迴出口，當左右指標重合時，便是找到了第k小的陣列
    if low <= high:
        # 取經過計算的pivot分組，這個pivot 的index應該接近中位數的index，這樣就可以很快的收斂
        index = partion_group_sort_size_5(arr,low,high)
        # 這個index恰好為中位數的index時，就可以直接返回中位數大小
        if k == index:
            return arr[index]
        # 當index>k時，代表在左半部分
        elif k < index :            
            return partion_group_sort_size_5_for_medium(arr,low,index-1,k)
        # 否則就在右半部分
        else:
            return partion_group_sort_size_5_for_medium(arr,index+1,high,k)        
    
            
    
arr3 = [7,3,66,33,22,66,9,0,1,11,14,17,15,22,88,91,10,5,11,77,88,45,990,1]
print(arr3)
print(partion_group_sort_size_5_for_medium(arr3,0,len(arr3)-1,len(arr3)//2-1))

a =sorted(arr3)
print(a)
print(a[len(arr3)//2-1])  

[7, 3, 66, 33, 22, 66, 9, 0, 1, 11, 14, 17, 15, 22, 88, 91, 10, 5, 11, 77, 88, 45, 990, 1]
15
[0, 1, 1, 3, 5, 7, 9, 10, 11, 11, 14, 15, 17, 22, 22, 33, 45, 66, 66, 77, 88, 88, 91, 990]
15

為什麼是失敗的方法了？這裡給中位數陣列求中位數的方法是插入排序？你是沒睡醒嗎？n/5的規模使用插入排序，你說雞肋不雞肋，雖然後面的陣列基本都是有序的，但是第一次的工作量就有O(n^2)的工作量。

我們的目標是求中位數，劃分子問題中位數劃分最均衡，所以用分治求中位數效率比較高，那麼我們求中位數陣列時就應該使用分治的方法，正確的方法是：求中位數陣列的中位數，遞迴呼叫自身，得到pivot後，左半邊要呼叫自身，右半邊也要呼叫自身，也就是三個地方都需要呼叫自身。

# -*- coding: utf-8 -*-

# 簡單的插入排序
def insert_sort(arr,low,high):
    
    for i in range(low+1,high+1):
        temp = arr[i]
        j = i
        
        while arr[j-1] > temp and j >low:
            arr[j] = arr[j-1]
            j -=1
        arr[j] = temp
        
        
def group_sort_size_5(arr):
    
    # 我們是在arr上原地操作的
    # 下面是每5個一組
    low =0
    high = 4
    
    # 儲存一下中位數陣列，便於求中位陣列的中位數
    # 此法相對於快排的規約，選擇首元素或者隨機選擇，這個pivot是通過計算得出
    # 每5個分成一組，最後5的餘數，特殊處理
    medium =[]
    while high < len(arr):
        insert_sort(arr,low,high)
        medium.append(arr[low+2])
        low +=5
        high +=5 
        
    insert_sort(arr,low,len(arr)-1)
    
    return arr,medium

def partion(arr,m_star,medium_num):
    
    # 因為沒有足夠的空位，所以臨時放在list裡，然後最後複製回去
    list = [-1]*(len(arr))
    # 小於pivot的指標，大於pivot的指標
    i =0
    j =len(arr)-1
    
    if medium_num == 0:
        left = arr[:len(arr)//2-1]
        right =arr[len(arr)//2:]
        return len(arr)//2-1,left,right
        
    
    # 先處理左邊的資料，處理左上角
    for k in range(medium_num):
        #左上角可以直接放進左邊
        # 理論上是直接把左上角放在head,右下角放在end,然後再處理左下角和右上角，以及最後的餘數
        # 這樣可以儘量保證有序，減少插入排序的工作量
        if arr[5*k + 2] < m_star:
            list[i]=arr[5*k + 2-2]
            i +=1
            list[i]=arr[5*k + 2-1]
            i +=1
            list[i]=arr[5*k + 2]
            i +=1

    # 處理中位數後面的分組，處理右下角
        # 從最後面開始處理，因為這裡的數都比較大
        elif  arr[5*k + 2] > m_star:
            list[j]=arr[5*k + 2+2]
            j -=1
            list[j]=arr[5*k + 2+1]
            j -=1
            list[j]=arr[5*k + 2]
            j -=1
            
        else:
            # 處理中位數那一組上邊，上面的放左邊
            list[i]

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    找中位數，找第k小,還存在問題
       
  
  
 找第k小 
 上次介紹了找第二大使用的方法時，使用錦標賽的方法，找到最大，在最大的手下敗將裡找第二大，也就是亞軍在冠軍的手下敗將裡產生，亞軍只敗給過冠軍，這種方法比較次數時(n-1) + (logn-1),這個時間複雜度最優的方案了為O(n) 那麼怎麼找第k大了，季軍只能在冠軍和亞軍的手下敗 

  
 

    

    
    從倆個有序陣列中找出第K小的數。要求時間複雜度O(logmin(m,n))
      
							
							
							思路

  該題目要求時間複雜度為O(log(min{m,n})) 所以不能直接遍歷任意一個數組這樣時間複雜度就不符合了。也不能對任意一陣列進行二分查詢，因為要求是倆個數組元素合併後的第K小的數，所以直接遍歷用二分遍歷任意一個數組也是行不通的。
  故我們可以以 

  
 

    

    
    COGS 930. [河南省隊2012] 找第k小的數 主席樹
      ==   name   oot   date   b+   iostream   ++   using   algo   主席樹裸板子

#include<cstdio>
#include<iostream>
#include<algorithm>
#define MAXN 

  
 

    

    
    第1章第1節練習題10 查找中位數
      str   idt   findmi   proc   borde   1.3   hidden   argc   -a   
        問題描寫敘述


  一個長度為L(L ≥1) 的升序序列S。處在第 ? L/2 ? 個位置的數稱為S的中位數。比如，若序列S1=(11,13,15,17,19)S 

  
 

    

    
    求兩個有序數組的中位數或者第k小元素（轉載）
      href   數組   lan   get   .cn   sdoi   com   第k小元素   .html   http://www.cnblogs.com/TenosDoIt/p/3554479.html
 
http://www.cnblogs.com/TenosDoIt/p/3675220.htm 

  
 

    

    
    劍指offer系列——二叉搜尋樹的第k個結點，資料流的中位數，滑動視窗的最大值
       
 
 二叉搜尋樹的第k個結點 
 題目描述 
 給定一棵二叉搜尋樹，請找出其中的第k小的結點。例如， （5，3，7，2，4，6，8）    中，按結點數值大小順序第三小結點的值為4。 
 解題思路： 
 二叉搜尋樹中序遍歷就能排好序，所以中序遍歷到第k個結點就是第k小的結點。 
 程式 

  
 

    

    
    230. 二叉搜尋樹中第K小的元素(中等，樹）
       
 
  給定一個二叉搜尋樹，編寫一個函式 kthSmallest 來查詢其中第 k 個最小的元素。 
 說明： 你可以假設 k 總是有效的，1 ≤ k ≤ 二叉搜尋樹元素個數。 
 示例 1: 
 輸入: root = [3,1,4,null,2], k  

  
 

    

    
    分治法：BFPTR演算法找第k小
       
  
  
 BFPTR演算法 
 來自於Blum、Floyd、Pratt、Rivest、Tarjan這5個人，一起釋出了一篇名為 “Time bounds for selection” 的論文，有興趣可以看一下:https://pan.baidu.com/s/1QEWjZBrjEJ7zTIrI99sFY 

  
 

    

    
    分治法：關於選擇演算法，找最大，找最小，同時找最大和最小，找第二大
       
  
  
 找最大或者最小，蠻力演算法為最優的演算法，需要比較n-1次 
 # 這個已經是最優的演算法了，比較n-1次
def findMax(arr):
    max_pivot = arr[0]
    
    for i in range(1,len(arr)):
        if arr 

  
 

    

    
    [LeetCode] Find K-th Smallest Pair Distance 找第K小的數對兒距離
      
Given an integer array, return the k-th smallest distance among all the pairs. The distance of a pair (A, B) is defined as the absolute difference betwee 

  
 

    

    
    大根堆 小根堆 找中位數
      
                
集合中元素，前一半儲存在一個最大堆中，後一半儲存在一個最小堆中。
使用變數MaxHeapNum記錄最大堆元素的個數，使用變數MinHeapNum記錄最小堆元素的個數。控制MaxHeapNum與MinHeapNum的差不能超過1。每次將要插入的元素Num與最大堆頂部元素Max 

  
 

    

    
    leetcode：Median of Two Sorted Arrays (找兩個序列的中位數，O(log (m+n))限制) 【面試演算法】
      
                
題目：
There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays. The overall run time comp 

  
 

    

    
    阿里開發者招聘節 | 面試題02-04：給定一個二叉搜尋樹(BST)，找到樹中第K小的節點
      
                                        
                                                為幫助開發者們提升面試技能、有機會入職阿里，雲棲社群特別製作了這個專輯——阿里巴巴資深技術專家們結合多年的工作、面試經驗總結提煉而 

  
 

    

    
    選擇問題（選擇數組中第K小的數）
      ++i   bsp   裝逼   mes   tof   quick   復雜度   names   返回       由排序問題可以引申出選擇問題，選擇問題就是選擇並返回數組中第k小的數，如果把數組全部排好序，在返回第k小的數，也能正確返回，但是這無疑做了很多無用功，由上篇博客中提到的快速排序，稍稍修改下就 

  
 

    

    
    少年，想學帶修改主席樹嗎 | BZOJ1901 帶修改區間第k小
      ==   write   algo   i++   sin   esp   天下   read   一個   少年，想學帶修改主席樹嗎 | BZOJ1901 帶修改區間第k小

有一道題（BZOJ 1901）是這樣的：n個數，m個詢問，詢問有兩種：修改某個數/詢問區間第k小。
不帶修改的區間第k小用主席樹很好 

  
 

    

    
    [LeetCode] Kth Smallest Number in Multiplication Table 乘法表中的第K小的數字
      dia   lee   kth   tco   example   class   ref   this   數字    

Nearly every one have used the Multiplication Table. But could you find out the k-th small 

  
 

    

    
    leetcode 二叉搜索樹中第K小的元素 python
      binary   rap   wid   div   append   idt   示例   src   查找   
 
 
 
二叉搜索樹中第K小的元素
 




 

給定一個二叉搜索樹，編寫一個函數 kthSmallest 來查找其中第 k 個最小的元素。
說明：你可以假設 k 總是有效的，1 ≤ k 

  
 

    

    
    LeetCode 230. 二叉搜索樹中第K小的元素 (平衡樹)
      如何   attack   有效   tac   並且   att   eno   del   root   題目
給定一個二叉搜索樹，編寫一個函數 kthSmallest 來查找其中第 k 個最小的元素。
說明：
你可以假設 k 總是有效的，1 ≤ k ≤ 二叉搜索樹元素個數。
示例 1:
輸入: root 

  
 

    

    
    LeetCode-230 kth smallest element in a bst 二叉搜尋樹中第K小的元素
       
 
 
 題目連結 
 https://leetcode-cn.com/problems/kth-smallest-element-in-a-bst/ 
 題意 
 中文題，對於二叉搜尋樹而言，找其中的第K小的數 
 題解 
         很有趣的題，但是很簡單 

  
 

    

    
    Leetcode--378. 有序矩陣中第K小的元素
       
 
 給定一個 n x n 矩陣，其中每行和每列元素均按升序排序，找到矩陣中第k小的元素。 請注意，它是排序後的第k小元素，而不是第k個元素。 
 示例: 
 matrix = [
   [ 1,  5,  9],
   [10, 11, 13],
   [12, 13, 15]
],

找中位數，找第k小,還存在問題

找第k小

前面講了，快排在最壞的情況下，每次選擇的都是邊緣上的元素，每次問題規模只縮小了1，那他的時間複雜度還是n^2

隨機快排的實現方法

還有一種思路，就是那個pivot也不是隨機選擇的，怎麼來了，他應該是在中位數附近，那麼我們是不是可以，計算的來pivot了

下面有一種失敗的方法，參考一下：

為什麼是失敗的方法了？這裡給中位數陣列求中位數的方法是插入排序？你是沒睡醒嗎？n/5的規模使用插入排序，你說雞肋不雞肋，雖然後面的陣列基本都是有序的，但是第一次的工作量就有O(n^2)的工作量。

找中位數，找第k小,還存在問題

從倆個有序陣列中找出第K小的數。要求時間複雜度O(logmin(m,n))

COGS 930. [河南省隊2012] 找第k小的數主席樹

第1章第1節練習題10 查找中位數

求兩個有序數組的中位數或者第k小元素（轉載）

劍指offer系列——二叉搜尋樹的第k個結點，資料流的中位數，滑動視窗的最大值

230. 二叉搜尋樹中第K小的元素(中等，樹）

分治法：BFPTR演算法找第k小

分治法：關於選擇演算法，找最大，找最小，同時找最大和最小，找第二大

[LeetCode] Find K-th Smallest Pair Distance 找第K小的數對兒距離

大根堆小根堆找中位數

leetcode：Median of Two Sorted Arrays (找兩個序列的中位數，O(log (m+n))限制) 【面試演算法】

阿里開發者招聘節 | 面試題02-04：給定一個二叉搜尋樹(BST)，找到樹中第K小的節點

選擇問題（選擇數組中第K小的數）

少年，想學帶修改主席樹嗎 | BZOJ1901 帶修改區間第k小

[LeetCode] Kth Smallest Number in Multiplication Table 乘法表中的第K小的數字

leetcode 二叉搜索樹中第K小的元素 python

LeetCode 230. 二叉搜索樹中第K小的元素 (平衡樹)

LeetCode-230 kth smallest element in a bst 二叉搜尋樹中第K小的元素

Leetcode--378. 有序矩陣中第K小的元素