其他分享
首页 > 其他分享> > 利用最小堆实现topk

利用最小堆实现topk

作者:互联网

import heapq

class TopK:
    '''
    思路:
    1.先放入元素前k个建立一个最小堆
    2.迭代剩余元素:
    如果当前元素小于堆顶元素,跳过该元素
    否则替换堆顶为当前元素,并重新调整堆

    用最小堆来获取最大的几个元素,用前面最小的值替换成最大的值
    '''
    def __init__(self,iterable,k):
        self.minheap = [] #最小堆
        self.capacity = k # 最大的几个数
        self.iterable = iterable # 传入的列表
    def push(self,val): # 传入数据
        # 如果超过k个元素就push
        if len(self.minheap) >= self.capacity:
            min_val = self.minheap[0]
            if val < min_val:
                pass # 忽略元素
            else:
                # 替换最小堆元素,并保持最小堆的性质
                heapq.heapreplace(self.minheap,val)
        else:
            # 没有超过k个元素则push
            heapq.heappush(self.minheap,val)
    def get_topk(self):
        for val in self.iterable:
            self.push(val) # 出入数据
        return self.minheap # 返回最小堆

def test():
    import random
    i = list(range(1000))
    random.shuffle(i)
    _ = TopK(i,3)
    print(_.get_topk())
test()

标签:val,self,元素,最小,利用,topk,minheap,iterable
来源: https://www.cnblogs.com/wkhzwmr/p/15868605.html