数据流中的中位数(顶堆)
作者:互联网
1.堆
堆的性质
大顶堆:每个节点的值都大于或者等于它的左右子节点的值(arr[i] >= arr[2i + 1] && arr[i] >= arr[2i + 2])。
小顶堆:每个节点的值都小于或者等于它的左右子节点的值(arr[i] <= arr[2i + 1] && arr[i] <= arr[2i + 2])。
第一个非叶子节点的索引就是arr.length / 2 -1。
public class HeapSort { public static void heapSort(int[] arr) { if (arr == null || arr.length == 0) { return; } int len = arr.length; // 构建大顶堆,这里其实就是把待排序序列,变成一个大顶堆结构的数组 buildMaxHeap(arr, len); // 交换堆顶和当前末尾的节点,重置大顶堆 for (int i = len - 1; i > 0; i--) { swap(arr, 0, i); len--; heapify(arr, 0, len); } } private static void buildMaxHeap(int[] arr, int len) { // 从最后一个非叶节点开始向前遍历,调整节点性质,使之成为大顶堆 for (int i = (int)Math.floor(len / 2) - 1; i >= 0; i--) { heapify(arr, i, len); } } private static void heapify(int[] arr, int i, int len) { // 先根据堆性质,找出它左右节点的索引 int left = 2 * i + 1; int right = 2 * i + 2; // 默认当前节点(父节点)是最大值。 int largestIndex = i; if (left < len && arr[left] > arr[largestIndex]) { // 如果有左节点,并且左节点的值更大,更新最大值的索引 largestIndex = left; } if (right < len && arr[right] > arr[largestIndex]) { // 如果有右节点,并且右节点的值更大,更新最大值的索引 largestIndex = right; } if (largestIndex != i) { // 如果最大值不是当前非叶子节点的值,那么就把当前节点和最大值的子节点值互换 swap(arr, i, largestIndex); // 因为互换之后,子节点的值变了,如果该子节点也有自己的子节点,仍需要再次调整。 heapify(arr, largestIndex, len); } } private static void swap (int[] arr, int i, int j) { int temp = arr[i]; arr[i] = arr[j]; arr[j] = temp; } }
2.数据流中的中位数
传入的数据为:[5,2,3,4,1,6,7,0,8],那么按照要求,输出是"5 3.5 3 3.5 3 3.5 4 3.5 4 "
- 先用java集合PriorityQueue来设置一个小顶堆和大顶堆
- 主要的思想是:因为要求的是中位数,那么这两个堆,大顶堆用来存较小的数,从大到小排列;
- 小顶堆存较大的数,从小到大的顺序排序*,显然中位数就是大顶堆的根节点与小顶堆的根节点和的平均数。
整个程序的执行流程应该是(用min表示小顶堆,max表示大顶堆):
- 5先进入大顶堆,然后将大顶堆中最大值放入小顶堆中,此时min=[5],max=[无],avg=[5]
- 2先进入小顶堆,然后将小顶堆中最小值放入大顶堆中,此时min=[5],max=[2],avg=[(5+2)/2]=[3.5]
- 3先进入大顶堆,然后将大顶堆中最大值放入小顶堆中,此时min=[3,5],max=[2],avg=[3]
- 4先进入小顶堆,然后将小顶堆中最小值放入大顶堆中,此时min=[4,5],max=[3,2],avg=[(4+3)/2]=[3.5]
- 1先进入大顶堆,然后将大顶堆中最大值放入小顶堆中,此时min=[3,4,5],max=[2,1],avg=[3]
- 6先进入小顶堆,然后将小顶堆中最小值放入大顶堆中,此时min=[4,5,6],max=[3,2,1],avg=[(4+3)/2]=[3.5]
- 7先进入大顶堆,然后将大顶堆中最大值放入小顶堆中,此时min=[4,5,6,7],max=[3,2,1],avg=[4]=[4]
- 0先进入小顶堆,然后将小顶堆中最大值放入小顶堆中,此时min=[4,5,6,7],max=[3,2,1,0],avg=[(4+3)/2]=[3.5]
- 8先进入大顶堆,然后将大顶堆中最小值放入大顶堆中,此时min=[4,5,6,7,8],max=[3,2,1,0],avg=[4]
import java.util.Comparator; import java.util.PriorityQueue; public class Solution { private int count = 0; //默认升序排列,也就是默认为最小堆 private PriorityQueue<Integer> minHeap = new PriorityQueue<>(); //通过重写Comparator接口的compare方法,构建一个逆序排列的最大堆 private PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>( new Comparator<Integer>() { @Override public int compare(Integer o1, Integer o2) { return o2 - o1; } }); public void Insert(Integer num) { if (count %2 == 0) { //最大堆插入一个元素之后,内部会自动重新构建一个最大堆maxheapify maxHeap.offer(num); //remove并返回第一个元素 int temp = maxHeap.poll(); //插入到最小堆,内部同样进行minheapify minHeap.offer(temp); } else { minHeap.offer(num); int temp = minHeap.poll(); maxHeap.offer(temp); } count++; } public Double GetMedian() { if (count %2 == 0) { return new Double((minHeap.peek() + maxHeap.peek())) / 2; } else { return new Double(minHeap.peek()); } } }
标签:大顶,arr,顶堆,int,中位数,len,数据流,小顶,节点 来源: https://www.cnblogs.com/Siughiqang/p/13387056.html