第 1 集 核心排序算法之堆排序原理讲解
简介: 重点排序算法之堆排序原理讲解

第 2 集 核心排序算法之堆排序编码实战《上》
简介: 核心排序算法之堆排序编码实战《上》
- 编码实现
- 无序堆构建成二叉堆
- 利用二叉堆特性:数组索引一半后的都是叶子节点,不需要做下沉比较;一半前都是非叶子节点,才需要做下沉比较

public class HeapSort {
/**
* 从小到大进行堆排序
* @param source
*/
public static void sort(int[] source) {
//步骤一:构建堆,数组下标0不存储数据
int[] heap = new int[source.length + 1];
//根据待排序数组,构造一个无序的堆
System.arraycopy(source, 0, heap, 1, source.length);
//对堆中的元素做下沉调整,从长度的一半处开始,往堆顶索引1处扫描)
//二叉堆特性:数组索引一半后的都是叶子节点,不需要做下沉,一半前都是非叶子节点,才需要做
for (int i = (heap.length) / 2; i > 0; i--) {
down(heap, i, heap.length - 1);
}
System.out.println("大顶堆:"+Arrays.toString(heap));
// 步骤二:堆排序
}
/**
* 比较大小,item[left] 元素是否小于 item[right]的元素
*/
private static boolean rightBig(int[] heap, int left, int right) {
return heap[left] < heap[right];
}
/**
* 交互堆中两个元素的位置
*/
private static void swap(int[] heap, int i, int j) {
int temp = heap[i];
heap[i] = heap[j];
heap[j] = temp;
}
/**
* 使用下沉操作,堆顶和最后一个元素交换后,重新堆化
* 不断比较 节点 arr[k]和对应 左节点arr[2*k] 和 右节点arr[2*k+1]的大小,如果当前结点小,则需要交换位置
* 直到找到 最后一个索引节点比较完成 则结束
* <p>
* 数组中下标为 k 的节点
* 左子节点下标为 2*k 的节点
* 右子节点就是下标 为 2*k+1 的节点
* 父节点就是下标为 k/2 取整的节点
*/
private static void down(int[] heap, int k, int range) {
// 最后一个节点的下标是range,即元素总个数
while (2 * k <= range) {
//记录当前节点的左右子节点,较大的节点
int maxIndex;
if (2 * k + 1 <= range) {
if (rightBig(heap, 2 * k, 2 * k + 1)) {
maxIndex = 2 * k + 1;
} else {
maxIndex = 2 * k;
}
} else {
maxIndex = 2 * k;
}
//比较当前节点和较大接的值,如果当前节点大则结束
if (heap[k] > heap[maxIndex]) {
break;
} else {
//否则往下一层比较,当前节点的k变为子节点中较大的值
swap(heap, k, maxIndex);
k = maxIndex;
}
}
}
}
第 3 集 核心排序算法之堆排序编码实战《下》
简介: 核心排序算法之堆排序编码实战《下》
/**
* 从小到大进行堆排序
* @param source
*/
public static void sort(int[] source) {
//步骤一:构建堆,数组下标0不存储数据
int[] heap = new int[source.length + 1];
//根据待排序数组,构造一个无序的堆
System.arraycopy(source, 0, heap, 1, source.length);
//对堆中的元素做下沉调整,从长度的一半处开始,往堆顶索引1处扫描)
//二叉堆特性:数组索引一半后的都是叶子节点,不需要做下沉,一半前都是非叶子节点,才需要做
for (int i = (heap.length) / 2; i > 0; i--) {
down(heap, i, heap.length - 1);
}
System.out.println("大顶堆:"+Arrays.toString(heap));
// 步骤二:堆排序,把堆顶元素和数组最后一个索引元素交换;然后再堆化,然后堆顶又是最大元素,再和数组倒数第二索引处交换;持续进行直到最后
// 类似删除操作,只需要下沉操作重新堆化即可
//记录未排序的元素中最大的索引
int maxUnSortIndex = heap.length - 1;
//通过循环,交换堆顶元素和最大未排序元素的下标
while (maxUnSortIndex != 1) {
//交换元素
swap(heap, 1, maxUnSortIndex);
//排序后最大元素所在的索引,不要参与堆的下沉,所以 递减1
maxUnSortIndex--;
//继续对堆顶处的元素进行下沉调整
down(heap, 1, maxUnSortIndex);
}
//把heap中的数据复制到原数组source中
System.arraycopy(heap, 1, source, 0, source.length);
}
public static void main(String[] args) {
//待排序数组
int[] arr = {923,23,12,4,9932,11,34,49,123,222,880};
//堆排序
HeapSort.sort(arr);
//输出排序后数组中的元素
System.out.println("堆排序:"+Arrays.toString(arr));
}
第 4 集 大厂超高频面试题-海量数据之堆应用 TopK 思想
简介:大厂超高频面试题-海量数据之堆应用 TopK 思想
-
TopK 问题
- 从一堆数据中选出前多少个最大或最小数,这类是一二线大厂特别高频的面试题
- 思想
- 用堆来解决问题,【取大用小,取小用大】
- 取最大的 K 个数 用小顶堆;
- 取最小的 K 个数 用大顶堆;
-
取海量数据里面最小的 K 个数
- 要找出数组中最小的 k 个数,就要【构造一个有 k 个元素的大顶堆】,大顶堆的堆顶元素值最大
- 比较堆顶的元素和扫描的元素,如果堆顶元素 < 扫描元素,继续扫描其他元素
- 如果堆顶元素 > 扫描元素 ,将堆顶元素出队,扫描元素插入大顶堆,将更小的元素换到堆中
- 反复根据上述步骤操作,直到比较完最后一个元素,此时堆里面的就是最小的 k 个数
- 取海量数据里面最大的 K 个数
- 要找出数组中最大的 k 个数,就要【构造一个有 k 个元素的小顶堆】,小顶堆的堆顶元素值最小
- 比较堆顶的元素和扫描的元素,如果堆顶元素 > 扫描元素,继续扫描其他元素
- 如果堆顶元素 < 扫描元素 ,将堆顶元素出队,扫描元素插入小顶堆,将更大的元素换到堆中
- 反复根据上述步骤操作,直到比较完最后一个元素,此时堆里面的就是最大的 k 个数
第 5 集 大厂超面试题-100 亿个数中找出最小的前 k 个数《上》
简介:大厂超面试题-100 亿个数中找出最小的前 k 个数《上》
-
需求
-
题目分析
-
100 亿个数,一个数占四个字节,那么 100 亿个数就需要 40G 的存储空间
- 1G = 10 亿字节, 100 亿个 int = 400 亿字节 = 40G
-
使用普通的电脑和服务器肯定不可能把全部数据,不能创建一个具有 100 亿个数据的堆
-
而且使用常规加载进去,存储空间不够大,时间复杂度也是很大
-
解题思路
- 要找出数组中最小的 k 个数,就要【构造一个有 k 个元素的大顶堆】,大顶堆的堆顶元素值最大
- 比较堆顶的元素和扫描的元素,如果堆顶元素 < 扫描元素,继续扫描其他元素
- 如果堆顶元素 > 扫描元素 ,将堆顶元素出队,扫描元素插入大顶堆,将更小的元素换到堆中
- 反复根据上述步骤操作,直到比较完最后一个元素,此时堆里面的就是最小的 k 个数
public class MinTopKHeapSort {
/**
* 从小到大进行堆排序
* @param source
*/
public static void sort(int[] source,int temp) {
//步骤一:构建堆,数组下标0不存储数据
int[] heap = new int[source.length + 1];
//根据待排序数组,构造一个无序的堆
System.arraycopy(source, 0, heap, 1, source.length);
//对堆中的元素做下沉调整,从长度的一半处开始,往堆顶索引1处扫描)
//二叉堆特性:数组索引一半后的都是叶子节点,不需要做下沉,一半前都是非叶子节点,才需要做
for (int i = (heap.length) / 2; i > 0; i--) {
down(heap, i, heap.length - 1);
}
System.out.println("大顶堆:"+Arrays.toString(heap)+", 新元素="+temp);
// 循环将数组中剩余的数放入heap数组中,并进行堆排序,如果当前数小于Heap数组中的第一个数,则将当前数替换为第一个数
if (temp < heap[1]) {
heap[1] = temp;
//重新堆化
down(heap, 1, source.length-1);
}
System.arraycopy(heap, 1, source, 0, source.length);
}
/**
* 比较大小,item[left] 元素是否小于 item[right]的元素
*/
private static boolean rightBig(int[] heap, int left, int right) {
return heap[left] < heap[right];
}
/**
* 交互堆中两个元素的位置
*/
private static void swap(int[] heap, int i, int j) {
int temp = heap[i];
heap[i] = heap[j];
heap[j] = temp;
}
/**
* 使用下沉操作,堆顶和最后一个元素交换后,重新堆化
* 不断比较 节点 arr[k]和对应 左节点arr[2*k] 和 右节点arr[2*k+1]的大小,如果当前结点小,则需要交换位置
* 直到找到 最后一个索引节点比较完成 则结束
*/
private static void down(int[] heap, int k, int range) {
}
public static void main(String[] args) {
//随机数据
int[] arr = {923,982,23,1000,1990,12,4,9932,11,34,49,123,1,222,880};
// 定义一个长度为k的数组
int top = 3;
int[] heap = new int[top];
// 循环将数组中的前k个数放入Heap数组中;
for (int i = 0; i < top; i++) {
heap[i] = arr[i];
}
//循环将数组中剩余的数放入heap数组中,并进行堆排序
for(int i = top; i < arr.length; i++){
MinTopKHeapSort.sort(heap,arr[i]);
}
//输出排序后数组中的元素
System.out.println("最小的 top k 数据:"+Arrays.toString(heap));
}
}
第 6 集 大厂超面试题-100 亿个数中找出最小的前 k 个数《下》
简介:大厂超面试题-100 亿个数中找出最小的前 k 个数《下》
/**
* 简单写法
*/
private static void siftDown(int[] arr, int i, int length) {
//当前节点存在左子树
while (2 * i < length) {
//此时j为左子树节点
int j = 2 * i;
//如果当前节点存在右子树,并且右子树的值大于左子树的值
if (j < length && arr[j + 1] > arr[j]) {
//此时j为右子树节点
j = j + 1;
}
//比较当前节点值与其左右子树值的大小
if (arr[i] > arr[j]) {
break;
} else {
swap(arr, i, j);
i = j;
}
}
}