996 Worker's Blog
996Worker 发布于 2022-06-07
996Worker 发布于 2022-06-03

Random sampling in Big Data -- Reservoir Sampling

需求给定一个可能含有重复元素的整数数组,要求随机输出给定的数字的索引。该数组很大, 可能存在海量下标.解决方案1. HashMap存储各种下标信息不可以, 因为下标很多, 导致HashMap过大时间复杂度:初始化消耗O(n),给出索引为O(1),其中n是nums的长度。空间复杂度:O(n)。我们需要

996Worker 发布于 2022-04-25
996Worker 发布于 2022-03-30
996Worker 发布于 2022-03-09
996Worker 发布于 2022-02-24