搜索引擎会通过日志文件把用户每次检索使用的所有查询串都记录下来,每个查询串的长度不超过255字节。假设目前有一千万个查询记录(重复度比较高,其实互异的查询串不超过三百万个;显然,一个查询串的重复度越高,说明查询它的用户越多,也就是越热门)。现要统计最热门的10个查询串,且要求使用的内存不能超过1GB。以下各方法中,可行且效率最高的方法是(41)
刷题刷出新高度,偷偷领先!偷偷领先!偷偷领先! 关注我们,悄悄成为最优秀的自己!
单选题
A
B
C
D
使用微信搜索喵呜刷题,轻松应对考试!
答案:
解析:
本题考查数据结构应用知识。
首先,我们需要考虑的是内存限制,快速排序和堆排序都需要较大的内存空间,对于大量的数据,可能会超过内存限制。因此,选项A和B因为存储需求过大而不可行。
对于选项C和D,都是利用哈希表保存所有的查询串并记下每个查询串的重复次数,再利用某种堆选出重复次数最多的10个查询串。但是,考虑到我们需要找出的是最大的10个元素,使用小顶堆更为合适。因为小顶堆在建立和调整时所需的时间是一个常数,可以确保在线性时间内找出最大的元素。
而选项D使用大顶堆,在数据量较大时,建立和维护大顶堆的时间成本较高,且可能存在存储容量问题。
因此,结合内存限制和效率要求,选项C是最合适的方法。
创作类型:
原创
本文链接:搜索引擎会通过日志文件把用户每次检索使用的所有查询串都记录下来,每个查询串的长度不超过255字节。假
版权声明:本站点所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明文章出处。让学习像火箭一样快速,微信扫码,获取考试解析、体验刷题服务,开启你的学习加速器!



