【经典问题】给两个文件,分别有100亿个整数,我们只有1G内存,如何找到两个文件交集?

【方案一】使用Hash函数 + 分文件的方式使用hash函数将第一个文件的所有整数映射到1000个文件中,每个文件有1000万个整数,大约40M内存, 内存可以放下,把1000个文件记为 a1,a2,a3.....a1000,用同样的hash函数映射第二个文件到1000个文件中,这1000个文件记为...

腾讯二面:有 40 亿个 QQ 号,限制 1G 内存,问如何去重?被问懵了!

腾讯二面:有 40 亿个 QQ 号,限制 1G 内存,问如何去重?被问懵了!

40亿个QQ号,限制1G内存,如何去重?40亿个unsigned int,如果直接用内存存储的话,需要:4*4000000000 /1024/1024/1024 = 14.9G ,考虑到其中有一些重复的话,那1G的空间也基本上是不够用的。想要实现这个功能,可以借助...

海量数据处理面试题:给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?

海量数据处理面试题:给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?

问题:给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?分析:50亿个url,每个url 64字节:一共需要 50亿 × 64字节 ÷ 1024 ÷ 1024 ÷ 1024 = 298G ≈ 300G ,显然无法一次读入内存的。因此这里...

给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件

给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

相关电子书
更多
内存取证与IaaS云平台恶意行 为的安全监控
云服务器ECS内存增强型实例re6全新发布
立即下载 立即下载