腾讯面试:如何实现10亿数据判重? 当数据量比较大时,使用常规的方式来判重就不行了。 例如,使用 MySQL 数据库判重,或使用 List.contains() 或 Set.contains() 判重就不可行,因为 MySQL 在数据量大时查询就会非常慢,而数据库又是及其珍贵的全局数据库资源。 《阿里巴巴Java开发手册》上也说了,如果单表数据量超过 500 万或 2GB 时就建议分库分表了,如下图所示: 所以数据库去重显然是不行的 数据运维 2024-06-03 泡泡