面试突击：MySQL 中如何去重？

时间：2025-11-04 12:28:16 来源：网络整理编辑：域名

核心提示

作者 | 磊哥来源 | Java面试真题解析ID：aimianshi666）转载请联系授权微信ID：GG_Stone）在 MySQL 中，最常见的去重方法有两个：使用 distinct 或使用 gro

作者 | 磊哥

来源 | Java面试真题解析（ID：aimianshi666）

转载请联系授权（微信ID：GG_Stone）

在 MySQL 中，面试最常见的突击去重方法有两个：使用 distinct 或使用 group by，那它们有什么区别呢？中重接下来我们一起来看。

1、何去创建测试数据

复制-- 创建测试表drop table if exists pageview

;

create table pageview

(

id bigint primary key auto_increment comment 自增主键

,面试

aid bigint not null comment 文章ID

uid bigint not null comment （访问）用户ID

createtime datetime default now() comment 创建时间) default charset=utf8mb4

;

-- 添加测试数据insert into pageview(aid,uid) values(1,1

);

insert into pageview(aid,uid) values(1,1

);

insert into pageview(aid,uid) values(2,1

);

insert into pageview(aid,uid) values(2,2);1.2.3.4.5.6.7.8.9.10.11.12.13.

最终展现效果如下：

2、distinct 使用

distinct 基本语法如下：

复制SELECT DISTINCT column_name,突击column_name FROM table_name;1. （1）单列去重

我们先用 distinct 实现单列去重，根据 aid（文章 ID）去重，中重具体实现如下：

（2）多列去重

除了单列去重之外，何去distinct 还支持多列（两列及以上）去重，面试我们根据 aid（文章 ID）和 uid（用户 ID）联合去重，突击具体实现如下：

（3）聚合函数+去重

使用 distinct + 聚合函数去重，中重计算 aid 去重之后的何去总条数，具体实现如下：

3、面试group by 使用

group by 基础语法如下：

复制SELECT column_name,突击column_name FROM table_nameWHERE column_name operator valueGROUP BY column_name1.2.3. （1）单列去重

根据 aid（文章 ID）去重，具体实现如下：

与 distinct 相比 group by 可以显示更多的中重列，而 distinct 只能展示去重的列。

（2）多列去重

根据 aid（文章 ID）和 uid（用户 ID）联合去重，具体实现如下：

（3）聚合函数 + group by

统计每个 aid 的总数量，SQL 实现如下：从上述结果可以看出，使用 group by 和 distinct 加 count 的查询语义是完全不同的，distinct + count 统计的是源码下载去重之后的总数量，而 group by + count 统计的是分组之后的每组数据的总数。

4、distinct 和 group by 的区别

官方文档在描述 distinct 时提到：在大多数情况下 distinct 是特殊的 group by，如下图所示：

官方文档地址：https://dev.mysql.com/doc/refman/8.0/en/distinct-optimization.html但二者还是有一些细微的不同的，比如以下几个。

区别1：查询结果集不同

当使用 distinct 去重时，查询结果集中只有去重列信息，如下图所示：

当你试图添加非去重字段（查询）时，SQL 会报错如下图所示：

而使用 group by 排序可以查询一个或多个字段，如下图所示：

区别2：使用业务场景不同

统计去重之后的总数量需要使用 distinct，而统计分组明细，或在分组明细的基础上添加查询条件时，就得使用 group by 了。使用 distinct 统计某列去重之后的总数量：

统计分组之后数量大于 2 的站群服务器文章，就要使用 group by 了，如下图所示：

区别3：性能不同

如果去重的字段有索引，那么 group by 和 distinct 都可以使用索引，此情况它们的性能是相同的；而当去重的字段没有索引时，distinct 的性能就会高于 group by，因为在 MySQL 8.0 之前，group by 有一个隐藏的功能会进行默认的排序，这样就会触发 filesort 从而导致查询性能降低。

总结

大部分场景下 distinct 是特殊的 group by，但二者也有细微的区别，比如它们在查询结果集上、使用的具体业务场景上，以及性能上都是不同的。

香港云服务器

上一篇：电脑音频抽帧教程（实用技巧与工具，让音频编辑更专业化）

下一篇：电脑出现bash错误的解决方法（快速修复电脑中的bash错误）

面试突击：MySQL 中如何去重？

1、何去创建测试数据

2、distinct 使用

3、面试group by 使用

4、distinct 和 group by 的区别

总结

推荐

热门