SQL去重(博主面试题)
SQL去重(博主面试题)
在 SQL 中,可以使用 DISTINCT 关键字进行去重操作。DISTINCT 关键字可以用于 SELECT 语句中,用于去除查询结果中重复的行。
例如,假设有一个名为 students 的表,其中包含学生的姓名和年龄信息,我们需要查询所有学生的姓名,并去重后返回结果。可以使用以下 SQL 语句进行查询:
SELECT DISTINCT name FROM students;
执行以上 SQL 语句后,将返回所有学生姓名的去重结果。
需要注意的是,DISTINCT 关键字是针对整行进行去重的,如果查询结果中有多列数据,只有当整行数据完全相同才会被去重。如果需要对部分列进行去重,可以使用 GROUP BY 子句和聚合函数进行操作。例如,如果需要查询每个年龄段的学生人数,并去重后返回结果,可以使用以下 SQL 语句进行查询:
SELECT age, COUNT(DISTINCT name) FROM students GROUP BY age;
执行以上 SQL 语句后,将返回每个年龄段的学生人数去重后的结果。但是当两个name一样的时候,就会数据有误。
如果有两个人的 name 相同,那么在使用 COUNT(DISTINCT name) 进行去重统计时,这两个人会被视为同一个人,计数器只会算作一个人。
如果需要对这两个人进行区分统计,可以使用其他列进行辅助去重,例如使用 ID 列或者其他唯一标识符列进行去重,例如:
SELECT COUNT(DISTINCT CONCAT(name, -, id)) FROM students;
这里使用 CONCAT(name, -, id) 将 name 和 id 拼接成一个字符串,然后对该字符串进行去重统计,这样就可以对两个 name 相同但是 id 不同的人进行区分统计。
当然,如果不需要对这两个人进行区分统计,只需要知道总共有多少个不同的 name,使用 COUNT(DISTINCT name) 就已经足够了。