【Mysql】Mysql删除重复数据只保留一条

InterviewCoder

# 【Mysql】Mysql 删除重复数据只保留一条

(1)以这张表为例:

1
2
3
4
5
6
7
CREATE TABLE `test`  (
`id` varchar(32) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL COMMENT '注解id',
`name` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '名字',
PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Compact;

INSERT INTO test (id,`name`) VALUES (replace(uuid(),'-',''),'张三'),(replace(uuid(),'-',''),'张三');

表里有两条数据,然后名字是相同的,但是 id 是不同的,现在要求是只留一条数据:

在这里插入图片描述

(2)查询 name 值重复的数据:

现实开发当中可能一个字段无法锁定重复值,可以采取 group by 多个值!利用多个值来锁定重复的行数据!

1
SELECT name FROM test GROUP BY `name` HAVING count( name ) > 1

(3)查询重复数据里面每个最小的 id:

1
SELECT  min(id) as id FROM test GROUP BY `name` HAVING count( name ) > 1

(4)查询去掉重复数据最小 id 的其他数据:也就是要删除的数据!

1
2
3
4
SELECT * FROM test 
WHERE name IN ( SELECT name FROM test GROUP BY `name` HAVING count( name ) > 1 )
AND
id NOT IN (SELECT min( id ) FROM test GROUP BY `name` HAVING count( NAME ) > 1)

(5)删除去掉重复数据最小 id 的其他数据:

可能这时候有人该说了,有了查询,直接改成 delete 不就可以了,真的是这样吗?其实不是的,如下运行报错:

在这里插入图片描述

首先明确一点这个错误只会发生在 delete 语句或者 update 语句,拿 update 来举例 : update A表 set A列 = (select B列 from A表); 这种写法就会报这个错误,原因:你又要修改 A 表,然后又要从 A 表查数据,而且还是同层级。Mysql 就会认为是语法错误!

嵌套一层就可以解决, update A表 set A列 = (select a.B列 from (select * from A表) a); 当然这个只是个示例,这个示例也存在一定的问题,比如 (select a.B列 from (select * from A表) a) 他会查出来多条,然后赋值的时候会报 1242 - Subquery returns more than 1 row

嵌套一层他就可以和 update 撇清关系,会优先查括号里面的内容,查询结果出来过后会给存起来,类似临时表,可能有的人该好奇了, update A表 set A列 = (select B列 from A表); 我明明加括号了呀,难道不算嵌套吗,当然不算,那个括号根本没有解决他们之间的层次关系!

详解看这篇文章:https://blog.csdn.net/weixin_43888891/article/details/127000534

(6)正确的写法:

方式一:

1
2
3
4
DELETE FROM test 
WHERE name IN ( select a.name from (SELECT name FROM test GROUP BY `name` HAVING count( name ) > 1) a)
AND
id NOT IN (select a.id from (SELECT min(id) as id FROM test GROUP BY `name` HAVING count( name ) > 1) a)

注意:删除之前一定要先查询,然后再删除,否则一旦语法有问题导致删了不想删除的数据,想要恢复很麻烦!或者删除前备份好数据,不要嫌麻烦,一旦出问题,才是真正的大麻烦!

方式二:

1
2
3
4
5
6
7
8
DELETE FROM test 
WHERE
id NOT IN (
SELECT
t.id
FROM
( SELECT MIN(id) as id FROM test GROUP BY NAME ) t)

(7)错误的写法: 这块我吃过一次亏,所以专门写出来,避免踩坑!

千万千万不能这么搞,下面这个语法相当于是先按 name 分组,然后查出来大于 1 的,这时候假如大于 1 的有很多,然后外面嵌套的那一层,只取了最小的一条数据,然后再加上使用的是 NOT IN ,最终会导致数据全部被删除!!!

在这里插入图片描述

执行前有四条数据,实际上我们要的是张三留下来一条,然后李四留下来一条

在这里插入图片描述

执行结果:只留下了一条!

在这里插入图片描述

# 关于我

Brath 是一个热爱技术的 Java 程序猿,公众号「InterviewCoder」定期分享有趣有料的精品原创文章!

InterviewCoder

非常感谢各位人才能看到这里,原创不易,文章如果有帮助可以关注、点赞、分享或评论,这都是对我的莫大支持!

评论