电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

MySQL 如何查找并刪除重復記錄的實現

瀏覽:7日期:2023-10-12 16:53:40

大家好,我是只談技術不剪發的 Tony 老師。由于一些歷史原因或者誤操作,可能會導致數據表中存在重復的記錄;今天我們就來談談如何查找 MySQL 表中的重復數據以及如何刪除這些重復的記錄。

創建示例表

首先創建一個示例表 people 并生成一些數據:

drop table if exists people;create table people ( id int auto_increment primary key, name varchar(50) not null, email varchar(100) not null);insert into people(name, email)values (’張三’, ’zhangsan@test.com’), (’李四’, ’lisi@test.com’), (’王五’, ’wangwu@test.com’), (’李斯’, ’lisi@test.com’), (’王五’, ’wangwu@test.com’), (’王五’, ’wangwu@test.com’);select * from people;id|name |email |--|------|-----------------| 1|張三 |zhangsan@test.com| 2|李四 |lisi@test.com | 3|王五 |wangwu@test.com | 4|李斯 |lisi@test.com | 5|王五 |wangwu@test.com | 6|王五 |wangwu@test.com |

其中,2 和 4 的 email 字段存在重復數據;3、5 和 6 的 name 和 email 字段存在重復數據。

此時,如果我們想要為 email 創建一個唯一約束,將會返回錯誤:

alter table people add constraint uk_people_email unique key (email);ERROR 1062 (23000): Duplicate entry ’wangwu@test.com’ for key ’people.uk_people_email’

顯然,我們必須找出并刪除 email 字段中的重復記錄才能創建唯一約束。

查找單個字段中的重復數據

如果想要找出 email 重復的數據,可以基于該字段進行分組統計,并且返回行數大于 1 的分組:

select email, count(email)from peoplegroup by emailhaving count(email) > 1;email |count(email)|---------------|------------|lisi@test.com | 2|wangwu@test.com| 3|

查詢結果顯示有兩個郵箱地址存在重復情況。如果想要查看完整的重復數據,可以使用子查詢或者連接查詢:

select *from peoplewhere email in ( select email from people group by email having count(email) > 1)order by email;id|name |email |--|------|---------------| 2|李四 |lisi@test.com | 4|李斯 |lisi@test.com | 3|王五 |wangwu@test.com| 5|王五 |wangwu@test.com| 6|王五 |wangwu@test.com|select p.*from people pjoin ( select email from people group by email having count(email) > 1) d on p.email = d.emailorder by email;id|name |email |--|------|---------------| 2|李四 |lisi@test.com | 4|李斯 |lisi@test.com | 3|王五 |wangwu@test.com| 5|王五 |wangwu@test.com| 6|王五 |wangwu@test.com|

另一種查找重復記錄的方法就是直接使用自連接查詢和 distinct 操作符,例如:

select distinct p.*from people pjoin people d on p.email = d.emailwhere p.id <> d.idorder by p.email;id|name |email |--|------|---------------| 4|李斯 |lisi@test.com | 2|李四 |lisi@test.com | 6|王五 |wangwu@test.com| 5|王五 |wangwu@test.com| 3|王五 |wangwu@test.com|

注意,不能省略 distinct,否則會某些數據(3、5、6)會返回多次。

查找多個字段中的重復數據

如果我們想要找出 name 和 email 字段都重復的數據,實現方式也類似:

select *from peoplewhere (name, email) in ( select name, email from people group by name, email having count(1) > 1)order by email;id|name |email |--|------|---------------| 3|王五 |wangwu@test.com| 5|王五 |wangwu@test.com| 6|王五 |wangwu@test.com|select distinct p.*from people pjoin people d on p.name = d.name and p.email = d.emailwhere p.id <> d.idorder by email;id|name |email |--|------|---------------| 6|王五 |wangwu@test.com| 5|王五 |wangwu@test.com| 3|王五 |wangwu@test.com|

只有當 name 和 email 都相同時才是重復數據,所以 2 和 4 不是重復記錄。

刪除重復數據

找出重復數據之后,需要解決的就是如何刪除了,通常我們需要保留其中的一條記錄。

使用 DELETE FROM 刪除重復數據

假如我們想要刪除 email 重復的記錄,只保留其中一條,可以使用 DELETE FROM 語句實現:

delete pfrom people pjoin people d on p.email = d.email and p.id < d.id;

delete 語句通過連接找出需要刪除的記錄,以上示例保留了重復數據中的最大 id 對應的數據行。再次查詢 people 表:

select * from people;id|name |email |--|------|-----------------| 1|張三 |zhangsan@test.com| 4|李斯 |lisi@test.com | 6|王五 |wangwu@test.com |

想一想,如果想要保留重復數據中 id 最小的數據應該怎么實現呢?

利用子查詢刪除重復數據

通過子查詢可以找出需要保留的數據,然后刪除其他的數據:

deletefrom peoplewhere id not in ( select max(id) from people group by email );

在執行上面的語句之前,記得重新創建 people 表并生成測試數據。

通過中間表刪除重復數據

通過使用中間表也可以實現重復記錄的刪除,例如:

-- 創建中間表create table people_temp like people;-- 復制需要保留的數據行insert into people_temp(id, name, email)select id, name, emailfrom peoplewhere id in ( select max(id) from people group by email );--刪除原表drop table people;-- 將中間表重命名為原表alter table people_temp rename to people;

在執行上面的語句之前,記得重新創建 people 表并生成測試數據。

這種方式需要注意的一個問題就是 create table … like 語句不會復制原表上的外鍵約束,需要手動添加。

利用窗口函數刪除重復數據

ROW_NUMBER() 是 MySQL 8.0 中新增的窗口函數,可以用于將數據進行分組,然后為每一條數據分配一個唯一的數字編號。例如:

select id, name, email, row_number() over (partition by email order by id) as row_num from people;id|name |email |row_num|--|------|-----------------|-------| 2|李四 |lisi@test.com | 1| 4|李斯 |lisi@test.com | 2| 3|王五 |wangwu@test.com | 1| 5|王五 |wangwu@test.com | 2| 6|王五 |wangwu@test.com | 3| 1|張三 |zhangsan@test.com| 1|

以上語句基于 email 分組(partition by email),同時按照 id 進行排序(order by id),然后為每個組內的數據分配一個編號;如果編號大于 1 就意味著存在重復的數據。

📝除了 ROW_NUMBER() 之外,RANK() 或者 DENSE_RANK() 函數也可以實現以上功能。關于窗口函數的介紹和使用案例,可以參考這篇文章。

基于該查詢結果可以刪除重復的記錄:

deletefrom peoplewhere id in ( select id from ( select id, row_number() over (partition by email order by id desc) as row_num from people) d where row_num > 1);

在執行上面的語句之前,記得重新創建 people 表并生成測試數據。

基于多個字段的重復數據刪除方法和單個字段非常類似,大家可以自行嘗試,也歡迎留言討論!

總結

本文介紹了如何在 MySQL 中查找并刪除重復記錄,包括使用 GROUP BY 分組、子查詢或者連接查詢等方法查找單個字段或者多個字段中的重復數據,以及使用 DELETE FROM 語句、子查詢、中間表和窗口函數等方法實現重復數據的刪除。更多相關MySQL 查找并刪除重復記錄內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: MySQL 數據庫
相關文章:
主站蜘蛛池模板: 磁力抛光机_磁力研磨机_磁力去毛刺机-冠古设备厂家|维修|租赁【官网】 | 自动钻孔机-全自动数控钻孔机生产厂家-多米(广东)智能装备有限公司 | 消防泵-XBD单级卧式/立式消防泵-上海塑泉泵阀(集团)有限公司 | 西安标准厂房_陕西工业厂房_西咸新区独栋厂房_长信科技产业园官方网站 | 蒸汽热收缩机_蒸汽发生器_塑封机_包膜机_封切收缩机_热收缩包装机_真空机_全自动打包机_捆扎机_封箱机-东莞市中堡智能科技有限公司 | 齿轮减速机_齿轮减速电机-VEMT蜗轮蜗杆减速机马达生产厂家瓦玛特传动瑞环机电 | 英思科GTD-3000EX(美国英思科气体检测仪MX4MX6)百科-北京嘉华众信科技有限公司 | 龙门加工中心-数控龙门加工中心厂家价格-山东海特数控机床有限公司_龙门加工中心-数控龙门加工中心厂家价格-山东海特数控机床有限公司 | 企典软件一站式企业管理平台,可私有、本地化部署!在线CRM客户关系管理系统|移动办公OA管理系统|HR人事管理系统|人力 | 外观设计_设备外观设计_外观设计公司_产品外观设计_机械设备外观设计_东莞工业设计公司-意品深蓝 | 玉米深加工设备-玉米深加工机械-新型玉米工机械生产厂家-河南粮院机械制造有限公司 | 涡轮流量计_LWGY智能气体液体电池供电计量表-金湖凯铭仪表有限公司 | 上海地磅秤|电子地上衡|防爆地磅_上海地磅秤厂家–越衡称重 | 定制奶茶纸杯_定制豆浆杯_广东纸杯厂_[绿保佳]一家专业生产纸杯碗的厂家 | 宝元数控系统|对刀仪厂家|东莞机器人控制系统|东莞安川伺服-【鑫天驰智能科技】 | 陕西华春网络科技股份有限公司| 贴片电容-贴片电阻-二三极管-国巨|三星|风华贴片电容代理商-深圳伟哲电子 | 工业铝型材-铝合金电机壳-铝排-气动执行器-山东永恒能源集团有限公司 | led冷热冲击试验箱_LED高低温冲击试验箱_老化试验箱-爱佩百科 | 电缆接头_防水接头_电缆防水接头_防水电缆接头_上海闵彬 | 隆众资讯-首页_大宗商品资讯_价格走势_市场行情 | 不锈钢/气体/液体玻璃转子流量计(防腐,选型,规格)-常州天晟热工仪表有限公司【官网】 | 彩超机-黑白B超机-便携兽用B超机-多普勒彩超机价格「大为彩超」厂家 | 无水硫酸铝,硫酸铝厂家-淄博双赢新材料科技有限公司 | 天津试验仪器-电液伺服万能材料试验机,恒温恒湿标准养护箱,水泥恒应力压力试验机-天津鑫高伟业科技有限公司 | 冷却塔改造厂家_不锈钢冷却塔_玻璃钢冷却塔改造维修-广东特菱节能空调设备有限公司 | 压缩空气检测_气体_水质找上海京工-服务专业、价格合理 | 雨水收集系统厂家-雨水收集利用-模块雨水收集池-徐州博智环保科技有限公司 | 国产离子色谱仪,红外分光测油仪,自动烟尘烟气测试仪-青岛埃仑通用科技有限公司 | Pos机办理_个人商户免费POS机申请-拉卡拉办理网 | 北京三友信电子科技有限公司-ETC高速自动栏杆机|ETC机柜|激光车辆轮廓测量仪|嵌入式车道控制器 | 能量回馈_制动单元_电梯节能_能耗制动_深圳市合兴加能科技有限公司 | 顺景erp系统_erp软件_erp软件系统_企业erp管理系统-广东顺景软件科技有限公司 | 医院专用门厂家报价-医用病房门尺寸大全-抗菌木门品牌推荐 | 深圳激光打标机_激光打标机_激光焊接机_激光切割机_同体激光打标机-深圳市创想激光科技有限公司 深圳快餐店设计-餐饮设计公司-餐饮空间品牌全案设计-深圳市勤蜂装饰工程 | 控显科技 - 工控一体机、工业显示器、工业平板电脑源头厂家 | 首页|专注深圳注册公司,代理记账报税,注册商标代理,工商变更,企业400电话等企业一站式服务-慧用心 | 快速门厂家批发_PVC快速卷帘门_高速门_高速卷帘门-广州万盛门业 快干水泥|桥梁伸缩缝止水胶|伸缩缝装置生产厂家-广东广航交通科技有限公司 | 防爆电机_防爆电机型号_河南省南洋防爆电机有限公司 | 安平县鑫川金属丝网制品有限公司,声屏障,高速声屏障,百叶孔声屏障,大弧形声屏障,凹凸穿孔声屏障,铁路声屏障,顶部弧形声屏障,玻璃钢吸音板 | 便携式高压氧舱-微压氧舱-核生化洗消系统-公众洗消站-洗消帐篷-北京利盟救援 |