电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

用python刪除文件夾中的重復圖片(圖片去重)

瀏覽:2日期:2022-06-19 18:53:27
目錄第一部分:判斷兩張圖片是否相同第二部分:判斷文件夾內是否有重復圖片第三部分:程序運行結果第四部分:注意第一部分:判斷兩張圖片是否相同

要查找重復的圖片,必然繞不開判斷兩張圖片是否相同。判斷兩張圖片簡單呀!圖片可以看成數組,比較兩個數組是否相等不就行了。但是這樣做太過簡單粗暴,因為兩個數組的每個元素都要一一比較,效率很低。為了盡量避免兩個龐大的數組比較:

先進行兩張圖片的大小(byte)比較,若大小不相同,則兩張圖片不相同; 在兩張圖片的大小相同的前提下,進行兩張圖片的尺寸(長和寬)比較,若尺寸不相同,則兩張不相同; 在兩張圖片的尺寸相同的前提下,進行兩張圖片的內容(即數組元素)比較,若內容不相同,則圖片不相同;

這樣,當圖片大小或圖片尺寸不相同的時候,便認為兩張圖片不同,可以省去比較數組元素的部分,效率up~

import shutilimport numpy as npfrom PIL import Imageimport osdef 比較圖片大小(dir_image1, dir_image2): with open(dir_image1, 'rb') as f1:size1 = len(f1.read()) with open(dir_image2, 'rb') as f2:size2 = len(f2.read()) if(size1 == size2):result = '大小相同' else:result = '大小不同' return resultdef 比較圖片尺寸(dir_image1, dir_image2): image1 = Image.open(dir_image1) image2 = Image.open(dir_image2) if(image1.size == image2.size):result = '尺寸相同' else:result = '尺寸不同' return resultdef 比較圖片內容(dir_image1, dir_image2): image1 = np.array(Image.open(dir_image1)) image2 = np.array(Image.open(dir_image2)) if(np.array_equal(image1, image2)):result = '內容相同' else:result = '內容不同' return resultdef 比較兩張圖片是否相同(dir_image1, dir_image2): # 比較兩張圖片是否相同 # 第一步:比較大小是否相同 # 第二步:比較長和寬是否相同 # 第三步:比較每個像素是否相同 # 如果前一步不相同,則兩張圖片必不相同 result = '兩張圖不同' 大小 = 比較圖片大小(dir_image1, dir_image2) if(大小 == '大小相同'):尺寸 = 比較圖片尺寸(dir_image1, dir_image2)if(尺寸 == '尺寸相同'): 內容 = 比較圖片內容(dir_image1, dir_image2) if(內容 == '內容相同'):result = '兩張圖相同' return result第二部分:判斷文件夾內是否有重復圖片

若要判斷文件夾內是否有和圖片A相同的圖片,則需要遍歷文件夾內所有圖片,挨個判斷兩個圖片是否相同。若文件夾有1000張圖片,那么第1張圖片需要與剩下的999張圖片作比較,第2張圖片需要與剩下的998張圖片作比較,第3張需要與剩下的997張圖片作比較,以此類推。在此程序中的做法是,先對所有圖片按圖片大小(byte)排序,然后再執行遍歷比較。這樣做的結果是:重復圖片很大概率會連著出現(因為重復圖片大小相同)

if __name__ == ’__main__’: load_path = ’E:測試圖片集(未去重)’ # 要去重的文件夾 save_path = ’E:測試圖片集(重復照片)’ # 空文件夾,用于存儲檢測到的重復的照片 os.makedirs(save_path, exist_ok=True) # 獲取圖片列表 file_map,字典{文件路徑filename : 文件大小image_size} file_map = {} image_size = 0 # 遍歷filePath下的文件、文件夾(包括子目錄) for parent, dirnames, filenames in os.walk(load_path):# for dirname in dirnames:# print(’parent is %s, dirname is %s’ % (parent, dirname))for filename in filenames: # print(’parent is %s, filename is %s’ % (parent, filename)) # print(’the full name of the file is %s’ % os.path.join(parent, filename)) image_size = os.path.getsize(os.path.join(parent, filename)) file_map.setdefault(os.path.join(parent, filename), image_size) # 獲取的圖片列表按 文件大小image_size 排序 file_map = sorted(file_map.items(), key=lambda d: d[1], reverse=False) file_list = [] for filename, image_size in file_map:file_list.append(filename) # 取出重復的圖片 file_repeat = [] for currIndex, filename in enumerate(file_list):dir_image1 = file_list[currIndex]dir_image2 = file_list[currIndex + 1]result = 比較兩張圖片是否相同(dir_image1, dir_image2)if(result == '兩張圖相同'): file_repeat.append(file_list[currIndex + 1]) print('n相同的圖片:', file_list[currIndex], file_list[currIndex + 1])else: print(’n不同的圖片:’, file_list[currIndex], file_list[currIndex + 1])currIndex += 1if currIndex >= len(file_list)-1: break # 將重復的圖片移動到新的文件夾,實現對原文件夾降重 for image in file_repeat:shutil.move(image, save_path)print('正在移除重復照片:', image)第三部分:程序運行結果

若文件夾下有10張圖片A、5張圖片B、1張圖片C,程序運行結束后,該文件夾下剩余1張圖片A、1張圖片B、1張圖片C;其他的圖片移動到 save_path 指定的文件夾下。

第四部分:注意

程序代碼可以直接復制使用,需要修改 load_path 和 save_path 參數;

保證 load_path 文件夾都為圖片格式(.jpg .png .jpeg)的文件類型,不可以有其他格式的文件(例如.mp4);請先用資源管理器處理文件夾,大佬直接修改代碼讀取文件夾下指定類型的文件;

以上就是用python刪除文件夾中的重復圖片的詳細內容,更多關于python 刪除重復圖片的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 杜康白酒加盟_杜康酒代理_杜康酒招商加盟官网_杜康酒厂加盟总代理—杜康酒神全国运营中心 | 清洁设备_洗地机/扫地机厂家_全自动洗地机_橙犀清洁设备官网 | 一体式钢筋扫描仪-楼板测厚仪-裂缝检测仪-泰仕特(北京) | 螺旋压榨机-刮泥机-潜水搅拌机-电动泥斗-潜水推流器-南京格林兰环保设备有限公司 | 仿清水混凝土_清水混凝土装修_施工_修饰_保护剂_修补_清水混凝土修复-德州忠岭建筑装饰工程 | 英国雷迪地下管线探测仪-雷迪RD8100管线仪-多功能数字听漏仪-北京迪瑞进创科技有限公司 | 挤塑板-XPS挤塑板-挤塑板设备厂家[襄阳欧格] | 天一线缆邯郸有限公司_煤矿用电缆厂家_矿用光缆厂家_矿用控制电缆_矿用通信电缆-天一线缆邯郸有限公司 | 东莞精密模具加工,精密连接器模具零件,自動機零件,冶工具加工-益久精密 | 沈飞防静电地板__机房地板-深圳市沈飞防静电设备有限公司 | MOOG伺服阀维修,ATOS比例流量阀维修,伺服阀维修-上海纽顿液压设备有限公司 | 压缩空气检测_气体_水质找上海京工-服务专业、价格合理 | 储能预警-储能消防系统-电池舱自动灭火装置-四川千页科技股份有限公司官网 | 北京燃气公司 用户服务中心| 【星耀裂变】_企微SCRM_任务宝_视频号分销裂变_企业微信裂变增长_私域流量_裂变营销 | 企典软件一站式企业管理平台,可私有、本地化部署!在线CRM客户关系管理系统|移动办公OA管理系统|HR人事管理系统|人力 | 喷砂机厂家_自动除锈抛丸机价格-成都泰盛吉自动化喷砂设备 | 欧美日韩国产一区二区三区不_久久久久国产精品无码不卡_亚洲欧洲美洲无码精品AV_精品一区美女视频_日韩黄色性爱一级视频_日本五十路人妻斩_国产99视频免费精品是看4_亚洲中文字幕无码一二三四区_国产小萍萍挤奶喷奶水_亚洲另类精品无码在线一区 | 防火门|抗爆门|超大门|医疗门|隔声门-上海加汇门业生产厂家 | 气体热式流量计-定量控制流量计(空气流量计厂家)-湖北南控仪表科技有限公司 | 上海宿田自动化设备有限公司-双面/平面/单面贴标机 | 石油/泥浆/不锈钢防腐/砂泵/抽砂泵/砂砾泵/吸砂泵/压滤机泵 - 专业石油环保专用泵厂家 | 洁净化验室净化工程_成都实验室装修设计施工_四川华锐净化公司 | 一级建造师培训_一建培训机构_中建云筑建造师培训网校 | 广东风淋室_广东风淋室厂家_广东风淋室价格_广州开源_传递窗_FFU-广州开源净化科技有限公司 | 南京泽朗生物科技有限公司-液体饮料代加工_果汁饮料代加工_固体饮料代加工 | 水篦子|雨篦子|镀锌格栅雨水篦子|不锈钢排水篦子|地下车库水箅子—安平县云航丝网制品厂 | 废水处理-废气处理-工业废水处理-工业废气处理工程-深圳丰绿环保废气处理公司 | 农业四情_农业气象站_田间小型气象站_智慧农业气象站-山东风途物联网 | 东莞画册设计_logo/vi设计_品牌包装设计 - 华略品牌设计公司 | 长沙一级消防工程公司_智能化弱电_机电安装_亮化工程专业施工承包_湖南公共安全工程有限公司 | 釜溪印象网络 - Powered by Discuz!| 精密交叉滚子轴承厂家,转盘轴承,YRT转台轴承-洛阳千协轴承 | 内窥镜-工业内窥镜厂家【上海修远仪器仪表有限公司】 | 武汉画册印刷厂家-企业画册印刷-画册设计印刷制作-宣传画册印刷公司 - 武汉泽雅印刷厂 | 铁艺,仿竹,竹节,护栏,围栏,篱笆,栅栏,栏杆,护栏网,网围栏,厂家 - 河北稳重金属丝网制品有限公司 山东太阳能路灯厂家-庭院灯生产厂家-济南晟启灯饰有限公司 | 胶辊硫化罐_胶鞋硫化罐_硫化罐厂家-山东鑫泰鑫智能装备有限公司 意大利Frascold/富士豪压缩机_富士豪半封闭压缩机_富士豪活塞压缩机_富士豪螺杆压缩机 | 华东师范大学在职研究生招生网_在职研究生招生联展网 | 120kv/2mA直流高压发生器-60kv/2mA-30kva/50kv工频耐压试验装置-旭明电工 | 上海租奔驰_上海租商务车_上海租车网-矢昂汽车服务公司 | 山东聚盛新型材料有限公司-纳米防腐隔热彩铝板和纳米防腐隔热板以及钛锡板、PVDF氟膜板供应商 |