电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

Python 統計數據集標簽的類別及數目操作

瀏覽:31日期:2022-06-18 17:26:50

看了大神統計voc數據集標簽框后,針對自己標注數據集,靈活應用 ,感謝!

看代碼吧~

import reimport osimport xml.etree.ElementTree as ETclass1 = ’answer’class2 = ’hand’class3 = ’write’class4 = ’music’class5 = ’phone’’’’class6 = ’bus’class7 = ’car’class8 = ’cat’class9 = ’chair’class10 = ’cow’class11 = ’diningtable’class12 = ’dog’class13 = ’horse’class14 = ’motorbike’class15 = ’person’class16 = ’pottedplant’class17 = ’sheep’class18 = ’sofa’class19 = ’train’class20 = ’tvmonitor’’’’annotation_folder = ’/home/.../train/’#改為自己標簽文件夾的路徑#annotation_folder = ’/home/.../VOC2007/Annotations/’list = os.listdir(annotation_folder) def file_name(file_dir):L = []for root, dirs, files in os.walk(file_dir):for file in files:if os.path.splitext(file)[1] == ’.xml’:L.append(os.path.join(root, file))return L total_number1 = 0total_number2 = 0total_number3 = 0total_number4 = 0total_number5 = 0’’’total_number6 = 0total_number7 = 0total_number8 = 0total_number9 = 0total_number10 = 0total_number11 = 0total_number12 = 0total_number13 = 0total_number14 = 0total_number15 = 0total_number16 = 0total_number17 = 0total_number18 = 0total_number19 = 0total_number20 = 0’’’total = 0total_pic=0 pic_num1 = 0pic_num2 = 0pic_num3 = 0pic_num4 = 0pic_num5 = 0’’’pic_num6 = 0pic_num7 = 0pic_num8 = 0pic_num9 = 0pic_num10 = 0pic_num11 = 0pic_num12 = 0pic_num13 = 0pic_num14 = 0pic_num15 = 0pic_num16 = 0pic_num17 = 0pic_num18 = 0pic_num19 = 0pic_num20 = 0’’’ flag1 = 0flag2 = 0flag3 = 0flag4 = 0flag5 = 0’’’flag6 = 0flag7 = 0flag8 = 0flag9 = 0flag10 = 0flag11 = 0flag12 = 0flag13 = 0flag14 = 0flag15= 0flag16 = 0flag17 = 0flag18 = 0flag19 = 0flag20 = 0’’’ xml_dirs = file_name(annotation_folder) for i in range(0, len(xml_dirs)):print(xml_dirs[i])#path = os.path.join(annotation_folder,list[i])#print(path) annotation_file = open(xml_dirs[i]).read() root = ET.fromstring(annotation_file)#tree = ET.parse(annotation_file)#root = tree.getroot() total_pic = total_pic + 1for obj in root.findall(’object’):label = obj.find(’name’).textif label == class1:total_number1=total_number1+1flag1=1total = total + 1#print('bounding box number:', total_number1)if label == class2:total_number2=total_number2+1flag2=1total = total + 1if label == class3:total_number3=total_number3+1flag3=1total = total + 1if label == class4:total_number4=total_number4+1flag4=1total = total + 1if label == class5:total_number5=total_number5+1flag5=1total = total + 1’’’if label == class6:total_number6=total_number6+1flag6=1total = total + 1if label == class7:total_number7=total_number7+1flag7=1total = total + 1if label == class8:total_number8=total_number8+1flag8=1total = total + 1if label == class9:total_number9=total_number9+1flag9=1total = total + 1if label == class10:total_number10=total_number10+1flag10=1total = total + 1if label == class11:total_number11=total_number11+1flag11=1total = total + 1if label == class12:total_number12=total_number12+1flag12=1total = total + 1if label == class13:total_number13=total_number13+1flag13=1total = total + 1if label == class14:total_number14=total_number14+1flag14=1total = total + 1if label == class15:total_number15=total_number15+1flag15=1total = total + 1if label == class16:total_number16=total_number16+1flag16=1total = total + 1if label == class17:total_number17=total_number17+1flag17=1total = total + 1if label == class18:total_number18=total_number18+1flag18=1total = total + 1if label == class19:total_number19=total_number19+1flag19=1total = total + 1if label == class20:total_number20=total_number20+1flag20=1total = total + 1’’’ if flag1==1:pic_num1=pic_num1+1#print('pic number:', pic_num1)flag1=0if flag2==1:pic_num2=pic_num2+1flag2=0if flag3==1:pic_num3=pic_num3+1flag3=0if flag4==1:pic_num4=pic_num4+1flag4=0if flag5==1:pic_num5=pic_num5+1flag5=0’’’if flag6==1:pic_num6=pic_num6+1flag6=0if flag7==1:pic_num7=pic_num7+1flag7=0if flag8==1:pic_num8=pic_num8+1flag8=0if flag9==1:pic_num9=pic_num9+1flag9=0if flag10==1:pic_num10=pic_num10+1flag10=0if flag11==1:pic_num11=pic_num11+1flag11=0if flag12==1:pic_num12=pic_num12+1flag12=0if flag13==1:pic_num13=pic_num13+1flag13=0if flag14==1:pic_num14=pic_num14+1flag14=0if flag15==1:pic_num15=pic_num15+1flag15=0if flag16==1:pic_num16=pic_num16+1flag16=0if flag17==1:pic_num17=pic_num17+1flag17=0if flag18==1:pic_num18=pic_num18+1flag18=0if flag19==1:pic_num19=pic_num19+1flag19=0if flag20==1:pic_num20=pic_num20+1flag20=0’’’ print(class1,pic_num1,total_number1)print(class2,pic_num2,total_number2)print(class3,pic_num3, total_number3)print(class4,pic_num4, total_number4)print(class5,pic_num5, total_number5)’’’print(class6,pic_num6, total_number6)print(class7,pic_num7, total_number7)print(class8,pic_num8, total_number8)print(class9,pic_num9, total_number9)print(class10,pic_num10, total_number10)print(class11,pic_num11,total_number11)print(class12,pic_num12,total_number12)print(class13,pic_num13, total_number13)print(class14,pic_num14, total_number14)print(class15,pic_num15, total_number15)print(class16,pic_num16, total_number16)print(class17,pic_num17, total_number17)print(class18,pic_num18, total_number18)print(class19,pic_num19, total_number19)print(class20,pic_num20, total_number20)’’’ print('total', total_pic, total)

補充:【數據集處理】Python對目標檢測數據集xml文件操作(統計目標種類、數量、面積、比例等&修改目標名字)

1. 根據xml文件統計目標種類以及數量

# -*- coding:utf-8 -*-#根據xml文件統計目標種類以及數量import osimport xml.etree.ElementTree as ETimport numpy as npnp.set_printoptions(suppress=True, threshold=np.nan)import matplotlibfrom PIL import Image def parse_obj(xml_path, filename): tree=ET.parse(xml_path+filename) objects=[] for obj in tree.findall(’object’): obj_struct={} obj_struct[’name’]=obj.find(’name’).text objects.append(obj_struct) return objects def read_image(image_path, filename): im=Image.open(image_path+filename) W=im.size[0] H=im.size[1] area=W*H im_info=[W,H,area] return im_info if __name__ == ’__main__’: xml_path=’/home/dlut/網絡/make_database/數據集——合集/VOCdevkit/VOC2018/Annotations/’ filenamess=os.listdir(xml_path) filenames=[] for name in filenamess: name=name.replace(’.xml’,’’) filenames.append(name) recs={} obs_shape={} classnames=[] num_objs={} obj_avg={} for i,name in enumerate(filenames): recs[name]=parse_obj(xml_path, name+ ’.xml’ ) for name in filenames: for object in recs[name]: if object[’name’] not in num_objs.keys(): num_objs[object[’name’]]=1 else: num_objs[object[’name’]]+=1 if object[’name’] not in classnames: classnames.append(object[’name’]) for name in classnames: print(’{}:{}個’.format(name,num_objs[name])) print(’信息統計算完畢?!?

Python 統計數據集標簽的類別及數目操作

2.根據xml文件統計目標的平均長度、寬度、面積以及每一個目標在原圖中的占比

# -*- coding:utf-8 -*-#統計# 計算每一個目標在原圖中的占比# 計算目標的平均長度、# 計算平均寬度,# 計算平均面積、# 計算目標平均占比import osimport xml.etree.ElementTree as ETimport numpy as np#np.set_printoptions(suppress=True, threshold=np.nan) #10,000,000np.set_printoptions(suppress=True, threshold=10000000) #10,000,000import matplotlibfrom PIL import Imagedef parse_obj(xml_path, filename): tree = ET.parse(xml_path + filename) objects = [] for obj in tree.findall(’object’):obj_struct = {}obj_struct[’name’] = obj.find(’name’).textbbox = obj.find(’bndbox’)obj_struct[’bbox’] = [int(bbox.find(’xmin’).text), int(bbox.find(’ymin’).text), int(bbox.find(’xmax’).text), int(bbox.find(’ymax’).text)]objects.append(obj_struct) return objectsdef read_image(image_path, filename): im = Image.open(image_path + filename) W = im.size[0] H = im.size[1] area = W * H im_info = [W, H, area] return im_infoif __name__ == ’__main__’: image_path = ’/home/dlut/網絡/make_database/數據集——合集/VOCdevkit/VOC2018/JPEGImages/’ xml_path = ’/home/dlut/網絡/make_database/數據集——合集/VOCdevkit/VOC2018/Annotations/’ filenamess = os.listdir(xml_path) filenames = [] for name in filenamess:name = name.replace(’.xml’, ’’)filenames.append(name) print(filenames) recs = {} ims_info = {} obs_shape = {} classnames = [] num_objs={} obj_avg = {} for i, name in enumerate(filenames):print(’正在處理 {}.xml ’.format(name))recs[name] = parse_obj(xml_path, name + ’.xml’)print(’正在處理 {}.jpg ’.format(name))ims_info[name] = read_image(image_path, name + ’.jpg’) print(’所有信息收集完畢。’) print(’正在處理信息......’) for name in filenames:im_w = ims_info[name][0]im_h = ims_info[name][1]im_area = ims_info[name][2]for object in recs[name]: if object[’name’] not in num_objs.keys():num_objs[object[’name’]] = 1 else:num_objs[object[’name’]] += 1 #num_objs += 1 ob_w = object[’bbox’][2] - object[’bbox’][0] ob_h = object[’bbox’][3] - object[’bbox’][1] ob_area = ob_w * ob_h w_rate = ob_w / im_w h_rate = ob_h / im_h area_rate = ob_area / im_area if not object[’name’] in obs_shape.keys():obs_shape[object[’name’]] = ([[ob_w, ob_h, ob_area, w_rate, h_rate, area_rate]]) else:obs_shape[object[’name’]].append([ob_w, ob_h, ob_area, w_rate, h_rate, area_rate])if object[’name’] not in classnames: classnames.append(object[’name’]) # 求平均 for name in classnames:obj_avg[name] = (np.array(obs_shape[name]).sum(axis=0)) / num_objs[name]print(’{}的情況如下:*******n’.format(name))print(’ 目標平均W={}’.format(obj_avg[name][0]))print(’ 目標平均H={}’.format(obj_avg[name][1]))print(’ 目標平均area={}’.format(obj_avg[name][2]))print(’ 目標平均與原圖的W比例={}’.format(obj_avg[name][3]))print(’ 目標平均與原圖的H比例={}’.format(obj_avg[name][4]))print(’ 目標平均原圖面積占比={}n’.format(obj_avg[name][5])) print(’信息統計計算完畢?!?

Python 統計數據集標簽的類別及數目操作

3.修改xml文件中某個目標的名字為另一個名字

#修改xml文件中的目標的名字,import os, sysimport globfrom xml.etree import ElementTree as ET# 批量讀取Annotations下的xml文件# per=ET.parse(r’C:UsersrockhuangDesktopAnnotations000003.xml’)xml_dir = r’/home/dlut/網絡/make_database/數據集——合集/VOCdevkit/VOC2018/Annotations’xml_list = glob.glob(xml_dir + ’/*.xml’)for xml in xml_list: print(xml) per = ET.parse(xml) p = per.findall(’/object’) for oneper in p: # 找出person節點child = oneper.getchildren()[0] # 找出person節點的子節點if child.text == ’PinNormal’: #需要修改的名字 child.text = ’normal bolt’ #修改成什么名字if child.text == ’PinDefect’: #需要修改的名字 child.text = ’defect bolt-1’ #修改成什么名字 per.write(xml) print(child.tag, ’:’, child.text)

Python 統計數據集標簽的類別及數目操作

修改為:

Python 統計數據集標簽的類別及數目操作

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 艾默生变频器,艾默生ct,变频器,ct驱动器,广州艾默生变频器,供水专用变频器,风机变频器,电梯变频器,艾默生变频器代理-广州市盟雄贸易有限公司官方网站-艾默生变频器应用解决方案服务商 | 铁素体测量仪/检测仪/铁素体含量测试仪-苏州圣光仪器有限公司 | 环球周刊网| 矿用履带式平板车|探水钻机|气动架柱式钻机|架柱式液压回转钻机|履带式钻机-启睿探水钻机厂家 | 智成电子深圳tdk一级代理-提供TDK电容电感贴片蜂鸣器磁芯lambda电源代理经销,TDK代理商有哪些TDK一级代理商排名查询。-深圳tdk一级代理 | 成都APP开发-成都App定制-成都app开发公司-【未来久】 | 丁基胶边来料加工,医用活塞边角料加工,异戊二烯橡胶边来料加工-河北盛唐橡胶制品有限公司 | 定硫仪,量热仪,工业分析仪,马弗炉,煤炭化验设备厂家,煤质化验仪器,焦炭化验设备鹤壁大德煤质工业分析仪,氟氯测定仪 | 硫酸钡厂家_高光沉淀硫酸钡价格-河南钡丰化工有限公司 | 山东螺杆空压机,烟台空压机,烟台开山空压机-烟台开山机电设备有限公司 | LHH药品稳定性试验箱-BPS系列恒温恒湿箱-意大利超低温冰箱-上海一恒科学仪器有限公司 | 热工多功能信号校验仪-热电阻热电偶校验仿真仪-金湖虹润仪表 | 上海新光明泵业制造有限公司-电动隔膜泵,气动隔膜泵,卧式|立式离心泵厂家 | 乐之康护 - 专业护工服务平台,提供医院陪护-居家照护-居家康复 | 国际线缆连接网 - 连接器_线缆线束加工行业门户网站 | 岩棉板|岩棉复合板|聚氨酯夹芯板|岩棉夹芯板|彩钢夹芯板-江苏恒海钢结构 | 医用酒精_84消毒液_碘伏消毒液等医用消毒液-漓峰消毒官网 | 理化生实验室设备,吊装实验室设备,顶装实验室设备,实验室成套设备厂家,校园功能室设备,智慧书法教室方案 - 东莞市惠森教学设备有限公司 | 企典软件一站式企业管理平台,可私有、本地化部署!在线CRM客户关系管理系统|移动办公OA管理系统|HR人事管理系统|人力 | 合肥注册公司|合肥代办营业执照、2024注册公司流程 | 盘煤仪,盘料仪,盘点仪,堆料测量仪,便携式激光盘煤仪-中科航宇(北京)自动化工程技术有限公司 | 喷漆房_废气处理设备-湖北天地鑫环保设备有限公司 | 宏源科技-房地产售楼系统|线上开盘系统|售楼管理系统|线上开盘软件 | 环氧乙烷灭菌器_压力蒸汽灭菌器_低温等离子过氧化氢灭菌器 _低温蒸汽甲醛灭菌器_清洗工作站_医用干燥柜_灭菌耗材-环氧乙烷灭菌器_脉动真空压力蒸汽灭菌器_低温等离子灭菌设备_河南省三强医疗器械有限责任公司 | 冷藏车-东风吸污车-纯电动环卫车-污水净化车-应急特勤保障车-程力专汽厂家-程力专用汽车股份有限公司销售二十一分公司 | 经济师考试_2025中级经济师报名时间_报名入口_考试时间_华课网校经济师培训网站 | nalgene洗瓶,nalgene量筒,nalgene窄口瓶,nalgene放水口大瓶,浙江省nalgene代理-杭州雷琪实验器材有限公司 | 高低温万能试验机_拉力试验机_拉伸试验机-馥勒仪器科技(上海)有限公司 | 智慧养老_居家养老_社区养老_杰佳通| 乐考网-银行从业_基金从业资格考试_初级/中级会计报名时间_中级经济师 | 烘箱-工业烘箱-工业电炉-实验室干燥箱 - 苏州华洁烘箱制造有限公司 | jrs高清nba(无插件)直播-jrs直播低调看直播-jrs直播nba-jrs直播 上海地磅秤|电子地上衡|防爆地磅_上海地磅秤厂家–越衡称重 | 云南外加剂,云南速凝剂,云南外加剂代加工-普洱澜湄新材料科技有限公司 | 东莞办公家具厂家直销-美鑫【免费3D效果图】全国办公桌/会议桌定制 | 高铝砖-高铝耐火球-高铝耐火砖生产厂家-价格【荣盛耐材】 | 优秀的临床医学知识库,临床知识库,医疗知识库,满足电子病历四级要求,免费试用 | 便携式XPDM露点仪-在线式防爆露点仪-增强型烟气分析仪-约克仪器 冰雕-冰雪世界-大型冰雕展制作公司-赛北冰雕官网 | 低浓度恒温恒湿称量系统,强光光照培养箱-上海三腾仪器有限公司 | 天津热油泵_管道泵_天津高温热油泵-天津市金丰泰机械泵业有限公司【官方网站】 | 烟台条码打印机_烟台条码扫描器_烟台碳带_烟台数据采集终端_烟台斑马打印机-金鹏电子-金鹏电子 | 蓝米云-专注于高性价比香港/美国VPS云服务器及海外公益型免费虚拟主机 |