电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術(shù)文章
文章詳情頁

python 如何做一個識別率百分百的OCR

瀏覽:43日期:2022-06-18 09:20:08
目錄寫在前面技術(shù)棧實現(xiàn)思路具體實現(xiàn)讀取圖片二值化圖像膨脹找輪廓外接矩形過濾字符字符分割構(gòu)造數(shù)據(jù)集向量搜索(分類)生成結(jié)果寫在前面

當(dāng)然這里說的百分百可能有點夸張,但其實想象一下,游戲里面的某個窗口的字符就是那種樣子,不會變化的。而且識別的字符可能也不需要太多。中文有大幾千個常用字,還有各種符號,其實都不需要。

這里針對的場景很簡單,主要是有以下幾點:

識別的字符不多:只要識別幾十個常用字符即可,比如說26個字母,數(shù)字,還有一些中文。 背景統(tǒng)一,字體一致:我們不是做驗證碼識別,我們要識別的字符都是清晰可見的。 字符和背景易分割:一般來說就是對圖片灰度化之后,黑底白字或者白底黑字這種。技術(shù)棧

這里用到的主要就是python+opencv了。

python3 opencv-python

環(huán)境主要是以下的庫:

pip install opencv-pythonpip install imutilspip install matplotlib實現(xiàn)思路

首先看下圖片的灰度圖。

python 如何做一個識別率百分百的OCR

第一步:二值化,將灰度轉(zhuǎn)換為只有黑白兩種顏色。

python 如何做一個識別率百分百的OCR

第二步:圖像膨脹,因為我們要通過找輪廓算法找到每個字符的輪廓然后分割,如果是字符還好,中文有很多左右偏旁,三點水這種無法將一個整體進(jìn)行分割,這里通過膨脹將中文都黏在一起。

python 如何做一個識別率百分百的OCR

第三步:找輪廓。

python 如何做一個識別率百分百的OCR

第四步:外接矩形。我們需要的字符是一個矩形框,而不是無規(guī)則的。

python 如何做一個識別率百分百的OCR

第五步:過濾字符,這里比如說標(biāo)點符號對我來說沒用,我通過矩形框大小把它過濾掉。

python 如何做一個識別率百分百的OCR

第六步:字符分割,根據(jù)矩形框分割字符。

python 如何做一個識別率百分百的OCR

第七步:構(gòu)造數(shù)據(jù)集,每一類基本上放一兩張圖片就可以。

python 如何做一個識別率百分百的OCR

第八步:向量搜索+生成結(jié)果,根據(jù)數(shù)據(jù)集的圖片,進(jìn)行向量搜索得到識別的標(biāo)簽。然后根據(jù)圖片分割的位置,對識別結(jié)果進(jìn)行排序。

具體實現(xiàn)讀取圖片

首先先讀取待識別的圖片。

import cv2import numpy as npfrom matplotlib import pyplot as pltfrom matplotlib.colors import NoNormimport imutilsfrom PIL import Imageimg_file = 'test.png'im = cv2.imread(img_file, 0)

使用matplotlib畫圖結(jié)果如下:

python 如何做一個識別率百分百的OCR

二值化

在進(jìn)行二值化之前,首先進(jìn)行灰度分析。

python 如何做一個識別率百分百的OCR

灰度值是在0到255之間,0代表黑色,255代表白色。可以看到這里背景色偏黑的,基本集中在灰度值30,40附近。而字符偏白,大概在180灰度這里。

這里選擇100作為分割的閾值。

thresh = cv2.threshold(im, 100, 255, cv2.THRESH_BINARY)[1]

2值化后效果如下:

python 如何做一個識別率百分百的OCR

圖像膨脹

接下來進(jìn)行一個圖像的縱向膨脹,選擇一個膨脹的維度,這里選擇的是7。

kernel = np.ones((7,1),np.uint8) dilation = cv2.dilate(thresh, kernel, iterations=1)

python 如何做一個識別率百分百的OCR

找輪廓

接下來調(diào)用opencv找一下輪廓,

# 找輪廓cnts = cv2.findContours(dilation.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)cnts = imutils.grab_contours(cnts)

接下來我們再讀取一下原圖,繪制輪廓看下輪廓的樣子。

python 如何做一個識別率百分百的OCR

外接矩形

對于輪廓我們可以做外接矩形,這里可以看下外接矩形的效果。

python 如何做一個識別率百分百的OCR

過濾字符

這里過濾字符的原理其實就是將輪廓內(nèi)的顏色填充成黑色。下面的代碼是將高度小于15的輪廓填充成黑色。

for i, c in enumerate(cnts): x, y, w, h = cv2.boundingRect(c) if (h < 15):cv2.fillPoly(thresh, pts=[c], color=(0))

填充后可以看到標(biāo)點符號就沒了。

python 如何做一個識別率百分百的OCR

字符分割

因為圖像是個矩陣,最后字符分割就是使用切片進(jìn)行分割。

for c in cnts: x, y, w, h = cv2.boundingRect(c) if (h < 15):continue cropImg = thresh[y:y+h, x:x+w] plt.imshow(cropImg) plt.show()構(gòu)造數(shù)據(jù)集

最后我們創(chuàng)建數(shù)據(jù)集進(jìn)行標(biāo)注,就是把上面的都串起來,然后將分割后的圖片保存到文件夾里,并且完成標(biāo)注。

import cv2import numpy as npimport imutilsfrom matplotlib import pyplot as pltimport uuiddef split_letters(im): # 2值化 thresh = cv2.threshold(im, 100, 255, cv2.THRESH_BINARY)[1] # 縱向膨脹 kernel = np.ones((7, 1), np.uint8) dilation = cv2.dilate(thresh, kernel, iterations=1) # 找輪廓 cnts = cv2.findContours(dilation.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) cnts = imutils.grab_contours(cnts) # 過濾太小的 for i, c in enumerate(cnts):x, y, w, h = cv2.boundingRect(c)if h < 15: cv2.fillPoly(thresh, pts=[c], color=(0)) # 分割 char_list = [] for c in cnts:x, y, w, h = cv2.boundingRect(c)if h < 15: continuecropImg = thresh[y:y + h, x:x + w]char_list.append((x, cropImg)) return char_listfor i in range(1, 10): im = cv2.imread(f'test{i}.png', 0) for ch in split_letters(im):print(ch[0])filename = f'ocr_datas/{str(uuid.uuid4())}.png'cv2.imwrite(filename, ch[1])向量搜索(分類)

向量搜索其實就是個最近鄰搜索的問題,我們可以使用sklearn中的KNeighborsClassifier。

訓(xùn)練模型代碼如下:

import osimport numpy as npfrom sklearn.neighbors import KNeighborsClassifierimport cv2import pickleimport jsonmax_height = 30max_width = 30def make_im_template(im): template = np.zeros((max_height, max_width)) offset_height = int((max_height - im.shape[0]) / 2) offset_width = int((max_width - im.shape[1]) / 2) template[offset_height:offset_height + im.shape[0], offset_width:offset_width + im.shape[1]] = im return templatelabel2index = {}index2label = {}X = []y = []index = 0for _dir in os.listdir('ocr_datas'): new_dir = 'ocr_datas/' + _dir if os.path.isdir(new_dir):label2index[_dir] = indexindex2label[index] = _dirfor filename in os.listdir(new_dir): if filename.endswith('png'):im = cv2.imread(new_dir + '/' + filename, 0)tpl = make_im_template(im) # 生成固定模板tpl = tpl / 255 # 歸一化X.append(tpl.reshape(max_height*max_width))y.append(index)index += 1print(label2index)print(index2label)model = KNeighborsClassifier(n_neighbors=1)model.fit(X, y)with open('simple_ocr.pickle', 'wb') as f: pickle.dump(model, f)with open('simple_index2label.json', 'w') as f: json.dump(index2label, f)

這里有一點值得說的是如何構(gòu)建圖片的向量,我們分隔的圖片的長和寬是不固定的,這里首先需要使用一個模型,將分隔后的圖片放置到模板的中央。然后將模型轉(zhuǎn)換為一維向量,當(dāng)然還可以做一個歸一化。

生成結(jié)果

最后生成結(jié)果就是還是先分割一遍,然后轉(zhuǎn)換為向量,調(diào)用KNeighborsClassifier模型,找到最匹配的一個作為結(jié)果。當(dāng)然這是識別一個字符的結(jié)果,我們還需要根據(jù)分割的位置進(jìn)行一個排序,才能得到最后的結(jié)果。

import cv2import numpy as npimport imutilsfrom sklearn.neighbors import KNeighborsClassifierimport pickleimport jsonwith open('simple_ocr.pickle', 'rb') as f: model = pickle.load(f)with open('simple_ocr_index2label.json', 'r') as f: index2label = json.load(f)max_height = 30max_width = 30def make_im_template(im): template = np.zeros((max_height, max_width)) offset_height = int((max_height - im.shape[0]) / 2) offset_width = int((max_width - im.shape[1]) / 2) template[offset_height:offset_height + im.shape[0], offset_width:offset_width + im.shape[1]] = im return template.reshape(max_height*max_width)def split_letters(im): # 2值化 thresh = cv2.threshold(im, 100, 255, cv2.THRESH_BINARY)[1] # 縱向膨脹 kernel = np.ones((7, 1), np.uint8) dilation = cv2.dilate(thresh, kernel, iterations=1) # 找輪廓 cnts = cv2.findContours(dilation.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) cnts = imutils.grab_contours(cnts) # 過濾太小的 for i, c in enumerate(cnts):x, y, w, h = cv2.boundingRect(c)if h < 15: cv2.fillPoly(thresh, pts=[c], color=(0)) # 分割 char_list = [] for c in cnts:x, y, w, h = cv2.boundingRect(c)if h < 15: continuecropImg = thresh[y:y + h, x:x + w]char_list.append((x, cropImg)) return char_listdef ocr_recognize(fname): im = cv2.imread(fname, 0) char_list = split_letters(im) result = [] for ch in char_list:res = model.predict([make_im_template(ch[1])])[0] # 識別單個結(jié)果result.append({ 'x': ch[0], 'label': index2label[str(res)]}) result.sort(key=lambda k: (k.get(’x’, 0)), reverse=False) # 因為是單行的,所以只需要通過x坐標(biāo)進(jìn)行排序。 return ''.join([it['label'] for it in result])print(ocr_recognize('test1.png'))

以上就是python 如何做一個識別率百分百的OCR的詳細(xì)內(nèi)容,更多關(guān)于python 做一個OCR的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 贝朗斯动力商城(BRCPOWER.COM) - 买叉车蓄电池上贝朗斯商城,价格更超值,品质有保障! | 上海logo设计 | 灰板纸、灰底白、硬纸板等纸品生产商-金泊纸业 | 天津散热器_天津暖气片_天津安尼威尔散热器制造有限公司 | 工业机械三维动画制作 环保设备原理三维演示动画 自动化装配产线三维动画制作公司-南京燃动数字 聚合氯化铝_喷雾聚氯化铝_聚合氯化铝铁厂家_郑州亿升化工有限公司 | 环球周刊网| 山东限矩型液力偶合器_液力耦合器易熔塞厂家-淄博市汇川源机械厂 | 刑事律师_深圳著名刑事辩护律师_王平聚【清华博士|刑法教授】 | 液压油缸-液压站生产厂家-洛阳泰诺液压科技有限公司 | 真石漆,山东真石漆,真石漆厂家,真石漆价格-山东新佳涂料有限公司 | 南京泽朗生物科技有限公司 | 网站seo优化_seo云优化_搜索引擎seo_启新网络服务中心 | 安全,主动,被动,柔性,山体滑坡,sns,钢丝绳,边坡,防护网,护栏网,围栏,栏杆,栅栏,厂家 - 护栏网防护网生产厂家 | 手术室净化装修-手术室净化工程公司-华锐手术室净化厂家 | PCB接线端子_栅板式端子_线路板连接器_端子排生产厂家-置恒电气 喷码机,激光喷码打码机,鸡蛋打码机,手持打码机,自动喷码机,一物一码防伪溯源-恒欣瑞达有限公司 假肢-假肢价格-假肢厂家-河南假肢-郑州市力康假肢矫形器有限公司 | 焊锡丝|焊锡条|无铅锡条|无铅锡丝|无铅焊锡线|低温锡膏-深圳市川崎锡业科技有限公司 | 制丸机,小型中药制丸机,全自动制丸机价格-甘肃恒跃制药设备有限公司 | 天一线缆邯郸有限公司_煤矿用电缆厂家_矿用光缆厂家_矿用控制电缆_矿用通信电缆-天一线缆邯郸有限公司 | 土壤养分检测仪|土壤水分|土壤紧实度测定仪|土壤墒情监测系统-土壤仪器网 | 施工电梯_齿条货梯_烟囱电梯_物料提升机-河南大诚机械制造有限公司 | TMT观察网_独特视角观察TMT行业| 河南mpp电力管_mpp电力管生产厂家_mpp电力电缆保护管价格 - 河南晨翀实业 | 混合气体腐蚀试验箱_盐雾/硫化氢/气体腐蚀试验箱厂家-北京中科博达 | GAST/BRIWATEC/CINCINNATI/KARL-KLEIN/ZIEHL-ABEGG风机|亚喜科技 | 北京公积金代办/租房发票/租房备案-北京金鼎源公积金提取服务中心 | 环保袋,无纺布袋,无纺布打孔袋,保温袋,环保袋定制,环保袋厂家,环雅包装-十七年环保袋定制厂家 | 篮球地板厂家_舞台木地板品牌_体育运动地板厂家_凯洁地板 | 二手光谱仪维修-德国OBLF光谱仪|进口斯派克光谱仪-热电ARL光谱仪-意大利GNR光谱仪-永晖检测 | 成都亚克力制品,PVC板,双色板雕刻加工,亚克力门牌,亚克力标牌,水晶字雕刻制作-零贰捌广告 | 不锈钢轴流风机,不锈钢电机-许昌光维防爆电机有限公司(原许昌光维特种电机技术有限公司) | 玻璃钢罐_玻璃钢储罐_盐酸罐厂家-河北华盛节能设备有限公司 | 酒店品牌设计-酒店vi设计-酒店标识设计【国际级】VI策划公司 | 好看的韩国漫画_韩漫在线免费阅读-汗汗漫画| 网站优化公司_北京网站优化_抖音短视频代运营_抖音关键词seo优化排名-通则达网络 | MES系统工业智能终端_生产管理看板/安灯/ESOP/静电监控_讯鹏科技 | 金属雕花板_厂家直销_价格低-山东慧诚建筑材料有限公司 | 婚博会2024时间表_婚博会门票领取_婚博会地址-婚博会官网 | 彭世修脚_修脚加盟_彭世修脚加盟_彭世足疗加盟_足疗加盟连锁_彭世修脚技术培训_彭世足疗 | IHDW_TOSOKU_NEMICON_EHDW系列电子手轮,HC1系列电子手轮-上海莆林电子设备有限公司 | 证券新闻,热播美式保罗1984第二部_腾讯1080p-仁爱影院 | 英国雷迪地下管线探测仪-雷迪RD8100管线仪-多功能数字听漏仪-北京迪瑞进创科技有限公司 |