电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

Python 實現任意區域文字識別(OCR)操作

瀏覽:23日期:2022-06-25 17:38:24

本文的OCR當然不是自己從頭開發的,是基于百度智能云提供的API(我感覺是百度在中國的人工智能領域值得稱贊的一大貢獻),其提供的API完全可以滿足個人使用,相對來說簡潔準確率高。

安裝OCR Python SDK

OCR Python SDK目錄結構

├── README.md├── aip //SDK目錄│ ├── __init__.py //導出類│ ├── base.py //aip基類│ ├── http.py //http請求│ └── ocr.py //OCR└── setup.py //setuptools安裝

支持Python版本:2.7.+ ,3.+

安裝使用Python SDK有如下方式:

如果已安裝pip,執行pip install baidu-aip即可。

如果已安裝setuptools,下載后執行python setup.py install即可。

代碼實現

下面讓我們來看一下代碼實現。

主要使用的模塊有

import os # 操作系統相關import sys # 系統相關import time # 時間獲取import signal # 系統信號import winsound # 提示音from aip import AipOcr # 百度OCR APIfrom PIL import ImageGrab # 捕獲剪切板中的圖片import win32clipboard as wc # WINDOWS 剪切板操作import win32con # 這里用于獲取 WINDOWS 剪貼板數據的標準格式

第一步 這里的APP_ID,API_KEY,SECRET_KEY是通過登陸百度智能云后自己在OCR板塊申請的, 實現基本的OCR程序,可以通過圖片獲取文字。

''' 你的 APPID AK SK '''APP_ID = ’xxx’API_KEY = ’xxx’SECRET_KEY = ’xxx’client = AipOcr(APP_ID, API_KEY, SECRET_KEY)''' 讀取圖片 '''def get_file_content(filePath): with open(filePath, ’rb’) as fp: return fp.read()''' 從API的返回字典中獲取文字 '''def getOcrText(txt_dict): txt = '' if type(txt_dict) == dict: for i in txt_dict[’words_result’]: txt = txt + i['words'] if len(i['words']) < 25: # 這里使用字符串長度決定了文本是否換行,讀者可以根據自己的喜好控制回車符的輸出,實現可控的文本顯示形式 txt = txt + 'nn' return txt''' 調用通用/高精度文字識別, 圖片參數為本地圖片 '''def BaiduOcr(imageName,Accurate=True): image = get_file_content(imageName) if Accurate: return getOcrText(client.basicGeneral(image)) else: return getOcrText(client.basicAccurate(image)) ''' 帶參數調用通用文字識別, 圖片參數為遠程url圖片 '''def BaiduOcrUrl(url): return getOcrText(client.basicGeneralUrl(url))

第二步,實現快捷鍵獲取文字,將識別文字放入剪切板中,提示音提醒以及快捷鍵退出程序

''' 剪切板操作函數 '''def get_clipboard(): wc.OpenClipboard() txt = wc.GetClipboardData(win32con.CF_UNICODETEXT) wc.CloseClipboard() return txtdef empty_clipboard(): wc.OpenClipboard() wc.EmptyClipboard() wc.CloseClipboard()def set_clipboard(txt): wc.OpenClipboard() wc.EmptyClipboard() wc.SetClipboardData(win32con.CF_UNICODETEXT, txt) wc.CloseClipboard() ''' 截圖后,調用通用/高精度文字識別'''def BaiduOcrScreenshots(Accurate=True,path='./',ifauto=False): if not os.path.exists(path): os.makedirs(path) image = ImageGrab.grabclipboard() if image != None: print('rThe image has been obtained. Please wait a moment!',end=' ') filename = str(time.time_ns()) image.save(path+filename+'.png') if Accurate: txt = getOcrText(client.basicAccurate(get_file_content(path+filename+'.png'))) else: txt = getOcrText(client.basicGeneral(get_file_content(path+filename+'.png'))) os.remove(path+filename+'.png') # f = open(os.path.abspath(path)+''+filename+'.txt',’w’) # f.write(txt) set_clipboard(txt) winsound.PlaySound(’SystemAsterisk’,winsound.SND_ASYNC) # os.startfile(os.path.abspath(path)+''+filename+'.txt') # empty_clipboard() return txt else : if not ifauto: print('Please get the screenshots by Shift+Win+S! ',end='') return '' else: print('rPlease get the screenshots by Shift+Win+S ! ',end='')def sig_handler(signum, frame): sys.exit(0) def removeTempFile(file = ['.txt','.png'],path='./'): if not os.path.exists(path): os.makedirs(path) pathDir = os.listdir(path) for i in pathDir: for j in file: if j in i: os.remove(path+i)def AutoOcrFile(path='./',filetype=['.png','.jpg','.bmp']): if not os.path.exists(path): os.makedirs(path) pathDir = os.listdir(path) for i in pathDir: for j in filetype: if j in i: f = open(os.path.abspath(path)+''+str(time.time_ns())+'.txt',’w’) f.write(BaiduOcr(path+i)) breakdef AutoOcrScreenshots(): signal.signal(signal.SIGINT, sig_handler) signal.signal(signal.SIGTERM, sig_handler) print('Waiting For Ctrl+C to exit ater removing all picture files and txt files!') print('Please get the screenshots by Shift+Win+S !',end='') while(1): try: BaiduOcrScreenshots(ifauto=True) time.sleep(0.1) except SystemExit: removeTempFile() break else : pass finally: pass

最終運行函數 AutoOcrScreenshots 函數便可以實現了:

if __name__ == ’__main__’: AutoOcrScreenshots()使用方法

使用 Windows 10 系統時,將以上代碼放置在一個 .py 文件下,然后運行便可以使用Shift+Win+S快捷鍵實現任意區域截取,截取后圖片將暫時存放在剪切板中,程序自動使用Windows API獲取圖片內容,之后使用百度的OCR API獲取文字,并將文字放置在剪切版內存中后發出提示音。

使用者則可以在開啟程序后,使用快捷鍵截圖后靜待提示音后使用Ctrl+V將文字內容放置在自己所需的位置。

補充:Python 中文OCR

有個需求,需要從一張圖片中識別出中文,通過python來實現,這種這么高大上的黑科技我們普通人自然搞不了,去github找了一個似乎能滿足需求的開源庫-tesseract-ocr:

Tesseract的OCR引擎目前已作為開源項目發布在Google Project,其項目主頁在這里查看https://github.com/tesseract-ocr,

它支持中文OCR,并提供了一個命令行工具。python中對應的包是pytesseract. 通過這個工具我們可以識別圖片上的文字。

筆者的開發環境如下:

macosx

python 3.6

brew

安裝tesseract

brew install tesseract

安裝python對應的包:pytesseract

pip install pytesseract

Python 實現任意區域文字識別(OCR)操作

怎么用?

如果要識別中文需要下載對應的訓練集:https://github.com/tesseract-ocr/tessdata,下載”chi_sim.traineddata”,然后copy到訓練數據集的存放路徑,如:

Python 實現任意區域文字識別(OCR)操作

Python 實現任意區域文字識別(OCR)操作

具體代碼就幾行:

#!/usr/bin/env python3# -*- coding: utf-8 -*-import pytesseractfrom PIL import Image# open imageimage = Image.open(’test.png’)code = pytesseract.image_to_string(image, lang=’chi_sim’)print(code)

OCR速度比較慢,大家可以拿一張包含中文的圖片試驗一下。

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持好吧啦網。如有錯誤或未考慮完全的地方,望不吝賜教。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 钛板_钛管_钛棒_钛盘管-无锡市盛钛科技有限公司 | 四合院设计_四合院装修_四合院会所设计-四合院古建设计与建造中心1 | 自动售货机_无人售货机_专业的自动售货机运营商_免费投放售货机-广州富宏主官网 | 金联宇电缆|广东金联宇电缆厂家_广东金联宇电缆实业有限公司 | 杰福伦_磁致伸缩位移传感器_线性位移传感器-意大利GEFRAN杰福伦-河南赉威液压科技有限公司 | 无锡门窗-系统门窗-阳光房-封阳台-断桥铝门窗厂[窗致美] | 岸电电源-60HZ变频电源-大功率变频电源-济南诚雅电子科技有限公司 | 线材成型机,线材折弯机,线材成型机厂家,贝朗自动化设备有限公司1 | 土壤检测仪器_行星式球磨仪_土壤团粒分析仪厂家_山东莱恩德智能科技有限公司 | 石牌坊价格石牌坊雕刻制作_石雕牌坊牌楼石栏杆厂家_山东嘉祥石雕有限公司 | 油液红外光谱仪-油液监测系统-燃油嗅探仪-上海冉超光电科技有限公司 | 企典软件一站式企业管理平台,可私有、本地化部署!在线CRM客户关系管理系统|移动办公OA管理系统|HR人事管理系统|人力 | 冷柜风机-冰柜电机-罩极电机-外转子风机-EC直流电机厂家-杭州金久电器有限公司 | hc22_hc22价格_hc22哈氏合金—东锜特殊钢 | 微动开关厂家-东莞市德沃电子科技有限公司 | 中国产业发展研究网 - 提供行业研究报告 可行性研究报告 投资咨询 市场调研服务 | 大米加工设备|大米加工机械|碾米成套设备|大米加工成套设备-河南成立粮油机械有限公司 | ◆大型吹塑加工|吹塑加工|吹塑代加工|吹塑加工厂|吹塑设备|滚塑加工|滚塑代加工-莱力奇塑业有限公司 | 轻型地埋电缆故障测试仪,频响法绕组变形测试仪,静荷式卧式拉力试验机-扬州苏电 | 众品家具网-家具品牌招商_家具代理加盟_家具门户的首选网络媒体。 | 雾度仪_雾度计_透光率雾度仪价格-三恩时(3nh)光电雾度仪厂家 | 罗氏牛血清白蛋白,罗氏己糖激酶-上海嵘崴达实业有限公司 | 压装机-卧式轴承轮轴数控伺服压装机厂家[铭泽机械] | 武汉森源蓝天环境科技工程有限公司-为环境污染治理提供协同解决方案 | 山东钢格板|栅格板生产厂家供应商-日照森亿钢格板有限公司 | 意大利Frascold/富士豪压缩机_富士豪半封闭压缩机_富士豪活塞压缩机_富士豪螺杆压缩机 | 西安烟道厂家_排气道厂家_包立管厂家「陕西西安」推荐西安天宇烟道 | 专业深孔加工_东莞深孔钻加工_东莞深孔钻_东莞深孔加工_模具深孔钻加工厂-东莞市超耀实业有限公司 | 环氧乙烷灭菌器_压力蒸汽灭菌器_低温等离子过氧化氢灭菌器 _低温蒸汽甲醛灭菌器_清洗工作站_医用干燥柜_灭菌耗材-环氧乙烷灭菌器_脉动真空压力蒸汽灭菌器_低温等离子灭菌设备_河南省三强医疗器械有限责任公司 | PAS糖原染色-CBA流式多因子-明胶酶谱MMP-上海研谨生物科技有限公司 | 广州监控安装公司_远程监控_安防弱电工程_无线wifi覆盖_泉威安防科技 | 北京四合院出租,北京四合院出售,北京平房买卖 - 顺益兴四合院 | 新能源汽车电池软连接,铜铝复合膜柔性连接,电力母排-容发智能科技(无锡)有限公司 | 菏泽知彼网络科技有限公司| 黄石妇科医院_黄石东方女子医院_黄石东方妇产医院怎么样 | 化妆品加工厂-化妆品加工-化妆品代加工-面膜加工-广东欧泉生化科技有限公司 | 净化车间_洁净厂房_净化公司_净化厂房_无尘室工程_洁净工程装修|改造|施工-深圳净化公司 | 无硅导热垫片-碳纤维导热垫片-导热相变材料厂家-东莞市盛元新材料科技有限公司 | 废气处理_废气处理设备_工业废气处理_江苏龙泰环保设备制造有限公司 | 济南ISO9000认证咨询代理公司,ISO9001认证,CMA实验室认证,ISO/TS16949认证,服务体系认证,资产管理体系认证,SC食品生产许可证- 济南创远企业管理咨询有限公司 郑州电线电缆厂家-防火|低压|低烟无卤电缆-河南明星电缆 | 污水处理设备-海普欧环保集团有限公司|