电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術(shù)文章
文章詳情頁

python開發(fā)一個解析protobuf文件的簡單編譯器

瀏覽:13日期:2022-07-05 10:01:09

引言

最近剛剛用python寫完了一個解析protobuf文件的簡單編譯器,深感ply實現(xiàn)詞法分析和語法分析的簡潔方便。乘著余熱未過,頭腦清醒,記下一點總結(jié)和心得,方便各位pythoner參考使用。

ply使用

簡介

如果你不是從事編譯器或者解析器的開發(fā)工作,你可能從未聽說過ply。ply是基于python的lex和yacc,而它的作者就是大名鼎鼎Python Cookbook, 3rd Edition的作者。可能有些朋友就納悶了,我一個業(yè)務(wù)開發(fā)怎么需要自己寫編譯器呢,各位編程大牛說過,中央決定了,要多嘗試新的東西。而且了解一些語法解析的姿勢,以后自己解析格式復(fù)雜的日志或者數(shù)學公式,也是非常有幫助的。

針對沒有編譯基礎(chǔ)的童鞋,強烈建議了解一些文法相關(guān)的基本概念。輪子哥強烈推薦的parsing techniques以及編譯龍虎鯨書,個人感覺都不適合入門學習,在此推薦胡倫俊的編譯原理(電子工業(yè)出版社),針對概念的例子講解很多,很適合入門學習。當然也不需要特別深入研究,知道詞法分析和語法分析的相關(guān)概念和方法就可以愉快的使用ply了。文檔鏈接: http://www.pchou.info/open-source/2014/01/18/52da47204d4cb.html

為了方便大家上手,以求解多元一次方程組為例,講解一下ply的使用。

例子說明

輸入是多個格式為x + 4y - 3.2z = 7的一次方程,為了讓例子盡可能簡單,做如下限制:

每個方程含有變量的部分在等號左邊,常數(shù)在等號右邊 每個方程不限制變量的個數(shù)以及變量的順序,但每個方程每個變量只允許出現(xiàn)一次 變量的命令規(guī)則為小寫字母串(x y xx yy abc 均為合法變量名) 變量的系數(shù)限制為整數(shù)和浮點數(shù),浮點數(shù)不允許1.4e8的格式,系數(shù)和變量緊鄰,且系數(shù)不能為0 方程組和方程組之間用, ;隔開

學過線性代數(shù)的童鞋肯定知道,只需要將方程組抽象為矩陣,按照線性代數(shù)的方法就可以解決。因此只需要將輸入方程組解析成右邊的矩陣和變量列表即可,剩下的求解過程就可以交給線性代數(shù)相關(guān)的工具解決。

python開發(fā)一個解析protobuf文件的簡單編譯器

詞法解析

ply中的lex來做詞法解析,詞法解析的理論有一大堆,但是lex用起來卻非常直觀,就是用正則表達式的方式將文本字符串解析為一個一個的token,下面的代碼就是用lex實現(xiàn)詞法解析。

from ply import lex# 空格 制表符 回車這些不可見符號都忽略t_ignore = ’ tr’# 解析錯誤的時候直接拋出異常def t_error(t): raise Exception(’error {} at line {}’.format(t.value[0], t.lineno))# 記錄行號,方便出錯定位def t_newline(t): r’n+’ t.lexer.lineno += len(t.value)# 支持c++風格的注釋def t_ignore_COMMENT(t): r’//[^n]*’# 變量的命令規(guī)則def t_VARIABLE(t): r’[a-z]+’ return t# 常數(shù)命令規(guī)則def t_CONSTANT(t): r’d+(.d+)?’ t.value = float(t.value) return t# 輸入中支持的符號頭token,當然也支持t_PLUS = r’+’的方式將加號定義為tokenliterals = ’+-,;=’tokens = (’VARIABLE’, ’CONSTANT’)if __name__ == ’__main__’: data = ’’’ -x + 2.4y + z = 0; //this is a comment 9y - z + 7.2x = -1; y - z + x = 8 ’’’ lexer = lex.lex() lexer.input(data) while True: tok = lexer.token() if not tok: break print tok

直接運行文件就可以將解析的token串打印出來,如下所示,詳細的使用文檔可以參考ply文檔。

LexToken(-,’-’,2,5)LexToken(VARIABLE,’x’,2,6)LexToken(+,’+’,2,8)LexToken(CONSTANT,2.4,2,10)LexToken(VARIABLE,’y’,2,13)LexToken(+,’+’,2,15)LexToken(VARIABLE,’z’,2,17)LexToken(=,’=’,2,19)LexToken(CONSTANT,0.0,2,21)LexToken(;,’;’,2,22)```### 語法解析ply中的yacc用作語法分析,雖然復(fù)雜的詞法分析可以代替簡單的語法分析,但類似于編程語言的解析再復(fù)雜的詞法分析也勝任不了。在使用yacc之前,需要了解上下文無關(guān)文法,這部分內(nèi)容太多太雜,我也只了解部分簡單的概念,有興趣的可以看一看編譯原理深入了解。目前語法分析的方法有兩大類,即自下向上的分析方法和自上而下的分析方法。所謂自上而下的分下法就是從文法的開始符號出發(fā),根據(jù)文法規(guī)則正向推到出給定句子的一種方法,或者說,從樹根開始,往下構(gòu)造語法樹,直到建立每個樹葉的分析方法。代表算法是LL(1),此算法文法解析能力不強,對文法定義要求比較高,主流的編譯器都沒有使用。自下而上的分析法是從給定的輸入串開始,根據(jù)文法規(guī)則逐步進行歸約,直至歸約到文法的開始符號,或者說從語法書的末端開始,步步向上歸約,直至歸約到根節(jié)點的分析方法。代表算法有SLR、LRLR,ply使用的就是LRLR。因此我們只需要定義文法和規(guī)約動作即可,以下就是完整的代碼。```python# -*- coding=utf8 -*-from ply import ( lex, yacc)# 空格 制表符 回車這些不可見符號都忽略t_ignore = ’ tr’# 解析錯誤的時候直接拋出異常def t_error(t): raise Exception(’error {} at line {}’.format(t.value[0], t.lineno))# 記錄行號,方便出錯定位def t_newline(t): r’n+’ t.lexer.lineno += len(t.value)# 支持c++風格的注釋def t_ignore_COMMENT(t): r’//[^n]*’# 變量的命令規(guī)則def t_VARIABLE(t): r’[a-z]+’ return t# 常數(shù)命令規(guī)則def t_CONSTANT(t): r’d+(.d+)?’ t.value = float(t.value) return t# 輸入中支持的符號頭token,當然也支持t_PLUS = r’+’的方式將加號定義為tokenliterals = ’+-,;=’tokens = (’VARIABLE’, ’CONSTANT’)# 頂層文法,規(guī)約的時候equations對應(yīng)的p[1]是一個列表,包含了方程左邊各個變量與系數(shù)還有方程左邊的常數(shù)def p_start(p): '''start : equations''' var_count, var_list = 0, [] for left, _ in p[1]: for con, var_name in left: if var_name in var_list:continue var_list.append(var_name) var_count += 1 matrix = [[0] * (var_count + 1) for _ in xrange(len(p[1]))] for counter, eq in enumerate(p[1]): left, right = eq for con, var_name in left: matrix[counter][var_list.index(var_name)] = con matrix[counter][-1] = -right var_list.append(1) p[0] = matrix, var_list# 方程組對應(yīng)的文法,每個方程用,或者;做分隔def p_equations(p): '''equations : equation ’,’ equations | equation ’;’ equations | equation''' if len(p) == 2: p[0] = [p[1]] else: p[0] = [p[1]] + p[3]# 單個方程對應(yīng)的文法def p_equation(p): '''equation : eq_left ’=’ eq_right''' p[0] = (p[1], p[3])# 方程等式左邊對應(yīng)的文法def p_eq_left(p): '''eq_left : var_unit eq_left|''' if len(p) == 1: p[0] = [] else: p[0] = [p[1]] + p[2]# 六種文法對應(yīng)例子: x, 5x, +x, -x, +4x, -4y# 歸約的形式是一個元組,例: (5, ’x’)def p_var_unit(p): '''var_unit : VARIABLE| CONSTANT VARIABLE| ’+’ VARIABLE| ’-’ VARIABLE| ’+’ CONSTANT VARIABLE| ’-’ CONSTANT VARIABLE''' len_p = len(p) if len_p == 2: p[0] = (1.0, p[1]) elif len_p == 3: if p[1] == ’+’: p[0] = (1.0, p[2]) elif p[1] == ’-’: p[0] = (-1.0, p[2]) else: p[0] = (p[1], p[2]) else: if p[1] == ’+’: p[0] = (p[2], p[3]) else: p[0] = (-p[2], p[3])# 方程等式右邊對應(yīng)的常數(shù),對應(yīng)的例子:1.2, +1.2, -1.2def p_eq_right(p): '''eq_right : CONSTANT| ’+’ CONSTANT| ’-’ CONSTANT''' if len(p) == 3: if p[1] == ’-’: p[0] = -p[2] else: p[0] = p[2] else: p[0] = p[1]if __name__ == ’__main__’: data = ’’’ -x + 2.4y + z = 0; //this is a comment 9y - z + 7.2x = -1; y - z + x = 8 ’’’ lexer = lex.lex() parser = yacc.yacc(debug=True) lexer.lineno = 1 s = parser.parse(data) print s

直接運行文件即可,得到的輸出如下,之后就可以根據(jù)線性代數(shù)的方法求解各個變量的值

([[-1.0, 2.4, 1.0, -0.0], [7.2, 9.0, -1.0, 1.0], [1.0, 1.0, -1.0, -8.0]], [’x’, ’y’, ’z’, 1])

總結(jié)

依托于python簡潔的語法,ply為我們提供了一個強大的語法分析工具,更復(fù)雜的例子可以參考https://github.com/LiuRoy/proto_parser,這是我用ply實現(xiàn)的一個簡單的protobuf解析器,用于減少頻繁的中間文件生成。有這種神器,一顆賽艇!

以上就是python開發(fā)一個解析protobuf文件的簡單編譯器的詳細內(nèi)容,更多關(guān)于python開發(fā)編譯器的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 神马影院-实时更新秒播| 哈希余氯测定仪,分光光度计,ph在线监测仪,浊度测定仪,试剂-上海京灿精密机械有限公司 | 爆破器材运输车|烟花爆竹运输车|1-9类危险品厢式运输车|湖北江南专用特种汽车有限公司 | 网站建设,北京网站建设,北京网站建设公司,网站系统开发,北京网站制作公司,响应式网站,做网站公司,海淀做网站,朝阳做网站,昌平做网站,建站公司 | 烟气换热器_GGH烟气换热器_空气预热器_高温气气换热器-青岛康景辉 | 上海办公室设计_办公楼,写字楼装修_办公室装修公司-匠御设计 | 纸箱抗压机,拉力机,脂肪测定仪,定氮仪-山东德瑞克仪器有限公司 | 雷冲击高压发生器-水内冷直流高压发生器-串联谐振分压器-武汉特高压电力科技有限公司 | 焊接烟尘净化器__焊烟除尘设备_打磨工作台_喷漆废气治理设备 -催化燃烧设备 _天津路博蓝天环保科技有限公司 | 化工ERP软件_化工新材料ERP系统_化工新材料MES软件_MES系统-广东顺景软件科技有限公司 | 进口试验机价格-进口生物材料试验机-西安卡夫曼测控技术有限公司 | 新中天检测有限公司青岛分公司-山东|菏泽|济南|潍坊|泰安防雷检测验收 | 河南卓美创业科技有限公司-河南卓美防雷公司-防雷接地-防雷工程-重庆避雷针-避雷器-防雷检测-避雷带-避雷针-避雷塔、机房防雷、古建筑防雷等-山西防雷公司 | 纯化水设备-EDI-制药-实验室-二级反渗透-高纯水|超纯水设备 | 香港新时代国际美容美发化妆美甲培训学校-26年培训经验,值得信赖! | 耐破强度测试仪-纸箱破裂强度试验机-济南三泉中石单品站 | 国产离子色谱仪,红外分光测油仪,自动烟尘烟气测试仪-青岛埃仑通用科技有限公司 | YAGEO国巨电容|贴片电阻|电容价格|三星代理商-深圳市巨优电子有限公司 | 耐高温硅酸铝板-硅酸铝棉保温施工|亿欧建设工程 | 喷涂流水线,涂装流水线,喷漆流水线-山东天意设备科技有限公司 | 花纹铝板,合金铝卷板,阴极铝板-济南恒诚铝业有限公司 | 内窥镜-工业内窥镜厂家【上海修远仪器仪表有限公司】 | 气动隔膜泵-电动隔膜泵-循环热水泵-液下排污/螺杆/管道/化工泵「厂家」浙江绿邦 | 尾轮组_头轮组_矿用刮板_厢式刮板机_铸石刮板机厂家-双驰机械 | 头条搜索极速版下载安装免费新版,头条搜索极速版邀请码怎么填写? - 欧远全 | 顶空进样器-吹扫捕集仪-热脱附仪-二次热解吸仪-北京华盛谱信仪器 | 高精度-恒温冷水机-螺杆式冰水机-蒸发冷冷水机-北京蓝海神骏科技有限公司 | 灌装封尾机_胶水灌装机_软管灌装封尾机_无锡和博自动化机械制造有限公司 | 超声波气象站_防爆气象站_空气质量监测站_负氧离子检测仪-风途物联网 | 臭氧老化试验箱,高低温试验箱,恒温恒湿试验箱,防水试验设备-苏州亚诺天下仪器有限公司 | 郑州大巴车出租|中巴车租赁|旅游大巴租车|包车|郑州旅游大巴车租赁有限公司 | POS机官网 - 拉卡拉POS机免费办理|官网在线申请入口 | 杭州可当科技有限公司—流量卡_随身WiFi_AI摄像头一站式解决方案 | 招商帮-一站式网络营销服务|搜索营销推广|信息流推广|短视视频营销推广|互联网整合营销|网络推广代运营|招商帮企业招商好帮手 | 小型气象站_便携式自动气象站_校园气象站-竞道气象设备网 | 一航网络-软件测评官网| loft装修,上海嘉定酒店式公寓装修公司—曼城装饰 | 机器视觉检测系统-视觉检测系统-机器视觉系统-ccd检测系统-视觉控制器-视控一体机 -海克易邦 | 西安文都考研官网_西安考研辅导班_考研培训机构_西安在职考研培训 | 篮球地板厂家_舞台木地板品牌_体育运动地板厂家_凯洁地板 | 团建-拓展-拓展培训-拓展训练-户外拓展训练基地[无锡劲途] |