电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

php使用自帶dom擴展進行元素匹配的原理解析

瀏覽:102日期:2022-09-10 09:48:15

DOMDocument

php提供了非常好用的解析html和xml文檔的擴展庫DOM,使用這個庫可以非常高效的進行html和xml文檔的解析,它的原理就是通過尋找首尾匹配對來進行文檔的解析。

從上面的分析可以看出,如果首位不匹配,可能就會導致一些錯誤的出現,因此,這個時候我們需要設置

libxml_use_internal_errors(true);

來進行錯誤的屏蔽,讓它可以解析整個文檔。

解析html基本用法

$dom = new DOMDocument;$content = htmlspecialchars_decode($content);libxml_use_internal_errors(true);$content = mb_convert_encoding($content, ’HTML-ENTITIES’, ’UTF-8’);$dom->loadHTML($content);

$content是要解析的html字符串,其中我們對它進行了轉義,因為可能含有實體集,然后我們有進行了編碼的轉換,因為可能文檔不是utf-8格式的,會導致日文,法文等文字亂碼。

獲取元素

$a = $dom->getElementsByTagName(’a’);$p = $dom->getElementsByTagName(’p’);

遍歷元素

$elements = $dom->getElementsByTagName(’a’);foreach ($elements as $element) { $element->textContent = ’替換成其它的文字’;}

通過上面的循環,可以將全部a標簽的文字替換掉。

元素嵌套

有些時候,html會嵌套很多層,比如

<div><p><a href='http://www.hdgsjgj.cn/bcjs/xxx' rel='external nofollow' >我是文字</a></p><p>內容替換</p></div>

如果我們想要對p標簽文字進行替換的化,并且不想要替換含有子元素的內容,就是這里的a標簽不想替換,下面的語句不能夠解決我們的問題:

$elements = $dom->getElementsByTagName(’p’);foreach ($elements as $element) { if($element->hasChildNodes()){ $element->textContent = ’p標簽內容替換’; }}

上面的代會將a標簽的內容也替換掉,這不是我們想要的結果,因為hasChildNodes()這個函數表示的含有內容,無論它是標簽還是文字,它都是返回true的,除非它是空標簽,例如

它才會返回false.

所以我們需要自己封裝一個函數進行檢查是否含有嵌套標簽。

function hasChild($element, $tags){ foreach($tags as $v){ $elements = $element->getElementsByTagName($v); if($elements->length){ return true; } } return false;}$tags = array(’title’,’h1’,’h2’,’h3’,’h4’,’h5’,’a’,’p’,’dd’,’img’); $elements = $dom->getElementsByTagName(’p’);foreach ($elements as $element) { if(hasChild($element, $tags)){ $element->textContent = ’p標簽內容替換’; }}

通過我們自己封裝的函數,就可以判斷出$dom的node節點是否含有子標簽。

總結

到此這篇關于php使用自帶dom擴展進行元素匹配的文章就介紹到這了,更多相關php元素匹配內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: PHP
相關文章:
主站蜘蛛池模板: 雷冲击高压发生器-水内冷直流高压发生器-串联谐振分压器-武汉特高压电力科技有限公司 | 小青瓦丨古建筑瓦丨青瓦厂家-宜兴市徽派古典建筑材料有限公司 | 517瓜水果特产网|一个专注特产好物的网站 | 砍排机-锯骨机-冻肉切丁机-熟肉切片机-预制菜生产线一站式服务厂商 - 广州市祥九瑞盈机械设备有限公司 | 建筑资质代办-建筑资质转让找上海国信启航 | 今日热点_实时热点_奇闻异事_趣闻趣事_灵异事件 - 奇闻事件 | 无线讲解器-导游讲解器-自助讲解器-分区讲解系统 品牌生产厂家[鹰米讲解-合肥市徽马信息科技有限公司] | 原色会计-合肥注册公司_合肥代理记账公司_营业执照代办 | 消防泵-XBD单级卧式/立式消防泵-上海塑泉泵阀(集团)有限公司 | 扬州汇丰仪表有限公司| 变压器配件,变压器吸湿器,武强县吉口变压器配件有限公司 | 莱州网络公司|莱州网站建设|莱州网站优化|莱州阿里巴巴-莱州唯佳网络科技有限公司 | 艺术涂料_进口艺术涂料_艺术涂料加盟_艺术涂料十大品牌 -英国蒙太奇艺术涂料 | 杭州中央空调维修_冷却塔/新风机柜/热水器/锅炉除垢清洗_除垢剂_风机盘管_冷凝器清洗-杭州亿诺能源有限公司 | 温泉机设备|温泉小镇规划设计|碳酸泉设备 - 大连连邦温泉科技 | 南昌旅行社_南昌国际旅行社_南昌国旅在线 | 蒸汽吸附分析仪-进口水分活度仪|康宝百科 | 苏州西朗门业-欧盟CE|莱茵UL双认证的快速卷帘门品牌厂家 | 信阳网站建设专家-信阳时代网联-【信阳网站建设百度推广优质服务提供商】信阳网站建设|信阳网络公司|信阳网络营销推广 | 济南冷库安装-山东冷库设计|建造|冷库维修-山东齐雪制冷设备有限公司 | 专业生物有机肥造粒机,粉状有机肥生产线,槽式翻堆机厂家-郑州华之强重工科技有限公司 | 河南新乡德诚生产厂家主营震动筛,振动筛设备,筛机,塑料震动筛选机 | 注塑模具_塑料模具_塑胶模具_范仕达【官网】_东莞模具设计与制造加工厂家 | 【铜排折弯机,钢丝折弯成型机,汽车发泡钢丝折弯机,线材折弯机厂家,线材成型机,铁线折弯机】贝朗折弯机厂家_东莞市贝朗自动化设备有限公司 | IP检测-检测您的IP质量 | 户外健身路径_小区健身器材_室外健身器材厂家_价格-浩然体育 | 电主轴-高速精密电主轴-高速电机厂家-瑞德沃斯品牌有限公司 | 清洁设备_洗地机/扫地机厂家_全自动洗地机_橙犀清洁设备官网 | 选矿设备-新型重选设备-金属矿尾矿重选-青州冠诚重工机械有限公司 | 水质监测站_水质在线分析仪_水质自动监测系统_多参数水质在线监测仪_水质传感器-山东万象环境科技有限公司 | 爆破器材运输车|烟花爆竹运输车|1-9类危险品厢式运输车|湖北江南专用特种汽车有限公司 | 上海盐水喷雾试验机_两厢式冷热冲击试验箱-巨怡环试 | 二氧化碳/活性炭投加系统,次氯酸钠发生器,紫外线消毒设备|广州新奥 | 清水-铝合金-建筑模板厂家-木模板价格-铝模板生产「五棵松」品牌 | 耐高温风管_耐高温软管_食品级软管_吸尘管_钢丝软管_卫生级软管_塑料波纹管-东莞市鑫翔宇软管有限公司 | 煤矿支护网片_矿用勾花菱形网_缝管式_管缝式锚杆-邯郸市永年区志涛工矿配件有限公司 | 木材烘干机,木炭烘干机,纸管/佛香烘干设备-河南蓝天机械制造有限公司 | 氢氧化钾厂家直销批发-济南金昊化工有限公司| 环球周刊网| 电采暖锅炉_超低温空气源热泵_空气源热水器-鑫鲁禹电锅炉空气能热泵厂家 | 激光内雕_led玻璃_发光玻璃_内雕玻璃_导光玻璃-石家庄明晨三维科技有限公司 激光内雕-内雕玻璃-发光玻璃 |