电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

Java HtmlParse提取標簽中的值操作

瀏覽:3日期:2022-08-26 16:57:53

☆代碼示例:

代碼塊語法遵循標準markdown代碼,例如:

package cas;import org.htmlparser.Node;import org.htmlparser.NodeFilter;import org.htmlparser.Parser;import org.htmlparser.filters.StringFilter;import org.htmlparser.filters.TagNameFilter;import org.htmlparser.tags.ImageTag;import org.htmlparser.util.NodeList;/** * Html 中的body體中提取出Img標簽中的src值 * * @author XY * */public class CASHtmlImgConvert { public static void main(String[] args) {//演示 String[] oldSrcPath=changeImgSrc('<img alt='' src='http://www.czb8688.comhttp://www.hdgsjgj.cn/attached/image/20160116/20160116141455_775.jpg' />'); if(oldSrcPath!=null){ for(String str:oldSrcPath){System.out.println(str); } } } public static boolean isEmpty(String str){ if(str!=null&&(!str.equals(''))) return false; else return true; } /** * * @param htmlPath 本地的html路徑 或者body */ private static String[] changeImgSrc(String htmlPath) { StringBuilder oldSrcPath = new StringBuilder(); try { Parser parser = new Parser(htmlPath); //標簽名過濾器 NodeFilter filter = new TagNameFilter ('img'); NodeList nodes = parser.extractAllNodesThatMatch(filter); Node eachNode = null; ImageTag imageTag = null; if (nodes != null) { // 遍歷所有的img節點 for (int i = 0; i < nodes.size(); i++) { eachNode = (Node)nodes.elementAt(i); if (eachNode instanceof ImageTag) { imageTag = (ImageTag)eachNode; // 獲得html文本的原來的src屬性 String path=imageTag.getAttribute('src'); if(path.startsWith('')) path='http://www.czb8688.com'+path; oldSrcPath .append(path+','); } } } } catch (Exception e) { e.printStackTrace(); } String str=oldSrcPath.toString(); //返回圖片數組 return str.substring(0,str.length()-1).split(','); } }

補充知識:java 掃描HTML 拿取各種標簽資源數據

直接上代碼,不比比。

package com.zhirui.oa.modules.notice.utils;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import java.util.regex.Matcher;import java.util.regex.Pattern;public class TemplateUtil { public static List<Map<String, Object>> getImgSrc(String htmlContent) { List<Map<String, Object>> srcList = new ArrayList<>(); //用來存儲獲取到的地址 Map<String, Object> map = null; Pattern p = Pattern.compile('<(img|IMG)(.*?)(>|></img>|/>)');//匹配字符串中的img標簽 Matcher matcher = p.matcher(htmlContent); boolean hasPic = matcher.find(); if (hasPic == true)//判斷是否含有圖片 { while (hasPic) //如果含有圖片,那么持續進行查找,直到匹配不到 {String group = matcher.group(2);//獲取第二個分組的內容,也就是 (.*?)匹配到的Pattern srcText = Pattern.compile('(src|SRC)=('|’)(.*?)('|’)');//匹配圖片的地址Matcher matcher2 = srcText.matcher(group);if (matcher2.find()) { map = new HashMap<>(); map.put('imgResourcePath', matcher2.group(3)); srcList.add(map);//把獲取到的圖片地址添加到列表中 map = null;}hasPic = matcher.find();//判斷是否還有img標簽 } } return srcList; } public static List<Map<String, Object>> getVideoSrc(String htmlContent) { List<Map<String, Object>> srcList = new ArrayList<>(); //用來存儲獲取到的視頻地址 Map<String, Object> map = null; Pattern p = Pattern.compile('<(video|VIDEO)(.*?)(>|></video>|/>)');//匹配字符串中的video標簽 Matcher matcher = p.matcher(htmlContent); boolean hasPic = matcher.find(); if (hasPic == true)//判斷是否含有視頻 { while (hasPic) //如果含有視頻,那么持續進行查找,直到匹配不到 {String group = matcher.group(2);//獲取第二個分組的內容,也就是 (.*?)匹配到的Pattern srcText = Pattern.compile('(src|SRC)=('|’)(.*?)('|’)');//匹配視頻的地址Matcher matcher2 = srcText.matcher(group);if (matcher2.find()) { map = new HashMap<>(); map.put('videoResourcePath', matcher2.group(3)); srcList.add(map);//把獲取到的視頻地址添加到列表中 map = null;}hasPic = matcher.find();//判斷是否還有video標簽 } } return srcList; } public static List<Map<String, Object>> getAhref(String htmlContent) { List<Map<String, Object>> srcList = new ArrayList<>(); //用來存儲獲取到的超鏈接地址 Map<String, Object> map = null; Pattern p = Pattern.compile('<(a|A)(.*?)(>|></a>|/>)');//匹配字符串中的a標簽 Matcher matcher = p.matcher(htmlContent); boolean hasPic = matcher.find(); if (hasPic == true)//判斷是否含有超鏈接 { while (hasPic) //如果含有超鏈接,那么持續進行查找,直到匹配不到 {String group = matcher.group(2);//獲取第二個分組的內容,也就是 (.*?)匹配到的Pattern srcText = Pattern.compile('(href|HREF)=('|’)(.*?)('|’)');//匹配超鏈接的地址Matcher matcher2 = srcText.matcher(group);if (matcher2.find()) { map = new HashMap<>(); map.put('aResourcePath', matcher2.group(3)); srcList.add(map);//把獲取到的超鏈接地址添加到列表中 map = null;}hasPic = matcher.find();//判斷是否還有a標簽 } } return srcList; }}

以上這篇Java HtmlParse提取標簽中的值操作就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持好吧啦網。

標簽: Java
相關文章:
主站蜘蛛池模板: 沥青灌缝机_路面灌缝机_道路灌缝机_沥青灌缝机厂家_济宁萨奥机械有限公司 | 定制异形重型钢格栅板/钢格板_定做踏步板/排水沟盖板_钢格栅板批发厂家-河北圣墨金属制品有限公司 | Dataforth隔离信号调理模块-信号放大模块-加速度振动传感器-北京康泰电子有限公司 | 上海佳武自动化科技有限公司| 无线联网门锁|校园联网门锁|学校智能门锁|公租房智能门锁|保障房管理系统-KEENZY中科易安 | MVR蒸发器厂家-多效蒸发器-工业废水蒸发器厂家-康景辉集团官网 | 杭州实验室尾气处理_实验台_实验室家具_杭州秋叶实验设备有限公司 | 杭州中央空调维修_冷却塔/新风机柜/热水器/锅炉除垢清洗_除垢剂_风机盘管_冷凝器清洗-杭州亿诺能源有限公司 | 伊卡洛斯软装首页-电动窗帘,别墅窗帘,定制窗帘,江浙沪1000+别墅窗帘案例 | 气弹簧定制-气动杆-可控气弹簧-不锈钢阻尼器-工业气弹簧-可调节气弹簧厂家-常州巨腾气弹簧供应商 | 密集架|电动密集架|移动密集架|黑龙江档案密集架-大量现货厂家销售 | 全自动五线打端沾锡机,全自动裁线剥皮双头沾锡机,全自动尼龙扎带机-东莞市海文能机械设备有限公司 | 陶瓷加热器,履带式加热器-吴江市兴达电热设备厂 | 中国玩具展_玩具展|幼教用品展|幼教展|幼教装备展 | 礼仪庆典公司,礼仪策划公司,庆典公司,演出公司,演艺公司,年会酒会,生日寿宴,动工仪式,开工仪式,奠基典礼,商务会议,竣工落成,乔迁揭牌,签约启动-东莞市开门红文化传媒有限公司 | 板框压滤机-隔膜压滤机-厢式压滤机生产厂家-禹州市君工机械设备有限公司 | 复合肥,化肥厂,复合肥批发,化肥代理,复合肥品牌-红四方 | 点胶机_点胶阀_自动点胶机_智能点胶机_喷胶机_点胶机厂家【欧力克斯】 | 杭州双螺杆挤出机-百科 | 杭州画室_十大画室_白墙画室_杭州美术培训_国美附中培训_附中考前培训_升学率高的画室_美术中考集训美术高考集训基地 | 便携式表面粗糙度仪-彩屏硬度计-分体式粗糙度仪-北京凯达科仪科技有限公司 | 成都亚克力制品,PVC板,双色板雕刻加工,亚克力门牌,亚克力标牌,水晶字雕刻制作-零贰捌广告 | 云南丰泰挖掘机修理厂-挖掘机维修,翻新,再制造的大型企业-云南丰泰工程机械维修有限公司 | 江苏南京多语种翻译-专业翻译公司报价-正规商务翻译机构-南京华彦翻译服务有限公司 | 集装袋吨袋生产厂家-噸袋廠傢-塑料编织袋-纸塑复合袋-二手吨袋-太空袋-曹县建烨包装 | 自动检重秤-动态称重机-重量分选秤-苏州金钻称重设备系统开发有限公司 | 防爆电机-高压防爆电机-ybx4电动机厂家-河南省南洋防爆电机有限公司 | 深圳市八百通智能技术有限公司官方网站 | 西点培训学校_法式西点培训班_西点师培训_西点蛋糕培训-广州烘趣西点烘焙培训学院 | 隔爆型防爆端子分线箱_防爆空气开关箱|依客思 | 实验室隔膜泵-无油防腐蚀隔膜泵-耐腐蚀隔膜真空泵-杭州景程仪器 电杆荷载挠度测试仪-电杆荷载位移-管桩测试仪-北京绿野创能机电设备有限公司 | 深圳市宏康仪器科技有限公司-模拟高空低压试验箱-高温防爆试验箱-温控短路试验箱【官网】 | 包装设计公司,产品包装设计|包装制作,包装盒定制厂家-汇包装【官方网站】 | 不锈钢钢格栅板_热浸锌钢格板_镀锌钢格栅板_钢格栅盖板-格美瑞 | 上海小程序开发-小程序制作-上海小程序定制开发公司-微信商城小程序-上海咏熠 | 骨密度检测仪_骨密度分析仪_骨密度仪_动脉硬化检测仪专业生产厂家【品源医疗】 | 杜康白酒加盟_杜康酒代理_杜康酒招商加盟官网_杜康酒厂加盟总代理—杜康酒神全国运营中心 | 企业管理培训,企业培训公开课,企业内训课程,企业培训师 - 名课堂企业管理培训网 | 智慧农业|农业物联网|现代农业物联网-托普云农物联网官方网站 | 家庭教育吧-在线家庭教育平台,专注青少年家庭教育 | 细沙回收机-尾矿干排脱水筛设备-泥石分离机-建筑垃圾分拣机厂家-青州冠诚重工机械有限公司 |