python 利用jieba.analyse進(jìn)行 關(guān)鍵詞提取
代碼如下:
#!/usr/bin/env python# -*- coding: utf-8 -*-# @File : jieba.analyse.py# @Author: 趙路倉(cāng)# @Date : 2020/3/14# @Desc : 提取關(guān)鍵字# @Contact : 398333404@qq.comimport jieba.analysetext=’安全、防止水合物和段塞生成的重要措施之一。因此,針對(duì)未來(lái)還上油田開(kāi)發(fā)技術(shù),我們預(yù)先開(kāi)展了水深1500米管道式油氣水分離器的概念設(shè)計(jì)。通過(guò)該研究,提出適合海洋環(huán)境的體積小、重量輕、分離效率高、便于操作和維護(hù)的新型油氣水三相分離器,使其成為海洋深水油氣田開(kāi)’Key=jieba.analyse.extract_tags(text,topK=3)print(Key)
keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=()) 第一個(gè)參數(shù):待提取關(guān)鍵詞的文本 第二個(gè)參數(shù):返回關(guān)鍵詞的數(shù)量,重要性從高到低排序 第三個(gè)參數(shù):是否同時(shí)返回每個(gè)關(guān)鍵詞的權(quán)重 第四個(gè)參數(shù):詞性過(guò)濾,為空表示不過(guò)濾,若提供則僅返回符合詞性要求的關(guān)鍵詞
代碼如下:
#!/usr/bin/env python# -*- coding: utf-8 -*-# @File : jieba.analyse.py# @Author: 趙路倉(cāng)# @Date : 2020/3/14# @Desc : 提取關(guān)鍵字# @Contact : 398333404@qq.comimport jieba.analyse# 字符串前面加u表示使用unicode編碼content = u’安全、防止水合物和段塞生成的重要措施之一。因此,針對(duì)未來(lái)還上油田開(kāi)發(fā)技術(shù),我們預(yù)先開(kāi)展了水深1500米管道式油氣水分離器的概念設(shè)計(jì)。通過(guò)該研究,提出適合海洋環(huán)境的體積小、重量輕、分離效率高、便于操作和維護(hù)的新型油氣水三相分離器,使其成為海洋深水油氣田開(kāi)’keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())# 訪問(wèn)提取結(jié)果for item in keywords: # 分別為關(guān)鍵詞和相應(yīng)的權(quán)重 print(item[0], item[1])
以上就是python 利用jieba.analyse進(jìn)行 關(guān)鍵詞提取的詳細(xì)內(nèi)容,更多關(guān)于python 關(guān)鍵詞提取的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. HTTP協(xié)議常用的請(qǐng)求頭和響應(yīng)頭響應(yīng)詳解說(shuō)明(學(xué)習(xí))2. Vue如何使用ElementUI對(duì)表單元素進(jìn)行自定義校驗(yàn)及踩坑3. HTML5實(shí)戰(zhàn)與剖析之觸摸事件(touchstart、touchmove和touchend)4. React優(yōu)雅的封裝SvgIcon組件示例5. HTML DOM setInterval和clearInterval方法案例詳解6. XML入門(mén)的常見(jiàn)問(wèn)題(三)7. HTML5 Canvas繪制圖形從入門(mén)到精通8. CSS清除浮動(dòng)方法匯總9. XML在語(yǔ)音合成中的應(yīng)用10. 不要在HTML中濫用div
