如何在Win10系統使用Python3連接Hive
由于數據存放在大數據平臺的Hive數據倉庫中,我需要在Win10系統上利用Python3連接Hive,然后讀取數據,進行探索、分析和挖掘工作。
我通過網上查找資料和實際測試,把Win10系統Python3成功連接Hive配置總結如下。
第一步:安裝依賴庫
pip install bitarraypip install bit_arraypip install thriftpip install thriftpypip install pure_saslpip install --no-deps thrift-sasl==0.2.1
提示:若是無法安裝,也可以點擊如下網址,
https://www.lfd.uci.edu/~gohlke/pythonlibs/
選擇合適庫的whl下載,然后進行本地化安裝。
第二步:安裝impyla庫
我采用本地化安裝方式,先下載impyla庫的whl,如下圖:
再安裝
pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl
提示:上面的絕對路徑根據你自己的情況而定
第三步:測試impyla庫是否可以使用
from impala.dbapi import connect #用來連接Hive的函數from impala.util import as_pandas #用來把數據結構轉換為pandas
若是運行通過,表示利用impala連接Hive配置成功。
簡單示例:
從Hive的一張表讀取100條記錄,放到pandas的DataFrame里面。
參考代碼:
from impala.dbapi import connect #用來連接Hive的函數from impala.util import as_pandas #用來把數據結構轉換為pandasconn = connect(host=’my.host.com’, port=21050)cursor = conn.cursor()cursor.execute(’SELECT * FROM mytable LIMIT 100’)df = as_pandas(cursor)cursor.close()
參考資料
https://github.com/cloudera/impyla
以上就是如何在Win10系統使用Python3連接Hive的詳細內容,更多關于Python3連接Hive的資料請關注好吧啦網其它相關文章!
相關文章:
1. 怎么檢測電腦是否支持Win11系統?電腦無法運行Win11怎么辦?2. Win10怎么卸載重裝聲卡驅動?Win10卸載聲卡驅動詳細教程3. Win10提示無法正常啟動你的電腦錯誤代碼0xc0000001的解決辦法4. 如何一鍵關閉所有程序?Windows系統電腦快捷關閉所有程序教程5. Win10電腦制作定時關機代碼bat文件教程6. Win10如何開啟多核優化?Win10開啟多核優化的方法7. dllhost.exe進程占用CPU很高怎么解決?全面解析dllhost.exe進程8. Win10專注助手自動打開怎么辦?Win10注助手自動打開的解決方法9. Win10更新原神2.1版本B服崩潰缺少PCgamesSDK.dll怎么辦?10. 如何在Win11上快速加密硬盤?Win11上快速加密硬盤方法步驟
