电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

Python實現的北京積分落戶數據分析示例

瀏覽:18日期:2022-07-31 18:39:25

本文實例講述了Python實現的北京積分落戶數據分析。分享給大家供大家參考,具體如下:

北京積分落戶狀況 獲取數據(爬蟲/文件下載)—> 分析 (維度—指標) 從公司維度分析不同公司對落戶人數指標的影響 , 即什么公司落戶人數最多也更容易落戶 從年齡維度分析不同年齡段對落戶人數指標影響 , 即什么年齡段落戶人數最多也更容易落戶 從百家姓維度分析不同姓對落戶人數的指標影響 , 即什么姓的落戶人數最多即也更容易落戶 不同分數段的占比情況

# 導入庫import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom matplotlib import font_manager

#讀取數據(文件) , 并查看數據相應結構和格式lh_data = pd.read_csv(’./bj_luohu.csv’,index_col=’id’,usecols=(0,1,2,3,4))lh_data.describe()

Python實現的北京積分落戶數據分析示例

# 1. 公司維度---人數指標# 對公司進行分組聚合 , 并查看分數的相關數據 (個數 , 總分數 , 平均分 , 人數占比)group_company = lh_data.groupby(’company’,as_index=False)[’score’].agg([’count’,’sum’,’mean’]).sort_values(’count’,ascending=False)#更改列名稱group_company.rename(columns={’count’:’people_num’,’sum’:’score_sum’,’mean’:’score_mean’},inplace=True)#定一個函數 , 得到占比def num_percent(people_num=1,people_sum=1): return str(’%.2f’%(people_num / people_sum * 100))+’%’#增加一個占比列group_company[’people_percent’] = group_company[’people_num’].apply(num_percent,people_sum=lh_data[’name’].count())#查看只有一個人落戶的公司 布爾索引group_company[group_company[’people_num’] == 1]group_company.head(10)

Python實現的北京積分落戶數據分析示例

# 2.年齡維度----人數指標#將出生年月轉為年齡lh_data[’age’] = (pd.to_datetime(’2019-09’) - pd.to_datetime(lh_data[’birthday’])) / pd.Timedelta(’365 days’)# 分桶lh_data.describe()bins_age = pd.cut(lh_data[’age’],bins=np.arange(30,70,5))bins_age_group = lh_data[’age’].groupby(bins_age).count()bins_age_group.index = [str(i.left) + ’~’ + str(i.right) for i in bins_age_group.index]bins_age_group.plot(kind=’bar’,alpha=1,rot=60,grid=0.2)

Python實現的北京積分落戶數據分析示例

# 3. 姓維度----人數指標# 增加姓列#定義一個函數 得到姓名的姓def get_fname(name): if len(str(name)) <= 3: return str(name[0]) else: return str(name[0:2])lh_data[’fname’] = lh_data[’name’].apply(get_fname)# 對姓進行分組group_fname = lh_data.groupby(’fname’)[’score’].agg([’count’,’sum’,’mean’]).sort_values(’count’,ascending=False)# 更改列名稱group_fname.rename(columns={’count’:’people_num’,’sum’:’people_sum’,’mean’:’score_mean’},inplace=True)# 增加占比列group_fname[’people_percent’] = group_fname[’people_num’].apply(num_percent,people_sum=lh_data[’name’].count())group_fname.head(10)

Python實現的北京積分落戶數據分析示例

# 4. 查看分數段占比 # 分桶 將分數劃分為一個個的區間bins_score = pd.cut(lh_data[’score’],np.arange(90,130,5))# 將分數裝入對應的桶里bins_score_group = lh_data[’score’].groupby(bins_score).count()# 更改索引顯示格式bins_score_group.index = [str(i.left)+’~’+str(i.right) for i in bins_score_group.index]bins_score_group.plot(kind=’bar’,alpha=1,rot=60,grid=0.2,title=’score-people_num’,colormap=’RdBu_r’)

Python實現的北京積分落戶數據分析示例

總結1.pandas的繪圖方法不夠靈活 , 功能也不夠強大 , 最好還是使用matplotlib繪圖2.記住數據分析最重要的兩個方法 分組: groupby() 和 分桶:cut() , 前者一般用于離散的數據(姓,公司) , 后者用于連續數據 (年齡段,分數段)

更多關于Python相關內容感興趣的讀者可查看本站專題:《Python數學運算技巧總結》、《Python數據結構與算法教程》、《Python函數使用技巧總結》、《Python字符串操作技巧匯總》及《Python入門與進階經典教程》

希望本文所述對大家Python程序設計有所幫助。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 呼末二氧化碳|ETCO2模块采样管_气体干燥管_气体过滤器-湖南纳雄医疗器械有限公司 | 青岛空压机,青岛空压机维修/保养,青岛空压机销售/出租公司,青岛空压机厂家电话 | 山东齐鲁漆业有限公司【官网】-工业漆专业生产厂家 | 大型工业风扇_工业大风扇_大吊扇_厂房车间降温-合昌大风扇 | 蓝莓施肥机,智能施肥机,自动施肥机,水肥一体化项目,水肥一体机厂家,小型施肥机,圣大节水,滴灌施工方案,山东圣大节水科技有限公司官网17864474793 | 糖衣机,除尘式糖衣机,全自动糖衣机,泰州市长江制药机械有限公司 体感VRAR全息沉浸式3D投影多媒体展厅展会游戏互动-万展互动 | 山东聚盛新型材料有限公司-纳米防腐隔热彩铝板和纳米防腐隔热板以及钛锡板、PVDF氟膜板供应商 | 电动不锈钢套筒阀-球面偏置气动钟阀-三通换向阀止回阀-永嘉鸿宇阀门有限公司 | 烟气换热器_GGH烟气换热器_空气预热器_高温气气换热器-青岛康景辉 | 开平机_纵剪机厂家_开平机生产厂家|诚信互赢-泰安瑞烨精工机械制造有限公司 | 保定市泰宏机械制造厂-河北铸件厂-铸造厂-铸件加工-河北大件加工 | LCD3D打印机|教育|桌面|光固化|FDM3D打印机|3D打印设备-广州造维科技有限公司 | 小小作文网_中小学优秀作文范文大全| 细砂提取机,隔膜板框泥浆污泥压滤机,螺旋洗砂机设备,轮式洗砂机械,机制砂,圆锥颚式反击式破碎机,振动筛,滚筒筛,喂料机- 上海重睿环保设备有限公司 | 成都离婚律师|成都结婚律师|成都离婚财产分割律师|成都律师-成都离婚律师网 | 皮带机_移动皮带机_大倾角皮带机_皮带机厂家 - 新乡市国盛机械设备有限公司 | lcd条形屏-液晶长条屏-户外广告屏-条形智能显示屏-深圳市条形智能电子有限公司 | 平面钻,法兰钻,三维钻-山东兴田阳光智能装备股份有限公司 | 流量卡中心-流量卡套餐查询系统_移动电信联通流量卡套餐大全 | 联系我们-腾龙公司上分客服微信19116098882 | 品牌策划-品牌设计-济南之式传媒广告有限公司官网-提供品牌整合丨影视创意丨公关活动丨数字营销丨自媒体运营丨数字营销 | 真空干燥烘箱_鼓风干燥箱 _高低温恒温恒湿试验箱_光照二氧化碳恒温培养箱-上海航佩仪器 | 仿真茅草_人造茅草瓦价格_仿真茅草厂家_仿真茅草供应-深圳市科佰工贸有限公司 | 液压中心架,数控中心架,自定心中心架-烟台恒阳机电设计有限公司 行星搅拌机,双行星搅拌机,动力混合机,无锡米克斯行星搅拌机生产厂家 | RTO换向阀_VOC高温阀门_加热炉切断阀_双偏心软密封蝶阀_煤气蝶阀_提升阀-湖北霍科德阀门有限公司 | 合肥卓创建筑装饰,专业办公室装饰、商业空间装修与设计。 | 不锈钢管件(不锈钢弯头,不锈钢三通,不锈钢大小头),不锈钢法兰「厂家」-浙江志通管阀 | 无锡网站建设_企业网站定制-网站制作公司-阿凡达网络 | 奶茶加盟,奶茶加盟店连锁品牌-甜啦啦官网 | 爱佩恒温恒湿测试箱|高低温实验箱|高低温冲击试验箱|冷热冲击试验箱-您身边的模拟环境试验设备技术专家-合作热线:400-6727-800-广东爱佩试验设备有限公司 | 拉力机-拉力试验机-万能试验机-电子拉力机-拉伸试验机-剥离强度试验机-苏州皖仪实验仪器有限公司 | 聚氨酯复合板保温板厂家_廊坊华宇创新科技有限公司 | 多功能真空滤油机_润滑油全自动滤油机_高效真空滤油机价格-重庆润华通驰 | 智能垃圾箱|垃圾房|垃圾分类亭|垃圾分类箱专业生产厂家定做-宿迁市传宇环保设备有限公司 | IWIS链条代理-ALPS耦合透镜-硅烷预处理剂-上海顶楚电子有限公司 lcd条形屏-液晶长条屏-户外广告屏-条形智能显示屏-深圳市条形智能电子有限公司 | 污水处理设备,一体化泵站,一体化净水设备-「梦之洁环保设备厂家」 | 欧洲MV日韩MV国产_人妻无码一区二区三区免费_少妇被 到高潮喷出白浆av_精品少妇自慰到喷水AV网站 | 合肥升降机-合肥升降货梯-安徽升降平台「厂家直销」-安徽鼎升自动化科技有限公司 | 铜镍-康铜-锰铜-电阻合金-NC003 - 杭州兴宇合金有限公司 | 电动垃圾车,垃圾清运车-江苏速利达机车有限公司 | 寮步纸箱厂_东莞纸箱厂 _东莞纸箱加工厂-东莞市寮步恒辉纸制品厂 |