电脑知识|欧美黑人一区二区三区|软件|欧美黑人一级爽快片淫片高清|系统|欧美黑人狂野猛交老妇|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网

您的位置:首頁技術文章
文章詳情頁

Kmeans均值聚類算法原理以及Python如何實現(xiàn)

瀏覽:12日期:2022-07-09 18:38:13

第一步.隨機生成質心

由于這是一個無監(jiān)督學習的算法,因此我們首先在一個二維的坐標軸下隨機給定一堆點,并隨即給定兩個質心,我們這個算法的目的就是將這一堆點根據(jù)它們自身的坐標特征分為兩類,因此選取了兩個質心,什么時候這一堆點能夠根據(jù)這兩個質心分為兩堆就對了。如下圖所示:

Kmeans均值聚類算法原理以及Python如何實現(xiàn)

第二步.根據(jù)距離進行分類

紅色和藍色的點代表了我們隨機選取的質心。既然我們要讓這一堆點的分為兩堆,且讓分好的每一堆點離其質心最近的話,我們首先先求出每一個點離質心的距離。假如說有一個點離紅色的質心比例藍色的質心更近,那么我們則將這個點歸類為紅色質心這一類,反之則歸于藍色質心這一類,如圖所示:

Kmeans均值聚類算法原理以及Python如何實現(xiàn)

第三步.求出同一類點的均值,更新質心位置

在這一步當中,我們將同一類點的xy的值進行平均,求出所有點之和的平均值,這個值(x,y)則是我們新的質心的位置,如圖所示:

Kmeans均值聚類算法原理以及Python如何實現(xiàn)

我們可以看到,質心的位置已經發(fā)生了改變。

第四步.重復第二步,第三步

我們重復第二步和第三部的操作,不斷求出點對質心的最小值之后進行分類,分類之后再更新質心的位置,直到得到迭代次數(shù)的上限(這個迭代次數(shù)是可以我們自己設定的,比如10000次),或者在做了n次迭代之后,最后兩次迭代質心的位置已經保持不變,如下圖所示:

Kmeans均值聚類算法原理以及Python如何實現(xiàn)

這個時候我們就將這一堆點按照它們的特征在沒有監(jiān)督的條件下,分成了兩類了!!

五.如果面對多個特征確定的一個點的情況,又該如何實現(xiàn)聚類呢?

首先我們引入一個概念,那就是歐式距離,歐式距離是這樣定義的,很容易理解:

Kmeans均值聚類算法原理以及Python如何實現(xiàn)

很顯然,歐式距離d(xi,xj)等于我們每一個點的特征去減去另一個點在該維度下的距離的平方和再開根號,十分容易理解。

我們也可以用另一種方式來理解kmeans算法,那就是使某一個點的和另一些點的方差做到最小則實現(xiàn)了聚類,如下圖所示:

Kmeans均值聚類算法原理以及Python如何實現(xiàn)

得解!

六:代碼實現(xiàn)

我們現(xiàn)在使用Python語言來實現(xiàn)這個kmeans均值算法,首先我們先導入一個名叫make_blobs的數(shù)據(jù)集datasets,然后分別使用兩個變量X,和y進行接收。X表示我們得到的數(shù)據(jù),y表示這個數(shù)據(jù)應該被分類到的是哪一個類別當中,當然在我們實際的數(shù)據(jù)當中不會告訴我們哪個數(shù)據(jù)分在了哪一個類別當中,只會有X當中數(shù)據(jù)。在這里寫代碼的時候比較特殊,make_blobs庫要求我們必須接受這兩個參數(shù),不能夠只接受X這個數(shù)據(jù)參數(shù),代碼如下

plt.figure(figsize=(15,15))#規(guī)定我們繪圖的大小為12*12X, y=make_blobs(n_samples=1600,random_state=170)#一共取用1600個sample,同時狀態(tài)設定為隨機#不知道這個狀態(tài)隨機是什么意思,只能查有關這個庫的官方文檔,同時這個數(shù)據(jù)集規(guī)定了是具備三個數(shù)據(jù)中心,也就是三個簇y_pred=KMeans(n_clusters=3,random_state=170).fit_predict(X)plt.subplot(221)#表示四個方格當中的第一格plt.scatter(X[:,0],X[:,1],c=y_pred)#表示數(shù)據(jù)的第0個和第1個維度,同時數(shù)據(jù)的colour與predict的結果有關plt.title('The result of the Kmeans')plt.subplot(222)#表示四個方格當中的第一格plt.scatter(X[:,0],X[:,1],c=y)plt.title('The Real result of the Kmeans')array=np.array([[0.60834549,-0.63667341],[-0.40887178,-0.85253229]])lashen=np.dot(X,array)y_pred=KMeans(n_clusters=3,random_state=170).fit_predict(lashen)plt.subplot(223)#表示四個方格當中的第一格plt.scatter(lashen[:,0],lashen[:,1],c=y_pred)#表示數(shù)據(jù)的第0個和第1個維度,同時數(shù)據(jù)的colour與predict的結果有關plt.title('The Real result of the tranfored data')

我們在使用scatter函數(shù)進行繪圖的時候會根據(jù)我們數(shù)據(jù)結的形狀來編寫相應的代碼,這里我們所拿到的X數(shù)據(jù)集的行數(shù)是我們所指定的1600行,因為我們一共拿到了1600個數(shù)據(jù),每一個數(shù)據(jù)僅有兩個特征,也就是在XY軸當中的坐標,因此X是一個二維的ndarray對象(X是numpy當中的ndarray對象),我們可以打印出來看看這個數(shù)據(jù)的構成,如下圖所示:

Kmeans均值聚類算法原理以及Python如何實現(xiàn)

同時我們也可以看到y(tǒng)也是ndarray對象,由于我們在采集數(shù)據(jù)的時候僅僅接受了3個簇,make_blobs默認接受的是三個簇(或稱cluster)的緣故,因此最后y的值只有0,1,2這三種可能。我們通過matplotlib繪圖,繪制出我們分類的結果圖,也就是上述代碼的運行結果如下:

Kmeans均值聚類算法原理以及Python如何實現(xiàn)

以上就是Kmeans均值聚類算法原理以及Python如何實現(xiàn)的詳細內容,更多關于Kmeans均值聚類算法的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 广东西屋电气有限公司-广东西屋电气有限公司 | 气动隔膜泵厂家-温州永嘉定远泵阀有限公司 | 济南冷库安装-山东冷库设计|建造|冷库维修-山东齐雪制冷设备有限公司 | 企业微信营销_企业微信服务商_私域流量运营_艾客SCRM官网 | 合肥仿石砖_合肥pc砖厂家_合肥PC仿石砖_安徽旭坤建材有限公司 | 升降炉_真空气氛炉_管式电阻炉厂家-山东中辰电炉有限公司 | 寮步纸箱厂_东莞纸箱厂 _东莞纸箱加工厂-东莞市寮步恒辉纸制品厂 | PCB接线端子_栅板式端子_线路板连接器_端子排生产厂家-置恒电气 喷码机,激光喷码打码机,鸡蛋打码机,手持打码机,自动喷码机,一物一码防伪溯源-恒欣瑞达有限公司 假肢-假肢价格-假肢厂家-河南假肢-郑州市力康假肢矫形器有限公司 | 安徽合肥项目申报咨询公司_安徽合肥高新企业项目申报_安徽省科技项目申报代理 | 广州展览设计公司_展台设计搭建_展位设计装修公司-众派展览装饰 广州展览制作工厂—[优简]直营展台制作工厂_展会搭建资质齐全 | 塑料异型材_PVC异型材_封边条生产厂家_PC灯罩_防撞扶手_医院扶手价格_东莞市怡美塑胶制品有限公司 | 【电子厂招聘_普工招工网_工厂招聘信息平台】-工立方打工网 | 北京印刷厂_北京印刷_北京印刷公司_北京印刷厂家_北京东爵盛世印刷有限公司 | 成都顶呱呱信息技术有限公司-贷款_个人贷款_银行贷款在线申请 - 成都贷款公司 | 蓄电池在线监测系统|SF6在线监控泄露报警系统-武汉中电通电力设备有限公司 | CTP磁天平|小电容测量仪|阴阳极极化_双液系沸点测定仪|dsj电渗实验装置-南京桑力电子设备厂 | 脱硫搅拌器厂家-淄博友胜不锈钢搅拌器厂家 | 喷砂机厂家_自动除锈抛丸机价格-成都泰盛吉自动化喷砂设备 | 猪I型/II型胶原-五克隆合剂-细胞冻存培养基-北京博蕾德科技发展有限公司 | 硅PU球场、篮球场地面施工「水性、环保、弹性」硅PU材料生产厂家-广东中星体育公司 | 上海佳武自动化科技有限公司| 伸缩节_伸缩器_传力接头_伸缩接头_巩义市联通管道厂 | 艾乐贝拉细胞研究中心 | 国家组织工程种子细胞库华南分库 | 电动球阀_不锈钢电动球阀_电动三通球阀_电动调节球阀_上海湖泉阀门有限公司 | 食品无尘净化车间,食品罐装净化车间,净化车间配套风淋室-青岛旭恒洁净技术有限公司 | 深圳诚暄fpc首页-柔性线路板,fpc柔性线路板打样生产厂家 | 连续密炼机_双转子连续密炼机_连续式密炼机-南京永睿机械制造有限公司 | 洗地机-全自动/手推式洗地机-扫地车厂家_扬子清洁设备 | 控显科技 - 工控一体机、工业显示器、工业平板电脑源头厂家 | 快干水泥|桥梁伸缩缝止水胶|伸缩缝装置生产厂家-广东广航交通科技有限公司 | 重庆网站建设,重庆网站设计,重庆网站制作,重庆seo,重庆做网站,重庆seo,重庆公众号运营,重庆小程序开发 | 贝朗斯动力商城(BRCPOWER.COM) - 买叉车蓄电池上贝朗斯商城,价格更超值,品质有保障! | 济南ISO9000认证咨询代理公司,ISO9001认证,CMA实验室认证,ISO/TS16949认证,服务体系认证,资产管理体系认证,SC食品生产许可证- 济南创远企业管理咨询有限公司 郑州电线电缆厂家-防火|低压|低烟无卤电缆-河南明星电缆 | 泰来华顿液氮罐,美国MVE液氮罐,自增压液氮罐,定制液氮生物容器,进口杜瓦瓶-上海京灿精密机械有限公司 | 合肥通道闸-安徽车牌识别-人脸识别系统厂家-安徽熵控智能技术有限公司 | 浙江皓格药业有限公司| 贵阳用友软件,贵州财务软件,贵阳ERP软件_贵州优智信息技术有限公司 | 加气混凝土砌块设备,轻质砖设备,蒸养砖设备,新型墙体设备-河南省杜甫机械制造有限公司 | 天津力值检测-天津管道检测-天津天诚工程检测技术有限公司 | 硬度计_影像测量仪_维氏硬度计_佛山市精测计量仪器设备有限公司厂家 | 集装箱展厅-住人集装箱住宿|建筑|房屋|集装箱售楼处-山东锐嘉科技工程有限公司 |