机器学习算法-kmeans 聚类算法一

Vida ·

更新时间:2024-09-21

· 715 次阅读

1.1 k-means算法的步骤

假设k=3，要分3个群体

随机在数据当中抽取3个样本，当作三个类别的中心点（k1，k2，k3）计算其余的点分别到这3个中心点的距离，每一个样本有3个距离（a,b,c）,从中选出距离最近的一个点作为自己的标记形成3个族群。分别计算这3个族群的平均值，把3个平均值与之前的3个旧中心点进行比较

如果相同，结束聚类，算法收敛。

如果不相同：把这3个平均值当做新的中心点，从第二步开始重新开始。

1.2 k-means算法的评估标准

外部距离最大化，内部距离最小化。

1、计算蓝1到自身类别的点距离的平均值a_i

2、计算蓝1分别到红色类别，绿色类别所有的点的距离，求出平均值

b1, b2，取其中最⼩的值当做b_i

轮廓系数的范围为:[-1 1]

简单案例：


# -*- coding: utf-8 -*-
# @File    : k-means2.py
# @Date    :  2020-02-18 11:25
# @Author  : admin
import pandas as pd
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
def programmer_4():
    inputfile = '../data/zscoreddata.xls'
    k = 5
    data = pd.read_excel(inputfile)
    kmodel = KMeans(n_clusters=k, n_jobs=4)
    kmodel.fit(data)
    r1 = pd.Series(kmodel.labels_).value_counts()  # 统计各个类别的数目
    r2 = pd.DataFrame(kmodel.cluster_centers_)  # 找出聚类中心
    r = pd.concat([r2, r1], axis=1)  # 横向连接（axis=0是纵向），得到聚类中心对应的类别下的数目
    r.columns = list(data.columns) + [u'类别个数']  # 重命名表头
    print(r)
    #matlib 显示
    import matplotlib.pyplot as plt
    plt.figure(figsize=(5,5));
    colored = ["orange", "green", "blue","red","yellow"];
    colr = [colored[i] for i in kmodel.labels_];
    plt.scatter(data.values[:, 0], data.values[:, 1], color=colr);
    plt.show()
programmer_4();



作者：健康平安的活着
                    
 
                

                            学习
                            kmeans
                            聚类
                            聚类算法
                            机器学习
                            算法


           
    
    

            
                
                    
                
            
            
                
    
        
            需要 登录 后方可回复, 如果你还没有账号请 注册新账号
        
    
                
            
                
                    
                        相关文章

    
        
            Python3 迭代器与生成器
        
        
            Serafina
            2021-03-06
        
    
    
        813
    


    
        
            Kotlin Android 环境搭建
        
        
            Quirita
            2021-04-07
        
    
    
        999
    


    
        
            做一个能自适应高度的textarea的示例代码
        
        
            Jayne
            2021-07-02
        
    
    
        774
    


    
        
            HTML5新增属性data-*和js/jquery之间的交互及注意事项
        
        
            Alice
            2020-11-20
        
    
    
        545
    


    
        
            基于Go和Gin的环境配置方法
        
        
            Flower
            2021-02-22
        
    
    
        601
    


    
        
            Shell中去除字符串前后空格的方法
        
        
            Iris
            2021-08-03
        
    
    
        567
    


    
        
    
    
        
            MySQL基础学习之字符集的应用
        
        
            Nafisa
            2023-05-17
        
    
    
        1150
    


    
        
            Swin Transformer模块集成到YOLOv5目标检测算法中实现
        
        
            Rhea
            2023-05-31
        
    
    
        411
    


    
        
    
    
        
            8种Python异常检测算法总结
        
        
            Pandora
            2023-06-06
        
    
    
        1433
    


    
        
            C++函数模板学习示例教程指南
        
        
            Pandora
            2023-07-07
        
    
    
        25
    


    
        
            go语言定义零值可用的类型学习教程
        
        
            Tallulah
            2023-07-17
        
    
    
        216
    


    
        
            MySQL中Join的算法(NLJ、BNL、BKA)详解
        
        
            Trixie
            2023-07-20
        
    
    
        343
    


    
        
            Redis数据结构之intset整数集合使用学习
        
        
            Janna
            2023-07-20
        
    
    
        1721
    


    
        
            Redis数据结构之跳跃表使用学习
        
        
            Ophelia
            2023-07-20
        
    
    
        644
    


    
        
            Redis数据结构之listpack和quicklist使用学习
        
        
            Natalia
            2023-07-20
        
    
    
        1968
    


    
        
            排序算法之插入排序法解析
        
        
            Hester
            2023-07-20
        
    
    
        301
    


    
        
            排序算法之希尔排序法解析
        
        
            Ianthe
            2023-07-20
        
    
    
        1837
    


    
        
            大语言模型的开发利器langchainan安装使用快速入门学习
        
        
            Irma
            2023-07-20
        
    
    
        829
    


    
        
            Python使用嵌套循环实现图像处理算法
        
        
            Valora
            2023-07-20
        
    
    
        1314
    


    
        
            C++前缀树字典树的学习与模拟实现代码示例
        
        
            Kirima
            2023-07-20
        
    
    
        1789


        
    
        
            我要提问
        
    
    
        
        
    
        致谢
        
            帮助他人，成就自己。
            人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。
            1024问感谢每一位朋友的帮助和支持。
            软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。
        
    
    
        
            
    育儿网
    微养生
    全球行
    美食街
    育儿
    菜谱大全
    海南旅游
    女性
    养狗百科
    星座