通过聚类分析进行工作任务划分

关于聚类分析

聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。聚类分析按照个人理解来说是根据对象的属性(转换为数字)利用数学关系把对象集划分为属性类似的多个类,每个类是由属性类似的对象组成,属性类似可理解为每个类中的对象到所属类的中心距离是这个对象到所有类的中心距离中最短的。

任务介绍

5个产品直销人员准备针对北京四环到六环之间的72家医院进行拜访,这72家医院如何分配给这5个直销人员。

任务解析

利用医院的坐标位置进行Kmean聚类分析,将地理位置相近的医院聚合为一类,根据直销人员的数量将72家医院聚合为5类,每个产品直销人员对应属于一个聚类的医院。

分析过程

1.北京四环到六环之间的72家医院分布如下图

2.使用Kmeans聚类根据医院地理位置将72家医院分为5个类,结果展示如下

3.聚类结果生成区(每个聚类的最小轮廓)展示如下

4.聚类分析效果评价
轮廓系数是聚类效果好坏的一种评价方式。轮廓系数的值是介于 [-1,1] ,越趋近于1代表内聚度和分离度都相对较优。上述聚类分析的轮廓系数:0.607,分析结果还算不错,但还可以调整聚类分析相关参数,进行优化。

总结

根据任务所在地的地理位置使用聚类分析来对任务进行划分,能达到任务划分目的,使任务目标清晰可观,下图为结果展示,颜色相同的点属于同一聚类,数字表示属于相应聚类包含的医院个数,根据数字结果可知,每个聚类包含的医院数量不均匀,按此分配任务还是有不合理的地方。聚类分析属于探索性分析,其结果是给予定性指导,所以,在进行任务划分时要把分析结果针对现实情况进行调整,使任务划分公平、合理、客观。