版权声明:本文为博主原创文章未经博主允许不得转载。 /qq_/article/details/
最近朋友想请我帮忙分析一下关于他们公司客户群体的数据他的目的是希望将用户分为几个类别,当然我首先想到的便是聚类了但是数据中有一个问题令我十分困惑,那便是数据集中既有二分类变量定义变量又有数值变量针对这种情况我们應该怎么处理呢?
经过一番搜索与尝试我个人利用了两种方法,仅供大家参考
当然,作为一个数据分析师第一步要对数据进行初步探索,
当然还要进行数据的预处理,删除缺失值等等但是因为重点不在这就略过了。
因为是第一次写博客问题可能很多,希望大家哆多包涵