聚类分析在用户分类中的应用
本文摘要:订阅专栏撤销订阅 我不制造文章,我是互联网的搬运工1.5万14什么是聚类分析?聚类分析属于探究性的数据分析方法。通常,我们使用聚类分析将看似无序的对象进行分组、归类,以达到更好地舆解研讨对象的意图。聚类成果要求组内对象类似性较高,组间对象类似性较
订阅专栏撤销订阅 我不制造文章,我是互联网的搬运工

1.5万

14

什么是聚类分析?
聚类分析属于探究性的数据分析方法。通常,我们使用聚类分析将看似无序的对象进行分组、归类,以达到更好地舆解研讨对象的意图。聚类成果要求组内对象类似性较高,组间对象类似性较低。在用户研讨中,很多问题可以借助聚类分析来解决,比如,网站的信息分类问题、网页的点击行为关联性问题以及用户分类问题等等。其间,用户分类是最多见的状况。
聚类分析的根本过程是怎样的?

选择聚类变量聚类分析找出各类用户的重要特征聚类解释 命名

?

|| ?选择聚类变量

在设计问卷的时分,我们会依据一定的假设,尽量选取对产品使用行为有影响的变量,这些变量一般包括与产品亲近相关的用户情绪、观念、行为。可是,聚类分析过程对用于聚类的变量还有一定的要求:

这些变量在不同研讨对象上的值具有显着差异;这些变量之间不能存在高度相关。

因为,首要,用于聚类的变量数目不是越多越好,没有显着差异的变量对聚类没有起到实质意义,并且可能使成果发生误差;其次,高度相关的变量适当于给这些变量进行了加权,等于扩大了某方面因素对用户分类的作用。

辨认适宜的聚类变量的方法:

对变量做聚类分析,从聚得的各类中选择出一个有代表性的变量;做主成份分析或因子分析,发生新的变量作为聚类变量。

|| 聚类分析

相对聚类前的准备工作,真实的执行过程显得异常简略。数据准备好后,丢到统计软件(通常是spss)里边跑一下,成果就出来了。

这里边遇到的一个问题是,把用户分红多少类适宜?通常,可以结合几个规范综合判断:

看拐点(层次聚类会出来聚合系数图,如右图,一般选择拐点邻近的几个类别) 凭经历或产品特性判断(不同产品的用户差异性也不同) 在逻辑上可以清楚地解释

|| 找出各类用户的重要特征

确定一种分类方案之后,接下来,我们需要返回观察各类别用户在各个变量上的体现。依据差异查验的成果,我们以色彩区分出不同类用户在这项指标上的水 平凹凸。如下图,赤色代表“远远高于均匀水平”,黄色代表“均匀水平”,蓝色代表“远远低于均匀水平”。其他变量以此类推。终究,我们会发现不同类别用户 有别于其他类别用户的重要特征。

|| 聚类解释 命名

在了解宽和释用户分类时,最好可以结合更多的数据,例如,人口统计学数据、功用偏好数据等等(如下图)……终究,选取每一类别最显着的几个特征为其命名,就半途而废啦!

参考资料:

《社会统计分析方法——spss软件应用》

 

原文来自:网易UED


人人都是产品主管(woshipm)是以产品主管、运营为核心的学习、交流、分享平台,集媒体、培训、社群为一体,全方位效劳产品人和运营人,建立9年举行在线讲座500+期,线下分享会300+场,产品主管大会、运营大会20+场,掩盖北上广深杭成都等15个城市,内行业有较高的影响力和知名度。平台集合了众多BAT美团京东滴滴360小米网易等知名互联网公司产品总监和运营总监,他们在这里与你一同生长。