非监督学习–聚类算法

04 Dec 2012

俗话说：”物以类聚，人以群分”，在自然科学和社会科学中，存在着大量的分类问题。所谓类，通俗地说，就是指相似元素的集合。

为了进一步理解什么叫做聚类，请看一面的例子：

地球人分三种，白种，黄种，黑种人，这是从肤色上分类的，这里的肤色是一种特征，一个人出现在你面前，他胸前没挂着自己是什么种人你也可以分别出来，也就是能自主分类。
一个班的学生我们计算他的各科和的平均分，按平均分可以分为不及格，及格，良，优秀4个等级，这里的等级就是分类数目。这些分类结果也是由平均分这一本质特征来决定的，并不是说谁优秀谁就优秀的。
试试想想在不知道中国老虎分为几类的情况下，你是怎么分类的。首先把所有老虎都抓起来慢慢研究，找出老虎特征间的本质不周再进行分类。而聚类就是能达到这种效果的方法。
先看看下图：

0 13083275648491