阅读: 114
答案 1:
传统的聚类方法比如k-means对于高维数据的效果是很差的。因为在高维度下距离的度量包含了大量随机扰动的结果。用PCA(或者LSI)降维以后那些随机扰动所在的分量都被滤掉了,所以聚类会有提高。总的来说引入很多没有信息量又带来噪声的维度总是会让聚类变差的。 另外统计工具经过发展之后已经能够处理高维的聚类问题了,比如LDA或者人工神经网络一类的方法。答案 2:
同意劳兄的看法,鄙人一点浅显的看法是在高维空间中任何两点间的距离都是很远的,那么即便聚类后作为特征仍然未必很好。而SVD类的工具要有效地多。分享常识给亲友.
下一篇:如果把现有 PC 性能提高 1000 倍,会发生什么? 下一篇 【方向键 ( → )下一篇】
上一篇:西方游戏公司在-频频折戟? 上一篇 【方向键 ( ← )上一篇】
快搜