仕事や研究において、クラスタリングのためにDensity-Based Spatial Clustering of Applications with Noise (DBSCAN) をする方もいらっしゃると思います。DBSCANの実用的かつ実践的な方法はこちらに書きました。 しかし、DBSCANのやり方はわかっても、実際にDBSCANができるように ...
k-meansはデータを事前に指定したk個の重心(セントロイド)に基づいてクラスタリングを行うアルゴリズムで、高速かつ大規模データにも対応可能です 。しかし、球状・凸状のクラスターにしか対応せず、初期値や外れ値に敏感という制約があります 。