1260 2012 2013 WEIGHTED CLUSTERING Proceedings of the

  • Slides: 15
Download presentation
Μιχάλης Χριστόπουλος Μ 1260 2012 -2013 WEIGHTED CLUSTERING ΠΡΟΗΓΜΕΝΗ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Proceedings of the

Μιχάλης Χριστόπουλος Μ 1260 2012 -2013 WEIGHTED CLUSTERING ΠΡΟΗΓΜΕΝΗ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Proceedings of the Twenty-Sixth AAAI Conference on Artificial Intelligence Paper of Margareta Ackerman, Shai Ben-David, Simina Branzei, David Loker

Βασικές έννοιες w: X --> R+ , domain: w[X] , element: w(x) d: distance

Βασικές έννοιες w: X --> R+ , domain: w[X] , element: w(x) d: distance function, X*X --> R+ U {0}, d(x, y)=0 x=y weighted data set: (w[X], d) K-clustering C = {C 1, C 2, …, Ck}, 1<k<|X| (no one-clusterings and no single-element clusters), Ui Ci =X |C| = number of clusters in C An algorithm A maps (w[X], d) and a 1<k<|X| to a k-clustering of X Dendrogram D=(T, M) Hierarchical algorithm maps a (w[X], d) to a dendrogram D.

Αλγόριθμοι clustering Partitional ◦ Ratio-cut Spectral Clustering ◦ K-Means ◦ (k-medoids, k-median, minsum, min-diameter,

Αλγόριθμοι clustering Partitional ◦ Ratio-cut Spectral Clustering ◦ K-Means ◦ (k-medoids, k-median, minsum, min-diameter, k-center) Hierarchical Average Linkage Ward’s method (Bisecting k-means, simple -linkage, complete-linkage) • Weight responsive: υπάρχει w => Α(w[X], d)=C και υπάρχει w’ => Α(w’[X], d)≠C • Weight sensitive: αν για όλα τα (Χ, d) και όλα τα C => weight responsive • Weight Robust: δεν αλλάζει το αποτέλεσμα τους από τα βάρη • Weight Considering: είναι responsive για κάποια (Χ, d) και C ενώ είναι robust για κάποια άλλα.

ΑΛΓΟΡΙΘΜΟΙ ΔΙΑΧΩΡΙΣΜΟΥ Ratio-cut spectral Clustering ◦ Χρησιμοποιεί similarity function Πορίσματα ◦ Perfect clustering: x

ΑΛΓΟΡΙΘΜΟΙ ΔΙΑΧΩΡΙΣΜΟΥ Ratio-cut spectral Clustering ◦ Χρησιμοποιεί similarity function Πορίσματα ◦ Perfect clustering: x 1, x 2, x 3, x 4 x 1 ~C x 2 and x 3 ≁C x 4 => s(x 1, x 2) > s(x 3, x 4) ◦ Separation-uniform clustering: υπάρχει λ ώστε για κάθε x, y є X αν x ≁ C y τότε s(x, y) = λ. ◦ Ο Ratio-cut είναι weight responsive σε ένα clustering C αν και μόνο αν το C δεν είναι perfect ή δεν είναι separation-uniform. Διαφορετικά είναι weight robust.

Αποτελέσματα Partitional Hierarchical Weight sensitive K-means, k-medoids, k-median, min-sum Ward’s method, Bisecting k-means Weight

Αποτελέσματα Partitional Hierarchical Weight sensitive K-means, k-medoids, k-median, min-sum Ward’s method, Bisecting k-means Weight considering Ratio-cut Average-linkage Weight robust Min-diameter, kcenter Single-linkage, Complete-linkage