Similarit Belkhir Abdelkader Laboratoire LSI USTHB belkhirlsiusthb dz
Similarité Belkhir Abdelkader Laboratoire LSI USTHB belkhir@lsi-usthb. dz 14/09/2021 BELKHIR ABDELKADER
Problématique • Input: Ensemble d’objets • Tâche: traitement Le plus similaire Requête: Nouveau objet Tâche: trouver l’objet (le plus) similaire parmi l’ensemble des objets 14/09/2021 BELKHIR ABDELKADER
1 Similarity Search in Web 3 Revising 4 New the Problem Algorithms 2 Similarity Search in Theory 14/09/2021 BELKHIR ABDELKADER
Mesure de similarité Soit N un ensemble d’objets (individus, documents, sites web, …) Une mesure de similarité, notée s, s: Nx. N R • • • 14/09/2021 x, y N : s(x, y) ≥ 0 x, y N : s(x, x) = s(y, y) ≥ s(x, y) x, y N : s(x, y) = s(y, x) BELKHIR ABDELKADER
Mesure de dissimilarité • Une mesure de dissimilarité, notée d, d: Nx. N R. • x, y N : d(x, y) ≥ 0 • x, y N : d(x, x) = 0 • x, y N : d(x, y) = d(y, x) 14/09/2021 BELKHIR ABDELKADER
similarité s dissimilarité d x, y N : d(x, y) = smax - s(y, x) smax est la valeur de similarité maximale atteinte par les éléments de Nx. N. 14/09/2021 BELKHIR ABDELKADER
Profil? Profil 14/09/2021 = {X 1, X 2, …, Xn} Xi: variable (characteristique)
Profil : valeur binaire système binaire: 1: characteristique est présente 0: sinon (1 , 0 , 1, 0 , 1) (1 , 1 , 0, 0 , 1) 14/09/2021
Profil : valeur binaire (X 1 , X 2 , … , Xm) : X (Y 1 , Y 2 , … , Ym) : Y X est-il similaire à Y? 14/09/2021
Profile : similarité profil {caracteristiques} Graphe bi-parti 14/09/2021
Graphe bi-parti G(N M, E) 14/09/2021
Graphe bi-parti 14/09/2021
Graphe bi-parti 14/09/2021
Measure de Similarité (X 1 , X 2 , … , Xm) : X (Y 1 , Y 2 , … , Ym) : Y X est-il similaire à Y? proportionelle aux arcs communs s: Nx. N → R. x, y N : s(x, y) ≥ 0 x, y N : s(x, x) = s(y, y) ≥ s(x, y) x, y N : s(x, y) = s(y, x) 14/09/2021
measure dissimilarité d: Nx. N → R. x, y N : d(x, y) ≥ 0 x, y N : d(x, x) = 0 x, y N : d(x, y) = d(y, x) 14/09/2021
Similarité vers Dissimilarité x, y N : d(x, y) = smax - s(y, x) 14/09/2021
measure similarité 14/09/2021
measure similarité/dissimilarité x, y N : s(x, y) = (1) x, y N : d( x, y) = smax - s( y, x) smax is equal to 1. d is equal to : x, y N : d( x, y) = 1 -(2*a + b + c)/2*(a + b + c) = (2) Il 14/09/2021 est facile de vérifier que d( x, y) = 0 x = y
la mesure de Jaccard a s’ = (a + b + c) mesure la métaphore. aucune caractéristique commune d’où a = 0. Dans ce cas, s’=0 ; rejet. s’il y a concordance totale (a ≠ 0 et b=c=0). Dans ce cas, s’= a/a = 1 ; 14/09/2021 acceptation absolue.
métaphore color = RGB(r, g, b) ; Dans notre cas, le troisième paramètre est ignoré. Le rejet de la négociation rouge ; la mesure s’ = 0. La couleur est obtenue par RGB(255, 0, 0). L’acceptation absolue vert ; la mesure s’ = 1. La couleur est obtenue par RGB(0, 255, 0). 14/09/2021
métaphore Le cas intermédiaire correspond à la valeur k de s’ (0≤k≤ 1) la couleur la formule suivante : RGB((1 -k)*255, k*255, 0). 14/09/2021
Mesure de similarité valeur binaire : abstraction de haut niveau Perte d’information! cpu use : 10 u ≠ 55 u 14/09/2021
Graphe bi-parti valué nouvelle mesure de similarité!
Mesure de similarité valuée 14/09/2021
14/09/2021
14/09/2021
Critiques: • Représentation du profil par une structure plate (vecteur) • Profil totalement défini Vers une nouvelle mesure…. . 14/09/2021
14/09/2021
14/09/2021
Quantitative similarity 14/09/2021
Distance= 1 -Simmax - 14/09/2021
14/09/2021
Properties neighborhood of the profile 14/09/2021
Properties 14/09/2021
Properties Partially defined profile 14/09/2021
Conclusion Applications multiples pour la gestion des profils…. . Ahmed Belkhirat, Abdelkader Belkhir, A New Similarity Measure for the Profiles Management, UKSIM '11: Proceedings of the Tenth International Conference on Computer Modeling and Simulation, Cambridge England, 2011. Belkhirat Ahmed, Bouras Abdelghani, Belkhir Abdelkader , A new similarity measure for the anomaly intrusion detection , NSS '09: Proceedings of the 2009 Third International Conference on Network and System Security, October, 2009 , Gold Coast, Australia 14/09/2021
- Slides: 36