Graph Matching Torsten Grndel 03 11 2006 berblick
Graph Matching Torsten Gründel 03. 11. 2006
Überblick 1. Was ist Graph Matching 2. Morphismen Allgeimeines 2. Graphisomorphismus 3. Subgraphisomorphismus 4. Eigenschaften 1.
Überblick 3. Kategorien von Matchingmethoden 1. Exakte Matchingmethoden 2. Unexaktes Matching 1. 2. 3. Matchingkosten Optimale & Suboptimale Inexakte Matchingalgorithmen Matchingmethoden
Überblick 4. Subgraphalgorithmus von Ullmann 1. 2. 3. Definitionen Einfacher Aufzählungsalgorithmus Verbesserte Prozedur 5. Zusammenfassung 6. Referenzen
1. Was ist Graph Matching? n Rechenintensive Technik aus den späten 70 ern n „Graph Matching ist der Prozess, eine Korrespondenz zwischen Knoten und Kanten zweier Graphen zu finden, die (mehr oder weniger strikte) Bedingungen erfüllt und sicherstellt, dass gleiche Substrukturen eines Graphen auf gleiche Substrukturen des anderen Graphen abgebildet werden. “ n Vielfältige Einsatzgebiete: 2 D & 3 D Bildanalyse Dokumentenverarbeitung Biometrische Identifizierung Bilddatenbanken Videoanalyse Biomedizinische und Biologische Anwendungen
2. Morphismen 1. 2. 3. 4. Allgemeines Graphisomorphismus Subgraphisomorphismus Eigenschaften
2. Morphismen n „Ein Morphismus ist eine Abbildung zwischen zwei mathematischen Objekten des selben Typs, die grundlegende Struktur der Objekte erhält. “ n Hier: Abbildung zwischen den Knoten der Graphen G=(V, E) und G‘=(V‘, E‘), die Kantenverbindungen erhält. n Definition Graphenhomomorphisus (schwächste Form): n Striktere Form: Graphmonomorphismus Hier müssen die Knotenabbildungen eindeutig sein
2. Morphismen 1. 2. 3. 4. Allgemeines Graphisomorphismus Subgraphisomorphismus Eigenschaften
2. 1 Graphisomorphismus n Definition: Ein Graphenisomorphismus ist ein bijektiver Graphenhomomorphismus zwischen zwei Graphen G=(V, E) und G‘=(V‘, E‘) 4 A D F(A) = 1 F(B) = 2 C B F(C) = 3 E F(D) = 4 3 1 2 F(E) = 5 5
2. 1 Graphisomorphismus n Definition: Ein Graphenisomorphismus ist ein bijektiver Graphenhomomorphismus zwischen zwei Graphen G=(V, E) und G‘=(V‘, E‘) 4 A D F(A) = 2 F(B) = 1 C B F(C) = 3 E F(D) = 5 3 1 2 F(E) = 4 5
2. Morphismen 1. 2. 3. 4. Allgemeines Graphisomorphismus Subgraphisomorphismus Eigenschaften
2. 2 Subgraphisomorphismus n Knoteninduzierter Subgraph: G‘=(V‘, E‘) ist Subgraph von G=(V, E) und n Definition: Ein Subgraphisomorphismus ist ein Graphisomorphismus zwischen einem Graph G=(V, E) und einem knoteninduzierten Subgraph eines zweiten Graphen G‘=(V‘, E‘) 4 A F(A) = 1 B F(B) = 3 F(C) = 2 3 1 2 C 5
2. 2 Subgraphisomorphismus n Knoteninduzierter Subgraph: G‘=(V‘, E‘) ist Subgraph von G=(V, E) und n Definition: Ein Subgraphisomorphismus ist ein Graphisomorphismus zwischen einem Graph G=(V, E) und einem knoteninduzierten Subgraph eines zweiten Graphen G‘=(V‘, E‘) 4 A F(A) = 1 B F(B) = 3 F(C) = 4 3 1 2 C 5
2. Morphismen 1. 2. 3. 4. Allgemeines Graphisomorphismus Subgraphisomorphismus Eigenschaften
2. 5 Eigenschaften n Graphisomorphismus: nicht bewiesen ob in NP n Alle Anderen: NP-Vollständig n Polynomielle Algorithmen für spezielle Graphen existieren n Rechenzeit heute akzeptabel, da ¨ ¨ ¨ Gesteigerte Rechenleistung Graphen in Praxis unterscheiden sich von „Worst Case Graphen“ Knoten- & Kanteneigenschaften reduzieren Suchzeiten
3. Graph Matching Methoden 1. 2. Exaktes Matching Unexaktes Matching 1. 2. 3. Matchingkosten Optimale & Suboptimale Inexakte Matchingalgorithmen Matchingmethoden
3. 1 Exaktes Graph Matching n Matching anhand vorgestellter Morphismen n Meist werden Bäume verwendet n Suchstrategie (z. B. BFS, DFS) gibt Reihenfolge vor n Grundidee: Partielles Matching (anfangs leer) iterativ um Matchingpaar erweitert 2 A B 1 { } {(A, 1)} {(A, 2)} {(A, 1), {(A, 2), (B, 1)} (B, 2)}
3. Graph Matching Methoden 1. 2. Exaktes Matching Unexaktes Matching 1. 2. 3. Matchingkosten Optimale & Suboptimale Inexakte Matchingalgorithmen Matchingmethoden
3. 2 Unexaktes Matching n Gründe für Unexaktheit: 1. Nichtdeterministische Elemente sind enthalten 2. Exaktes Matching ist zu teuer (Rechenzeit) n Matching muss nicht kantenerhaltend sein ¨ Bestrafung durch zuweisen von Kosten bei Unterschieden ¨ Suche Matching mit minimalen Kosten n Unterscheiden: ¨ Optimale Inexakte Matchingalgorithem ¨ Suboptimale Matchingalgorithmen
3. 2. 1 Matchingkosten n Fehlerkorrektur oder Fehlertoleranz Zuweisung von Kosten für jeden Fehler (z. B. fehlender Knoten) ¨ Vergleich der Graphen anhand der Kosten ¨ n Graphenbearbeitungskosten (Gb. K) Zuweisung von Kosten für Graphenbearbeitungsoperationen ¨ Gb. K = billigste Sequenz von Operationen zur Transformierung von G in G‘ ¨ n Graphenbearbeitungsabstand Graphenbearbeitungskosten erfüllen gewisse Bedingungen ¨ Operationen zur Transformierung als Maß für den Abstand zwischen Graphen ¨ n Graphabstand (nur für Algorithmen in metrischen Räumen) Kostendefinition erfüllt Distanzfunktionseigenschaften ¨ Kosten sind Maß für die Ungleichheit von Graphen ¨
3. 2. 2 Optimale & Suboptimale inexakte Matchingalgorithmen n Optimale Inexakte Matchingalgorithmen Finden immer globales Minimum, also auch exakte Lösung wenn vorhanden ¨ Kommt mit Graphschwankungen zurecht ¨ Kostenintensiver als Exakte Algorithmen ¨ Eignen sich zur Lösung von Problemen wenn exakte Lösung erforderlich aber Graphschwankungen vorliegen ¨ n Suboptimale Matchingalgorithmen Finden lokales Minimum ¨ Keine Garantie exakte Lösung zu finden, wenn vorhanden ¨ Normalerweise polynomielle Vergleichszeit ¨ Eignen sich, wenn Rechenzeit gespart werden soll ¨
3. 2. 3 Matchingmethoden n Baumsuche ¨ ¨ n Kontinuierliche Optimierung ¨ ¨ n Heuristische Abschätzung der Matchingkosten für verbleibende Knoten Entfernen von unfruchtbaren Pfaden anhand Abschätzungen Grundidee: 1. Graphmatching umwandeln in kontinuierliches, nichtlineares OP 2. Anwendung eines Optimierungsalgorithmus um Lösung zu finden 3. Rücktransformierung in Graphmatching Domäne Polynomielle Rechenzeit (mit kleinem Exponenten) bzgl. Graphgröße Spektralmethoden ¨ Benutzt Eigenschaft, dass
4. Ullmanns Subgraphalgorithmus 1. 2. 3. 4. Allgemeines Einfacher Aufzählalgorithmus Verbesserte Version Eigenschaften
4. 1 Allgemeines n Wahrscheinlich bekanntester Graphmatching Algorithmus n Anwendbar für ¨ ¨ ¨ Subgraphisomorphismus Graphisomorphismen Graphmonomorphismen MCS Maximum Clique n Exakter DFS Baumsuchalgorithmus n Findet Subgraphisomorphismen zwischen zwei Graphen und
4. Ullmanns Subgraphalgorithmus 1. 2. 3. 4. Allgemeines Einfacher Aufzählalgorithmus Verbesserte Version Eigenschaften
4. 2 Einfacher Aufzählungsalgorithmus n Benutzen Matrizen der Form: Einträge bestehen aus 0 und 1 ¨ Genau eine 1 in jeder Reihe ¨ Nicht mehr als eine 1 pro Spalte ¨ n Matrizen dienen Zur Permutation von Adjazenzmatrizen n Permutationsmatrix n Falls in , dann korrespondiert der j-te Knoten in zu dem i-ten Knoten
4. 2 Einfacher Aufzählungsalgorithmus (Beispiel Permutation) 1 2 4 3 1 3 2
4. 2 Einfacher Aufzählungsalgorithmus n Vergleiche Resultierenden Graph mit n Isomorphismus vorhanden falls n Erstellung einer Startmatrix n Generierung aller mit umändern von 1 en in 0 en n Baum von Matrizen mit Terminierungsebene mit durch systematisches
4. 2 Einfacher Aufzählungsalgorithmus (Generierung Startmatrix) 1 1 2 2 3 4 3
4. 2 Einfacher Aufzählungsalgorithmus (Der Algorithmus) Step 7: 2: 3: 4: 5: 6: Gibt Suche Falls Überprüfe, Backtracking es Terminierungslevel ersten in aktueller welche ob verwendbaren es. Variablen, einen Zeile Reihe Eintrag verwendet erreicht, eine Spalteneintrag 1, weiter deren dann wurde rechts überprüfe Spalte und mit inerhöhe noch Matrix 1 und ob nicht die gibt, 1: Speichere Initialisieren der starten bei Initialmatrix und verwendet setze Isomorphismus der Zeilenanzahl 1 ist alle und anderen wurde? verwendet umvorhanden 1 Einträge Wennwerden ja, der dann Zeile kann verwende auf 0 verwendet diese Spalte erster Zeile. Alle Spalten wurden noch nicht
4. 2 Einfacher Aufzählungsalgorithmus (Beispiel) Step 3 4 6 7 5 1 2
4. 2 Einfacher Aufzählungsalgorithmus (Beispiel) Vergleiche mit A 1 2 3 1 4 3 1 2 3 2 2 4 3 3 1 2 3 1 4 1 3 1 1 1 3 3 2
4. 3 Verbesserte Prozedur n Wenn für alle Isomorphismen M‘ unter M gilt setze n Neue Bedingung: n Iteratives Testen bis keine 1 in 0 umgewandelt wird dann
4. 3 Verbesserte Prozedur (Der Algorithmus) Step 10: 1: -Nächster 2 5: 6: 7: 8: 9: Variablen nächster Überprüfe Setze 4: Fehler, Nachbarn Eintrag Matrixeintrag aufsetzen ob des Nachbar auf 0 i-ten Matrixeintrag des und nächster Knoten i-ten nächster Knotens Knoten suchen 0 Knoten ist auf i, j einen neuer. Knoten Durchlauf gemappt werden oder Erfolg kann.
4. 3 Verbesserte Prozedur (Anwendung) n Verbesserung durch Anwendung von
4. 3 Verbesserte Prozedur (Anwendung) n n n i=1 j=1 sc = 1000 lst = 3 h=2 1 x=3 Step 7 1, 2, 3, 4, 5 6
4. 3 Verbesserte Prozedur (Anwendung) n n n i=1 j=2 sc = 0100 lst = 3 h=1 2 x=3 Step 8 6 7 9
4. 3 Verbesserte Prozedur (Adaptierter Suchalgorithmus)
4. 2 Verbesserte Prozedur (Beispiel) Step 5 1 2 3 4 6 7
5. Zusammenfassung n Rechenintensiv, aber akzeptabel n Verschiedene Arten von Matching und Methoden n Vielfältige Anwendungsgebiete und Methoden (>170 Referenzen im zweiten Paper) n Für uns besonders RDF-Matching interessant
Referenzen
- Slides: 41