Form Gradient Informationsgewinnung Motivation Wenn Objekte homogen bezglich
Form: Gradient Informationsgewinnung Motivation: Wenn Objekte homogen bezüglich dem Grauwert (oder einem Texturmerkmal) sind, dann treten an den Objektgrenzen starke Gradienten auf. Grauwertbild Gradientenbetragsbild Computer Vision 1_Seite 1
Form: Gradient Informationsgewinnung Grauwertbild Grauwertprofil 1. Ableitung Gradientenbetrag 2. Ableitung Die erste Ableitung besitzt an starken Grauwertübergängen Extremwerte! Computer Vision Die zweite Ableitung besitzt an starken Grauwertübergängen Nulldurchgänge! 1_Seite 2
Form: Gradient Informationsgewinnung Gradient: partielle 1. Ableitungen als zweidimensionaler Vektor ● Der Gradientenbetrag gibt die Stärke des Grauwertübergangs an. l rotationsinvariant l invariant gegenüber homogenen GW-Änderungen. ● Die Phase gibt die Richtung des Grauwert. Kurzschreibweise übergangs an. l invariant gegenüber homogenen GW-Änderungen. Betrag Diskretisierung der Gradienten? Phase Differenzenquotienten. Betrag Computer Vision 1_Seite 3
Form: Differenzenquotient Informationsgewinnung Rückwärts-x-Gradient: Idee: Setze –D x Vorwärts-x-Gradient: +D Symmetrischer-x-Gradient SD x x und y-Richtung analog Computer Vision 1_Seite 4
Form: lokaler Operator Informationsgewinnung ● Differenzenquotient als lokaler Operator x-Gradient Bild Keine Einträge : = 0 x-Gradientenbild Operatorfenster (auch: Maske, Faltungskern) ● Das Operatorfenster besitzt Koeffizienten (Gewichte) ● Die Anwendung des Operators erfolgt durch Faltung des Bildes mit dem Faltungskern. Computer Vision 1_Seite 5
Erinnerung: Faltung Informationsgewinnung ● Eindimensionale, diskrete Faltung: K(m) g(m) Grauwertprofil Kern GW-Profil mit Kern (m=17) Schreibweise: ● Bemerkung: Beachte die Indizierung des Kerns ist symmetrisch zur Null! Computer Vision 1_Seite 6
Form: x-Gradientenbild Informationsgewinnung ● Das x-Gradientenbild (Differenzenquotienten in x-Richtung) kann durch Faltung des Bildes mit dem Kern berechnet werden. SD x SD Bild Computer Vision x Keine Einträge : = 0 x-Gradientenbild gx 1_Seite 7
Form: y-Gradientenbild Informationsgewinnung ● Analog in y-Richtung: SD Bild y SD y Computer Vision Keine Einträge : = 0 y-Gradientenbild gy 1_Seite 8
Form: Beispiel Gradientenbild Informationsgewinnung ● Beispiel 1: Holz x-Gradientenbild gx Phase (Richtung) y-Gradientenbild gy Betrag (Stärke) Bild Computer Vision 1_Seite 9
Form: Beispiel Gradientenbild Informationsgewinnung ● Beispiel 2: Stroh x-Gradientenbild gx Phase (Richtung) y-Gradientenbild gy Betrag (Stärke) Bild Computer Vision 1_Seite 10
Form: mehrdimensionale Operatoren Informationsgewinnung ● Problem: Rauschanfälligkeit – nur je zwei Bildpunkte gehen in die Berechnung der Differenzenquotienten ein. ● Idee: Berechnung des x-Gradienten und simultane Glättung in y-Richtung (für das y. Gradientenbild umgekehrt) x-Gradient Keine Einträge : = 0 Glättung ? ? ? Bild Computer Vision x-Gradientenbild gx 1_Seite 11
Erinnerung: Faltung Informationsgewinnung ● Beispiel: zweidimensionaler (endlicher) Faltungskern K der Größe 3 x 3 g 1, 1 g 1, 2 g 1, 3 g 1, 4 g 1, 5 g 1, 6 g 1, 7 g 1, 8 g 1, 9 . . . g 2, 1 g 2, 2 g 2, 3 g 2, 4 g 2, 5 g 2, 6 g 2, 7 g 2, 8 g 2, 9 . . . g 3, 1 g 3, 2 g 3, 3 K 1, 1 g 3, 4 K 1, 0 g 3, 5 K 1 -1 g 3, 6 g 3, 7 g 3, 8 g 3, 9 . . . g 4, 1 g 4, 2 g 4, 3 K 0, 1 g 4, 4 X K 0, 0 g 4, 5 K 0, -1 g 4, 6 g 4, 7 g 4, 8 g 4, 9 . . . g 5, 1 g 5, 2 g 5, 3 K-1, 1 g 5, 4 K-1, 0 g 5, 5 K-1, -1 g 5, 6 g 5, 7 g 5, 8 g 5, 9 . . . g 6, 1 g 6, 2 g 6, 3 g 6, 4 g 6, 5 g 6, 6 g 6, 7 g 6, 8 g 6, 9 . . . g 7, 1 g 7, 2 g 7, 3 g 7, 4 g 7, 5 g 7, 6 g 7, 7 g 7, 8 g 7, 9 . . . g 8, 1 g 8, 2 g 8, 3 g 8, 4 g 8, 5 g 8, 6 g 8, 7 g 8, 8 g 8, 9 . . . g 9, 1 g 9, 2 g 9, 3 g 9, 4 g 9, 5 g 9, 6 g 9, 7 g 9, 8 g 9, 9 . . K-1, - K-1, 0 K-1 1 K 0, -1 X K 0, 0 K 0, 1 K 1, -1 K 1, 0 K 1, 1 Faltungskern {Km, n} 1 w Computer Vision 1_Seite 12
Form: Klassische Gradientenoperatoren x-Gradient Informationsgewinnung y-Gradient Prewitt-Operator (Mittelwert-Differenz-Operator) Sobel-Operator Isotroper Operator Roberts Cross Computer Vision 1_Seite 13
Form: Faltung allgemein Informationsgewinnung ● Die Faltung ist eine universelle Technik (und Theorie) ● Beispiel 1: Die Mittelwertbildung für einen Bildausschnitt lässt sich als Faltung mit einem Kern darstellen (und durchführen) B = H = 3: ● Beispiel 2: Glättung mit der Gaußfunktion (Tiefpassfilter) Computer Vision 1_Seite 14
Form: Faltung allgemein Informationsgewinnung ● Masken heißen separierbar, wenn sie in eine eindimensionale horizontale und eine eindimensionale vertikale Maske zerlegt werden können. ● Beispiel 1: pro Bildpunkt: 25 Multiplikationen 24 Additionen pro Bildpunkt: 10 Multiplikationen 8 Additionen ● Beispiel 2: Gaußfunktion mit ² 1. 14 ● Der Medianoperator lässt sich nicht durch eine Faltung beschreiben (kein linearer Operator). Computer Vision 1_Seite 15
Form: Canny-Filter Informationsgewinnung ● Canny-Filter (partielle Ableitungen der Gauß-Funktion) partielle Ableitung von G nach x ● Die Faltung mit der partiellen Ableitung von G nach x ist separierbar und liefert ein x-Gradientenbild. ● y-Richtung analog. partielle Ableitung von G nach y Computer Vision 1_Seite 16
Form: Laplace-Operator Informationsgewinnung ● Erinnerung: Die zweite Ableitung besitzt an starken Grauwertübergängen Nulldurchgänge! ● Laplace-Operator einer zweidimensionalen Funktion g: ● Die Approximation der zweiten partiellen Ableitung nach x (y analog) führt zu einem 3 x 3 -Faltungskern (diskreter Laplace-Operator): Computer Vision 1_Seite 17
Form: Mexican Hat-Operator Informationsgewinnung ● Problem: Die zweite Ableitung ist sehr empfindlich gegenüber Rauschen. ● Abhilfe: Vorheriges Glätten (Tiefpassfiltern) des Bildes g durch Faltung mit der Gaußfunktion G Laplacian of Gaussian- (Lo. G) oder Hildreth-Marr- oder Mexican Hat-Operator 2 s Computer Vision 1_Seite 18
Form: Zusammenfassung Kantenoperatoren Informationsgewinnung ● Im Gradientenbetragsbild werden überschwellige Bildpunkte als Kantenpixel-Kandidaten deklariert. ● Im Mexican Hut gefilterten Bild werden die Nulldurchgänge als Kantenpixel-Kandidaten deklariert. ● Problem: Die verbleibenden Kandidaten müssen ausgedünnt werden, sonst entstehen breite Konturen. Ausschnitt Gradientenbetragsbild Computer Vision 1_Seite 19
Form: Ausdünnen der Kandidaten Informationsgewinnung Ausdünnen der Kandidaten in Gradiententrichtung ● Berechnung des Gradientenbetrags- und Gradientenrichtungsbildes (z. B. mit Canny-Operator). ● Im Gradientenbetragsbild: Betrachte das Gradientenbetragsmaximum in Gradientenrichtung. 225° Gradienten-Richtung in M 1°. . . 22°, 158°. . . 202°, 338°. . . 360° 23°. . . 67°, 203°. . . 247° 68°. . . 112°, 248°. . . 292° 113°. . . 157°, 293°. . . 337° Maximumbedingung b(A) £ b(M) und b(E) £ b(M) b(B) £ b(M) und b(F) £ b(M) b(C) £ b(M) und b(G) £ b(M) b(D) £ b(M) und b(H) £ b(M) 270° 180° 135° 315° 0° 90° 45° Wenn M Maximum, trage in Ergebnisbild Betrag und Richtung ein, sonst 0. Computer Vision 1_Seite 20
Form: Ausdünnen der Kandidaten Informationsgewinnung ● Beispiel: Ausgedünntes Gradientenbetragsbild Original Gradientenrichtungsbild Computer Vision 1_Seite 21
Form: Ausdünnen der Kandidaten Informationsgewinnung Diese Methoden liefern Intensitäts-Diskontinuitäten aber nicht immer Objektränder (zusätzliche Struktur und Kantenunterbrechungen durch Rauschen, Beleuchtungsdiskontinuitäten, etc). Weitere Verarbeitung zur Zusammenstellung von Kantenpixel-Kandidaten zu Objekträndern. Computer Vision 1_Seite 22
Form: Binarisierung Informationsgewinnung = 20 binarisierte Gradientenbetragsbilder Original ausgedünntes Gradientenbetragsbild = 40 Unterdrückung zusätzlicher Strukturen bei Erhalt von relevanten Objektkonturen? Computer Vision 1_Seite 23
Form: Unterdrückung zusätzlicher Strukturen Informationsgewinnung Unterdrückung zusätzlicher Strukturen ● Zusätzliche Strukturen liefern oft nur „kleine“ Gradientenbeträte. ● Andererseits liefern auch relevante Objektkonturen (teilweise) „kleine“ Gradientenbeträge. ● Idee: Zwei-Schwellen-Mechanismus: 1. Starte die Binarisierung mit einer hohen Schwelle 1. 2. Verfolgung der Kontur mit kleinerer Schwelle 2. Filterung ausgeprägter Konturen Computer Vision 1_Seite 24
Form: Binarisierung mit zwei Schwellen Informationsgewinnung = 20 binarisierte Gradientenbetragsbilder Original ausgedünntes Gradientenbetragsbild = 40 1 = 40 und 2 = 20 Computer Vision 1_Seite 25
Form: Gruppierung der Kandidaten Informationsgewinnung Gruppierung der Kandidaten nach Ähnlichkeit: ● Analyse einer kleinen Nachbarschaft (z. B. 3 x 3 oder 5 x 5) um einen Kandidaten (x 0, y 0) ● Alle ähnlichen Kandidaten innerhalb dieser Nachbarschaft werden mit dem Kandidaten (x 0, y 0) verbunden. ● Die Ähnlichkeit kann anhand des Gradientenbetrags und / oder Gradientenrichtung gemessen werden: aktueller Kandidat Beispiel: Richtung 3 x 3 Computer Vision Beispiel: Richtung 5 x 5 1_Seite 26
Form: Zusammenfassung Kantenpixel Informationsgewinnung Berechnung und Gruppierung von Kantenpixeln ● Anwendung eines Kantenoperators (z. B. Canny. Operator): Gradientenbetrags- und Gradientenrichtungsbild. ● Ausdünnen der Kantenpixelkandidaten (im Gradientenbetragsbild) anhand der Gradientenrichtung. ● Binarisierung (evtl. mit zwei Schwellen) des Betragsbildes. ● Lokale Gruppierung nach Ähnlichkeit. ● Aggregation zu Merkmalen höherer Ordnung (z. B. Kantensegmente, Kreisbogensegmente). Computer Vision 1_Seite 27
- Slides: 27