Una aproximacin a la visin La Visin David

  • Slides: 25
Download presentation
Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT,

Una aproximación a la visión La Visión, David Marr Laboratorio de Inteligencia Artificial MIT, años 70

Neurofisiología • Entender el conexionado, los sensores, los mecanismos. • Encontrar la imagen neural

Neurofisiología • Entender el conexionado, los sensores, los mecanismos. • Encontrar la imagen neural y la imagen física. • Existe la “Neurona Abuela”? • Donde se producen los niveles de integración?

Psicofísica • Estudios comportamentales. • Experimentos que intentas aislar los diferentes aspectos. Por ejemplo

Psicofísica • Estudios comportamentales. • Experimentos que intentas aislar los diferentes aspectos. Por ejemplo los estereogramas de Julezs. • Permite encontrar reglas o leyes de cómo funciona la visión en términos más generales?

Aproximación computacional. • Hacer programas (algoritmos) que resuelven problemas visuales sencillos o simplificados. •

Aproximación computacional. • Hacer programas (algoritmos) que resuelven problemas visuales sencillos o simplificados. • Por ejemplo: detección de bordes en un conjunto de estructuras poligonales de color mate (Horn). Con la esperanza de poder generalizar después.

Marr y Poggio (‘ 77) • Aproximación como un problema de análisis de información.

Marr y Poggio (‘ 77) • Aproximación como un problema de análisis de información. • Independencia de la realización particular de una solución concreta en el cerebro o en una máquina. • Es una aproximación arriba-abajo con niveles diversos engarzados.

Representación y Descripción. • Representación: Sistema formal para hacer explícitas ciertas entidades o tipos

Representación y Descripción. • Representación: Sistema formal para hacer explícitas ciertas entidades o tipos de información y una descripción de cómo el sistema lo hace. • Descripción: Resultado de emplear una representación para describir una entidad. – Ej: números arábigos o romanos. Son mejores o peores para hacer ciertas cosas (*, +). . .

Proceso • Significados restringido a los asociados a máquinas de procesamiento de información. •

Proceso • Significados restringido a los asociados a máquinas de procesamiento de información. • Hay que escoger la representación adecuada para las entidades a manipular por ese proceso (entrada y salida) • Un algoritmo para implementar el proceso. – Serie, paralelo, más robusto, más eficiente. . .

Tres niveles • La explicación de la visión debe ser coherente a diferentes niveles:

Tres niveles • La explicación de la visión debe ser coherente a diferentes niveles: desde la neurona a la representación global. • Teoría del cálculo: Procesamiento de la información • Algoritmo y representación: psicofísica • Realización física: neuroanatomía y neurofisiología

Teoría de cálculo • Cual es el objetivo? • Porqué es apropiado? • Cuál

Teoría de cálculo • Cual es el objetivo? • Porqué es apropiado? • Cuál es la lógica de la estrategia mediante la que se la puede llevar a cabo?

Representación y algoritmo • Cómo puede implementarse esta teoría de cálculo? • Cuál es

Representación y algoritmo • Cómo puede implementarse esta teoría de cálculo? • Cuál es la representación de la entrada y la salida? • Cuál es el algoritmo para la transformación?

Implementación física • Cómo puede realizarse físicamente esta representación y algoritmo? • Solución biológica

Implementación física • Cómo puede realizarse físicamente esta representación y algoritmo? • Solución biológica • Solución informática • Figura 6. 1

Visión • “Proceso que a partir de imágenes del mundo externo produce una representación

Visión • “Proceso que a partir de imágenes del mundo externo produce una representación útil al observador y no está ensombrecida por información irrelevante”. • Puede concebirse como una proyección de una representación en otra: – Entrada: distribución de intensidad de luz detectada por los fotorreceptores en la retina

Marco teórico • Tabla 1. 1

Marco teórico • Tabla 1. 1

Factores responsables de la intensidad en una imagen • Geometría de la escena •

Factores responsables de la intensidad en una imagen • Geometría de la escena • Punto de observación (geometría del observador) • Reflectancia de las superficies • Iluminación de la escena

Procesamiento visual inicial • Obtener representaciones adecuadas a los cambios y estructuras de la

Procesamiento visual inicial • Obtener representaciones adecuadas a los cambios y estructuras de la imagen: – detección de cambios de intensidad – representación y análisis de la estructura geométrica local – detección de efectos de iluminación (por ej. transparencia)

Qué representación? • Debe incluir “marcadores de lugar” que puedan derivarse de las imágenes

Qué representación? • Debe incluir “marcadores de lugar” que puedan derivarse de las imágenes de modo fiable. • Atributos: orientación, brillo, tamaño, posición. • Deben corresponder con cambios físicos reales.

Supuestos físicos • “El mundo está formado por superficies lisas con funciones de reflectancia

Supuestos físicos • “El mundo está formado por superficies lisas con funciones de reflectancia (FR) cuya estructura espacial se puede elaborar” • Organización jerárquica: “A menudo la organización espacial de la FR de una superficie ha sido generada por varios procesos diferentes, actuando a escalas distintas”

Supuestos físicos • Similitud: ” Los elementos generados en una superficie dada por un

Supuestos físicos • Similitud: ” Los elementos generados en una superficie dada por un proceso generador de reflectancia que actúa en una escala dada tienden a ser más similares entre sí en su tamaño, contraste local, color y organización espacial que otros elementos de esta superficie” • Se puede medir dentro de una escala. . .

Supuestos físicos • Continuidad espacial: “A menudo las señales generadas en una superficie por

Supuestos físicos • Continuidad espacial: “A menudo las señales generadas en una superficie por un único proceso se organizan espacialmente” • La continuidad en la superficie debe reflejarse de algún modo en la continuidad de los marcadores. . .

Supuestos físicos • Continuidad de las discontinuidades: Las localizaciones de las discontinuidades en profundidad

Supuestos físicos • Continuidad de las discontinuidades: Las localizaciones de las discontinuidades en profundidad u orientación de las superficies son suaves. • La cohesión de la materia implica que los objetos existen y tienen límites. . .

Supuestos físicos • Continuidad de flujo: si la dirección del movimiento es discontinua en

Supuestos físicos • Continuidad de flujo: si la dirección del movimiento es discontinua en más de un punto (por ejemplo en una línea) entonces estamos frente al límite de un objeto.

Los ceros • Detección de los cambios de intensidad: – Ocurren a diferentes escalas

Los ceros • Detección de los cambios de intensidad: – Ocurren a diferentes escalas – Un cambio brusco de I equivale a un cero de la segunda derivada. • Figura 2. 12 (detección de ceros con el operador laplaciano. Negro es negativo y blanco positivo, cruces por cero). • Figs 2. 17 y 2. 23

Qué relaciones espaciales hacer explícitas? • • • Intensidad local media. Tamaño medio Densidad

Qué relaciones espaciales hacer explícitas? • • • Intensidad local media. Tamaño medio Densidad Orientación local Distancias locales de los elementos agrupados. • Orientación local de los elementos agrupados.

Procesos de agrupamiento • Construir marcadores de lugar que capten la estructura a mayor

Procesos de agrupamiento • Construir marcadores de lugar que capten la estructura a mayor escala de la función de reflectancia de la superficie. • Detectar cambios en los parámetros medidos asociados con estos marcadores y que indiquen cambios de orientación o distancia al observador • Elaborar marcadores y encontrar límites. • Figs. 2. 5, 2. 6, 2. 33 y 2. 34

 • Tabla 3. 2 • Tabla 3. 3 • tabla 4. 1

• Tabla 3. 2 • Tabla 3. 3 • tabla 4. 1