Information Science 2005 Tefko Saracevic Ph D School

  • Slides: 45
Download presentation
Information Science 2005 Tefko Saracevic, Ph. D School of Communication, información and Library Studies

Information Science 2005 Tefko Saracevic, Ph. D School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey USA http: //www. scils. rutgers. edu/~tefko 1

Organización de la presentación 1. 2. 3. 4. 5. 6. 7. 8. El paisaje

Organización de la presentación 1. 2. 3. 4. 5. 6. 7. 8. El paisaje – problemas, soluciones, lugar social Estructura – áreas principales de investigación y práctica Tecnología – Recuperación de la información – la mayor parte Información – representación; bibliometría Gente – usuarios, uso, búsqueda, contexto Ruptura paradigmática – distanciamiento de las áreas de investigación Bibliotecas digitales – ¿de quiénes son? Conclusiones – grandes cuestiones para el futuro 2

Parte 1. El gran paisaje Problemas abordados n Un poco de historia: Vannevar Bush

Parte 1. El gran paisaje Problemas abordados n Un poco de historia: Vannevar Bush (1945): u. Definió el problema como “. . . La tarea masiva de hacer más accesible el enorme repositorio del conocimiento. ” u. Un problema que sigue con nosotros y sigue creciendo. Tabla de contenidos 3

… solución n Bush sugirió una máquina: “Memex. . . Asociación de ideas …

… solución n Bush sugirió una máquina: “Memex. . . Asociación de ideas … que duplique los procesos mentales artificialmente. ” n Una solución tecnológica al problema n Todavía con nosotros: determinante tecnológico 4

En la base de la Ciencia de la Información: un problema Intentar controlar el

En la base de la Ciencia de la Información: un problema Intentar controlar el contenido en: n La explosión de la información u El crecimiento exponencial de los artefactos informativos, si no de la propia información Y hoy ADEMÁS n La explosión de la comunicación u El crecimiento exponencial de los medios y modos de comunicación, transmisión, acceso y uso de la información 5

solución tecnológica, PERO … Aplicar la tecnología para solucionar los problemas en el uso

solución tecnológica, PERO … Aplicar la tecnología para solucionar los problemas en el uso efectivo de la información PERO: Desde una perspectiva HUMANA & SOCIAL Y no solo TECNOLOGICA 6

o un modelo simbólico Gente Información Tecnología 7

o un modelo simbólico Gente Información Tecnología 7

Problemas & soluciones: CONTEXTO SOCIAL n Práctica profesional E investigación científica relacionada con: Comunicación

Problemas & soluciones: CONTEXTO SOCIAL n Práctica profesional E investigación científica relacionada con: Comunicación efectiva de los registros del conocimiento ‘literatura’ - entre humanos en el contexto de las necesidades y usos sociales, organizaciones e individuales n Con la ventaja de las nuevas tecnologías de la información 8

Características generales n Interdisciplinariedad - relaciones con un conjunto de campos, algunos más o

Características generales n Interdisciplinariedad - relaciones con un conjunto de campos, algunos más o menos predominantes n Imperativo tecnológico - fuerza impulsora como en muchos campos modernos n Sociedad de la información - contexto social y papel social en su evolución - compartido con muchos otros campos Tabla de contenidos 9

Parte 2. Estructura Composición del campo n Como muchos campos, la ciencia de la

Parte 2. Estructura Composición del campo n Como muchos campos, la ciencia de la información tiene muchas áreas diferentes de concentración y especialización n Que cambian y evolucionan a lo largo de tiempo use acercan y se separan use ignoran, más o menos, entre sí 10

más importante aún, las diferentes áreas… n reciben más o menos financiación & énfasis

más importante aún, las diferentes áreas… n reciben más o menos financiación & énfasis u produciendo grandes desequilibrios en el trabajo y el progreso u atrayendo diferentes audiencias y campos n esto incluye u vastas diferencias en los niveles de soporte para la investigación e u inversiones y aplicaciones enormes en el campo comercial 11

¿Cómo encontrar una estructura? descomponiendo áreas y esfuerzos en la investigación y práctica, enfatizando

¿Cómo encontrar una estructura? descomponiendo áreas y esfuerzos en la investigación y práctica, enfatizando Tecnología o Información Gente o Tabla de contenido 12

Parte 3. Tecnología n Identificada con la recuperación de información (RI) ucon mucho se

Parte 3. Tecnología n Identificada con la recuperación de información (RI) ucon mucho se lleva los mayores esfuerzos e inversiones ues internacional y global ulos intereses comerciales subyacentes son grandes y crecientes 13

Recuperación de información – definición & objetivo “ RI: . . . aspectos intelectuales

Recuperación de información – definición & objetivo “ RI: . . . aspectos intelectuales de la descripción de información, . . . búsqueda, . . . & sistemas, máquinas. . . ” Calvin Mooers, 1951 n ¿Cómo proporcionar a los usuarios información relevante de forma efectiva? Para ese fin: 1. ¿Cómo organizar la información intelectualmente? 2. ¿Cómo especificar la búsqueda & la interacción intellectualmente? 3. ¿Qué técnicas & sistemas usar efectivamente? 14

Investigación contemporánea en RI n Ahora principalmente dentro de la Informática u e. g

Investigación contemporánea en RI n Ahora principalmente dentro de la Informática u e. g Special Interest Group on RI, Association for Computing Machinery (SIGIR, ACM) n Extendida globalmente u v. g. grandes comunidades de investigación han emergido en China, Corea y Singapur n Sacada fuera de la Ciencia de la Información - “todo el mundo hace recuperación de información” u minería de datos, aprendizaje automático, procesamiento del lenguaje natural, inteligencia articial, gráficos por ordenador … 15

Text REtrieval Conference (TREC) n Principal esfuerzo de investigación experimental n Comenzó en 1992,

Text REtrieval Conference (TREC) n Principal esfuerzo de investigación experimental n Comenzó en 1992, ahora probablemente terminando u “para soportar la investigación de la comunidad RI proporcionando la infraestructura necesaria para la evaluación en gran escala” n Métodos u proporciona grandes bases de documentos, consultas, juicios de relevancia y análisis comparativos u usando esencialmente la metodología que uso Cranfield en los sesenta u organizada en varios temas que han ido evolucionando 16

El impacto de TREC n Internacional – gran impacto en crear comunidades de investigación

El impacto de TREC n Internacional – gran impacto en crear comunidades de investigación n Conferencias anuales u informes, intercambio de resultados, cooperación n Resultados u principalmente en informes, disponibles en http: //trec. nist. gov/pubs. html u estados de la cuestión u pero solo una parte publicada en revistas y libros 17

Líneas TREC 2004 103 grupos de 21 países n Genómica con 4 sub líneas

Líneas TREC 2004 103 grupos de 21 países n Genómica con 4 sub líneas n HARD (High Accuracy Retrieval from Documents) n Novelty (nueva información no redundante) n Respuestas a consultas n Robust (mejorando temas en los que la recuperación es deficiente) n Terabyte (colecciones muy grandes) n Web n Líneas anteriores: u ad-hoc (1992 -1999) u routing (92– 97) u interactive (94 -02) u filtering (95 -02) u cross language (97 -02) u speech (97 -00) u Spanish (94 -96) u video (00 -01) u Chinese (96 -97) u query (98 -00) u y unas pocas más que solo tuvieron dos años de duración 18

Ampliación del RI – siempre cambiando y con nuevas áreas añadidas n n n

Ampliación del RI – siempre cambiando y con nuevas áreas añadidas n n n RI a través de diferentes idiomas (CLIR) Procesamiento del lenguaje natural (NLP RI) RI de música (MIR) Imagen, vídeo y multimedia Lenguaje oral RI en Bioinformática y Genómica Resumen; extracción de texto Respuesta de consultas Interacción hombre/máquina XML RI RI en la Web; buscadores web RI en contexto – gran área para los grandes buscadores e investigación más reciente 19

RI comercial n Buscadores basados en la RI n Pero añadiendo muchas elaboraciones e

RI comercial n Buscadores basados en la RI n Pero añadiendo muchas elaboraciones e innovaciones significativas u gestionando enormes cantidades de páginas rápidamente u interesantes juegos de algoritmos de spamming & page rank –IR competitivo- combate de algoritmos u incluyendo el contexto en la búsqueda n Extensión e impacto mundial u unos 2000 buscadores en más de 160 países u El inglés fue dominante, pero ya no 20

RI comercial : “un mundo feliz” n Grandes inversiones & sector económico u Esperanzas

RI comercial : “un mundo feliz” n Grandes inversiones & sector económico u Esperanzas de grandes beneficios, aunque todavía cuestionables n Conduce a RI propietaria y secreta u Con un fichaje agresivo de los mejores talentos u Nuevos centros comerciales de investigación en diferentes países (v. g. MS en China) n La financiación de la investigación académica está cambiando u Fuga de cerebros de la academia n Los motores de búsqueda comerciales tienen que hacer frente a grandes retos u Perspectiva de: Amit Singhal� 21

La RI puso en marcha con éxito n La emergencia y desarrollo de la

La RI puso en marcha con éxito n La emergencia y desarrollo de la INDUSTRIA de la información n La evolución de la CI como PROFESIÓN y CIENCIA n Muchas APLICACIONES en muchos campos u Incluyendo la Web – motores de búsqueda� n Mejoras en la INTERACCIÓN PERSONAS COMPUTADORAS n La evolución de la INTEDISCIPLINARIEDAD La RI tiene una larga y orgullosa historia Tabla de contenidos 22

Parte 4. Información n Varias áreas de investigación u. Como un fenómeno básico –

Parte 4. Información n Varias áreas de investigación u. Como un fenómeno básico – no demasiado progreso • Medidas como las de Shannon no han tenido éxito • Concentrada en sus manifestaciones y efectos • No hay progreso reciente en este tema de investigación básica u. Representación de la información • Gran área conectada con RI, biblioteconomía • Metadatos u. Bibliometría • Estructuras de la literatura 23

¿Qué es la información? Bien comprendida intuitivamente, pero mal formulada formalmente u Han emergido

¿Qué es la información? Bien comprendida intuitivamente, pero mal formulada formalmente u Han emergido varios puntos de vista y modelos n Shannon: fuente - canal -destino u señales no son contenido – no es realmente aplicable, a pesar de muchos intentos n Cognitivo: cambios en las estructuras cognitivas u Procesamiento y efectos del contenido n Social: contexto, situación u Búsqueda de información, tareas 24

La información en la Ciencia de la Información: Tres sentidos (del más estrecho al

La información en la Ciencia de la Información: Tres sentidos (del más estrecho al más amplio) 1. información en términos de la decisión, sin tener en cuenta prácticamente los procesos cognitivos u señales, bits, datos simples - v. g. . Teoría de la Información (Shanon), Economía, 2. información incluyendo el procesamiento cognitivo y la comprensión u comprensión, emparejamiento de textos, Brookes 3. información también en relación al contexto, la situación, el problema a resolver β USUARIOS, USO, TAREA Para la Ciencia de la Información (incluyendo la recuperación de información): la tercera interpretación, la más amplia, es necesaria 25

Parte 5. Gente n Servicios profesionales u en la organización – moviéndose hacia la

Parte 5. Gente n Servicios profesionales u en la organización – moviéndose hacia la gestión del conocimiento y la inteligencia competitiva u en la industria – vendedores, agregadores, Internet, n Investigación u Usuarios & estudios de usuario u Estudios de interacción u Ampliando el campo a los estudios de búsqueda de la información, contexto social, colaboración u Estudios de relevancia u Social informatics 26

Uso y estudios de usuarios n El área más antigua ucubre muchos temas, métodos

Uso y estudios de usuarios n El área más antigua ucubre muchos temas, métodos y orientaciones umuchos estudios están relacionados con la RI • v. g. búsqueda, multitarea, visualización, navegación n Introduciéndose en los estudios de usuarios de la web u. Estudios cuantitativos y cualitativos u. Emergencia de la webmetría 27

Interacción n El modelo tradicional de la RI se concentra en el emparejamiento, pero

Interacción n El modelo tradicional de la RI se concentra en el emparejamiento, pero no en el lado del usuario y la interacción n Diversos modelos de interacción han sido sugeridos • Ingwersen’s cognitive, Belkin’s episode, Saracevic’s stratified model u. Difícil de realizar experimentos y de confirmarlos n Se consideran clave para proporcionar • las bases de un diseño mejor • la comprensión sobre el uso de los sistemas n Las interacciones en la Web: una nueva área clave 28

Búsqueda de información n Se concentra en el contexto más amplio, no solo en

Búsqueda de información n Se concentra en el contexto más amplio, no solo en la RI o la interacción: en la gente según se comporta en la vida y el trabajo n Ha proporcionado varios modelos u v. g. Las etapas de Kuhlthau’s stages, o el modelo basado en tareas de Järvelin n Incluye estudios sobre la vida real, construcción del sentido, localización de la información, vida laboral, descubrimiento de información n Basado en el concepto de la construcción social de la información Tabla de contenidos 29

Parte 6. Ruptura del paradigma entre sistemas y gente n Desde principios de los

Parte 6. Ruptura del paradigma entre sistemas y gente n Desde principios de los años ochenta se ha producido una ruptura entre dos enfoques: centrado en los sistemas u algoritmos, TREC, motores de búsqueda u continua el modelo tradicional de RI centrado en los humanos (usuarios) u cognitivo, situacional, estudios de usuarios u modelos de interacción, algunos comenzados en TREC 30

Lado humano vs. sistema n Lado humano (usuario) : u a menudo crítico, incluso

Lado humano vs. sistema n Lado humano (usuario) : u a menudo crítico, incluso unilateral u propone un mantra de implicaciones para el diseño u pero no proporciona resultados en la práctica n Lado del sistema: u ignora los estudios H u ‘dinos que hacer y lo haremos’ n El tema NO es H o S u ni siquiera menos H vs. S u sino como pueden H y S trabajar juntos u uno de los principales retos para el futuro 31

Llamadas vs soporte n Muchas llamadas a un diseño, enfoque y evaluación centrados en

Llamadas vs soporte n Muchas llamadas a un diseño, enfoque y evaluación centrados en el usuario/humano n Conjunto de obras que lo discuten, pero pocas proponen soluciones concretas n Sin embargo, la mayor parte del soporte se va al trabajo de sistemas u en la era digital el soporte es para lo digital n Un intento reciente de combinar ambas perspectivas: Book: Ingerwersen, P. and Järvelin, K. (2005). The turn: Integration of información seeking and retrieval in context. Springer. Tabla de contenidos 32

Parte 7. Bibliotecas digitales n Área ENORME & creciente n Área “caliente” in I&D

Parte 7. Bibliotecas digitales n Área ENORME & creciente n Área “caliente” in I&D ucon un número importante de becas y proyectos en los EE. UU. , Europa y otros países upero en ellos lo “DIGITAL” es grande & “bibliotecas“ pequeño n Área “caliente” en la práctica u. Se están construyendo colecciones digitales y bibliotecas híbridas u. Existen muchos proyectos por todo el mundo 33

Problemas técnicos n Sustanciales - mayores y más complejos que lo anticipado: u representación,

Problemas técnicos n Sustanciales - mayores y más complejos que lo anticipado: u representación, almacenamiento y recuperación de los objetos bibliotecarios digitales • particularmente si fueron originalmente diseñados para ser impresos y luego se digitalizaron u gestionar operacionalmente grandes colecciones - temas de escala u tratar con colecciones diversas y distribuidas • interoperabilidad u asegurar la preservación y la persistencia u incorporar la gestión de derechos 34

EEUU: Digital Library Initiatives n Consorcios dependientes de la financiación de la National Science

EEUU: Digital Library Initiatives n Consorcios dependientes de la financiación de la National Science Foundation u DLI 1: 1994 -98, 3 agencias, $24 M, 6 grandes proyectos u DLI 2: 1999 -2006, 8 agencias, $60+M, 77 proyectos grandes y pequeños en varias categorías u proyectos internacionales conjuntos u National Science, Mathematics, Engineering, and Technology Education Digital Library • cerca de 200 proyectos de demostración & desarrollo n La financiación terminada en 2005 u ahora desviada a áreas relacionadas 35

Unión europea: DELOS n DELOS Network of Excellence on Digital Libraries umuchos proyectos a

Unión europea: DELOS n DELOS Network of Excellence on Digital Libraries umuchos proyectos a lo largo de la Unión Europea • de carácter muy tecnológico umuchas reuniones y talleres uhasta cierto punto recuerda a las DLIs de los EE. UU: ubien financiados, a largo plazo ua diferencia de lo que ocurre en los EE. UU. el soporte continúa 36

Temas de investigación n comprender los objetos en las BD u representados en muchos

Temas de investigación n comprender los objetos en las BD u representados en muchos formatos n n n n metadatos, catalogación, indización conversión, digitalización organización de grandes colecciones gestión de colecciones, escalamiento preservacion, archivo interoperabilidad, estandarización acceso, uso, búsqueda u búsqueda federada en colecciones distribuidas n evaluación de bibliotecas digitales 37

Proyectos de BD en la práctica n Muy orientados a las instituciones y sus

Proyectos de BD en la práctica n Muy orientados a las instituciones y sus misiones uen bibliotecas, pero también en otras • museos, sociedades, gobiernos, empresas • en muchas variantes n Extendidos globalmente uincluyendo la digitalización n U California, Berkeley’s Libweb “lista más de 7300 páginas de bibliotecas de más de 125 países” n Extendiéndose a gran velocidad ua menudo a costa de otros recursos 38

¿En conexión? n La investigación y la práctica actual en BD son desarrolladas actualmente

¿En conexión? n La investigación y la práctica actual en BD son desarrolladas actualmente u mayormente de forma independiente una de otra u informando mínimamente a la otra parte u y con una conexión mútua ligera o inexistente n Son en el momento actual universos paralelos con escasas conexiones e interación u no es bueno ni para la investigación ni para la práctica Tabla de contenido 39

Parte 8. Conclusiones Las contribuciones de la CI n Puso en marcha la gestión

Parte 8. Conclusiones Las contribuciones de la CI n Puso en marcha la gestión de la información en la sociedad n Desarolló un cuerpo organizado de conocimiento y de competencias profesionales n Aplicó la interdisciplinariedad n Alcanzó un estado de madurez u penetró muchos campos y actividades humanas n Acentuó el factor HUMANO en la interacción hombremáquina 40

Retos n Ajustarse al papel organizacional y social creciente y cambiante de la información

Retos n Ajustarse al papel organizacional y social creciente y cambiante de la información y de la infraestructura informacional relacionada n Jugar un papel positivo en la globalización de la información n Responder al imperativo tecnológico en términos humanos n Responder a los cambios que se han producido desde la explosión de la información a la de la comunicación u convirtiendo las propias experiencias en soluciones, especialmente en el campo de la web n Unir competitividad y calidad n Reunir lo DIGITAL con las BIBLIOTECAS 41

Momento crítico n La CI está en un momento crítico de su evolución n

Momento crítico n La CI está en un momento crítico de su evolución n Muchos grupos y campos… se están desplazando al campo de la información u fuerte competencia u entrada de jugadores poderosos u lucha por el control n Para ser un jugador de primera, la CI necesita progresar en: u investigación & desarrollo u competencias profesionales u esfuerzos educacionales u relaciones interdisciplinares n Es necesaria una re-examinación 42

Gracias Miró! 43

Gracias Miró! 43

44

44

Bibliografía Bates, M. J. (1999). Invisible Substrate of información Science. Journal of the American

Bibliografía Bates, M. J. (1999). Invisible Substrate of información Science. Journal of the American Society for información Science, 50, 1043 -1050. Bush, V. (1945). As We May Think. Atlantic Monthly, 176, (11), 101 -108. Available: http: //www. theatlantic. com/unbound/flashbks/computer/bushf. htm Hjørland, B. (2000). Library and información Science: Practice, Theory, and Philosophical Basis. información Processing & Management, 36 (3), 501 -531. Pettigrew, K. E. & Mc. Kechnie, L. E. F. (2000). The use of theory in información science research. Journal of the American Society for información Science and Technology, 52 (1), 62 - 73. Saracevic, T. (1999). información Science. Journal of the American Society for información Science, 50 (9) 1051 -1063. Available: http: //www. scils. rutgers. edu/~tefko/JASIS 1999. pdf Saracevic, T. (2005). How were digital libraries evaluated? Presentation at the course and conference Libraries in the Digital Age (LIDA)30 May-3 June 2005, Dubrovnik, Croatia. Available: http: //www. scils. rutgers. edu/~tefko/DL_evaluation_LIDA. pdf Webber, S. (2003) información Science in 2003: A Critique. Journal of información Science, 29, (4), 311330. White, H. and Mc Cain, K. (1998). Visualizing a Discipline: An Author Co-citation Analysis of información Science 1972 -1995. Journal of the American Society for información Science, 49 (4), 327 -355. 45