Information Science 2005 Tefko Saracevic Ph D School













































- Slides: 45
Information Science 2005 Tefko Saracevic, Ph. D School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey USA http: //www. scils. rutgers. edu/~tefko 1
Organización de la presentación 1. 2. 3. 4. 5. 6. 7. 8. El paisaje – problemas, soluciones, lugar social Estructura – áreas principales de investigación y práctica Tecnología – Recuperación de la información – la mayor parte Información – representación; bibliometría Gente – usuarios, uso, búsqueda, contexto Ruptura paradigmática – distanciamiento de las áreas de investigación Bibliotecas digitales – ¿de quiénes son? Conclusiones – grandes cuestiones para el futuro 2
Parte 1. El gran paisaje Problemas abordados n Un poco de historia: Vannevar Bush (1945): u. Definió el problema como “. . . La tarea masiva de hacer más accesible el enorme repositorio del conocimiento. ” u. Un problema que sigue con nosotros y sigue creciendo. Tabla de contenidos 3
… solución n Bush sugirió una máquina: “Memex. . . Asociación de ideas … que duplique los procesos mentales artificialmente. ” n Una solución tecnológica al problema n Todavía con nosotros: determinante tecnológico 4
En la base de la Ciencia de la Información: un problema Intentar controlar el contenido en: n La explosión de la información u El crecimiento exponencial de los artefactos informativos, si no de la propia información Y hoy ADEMÁS n La explosión de la comunicación u El crecimiento exponencial de los medios y modos de comunicación, transmisión, acceso y uso de la información 5
solución tecnológica, PERO … Aplicar la tecnología para solucionar los problemas en el uso efectivo de la información PERO: Desde una perspectiva HUMANA & SOCIAL Y no solo TECNOLOGICA 6
o un modelo simbólico Gente Información Tecnología 7
Problemas & soluciones: CONTEXTO SOCIAL n Práctica profesional E investigación científica relacionada con: Comunicación efectiva de los registros del conocimiento ‘literatura’ - entre humanos en el contexto de las necesidades y usos sociales, organizaciones e individuales n Con la ventaja de las nuevas tecnologías de la información 8
Características generales n Interdisciplinariedad - relaciones con un conjunto de campos, algunos más o menos predominantes n Imperativo tecnológico - fuerza impulsora como en muchos campos modernos n Sociedad de la información - contexto social y papel social en su evolución - compartido con muchos otros campos Tabla de contenidos 9
Parte 2. Estructura Composición del campo n Como muchos campos, la ciencia de la información tiene muchas áreas diferentes de concentración y especialización n Que cambian y evolucionan a lo largo de tiempo use acercan y se separan use ignoran, más o menos, entre sí 10
más importante aún, las diferentes áreas… n reciben más o menos financiación & énfasis u produciendo grandes desequilibrios en el trabajo y el progreso u atrayendo diferentes audiencias y campos n esto incluye u vastas diferencias en los niveles de soporte para la investigación e u inversiones y aplicaciones enormes en el campo comercial 11
¿Cómo encontrar una estructura? descomponiendo áreas y esfuerzos en la investigación y práctica, enfatizando Tecnología o Información Gente o Tabla de contenido 12
Parte 3. Tecnología n Identificada con la recuperación de información (RI) ucon mucho se lleva los mayores esfuerzos e inversiones ues internacional y global ulos intereses comerciales subyacentes son grandes y crecientes 13
Recuperación de información – definición & objetivo “ RI: . . . aspectos intelectuales de la descripción de información, . . . búsqueda, . . . & sistemas, máquinas. . . ” Calvin Mooers, 1951 n ¿Cómo proporcionar a los usuarios información relevante de forma efectiva? Para ese fin: 1. ¿Cómo organizar la información intelectualmente? 2. ¿Cómo especificar la búsqueda & la interacción intellectualmente? 3. ¿Qué técnicas & sistemas usar efectivamente? 14
Investigación contemporánea en RI n Ahora principalmente dentro de la Informática u e. g Special Interest Group on RI, Association for Computing Machinery (SIGIR, ACM) n Extendida globalmente u v. g. grandes comunidades de investigación han emergido en China, Corea y Singapur n Sacada fuera de la Ciencia de la Información - “todo el mundo hace recuperación de información” u minería de datos, aprendizaje automático, procesamiento del lenguaje natural, inteligencia articial, gráficos por ordenador … 15
Text REtrieval Conference (TREC) n Principal esfuerzo de investigación experimental n Comenzó en 1992, ahora probablemente terminando u “para soportar la investigación de la comunidad RI proporcionando la infraestructura necesaria para la evaluación en gran escala” n Métodos u proporciona grandes bases de documentos, consultas, juicios de relevancia y análisis comparativos u usando esencialmente la metodología que uso Cranfield en los sesenta u organizada en varios temas que han ido evolucionando 16
El impacto de TREC n Internacional – gran impacto en crear comunidades de investigación n Conferencias anuales u informes, intercambio de resultados, cooperación n Resultados u principalmente en informes, disponibles en http: //trec. nist. gov/pubs. html u estados de la cuestión u pero solo una parte publicada en revistas y libros 17
Líneas TREC 2004 103 grupos de 21 países n Genómica con 4 sub líneas n HARD (High Accuracy Retrieval from Documents) n Novelty (nueva información no redundante) n Respuestas a consultas n Robust (mejorando temas en los que la recuperación es deficiente) n Terabyte (colecciones muy grandes) n Web n Líneas anteriores: u ad-hoc (1992 -1999) u routing (92– 97) u interactive (94 -02) u filtering (95 -02) u cross language (97 -02) u speech (97 -00) u Spanish (94 -96) u video (00 -01) u Chinese (96 -97) u query (98 -00) u y unas pocas más que solo tuvieron dos años de duración 18
Ampliación del RI – siempre cambiando y con nuevas áreas añadidas n n n RI a través de diferentes idiomas (CLIR) Procesamiento del lenguaje natural (NLP RI) RI de música (MIR) Imagen, vídeo y multimedia Lenguaje oral RI en Bioinformática y Genómica Resumen; extracción de texto Respuesta de consultas Interacción hombre/máquina XML RI RI en la Web; buscadores web RI en contexto – gran área para los grandes buscadores e investigación más reciente 19
RI comercial n Buscadores basados en la RI n Pero añadiendo muchas elaboraciones e innovaciones significativas u gestionando enormes cantidades de páginas rápidamente u interesantes juegos de algoritmos de spamming & page rank –IR competitivo- combate de algoritmos u incluyendo el contexto en la búsqueda n Extensión e impacto mundial u unos 2000 buscadores en más de 160 países u El inglés fue dominante, pero ya no 20
RI comercial : “un mundo feliz” n Grandes inversiones & sector económico u Esperanzas de grandes beneficios, aunque todavía cuestionables n Conduce a RI propietaria y secreta u Con un fichaje agresivo de los mejores talentos u Nuevos centros comerciales de investigación en diferentes países (v. g. MS en China) n La financiación de la investigación académica está cambiando u Fuga de cerebros de la academia n Los motores de búsqueda comerciales tienen que hacer frente a grandes retos u Perspectiva de: Amit Singhal� 21
La RI puso en marcha con éxito n La emergencia y desarrollo de la INDUSTRIA de la información n La evolución de la CI como PROFESIÓN y CIENCIA n Muchas APLICACIONES en muchos campos u Incluyendo la Web – motores de búsqueda� n Mejoras en la INTERACCIÓN PERSONAS COMPUTADORAS n La evolución de la INTEDISCIPLINARIEDAD La RI tiene una larga y orgullosa historia Tabla de contenidos 22
Parte 4. Información n Varias áreas de investigación u. Como un fenómeno básico – no demasiado progreso • Medidas como las de Shannon no han tenido éxito • Concentrada en sus manifestaciones y efectos • No hay progreso reciente en este tema de investigación básica u. Representación de la información • Gran área conectada con RI, biblioteconomía • Metadatos u. Bibliometría • Estructuras de la literatura 23
¿Qué es la información? Bien comprendida intuitivamente, pero mal formulada formalmente u Han emergido varios puntos de vista y modelos n Shannon: fuente - canal -destino u señales no son contenido – no es realmente aplicable, a pesar de muchos intentos n Cognitivo: cambios en las estructuras cognitivas u Procesamiento y efectos del contenido n Social: contexto, situación u Búsqueda de información, tareas 24
La información en la Ciencia de la Información: Tres sentidos (del más estrecho al más amplio) 1. información en términos de la decisión, sin tener en cuenta prácticamente los procesos cognitivos u señales, bits, datos simples - v. g. . Teoría de la Información (Shanon), Economía, 2. información incluyendo el procesamiento cognitivo y la comprensión u comprensión, emparejamiento de textos, Brookes 3. información también en relación al contexto, la situación, el problema a resolver β USUARIOS, USO, TAREA Para la Ciencia de la Información (incluyendo la recuperación de información): la tercera interpretación, la más amplia, es necesaria 25
Parte 5. Gente n Servicios profesionales u en la organización – moviéndose hacia la gestión del conocimiento y la inteligencia competitiva u en la industria – vendedores, agregadores, Internet, n Investigación u Usuarios & estudios de usuario u Estudios de interacción u Ampliando el campo a los estudios de búsqueda de la información, contexto social, colaboración u Estudios de relevancia u Social informatics 26
Uso y estudios de usuarios n El área más antigua ucubre muchos temas, métodos y orientaciones umuchos estudios están relacionados con la RI • v. g. búsqueda, multitarea, visualización, navegación n Introduciéndose en los estudios de usuarios de la web u. Estudios cuantitativos y cualitativos u. Emergencia de la webmetría 27
Interacción n El modelo tradicional de la RI se concentra en el emparejamiento, pero no en el lado del usuario y la interacción n Diversos modelos de interacción han sido sugeridos • Ingwersen’s cognitive, Belkin’s episode, Saracevic’s stratified model u. Difícil de realizar experimentos y de confirmarlos n Se consideran clave para proporcionar • las bases de un diseño mejor • la comprensión sobre el uso de los sistemas n Las interacciones en la Web: una nueva área clave 28
Búsqueda de información n Se concentra en el contexto más amplio, no solo en la RI o la interacción: en la gente según se comporta en la vida y el trabajo n Ha proporcionado varios modelos u v. g. Las etapas de Kuhlthau’s stages, o el modelo basado en tareas de Järvelin n Incluye estudios sobre la vida real, construcción del sentido, localización de la información, vida laboral, descubrimiento de información n Basado en el concepto de la construcción social de la información Tabla de contenidos 29
Parte 6. Ruptura del paradigma entre sistemas y gente n Desde principios de los años ochenta se ha producido una ruptura entre dos enfoques: centrado en los sistemas u algoritmos, TREC, motores de búsqueda u continua el modelo tradicional de RI centrado en los humanos (usuarios) u cognitivo, situacional, estudios de usuarios u modelos de interacción, algunos comenzados en TREC 30
Lado humano vs. sistema n Lado humano (usuario) : u a menudo crítico, incluso unilateral u propone un mantra de implicaciones para el diseño u pero no proporciona resultados en la práctica n Lado del sistema: u ignora los estudios H u ‘dinos que hacer y lo haremos’ n El tema NO es H o S u ni siquiera menos H vs. S u sino como pueden H y S trabajar juntos u uno de los principales retos para el futuro 31
Llamadas vs soporte n Muchas llamadas a un diseño, enfoque y evaluación centrados en el usuario/humano n Conjunto de obras que lo discuten, pero pocas proponen soluciones concretas n Sin embargo, la mayor parte del soporte se va al trabajo de sistemas u en la era digital el soporte es para lo digital n Un intento reciente de combinar ambas perspectivas: Book: Ingerwersen, P. and Järvelin, K. (2005). The turn: Integration of información seeking and retrieval in context. Springer. Tabla de contenidos 32
Parte 7. Bibliotecas digitales n Área ENORME & creciente n Área “caliente” in I&D ucon un número importante de becas y proyectos en los EE. UU. , Europa y otros países upero en ellos lo “DIGITAL” es grande & “bibliotecas“ pequeño n Área “caliente” en la práctica u. Se están construyendo colecciones digitales y bibliotecas híbridas u. Existen muchos proyectos por todo el mundo 33
Problemas técnicos n Sustanciales - mayores y más complejos que lo anticipado: u representación, almacenamiento y recuperación de los objetos bibliotecarios digitales • particularmente si fueron originalmente diseñados para ser impresos y luego se digitalizaron u gestionar operacionalmente grandes colecciones - temas de escala u tratar con colecciones diversas y distribuidas • interoperabilidad u asegurar la preservación y la persistencia u incorporar la gestión de derechos 34
EEUU: Digital Library Initiatives n Consorcios dependientes de la financiación de la National Science Foundation u DLI 1: 1994 -98, 3 agencias, $24 M, 6 grandes proyectos u DLI 2: 1999 -2006, 8 agencias, $60+M, 77 proyectos grandes y pequeños en varias categorías u proyectos internacionales conjuntos u National Science, Mathematics, Engineering, and Technology Education Digital Library • cerca de 200 proyectos de demostración & desarrollo n La financiación terminada en 2005 u ahora desviada a áreas relacionadas 35
Unión europea: DELOS n DELOS Network of Excellence on Digital Libraries umuchos proyectos a lo largo de la Unión Europea • de carácter muy tecnológico umuchas reuniones y talleres uhasta cierto punto recuerda a las DLIs de los EE. UU: ubien financiados, a largo plazo ua diferencia de lo que ocurre en los EE. UU. el soporte continúa 36
Temas de investigación n comprender los objetos en las BD u representados en muchos formatos n n n n metadatos, catalogación, indización conversión, digitalización organización de grandes colecciones gestión de colecciones, escalamiento preservacion, archivo interoperabilidad, estandarización acceso, uso, búsqueda u búsqueda federada en colecciones distribuidas n evaluación de bibliotecas digitales 37
Proyectos de BD en la práctica n Muy orientados a las instituciones y sus misiones uen bibliotecas, pero también en otras • museos, sociedades, gobiernos, empresas • en muchas variantes n Extendidos globalmente uincluyendo la digitalización n U California, Berkeley’s Libweb “lista más de 7300 páginas de bibliotecas de más de 125 países” n Extendiéndose a gran velocidad ua menudo a costa de otros recursos 38
¿En conexión? n La investigación y la práctica actual en BD son desarrolladas actualmente u mayormente de forma independiente una de otra u informando mínimamente a la otra parte u y con una conexión mútua ligera o inexistente n Son en el momento actual universos paralelos con escasas conexiones e interación u no es bueno ni para la investigación ni para la práctica Tabla de contenido 39
Parte 8. Conclusiones Las contribuciones de la CI n Puso en marcha la gestión de la información en la sociedad n Desarolló un cuerpo organizado de conocimiento y de competencias profesionales n Aplicó la interdisciplinariedad n Alcanzó un estado de madurez u penetró muchos campos y actividades humanas n Acentuó el factor HUMANO en la interacción hombremáquina 40
Retos n Ajustarse al papel organizacional y social creciente y cambiante de la información y de la infraestructura informacional relacionada n Jugar un papel positivo en la globalización de la información n Responder al imperativo tecnológico en términos humanos n Responder a los cambios que se han producido desde la explosión de la información a la de la comunicación u convirtiendo las propias experiencias en soluciones, especialmente en el campo de la web n Unir competitividad y calidad n Reunir lo DIGITAL con las BIBLIOTECAS 41
Momento crítico n La CI está en un momento crítico de su evolución n Muchos grupos y campos… se están desplazando al campo de la información u fuerte competencia u entrada de jugadores poderosos u lucha por el control n Para ser un jugador de primera, la CI necesita progresar en: u investigación & desarrollo u competencias profesionales u esfuerzos educacionales u relaciones interdisciplinares n Es necesaria una re-examinación 42
Gracias Miró! 43
44
Bibliografía Bates, M. J. (1999). Invisible Substrate of información Science. Journal of the American Society for información Science, 50, 1043 -1050. Bush, V. (1945). As We May Think. Atlantic Monthly, 176, (11), 101 -108. Available: http: //www. theatlantic. com/unbound/flashbks/computer/bushf. htm Hjørland, B. (2000). Library and información Science: Practice, Theory, and Philosophical Basis. información Processing & Management, 36 (3), 501 -531. Pettigrew, K. E. & Mc. Kechnie, L. E. F. (2000). The use of theory in información science research. Journal of the American Society for información Science and Technology, 52 (1), 62 - 73. Saracevic, T. (1999). información Science. Journal of the American Society for información Science, 50 (9) 1051 -1063. Available: http: //www. scils. rutgers. edu/~tefko/JASIS 1999. pdf Saracevic, T. (2005). How were digital libraries evaluated? Presentation at the course and conference Libraries in the Digital Age (LIDA)30 May-3 June 2005, Dubrovnik, Croatia. Available: http: //www. scils. rutgers. edu/~tefko/DL_evaluation_LIDA. pdf Webber, S. (2003) información Science in 2003: A Critique. Journal of información Science, 29, (4), 311330. White, H. and Mc Cain, K. (1998). Visualizing a Discipline: An Author Co-citation Analysis of información Science 1972 -1995. Journal of the American Society for información Science, 49 (4), 327 -355. 45