Alineacin de textos paralelos Informtica aplicada a la

  • Slides: 11
Download presentation
Alineación de textos paralelos Informática aplicada a la traducción

Alineación de textos paralelos Informática aplicada a la traducción

1. Crear una memoria de traducción 1. 1 A partir de la alineación de

1. Crear una memoria de traducción 1. 1 A partir de la alineación de textos n n n Una memoria de traducción se alimenta de textos originales alineados con sus respectivas traducciones. Puede crearse a medida que se traduce o con traducciones anteriores En esta clase y la siguiente veremos: n n Distintas herramientas de alineación Procedimientos para alinear documentos

1. 2 En qué consiste la alineación • El proceso de alineación consiste en

1. 2 En qué consiste la alineación • El proceso de alineación consiste en comparar el texto de origen y su traducción, haciendo coincidir los segmentos correspondientes y uniéndolos como unidades de traducción de una MT. • Este corpus paralelo es la base de las memorias de traducción

Los segmentos están asociados a su traducción (similar a un corpus paralelo)

Los segmentos están asociados a su traducción (similar a un corpus paralelo)

2. Herramientas de alineación § Procedimiento manual: hoja de cálculo (ej. Microsoft Excel) §

2. Herramientas de alineación § Procedimiento manual: hoja de cálculo (ej. Microsoft Excel) § Herramientas incluidas en paquetes de MT: § Win. Align (incluido en el paquete de Trados) http: //blog. quillslanguage. com/2008/11/trados-winalign/ § Deja. Vu de Atril incluye también su propio alineador § Sistemas de código abierto § Microsoft Bilingual Sentence Aligner § LF Aligner http: //sourceforge. net/projects/aligner/ § Bitext 2 tmx http: //bitext 2 tmx. sourceforge. net § Más en: http: //www. cse. unt. edu/~rada/wa/#software. SA

2. 1 Ejemplo: Win. Align de Trados

2. 1 Ejemplo: Win. Align de Trados

2. 1 Ejemplo: Alineador de DéjàVu Segmentado en los dos puntos Herramientas para modificar

2. 1 Ejemplo: Alineador de DéjàVu Segmentado en los dos puntos Herramientas para modificar segmentos

2. 2 Cómo mejorar el resultado de la alineación n Detectar con antelación los

2. 2 Cómo mejorar el resultado de la alineación n Detectar con antelación los posibles errores de alineación: n n n Incoherencia de formatos entre ambos textos (figuras, tablas, logos, etc. ) Falta de correspondencias: división de un segmento de la TO en dos segmentos en TT o viceversa… Revisar la alineación propuesta por el programa: n Problemas de división de segmentos (puntos de abreviaturas, dos puntos…)

3. Procedimiento general 1. 2. 3. 4. 5. 6. 7. Comprobar que los textos

3. Procedimiento general 1. 2. 3. 4. 5. 6. 7. Comprobar que los textos en LO y LT son adecuados y tienen el mismo formato de archivo. Especificar el formato de entrada (doc, html, txt…) Especificar las lenguas de origen y llegada Seleccionar los archivos correspondientes (puede trabajarse en uno o más archivos simultáneamente) Seguir las instrucciones de la herramienta de alineación elegida (Win. Align, Deja. Vu, Bitext 2 TMX…) Exportar el resultado en un formato compatible con el programa de memoria que se vaya a utilizar No todos los textos son adecuados para alimentar una MT

4. Conceptos generales n n e. Content: Información digital con una vida útil electrónica,

4. Conceptos generales n n e. Content: Información digital con una vida útil electrónica, es decir, material creado, distribuido, utilizado y finalmente descartado en forma exclusivamente electrónica. También puede ser creado electrónicamente, aunque su distribución o uso sea en forma impresa. TMX: Formato estándar para memorias de traducción desarrollado por la LISA con el objetivo de facilitar el intercambio de memorias de traducción entre los distintos programas de software y/o entre los proveedores de servicios de localización. Para mayores detalles véase la página principal TMX. Segmento: Una unidad de texto predefinida que puede ser alineada con su traducción correspondiente. Normalmente la unidad básica de segmentación es una frase, aunque otras unidades también se pueden definir como segmentos, por ejemplo titulares, elementos de una lista, celdas de una tabla o párrafos. (Bowker 2002, 152) ( Alineación: El proceso de alineación consiste en comparar el texto de origen y su traducción, haciendo coincidir los segmentos correspondientes y uniéndolos como unidades de traducción de una MT.

Referencias n n n Abiatura, Joseba (2001), “Memorias de traducción en TMX compartidas por

Referencias n n n Abiatura, Joseba (2001), “Memorias de traducción en TMX compartidas por Internet”, Tradumática Bowker, Lynne (2002). Computer-Aided Translation Technology: A Practical Introduction. Ottawa: University of Ottawa Press. Bowker, Lynne (2003). "Terminology tools for translators". In: Somers, Harold (ed. ) (2003), pages 49 -65. Esselink, Bert (2000). A Practical Guide to Localization. Amsterdam/Philadelphia: John Benjamins. Esselink, Bert (2003). "Localisation and translation". In: Somers, Harold (ed. ) (2003), pages 67 -86. Somers, Harold (ed. ) (2003). Computers and Translation: A Translator's guide. Amsterdam/Philadelphia: John Benjamins.