T I P

Text & Information Processing

  • Increase font size
  • Default font size
  • Decrease font size
English
Home Research projects Caracterización objetiva de la dificultad general de los originales (CÓDIGO). 2011-2013

Caracterización objetiva de la dificultad general de los originales (CÓDIGO). 2011-2013

There are no translations available.

Caracterización objetiva de la dificultad general de los originales (CÓDIGO)

Investigador principal: Ricardo Muñoz Martín

Financiado por: Ministerio de Ciencia e Innovación

Referencia: FFI2010-15724

Los estudios cognitivos experimentales sobre el proceso de la traducción se centran mayoritariamente en la solución de problemas y en el resultado, y descuidan el proceso de lectura. CÓDIGO puede contribuir a conocer mejor los procesos de comprensión al traducir. La relevancia científica de este proyecto radica también en sus aportaciones metodológicas. En la investigación empírica de los procesos de traducción hay dos variables extrañas que afectan tanto a la validez interna como a la validez externa de los experimentos: a) no hay criterios objetivos para comparar la dificultad de los textos que se utilizan, b) los sujetos se seleccionan y caracterizan con criterios heterogéneos. CÓDIGO puede aportar criterios objetivos para caracterizar textos y sujetos.

El proyecto también es relevante para el mercado de la traducción, que no dispone de un modo objetivo de dilucidar la dificultad de un texto. Ello genera varios problemas: a) el cálculo de precios se realiza con parámetros heterogéneos (longitud, formato, tema, difusión, combinación lingüística, etc.), pero no por la dificultad, donde apenas se suele distinguir intuitivamente entre textos «generales» y «especializados». Esta imprecisión provoca pérdidas pecuniarias a traductores autónomos y empresas; b) la valoración intuitiva de la dificultad de los originales impide valorar con precisión el grado de pericia o el perfil del traductor que debería llevar a cabo un determinado proyecto. La baja calidad de algunas traducciones profesionales se debe a que se ha colegido mal su dificultad y se ha acordado una fecha de entrega que no permite realizar una buena labor, o bien se ha asumido un trabajo para el que no se estaba preparado; c) la escasa calidad de muchas traducciones se debe a menudo a que el usuario potencial cree que la dificultad de los textos es menor que la real y, en consecuencia, los asigna a un empleado o conocido con destrezas lingüísticas aceptables e incluso una cierta capacidad de traducir, pero que no alcanzan para la tarea. Una herramienta como la de CÓDIGO puede ayudar a las empresas a ajustar sus presupuestos y plazos, y a seleccionar al profesional idóneo para una tarea.

Objetivos concretos

1. Compilar un banco textual para cada lengua del proyecto.
2. Crear una base de datos léxicos para cada lengua del proyecto.
3. Efectuar pruebas de caracterización de informantes y de lectura, comprensión y traducción de algunos fragmentos
textuales del banco textual, a través de una interfaz informática de informantes basada en web.
4. Desarrollar una aplicación de análisis textual con una interfaz informática de usuarios basada en web, partiendo
de los resultados de los objetivos 2 y 3.

Organización del trabajo

La envergadura de las tareas y su naturaleza justifican el tamaño y la estructura del equipo. La investigación se lleva a cabo desde una aproximación multidisciplinar, que integra conocimientos de campos diversos como la traductología, el procesamiento de lenguaje natural, la lingüística aplicada y de contrastes, la lexicografía y la psicología experimental. El equipo cuenta con 24 investigadores organizados en ocho agentes, seis colectivos (los grupos lingüísticos, el de procesamiento de lenguaje natural y el de pruebas a sujetos) y dos individuales (el investigador principal y el desarrollador de los sitios web). Las tareas se realizarán a través de una plataforma virtual de trabajo colaborativo, que permitirá el libre intercambio de informaciones. Las responsabilidades del desarrollador de los sitios web serán mantener la plataforma virtual de trabajo y crear el sitio web de informantes, y apoyar al grupo de procesamiento del lenguaje natural cuando no esté ocupado por esas tareas.

Cada investigador integrado en un grupo será responsable solidario de la tarea encomendada a su grupo, de tal modo que si un investigador falla temporalmente, los demás deberán cubrir su parte del trabajo. Cada grupo de trabajo contará con un coordinador, que se encargará de remitir materiales a los restantes coordinadores y al investigador principal, para evitar duplicidades y disfunciones. Los coordinadores organizarán y distribuirán el trabajo, dentro del marco general establecido por el investigador principal, y revisarán y validarán las aportaciones de los miembros del equipo. Los coordinadores redactarán también los informes periódicos de progresos, que servirán de base a los informes del investigador principal. Las tareas básicas de los grupos serán:

Grupos lingüísticos

  • Banco textual: compilar y procesar previamente los textos. Revisar el etiquetado para detectar errores.
  • Base léxica: compilar y analizar lingüísticamente para formular condiciones sintácticas.
  • Pruebas a informantes: captar a informantes, negociar reconocimientos.

Grupo de procesamiento de lenguaje natural

  • Desarrollar herramientas y formatos para que los equipos lingüísticos desarrollen la base léxica y revisen los textos
  • procesados.
  • Desarrollar las herramientas de etiquetado y caracterización textual.
  • Redactar la documentación técnica de las herramientas.

Grupo de pruebas a informantes

  • Confeccionar las pruebas en su aspecto material.
  • Analizar los datos de los informantes.
  • Gestionar los análisis estadísticos.