Computational text analysis in Spanish - Arabic translation - four empirical studies
- MOUSTAFA, MOHAMED M.
- Nicolás Roser Nebot Directeur/trice
Université de défendre: Universidad de Málaga
Fecha de defensa: 10 février 2023
- Mohamed Yousef Ibrahim Banat President
- Abdelali Oamroni El Bouchani Secrétaire
- Lola Bañón Castellón Rapporteur
Type: Thèses
Résumé
La tecnología informática juega un papel central en el estudio del vocabulario, la lexicografía y la traducción. De hecho, ya en la década de 1980, Sinclair señaló que la capacidad de las computadoras para almacenar y escanear textos muy largos “proporciona una base casi objetiva sobre la cual se pueden observar los patrones del lenguaje” (Sinclair, 1984, p. 3). También señaló que la evidencia de la lingüística computacional proporcionada por las concordancias es bastante superior a cualquier otro método tradicional. Por lo tanto, tan pronto como los traductores hagan pleno uso de esta evidencia, “será imposible volver a confiar en técnicas precomputacionales” (Sinclair, 1985, p. 87). Una tendencia importante en la lingüística de corpus es el uso de corpus altamente especializados para lograr varios propósitos diferentes, entre los que destacan la enseñanza de la escritura técnica (Noguchi, 2004), el aprendizaje de idiomas (Miangah, 2012, p. 321) y la enseñanza de técnicas de traducción (Frankenberg-Garcia, 2012, p. 473). De esta manera, mediante el uso de tecnología informática moderna en la traducción, se pueden corregir los sesgos semánticos y lingüísticos. Por ejemplo, si examinamos los dos verbos “quake” y “quiver”, que pertenecen a la misma clase semántica “shake” en dos diccionarios ampliamente utilizados como el COBUILD y el Longman, encontramos que ambos diccionarios afirman que los dos los verbos son intransitivos. Sin embargo, la entrada para "quake" en el diccionario de Oxford califica el verbo de intransitivo, mientras que el mismo diccionario enumera "quiver" como un verbo transitivo. Para resolver este dilema, Atkins y Levin (1995, p. 132) utilizaron un corpus inglés muy grande que comprendía más de 50 millones de palabras y pudieron detectar posibles usos de ambos verbos en formas transitivas como “it quakeed her guts” y “…quivering its wings.” Por lo tanto, al usar un corpus lo suficientemente grande, parece posible corregir los errores de los diccionarios tradicionales y proporcionar evidencia de entradas precisas (McEnery y Wilson, 1996, p. 532). Las redes sociales tienen otras peculiaridades como los hashtags, que suponen otro reto para los traductores. De hecho, no es recomendable tener solo una traducción directa de un hashtag original al traducir en las redes sociales. Se requiere de una investigación previa para encontrar los hashtags más relevantes en el país al que va destinada la traducción. Esta Tesis doctoral se basa en cuatro trabajos de investigación publicados en tres revistas academicas: Journal of Information Technology Case and Application Research, Journal of Language Teaching and Research y Journal of Intercultural Communication Research. El tema subyacente de los documentos se encuentra en la interfaz de la traducción y la minería de textos. Por ejemplo, este primer estudio está motivado por el importante papel que juegan los medios de comunicación en la formación de la opinión pública. El estudio tiene como objetivo analizar los sentimientos expresados en los medios tradicionales y sociales hacia los términos y expresiones acuñadas en español para referirse al islam. Dado el gran número de medios de comunicación en España, el estudio se centra tanto en el diario líder español El País como en los microblogs de Twitter. A lo largo de esta tesis, nuestro objetivo ha sido encontrar respuestas a la siguientes preguntas: a) ¿Se pueden utilizar técnicas de minería de opinión digital para detectar el impacto del idioma árabe en el vocabulario español? b) ¿Pueden utilizarse con éxito las técnicas de minería de opinión de los corpus digitales y las redes sociales para detectar patrones ocultos en el sentimiento de los legos hacia las palabras españolas de etimología árabe relacionadas con el islam? c) ¿Cuál es el sentimiento general de los tuiteros españoles hacia la imagen de lo árabe? d) ¿Cuáles son los principales temas tratados por los tuiteros españoles en relación con la imagen de lo árabe? e) ¿Existe una espiral de refuerzo que vincule la exposición del contenido de los medios con el sentimiento de imagen árabe formado en Twitter? (El modelo de espirales de refuerzo (RSM) de Slater (2007, 2015) postula que la comunicación y las actitudes a menudo pueden reforzarse mutuamente).