La Biblia como corpus para tecnologías del lenguaje

  • Gerardo Sierra Martinez Universidad NacionalAutónoma de México
  • Gemma Bel Enguix

Resumen

El presente trabajo tiene como objetivo crear un corpus alineado de once traducciones al español de la Biblia para avanzar en la lingüística computacional en español. El uso de este corpus resulta fundamental en aplicaciones como la detección de paráfrasis, la identificación de grupos léxicos y la evaluación de modelos de lenguaje para sistemas de búsqueda. De esta manera, este trabajo abarca estudios en procesamiento del lenguaje natural, como la similitud, extracción léxica, y análisis de sesgos, con el propósito de impulsar el desarrollo de tecnologías del lenguaje en español.

Descargas

La descarga de datos todavía no está disponible.
Publicado
2024-12-13
Cómo citar
Sierra Martinez, G., & Bel Enguix, G. (2024). La Biblia como corpus para tecnologías del lenguaje. Signos Lingüísticos, 20(39), 136-167. https://doi.org/10.24275/sling.v20n39.05
Sección
Notas