Acerca de mí

Soy estudiante de doctorado en Ciencias de la Computación y trabajo principalmente en Procesamiento de Lenguajes Naturales (PLN) para documentos históricos en Sorbonne Université y en el equipo de investigación ALMAnaCH en el Inria.

Me intereso principalmente en la creación de datasets de gran tamaño para el entrenamiento de modelos de lenguaje, especialmente para idiomas de escasos recursos e idiomas históricos. Estoy interesado en tareas como Reconocimiento de entidades (NER), Análisis de dependencias y etiquetado de parte del discurso, Traducción automática y Estructuración de documentos.

Me encanta el café, las galletas y la programación. ☕🍪

Intereses
  • Modelación del lenguaje
  • Lingüística de corpus
  • Reconocimiento de entidades nombradas
  • Lingüística computacional
  • Traducción automática
Educación
  • Doctorado en Ciencias de la Computación

    Sorbonne Université

  • Pregrado MIASHS, 2018

    Université Paris 8

  • Master en Matemáticas, 2017

    Aix-Marseille Université

  • Pregrado en Matemáticas, 2016

    Universidad Nacional de Colombia

Publicaciones recientes

Proyectos

*
BASNUM

BASNUM

Digitization and analysis of Basnage de Beauval’s Universal Dictionary: lexicography and scientific networks

CamemBERT

CamemBERT

A state-of-the-art language model for French.

OSCAR

OSCAR

OSCAR or Open Super-large Crawled Aggregated coRpus is a huge multilingual corpus

Contacto