Je suis chercheur senior au sein de la Fondation Common Crawl.
Je m’intéresse aux grands corpus pour l’entraînement de modèles de langue, en particulier pour les langues peu-dotées et les langues historiques. Je suis intéressé par des tâches telles que la reconnaissance d’entités nommées (NER), l’analyse syntaxique, l’étiquetage morpho-syntaxique, la traduction automatique et la structuration de documents.
J’adore le café, les cookies et les maths. ☕🍪
Doctorat en Informatique, 2022
Sorbonne Université
Licence MIASHS, 2018
Université Paris 8
Master en Mathématiques, 2017
Aix-Marseille Université
Licence en Mathématiques, 2016
Universidad Nacional de Colombia