Pedro Ortiz Suarez
Pedro Ortiz Suarez
Accueil
Publications
Présentations
Projets
Contactez moi
CV
Clair
Sombre
Automatique
Français
Français
Deutsch
English
Español
Recent & Upcoming Talks
Des Méthodes de TAL modernes pour l'Enrichissement de Documents
Nous présentons une pipeline pour le traitement et l’enrichissement de documents basée sur les dernières méthodes d’apprentissage neuronal.
Pedro Ortiz Suarez
sept. 22, 2020
Diapositives
Follow
A Monolingual Approach to Contextualized Word Embeddings for Mid-Resource Languages
We explore the impact of the training corpus on contextualized word embeddings in five mid-resource languages.
Pedro Ortiz Suarez
,
Laurent Romary
,
Benoît Sagot
juil. 6, 2020
Diapositives
Vidéo
Follow
Asynchronous Pipeline for Processing Huge Corpora on Medium to Low Resource Infrastructures
We propose a new pipeline to filter, clean and classify Common Crawl by language, we publish the final corpus under the name OSCAR.
Pedro Ortiz Suarez
,
Benoît Sagot
,
Laurent Romary
juil. 22, 2019
PDF
Code
Diapositives
Follow
Preparing the Dictionnaire Universel for Automatic Enrichment
A talk about automatic enrichment of dictionaries.
Pedro Ortiz Suarez
,
Laurent Romary
,
Benoît Sagot
juin 13, 2019
Diapositives
Follow
Reducing computation time by months by rewriting Bash scripts in Go
Pedro Ortiz Suarez
mars 24, 2019
Code
Diapositives
Follow
Citation
×