CamemBERT avr. 27, 2016 Aller sur le site du projet Image credit: Alix Chagué Language Modeling Pedro Ortiz Suarez Chercheur Je suis chercheur à l’équipe de recherche de Data and Web Science de l’Université de Mannheim. Publications CamemBERT: a Tasty French Language Model We explore the impact of the training data size on a French version of RoBERTa. Louis Martin, Benjamin Muller, Pedro Ortiz Suarez, Yoann Dupont, Laurent Romary, Éric de la Clergerie, Djamé Seddah, Benoît Sagot PDF Citation Jeu de données Projet Vidéo DOI ACL Anthology arXiv Website ACL 2020 HAL Les modèles de langue contextuels Camembert pour le Français : impact de la taille et de l'hétérogénéité des données d'entrainement Nous explorons l’impact de la taille et de l’hétérogénéité des données d’entraînement sur la modélisation de la langue française. Louis Martin, Benjamin Muller, Pedro Ortiz Suarez, Yoann Dupont, Laurent Romary, Éric de la Clergerie, Benoît Sagot, Djamé Seddah PDF Citation Jeu de données Projet TALN 2020 HAL Website