Outilocc est un pack d’outils permettant de résoudre plusieurs tâches de traitement automatique des langues occitanes. La particularité de ces langues c’est qu’il y a très peu de données langagières sur elles. Nous avons développé PoS-Tagger qui permet de prédire pour chaque mot d’une phrase sa fonction (déterminant, verbe, adjectif, etc), un lemmatiseur, un système d’auto-complétion et un extracteur de mots clefs sur un document.
BERT, TransformerXL, Naive Bayes, n-gram, pytorch, python
Share on