index - GETALP Accéder directement au contenu

Voici l'ensemble de la production scientifique de l'équipe GETALP (Groupe d’Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole), qui fait partie de l'axe de recherche "Traitement de Données et de Connaissances à Grande Echelle" au sein du LIG, Laboratoire d'Informatique de Grenoble.

En bref

L'équipe GETALP (Groupe d'Étude en Traduction Automatique/<b<Traitement Automatisé des Langues et de la Parole) est née en 2007 lors de la création du LIG.
Issue de l'union vertueuse de chercheurs en traitement de l'écrit et de la parole, le GETALP est une équipe pluridisciplinaire (informaticiens, linguistes, phonéticiens, traducteurs et traiteurs de signaux, ...) dont l'objectif est d'aborder tous les aspects théoriques, méthodologiques et pratiques de la communication et du traitement de l'information multilingue (écrite ou orale).
La méthodologie de travail du GETALP s’appuie sur des allers-retours continus entre collectes de données, investigations fondamentales, développement de systèmes opérationnels, applications et évaluations expérimentales.

Points saillants

Approche écologique : une des spécificités du GETALP est sa volonté de se confronter à la diversité des situations d'usage de la langue écrite ou parlée : multiplicité des langues, des locuteurs, des dialectes, des cultures, des contextes sociaux ou applicatifs ; avec une disposition particulière pour les « longues traines » (langues peu dotées, locuteurs atypiques, ...).

Démarche agnostique : l'histoire de l'équipe, et les cultures scientifiques diverses qui y sont rassemblées, permettent de mettre en synergie méthodes expertes et empiriques, analyse à grande échelle (big data) et analyse de phénomènes nécessitant une annotation fine (beautiful data), modèles et induction, etc.

Pluridisciplinarité : la dynamique de l'équipe GETALP est liée en partie à la complémentarité de ses membres, permettant une approche « en largeur », de la collecte de ressources à l'évaluation de systèmes ; de la compréhension de phénomènes communicatifs aux applications industrielles.

Avec l'humain au centre : pour assister l'humain dans des situations de communication et d'interaction, il est nécessaire de l'inclure dans les processus automatisés (approches semi-supervisées, interactives, collaboratives, analyse de traces et d'erreurs des systèmes).

Production d'outils et de ressources : le GETALP développe et distribue librement des outils et des ressources (plate-forme Web de développement coopératif de bases lexicales multilingues, collecte de corpus écrits et oraux pour le traitement des langues peu dotées, collecte de corpus multimodaux dans des contextes d’interaction, système collaboratif de post-édition et d'évaluation de traductions automatiques, services web pour la langue, etc.).

Axes de recherche

Nous listons ci-dessous les axes de recherche « phares » et « en devenir » du GETALP. Ils trouvent des applications directes dans des domaines divers tels que la recherche d'information, la robotique, les technologies d'assistance à la personne, l'apprentissage des langues.

Ecosystème local, national et international

Le GETALP bénéficie d'un écosystème local riche et collabore avec d'autres équipes du LIG (en liaison avec les applications mentionnées ci-dessus) et avec d'autres laboratoires grenoblois. Au niveau national et international, le GETALP est un acteur reconnu de la communauté de recherche en traitement des langues naturelles et de la parole (nombreux projets collaboratifs et industriels, organisation en 2012 de JEP-TALN-RECITAL, etc.). Enfin, un point remarquable est son réseau international de collaborations et de contacts sur tous les continents, qui fait du GETALP un acteur de terrain particulièrement pertinent et crédible pour contribuer au Graal théorique et technologique du multilinguisme.


L'équipe GETALP est issue des équipe GEOD et GETA du laboratoire CLIPS et s'inscrit dans une longue histoire.

Site web de l'équipe GETALP
Site web du LIG

Mots clés

Deep learning Collaborative annotation Apprentissage profond ASR Speech Désambiguïsation lexicale Classification Extraction de contenu Activity Recognition Computational language documentation Markov Logic Network Ambient Intelligence Augmentative and Alternative Communication Corpus Voice-user interface Jibiki Habitat intelligent Challenge Comprehensibility Language model Language documentation Wolof Reconnaissance de sons Locuteur LSTM Categst2i Spoken language understanding Speaker recognition Apprentissage machine Lexical stress Bambara Machine Learning Automatic speech recognition Ambient intelligence Ambient Assisted Living AAL Speech recognition Data collection Machine learning Modèle acoustique Under-resourced languages Natural Language Processing Reconnaissance automatique de la parole Unwritten languages Affective Computing Pictogrammes Dictionary Statistical machine translation Traduction automatique Assessment Communication Alternative et Augmentée Lexical database Smart Home Assistance à la vie autonome LMF Évaluation Automatic Speech Recognition Elderly Word Embedding DiLAF Traduction Automatique Machine translation Spontaneous speech Reconnaissance Français African languages Active learning BERT TAL Word Sense Disambiguation Emotion recognition Arabizi Information Retrieval Analyse morphologique MotÀMot Affective computing Natural language generation Active reading Machine Translation Arabic Dialect Natural language processing Natural language understanding Langues peu dotées Base lexicale French Apprentissage automatique Lexique Human-computer interaction Ambient Assisted Living Rhythm Neural machine translation Comparable corpora Smart home NLP Détection-de-sons Expressive speech Traduction automatique neuronale Quality estimation XML L2 English Forensic voice comparison

Dernières publications