Bannière Recherche Recherche

Laboratoires.Ecoles, Collège et Formation doctorales 

Stratégie. Séminaires, colloques. Sciences et société

Réseaux et pôles d'excellence. Investissements d'avenir (Labex)

Licence Creative Commons Modèles d'Embeddings à Valeurs Complexes pour les Graphes de Connaissances

29 septembre 2017
Durée : 00:43:52
Nombre de vues 53
Nombre d’ajouts dans une liste de lecture 0
Nombre de favoris 0
Théo TROUILLON / LIG
Résumé : 

L’explosion de données relationnelles disponibles sous la forme de graphes de connaissances a permis le développement de multiples applications, dont les agents personnels automatisés, les systèmes de recommandation et l’amélioration des résultats de recherche en ligne. La grande taille et l’incomplétude de ces bases de données nécessite le développement de méthodes de complétion automatiques pour rendre ces applications viables. La complétion de graphes de connaissances, aussi appelée prédiction de liens, se doit de comprendre automatiquement la structure de larges graphes de connaissances (graphes dirigés labellisés) pour prédire les entrées manquantes (les arêtes labellisées). Une approche populaire consiste à représenter un graphe de connaissances comme un tenseur d’ordre 3, et à utiliser des méthodes de décomposition de tenseur pour prédire leurs entrées manquantes.

Les modèles de factorisation existants proposent différents compromis entre leur expressivité, leur complexité en temps et en espace, et leurs capacités de généralisation. Nous proposons un nouveau modèle appelé ComplEx, pour Complex Embeddings, pour réconcilier expressivité, complexité et généralisation par l’utilisation d’une factorisation en nombre complexes. Nous corroborons notre approche théoriquement en montrant que tous les graphes de connaissances possibles peuvent être exactement décomposés par le modèle proposé. Notre approche, basée sur des embeddings complexes reste simple, car n’impliquant qu’un produit trilinéaire complexe, là où d’autres méthodes recourent à des fonctions de composition de plus en plus sophistiquées pour accroître leur expressivité. Le modèle proposé ayant une complexité linéaire en temps et en espace est passable à l’échelle, tout en dépassant les scores de prédiction des approches existantes sur les jeux de données de référence pour la prédiction de liens.

Mots clés : soutenance thèse

 Informations

  • Ajouté par : Gricad Vidéos
  • Mis à jour le : 1 janvier 2021 00:00
  • Chaîne :
  • Type : Autres
  • Langue principale : Français
Les commentaires ont été désactivés pour cette vidéo.