Exploiter la richesse des données multidimensionnelles avec les décompositions tensorielles couplées : application à la détection d'actions de diffusion groupées dans les réseaux sociaux
Abstract
Les données issues d’interactions entre les utilisateurs des plateformes de réseaux sociaux numériques sont essentielles pour comprendre les phénomènes qui contribuent à la diffusion des infox.
Ces données sont complexes, et souvent multidimensionnelles, c’est-à-dire qu’une valeur dépend d’un ensemble de dimensions (ou variables) interdépendantes [4]. Les dimensions peuvent être simples, comme par exemple les dimensions temporelle et géographique pour mesurer l’évolution d’une valeur au cours du temps et de l’espace, ou plus complexes, comme par exemple une combinaison de plusieurs dimensions représentant une information à un niveau d’abstraction différent, telle que la représentation du profil des retweets d’un utilisateur ou encore son profil d’utilisation des hashtags.
L’exploitation conjointe de plusieurs dimensions permet d’enrichir considérablement les analyses réalisées, mais présente toutefois une complexité accrue, à la fois au niveau de la modélisation des données et au niveau de la conception des algorithmes pour les analyser. La modélisation de données multidimensionnelles requiert de pouvoir intégrer différents niveaux d’abstraction à la représentation, afin de prendre en compte les dimensions complexes, ce qui est difficilement réalisable avec des modélisation sous la forme de dataframes ou de graphes qui sont souvent utilisées pour analyser des données d’interactions. Pour prendre en compte les données multidimensionnelles, les algorithmes sont adaptés de façon ad hoc, comme par exemple avec l’utilisation de snapshots de durée fixe dansles algorithmes Walktrap ou Louvain pour détecter et suivre l’évolution de communautés. Il est par conséquent difficile de faire évoluer ces algorithmes pour prendre en compte d’autres dimensions. Il est donc nécessaire de proposer des approches prenant nativement en compte la multidimensionnalité des données. Nous proposons d’utiliser les tenseurs couplés, qui permettent d’intégrer plusieurs niveaux d’abstraction dans la représentation, ainsi que leurs décompositions couplées, qui bénéficient des tenseurs couplés pour améliorer le résultat en combinant itérativement le résultat des décompositions appliquées sur chaque tenseur individuellement. Nous proposons d’utiliser les tenseurs couplés, qui permettent d’intégrer plusieurs niveaux d’abstraction dans la représentation, ainsi que leurs décompositions couplées, qui améliorent les décompositions simples en combinant itérativement le résultat des décompositions appliquées sur chaque tenseurs individuellement.
Auteur(s) : Annabelle Gillet et Eric Leclercq
Lien vers l'article :