Comment détecter le sarcasme sur les réseaux sociaux ?

Les réseaux sociaux sont d’incroyables sources d’information, de commentaires du public et d’avis de consommateurs. Mais les réseaux sociaux sont aussi inondés de commentaires sarcastiques et à double sens; qui sont d’ailleurs souvent très engagés.

Dans l’analyse des discussions social média, il est essentiel de bien identifier ces discussions sarcastiques et de bien comprendre leur contexte et leur impact. Que cela soit de la gestion d’une crise ou du suivi de l’opinion sur une marque, cette « social intelligence » très fine permettra de mieux ajuster ses actions médias.

Des exemples grandioses de tweets sarcastiques:

Nous ne pouvions pas omettre de parler de Donald Trump, qui est peut-être le roi du sarcasme? Regardons cet échange à propos de Kim Jong-un, le leader Nord Coréen …

Jetons également un oeil sur cet autre tweet. Le « Great Job » est subtilement sarcastique. Il peut être facilement identifiable par une personne qui connait le contexte, et mais difficile à reconnaître par un outil automatique d’analyse de texte.

 

Pourquoi est-ce si difficile de reconnaître le sarcasme?

L’interprétation du texte n’est pas toujours évidente. Qui n’a pas un jour été confronté à une mauvaise interprétation des propos de l’email d’un collègue? D’un message perçu comme très agressif alors que le ton se voulait simplement ironique?

Sur les réseaux sociaux, le problème reste le même. Et il est amplifié, par l’ampleur des différents engagements et des différentes interprétations qu’il peut susciter.

Certes un bon marketing manager pourra repérer certains propos sarcastiques, grâce à sa connaissance avisée du sujet et à une analyse du profil de la personne à l’origine du post. Mais lorsqu’il s’agit d’analyser un grand nombre de posts, la tâche manuelle devient trop pénible et il est alors indispensable de passer par un outil automatique d’analyse (des « Listening Platforms »). L’identification du sarcasme de manière automatisée peut devenir alors un énorme problème et les résultats des analyses automatiques peuvent s’avérer en fait totalement faux.

Les raisons sont nombreuses; les messages sarcastiques sont rarement tagués #sarcasme… :

  • Par rapport à une conversation orale, il manque l’intonation d’une voix, ou le langage corporel, qui aident à comprendre le sens des propos
  • Sur les réseaux sociaux, les textes sont souvent très courts
  • Ils contiennent parfois des acronymes
  • Ils sont souvent mal écrits

 

Beware of Sarcasme

Sans oublier l’aspect « conversationnel » des réseaux sociaux. Un commentaire est dépendant de son contexte et de la cascade d’échanges en amont. Il faut souvent remonter à l’origine du post pour bien saisir le contexte.

Pourquoi cherche-t-on à détecter le sarcasme en ligne ?

L’identification du sarcasme est une partie essentielle de l’écoute social media ou « social intelligence ». Que cela soit pour un suivi digital marketing ou une analyse des marchés financiers. Quelques exemples:

  • Pour reconnaître les situations de crise pour les entreprises face à un scandale ou attitude envers un produit spécifique.
  • Pour détecter et supprimer automatiquement les propos haineux et les commentaires abusifs.
  • Pour identifier les signaux qui pourraient indiquer les tendances sur les marchés financiers.
  • Pour suivre l’opinion publique lors de votations.
  • etc.

Mais également, l’identification du sarcasme a débouché sur d’autres applications. A l’institut Technologique de Jérusalem, les scientifiques ont développé un nouveau système qui permet de détecter le sarcasme dans les médias sociaux, et de l’interpréter pour les personnes autistes et atteintes par le syndrome d’Asperger qui ont de la difficulté à comprendre le sarcasme, l’ironie et l’humour.

Quelles solutions trouve-t-on aujourd’hui sur le marché?

Du côté des Etats-Unis, les scientifiques du MIT ont mis au point un nouveau système d’intelligence artificielle capable de détecter les sarcasmes dans les tweets, et ce mieux que les humains.

L’algorithme utilise l’apprentissage en profondeur, une technique d’apprentissage automatique populaire qui repose sur la formation d’un très grand réseau de neurones simulé pour reconnaître des modèles subtils en utilisant une grande quantité de données. Les chercheurs ont profité des emojis pour aider l’algorithme à identifier et étiqueter le contenu émotionnel. Une fois que le système a lu des tweets d’émotions, les chercheurs lui ont appris à reconnaître le sarcasme.

Si le programme n’est pas parfait, il est tout de même très pertinent. Sur 2000 tweets, DeepMoji a vu juste dans plus de 82% des cas, précisent les chercheurs dans leur article. Mieux que fastText, le concurrent développé par Facebook (71%), mais surtout mieux que des testeurs humains (76%).

Un doute ? Essaie pour voir !

Capture d_écran 2018-01-04 à 15.35.31

Comment ça marche ?

Petite vidéo explicative:

Pour comprendre son fonctionnement, il faut décortiquer son nom. Deep pour « deep learning », la technique d’apprentissage profond où la machine est nourrie de millions d’exemples pour apprendre une tâche. C’est elle qui a permis à l’intelligence artificielle de l’emporter sur l’homme au jeu de go. Moji pour « emoji« , les smileys qui ont envahi nos discussions en ligne.

A l’origine, les chercheurs voulaient trouver un moyen de détecter les messages racistes sur Twitter, raconte la MIT Technology Review. Tâche impossible sans comprendre si l’utilisateur est sarcastique ou ironique.

Et plus près de chez nous…

Le Social Media Lab de l’EPFL a développé des algorithmes qui permettent de comprendre l’opinion exprimée sur le web et les réseaux sociaux

Jean-Luc Jaquier, le directeur du Lab, nous explique :

« L’opinion exprimée sur les réseaux sociaux est souvent très succincte et sarcastique. Tout tient en quelques caractères que cela soit sur Facebook ou Twitter par exemple».

Il nous donne un exemple. Lors des dernières élections françaises, un internaute relaye un article favorable à un candidat sur son compte Twitter, en commentant «Super». A ce stade il est difficile de comprendre si ce commentaire est sarcastique ou pas. Cependant il poursuit :

« Il s’agit d’aller plus loin que de la simple compréhension du texte, et de comprendre le contexte dans lequel ce message est exprimé ».

Dans cet exemple, l’algorithme comprend que cette personne est plus fortement liée au camp opposé pour avoir abondamment relayé des messages favorables à l’opposition. En prenant en compte le contenu (le « texte ») du message et surtout le « contexte » du message, l’algorithme identifie ainsi le ton sarcastique du commentaire.

 

frelection_transparent_background2

Quelques heures d’activité Twitter & Web sur les élections françaises.

 

Conclusion

L’identification du sarcasme est un enjeu majeur dans l’analyse social média, la « social intelligence ». Il le devient d’autant plus que l’activité sur les réseaux sociaux ne cesse de croître. Elle est de plus en plus déstructurée et difficile à contrôler par les entreprises.

Par le volume des échanges, l’analyse social média dépendra de plus en plus d’outils d’analyse automatisés, et les sociétés technologiques s’attèlent à trouver des solutions à l’identification du sarcasme.

Grâce à l’Intelligence artificielle et au Machine Learning, elles permettent d’affiner la compréhension du texte. On peut s’attendre à des avancées spectaculaires ces prochaines années avec des résultats de plus en plus pertinents.

 

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s