Twitter parle Crowdlending — Un cas d’analyse des sentiments

Chez Acredius, nous utilisons des données alternatives pour améliorer constamment notre évaluation du risque des crédits. L’une des ressources que nous utilisons est Twitter. Les tweets se sont avérés plus puissants qu’on ne le pensait lorsqu’il s’agit de comprendre les tendances. Associés à des techniques d’apprentissage automatique appropriées, on peut obtenir de bonnes informations. En tant que projet « fun », nous voulions voir ce que les gens pensent de notre industrie. Nous avons donc enquêté sur l’opinion générale sur le «Crowdlending».

Généralement, nous nous forgeons notre propre opinion en fonction de plusieurs facteurs. Ils peuvent être personnels, par exemple nos différentes expériences ou notre compréhension actuelle sur différents sujets. Ces facteurs peuvent aussi être externes comme l’actualité ou une personne qui nous inspire.

Toutes ces opinions individuelles une fois recueillies et analysées peuvent être un indicateur puissant dans le marketing, les ventes, l’évaluation des risques et même dans les applications de rencontres.

Tout tweet représente une opinion à un moment donné. La beauté de la chose est que tant de personnes de différents endroits, de différents horizons et de différentes démographies utilisent les mêmes réseaux sociaux. Cela forme des données qui peuvent être considérée, avec prudence, comme une opinion générale.

Essayons d’analyser le sentiment global sur le Crowdlending, en utilisant uniquement des tweets.

Analyse des sentiments

L’objectif principal est de déterminer le sentiment général des tweets sur le crowdlending. Pour ce faire, nous allons utiliser l’analyse des sentiments et classer ces tweets en trois catégories, à savoir : positif, neutre et négatif.

Comme tous les tweets ne sont pas rédigés en anglais, nous avons effectué notre analyse deux fois. La première fois sur l’ensemble complet de tweets qui inclut n’importe quel article sur le crowdlending, quelle que soit la langue. La deuxième fois uniquement sur des tweets rédigés en anglais, qui est la langue la plus courante en termes de tweets sur le crowdlending.

Dans les deux cas, on observe la même tendance. La grande majorité des tweets sont classés comme neutres. Seulement quelques-uns sont étiquetés comme négatifs tandis que près d’un tiers sont considérés comme positifs. Ces résultats montrent une nette méconnaissance de cette nouvelle classe d’actifs car la majorité des tweets sont neutres, mais de belles perspectives car ceux qui ont pris position sont majoritairement positifs (autour de 75 % si on retire les neutres).

Cet étiquetage est fait en fonction des mots composant le tweet. Certains mots tels que « super » ou « incroyable » apparaissent principalement dans des phrases positives. Plus un tweet contient de mots positifs, plus le coefficient positif est élevé et donc la chance d’être étiqueté comme positif.

Ceci étant dit, les pourcentages de positif ou de négatif sont plus élevés dans le second cas. La raison derrière cette différence est l’utilisation d’un traducteur. En effet, dans le second cas nous avons analysé des tweets initialement anglais. Alors que dans le premier cas, nous avons appliqué un traducteur à tout tweet écrit dans une autre langue que l’anglais, puis avons exécuté notre analyse des sentiments sur l’ensemble des tweets. Par conséquent, nous avons perdu une partie de la sémantique incluse dans la langue d’origine en raison de la traduction. Cette perte se traduit par un nombre plus élevé de tweets attribués à la classe neutre.

Nous aurions pu arrêter l’analyse des sentiments ici, mais puisque nous avons chaque mot étiqueté comme positif, négatif ou neutre, regardons les termes positifs les plus courants.

Nous n’avons ici qu’utilisé les tweets écrits à l’origine en anglais et extrait les mots étiquetés positivement les plus fréquents à la fois sur une base annuelle et sur une base globale.

Le Crowdlending est une industrie récente. La plupart des tweets révèlent le même schéma: informer les gens sur les avantages du Crowdlending. On peut tout d’abord constater que, sur les cinq mots les plus utilisés, les mots « participation » et « alternative » relèvent de l’incitation à participer, tandis que « avantages » et « croissance » sont du champ de la promotion.

Cette tendance est également observée sur une base annuelle.

En 2014, les tweets ont surtout essayé d’initier les gens à rejoindre la communauté et de faire connaître cette industrie. De même en 2016, où la plupart des messages positifs incluaient le mot « participer ».

Entre les deux, la plupart des tweets de 2015 ont souligné que le crowdlending est une excellente alternative aux moyens traditionnels d’investir ou de se financer. Alors qu’en 2017, la plupart des publications incluaient les avantages du crowdlending tels que la diversification d’un portefeuille.

Fintech est le mot positif le plus courant de l’année 2018, car la plupart des entreprises de crowdlending se sont récemment établies en tant que Fintech. Comme les tweets sont notés en fonction des mots qu’ils contiennent, il y a certainement d’autres mots positifs qui ont fait apparaître Fintech en haut. Mais le fait est que Fintech était le mot le plus fréquent dans tous les tweets positifs de 2018 !

Enfin, en 2019, la plupart des publications positives ont souligné la croissance future potentielle de l’industrie du crowdlending. Elle est bien illustrée par le mot « croissance », le mot positif le plus utilisé cette année.

Maintenant que nous avons un aperçu clair du sentiment des tweets, examinons le contexte dans lequel ils ont été écrits.

Top 3 des hashtags liés au #Crowdlending

Le premier composant d’un tweet sont les hashtags qu’il contient. Ils sont utilisés pour catégoriser le contenu de la publication et y conduire les utilisateurs. Étant donné qu’un message sur Twitter comprend généralement plus d’un hashtag, examinons les différents hashtags associés au crowdlending.

Les principaux hashtags utilisés avec le crowdlending sont classés par ordre d’importance : Fintech, Invest et Investissement alternatif.

Le hashtag le plus répandu est Fintech, ce qui n’est pas surprenant puisque le crowdlending est une activité propre aux Fintech. Tous les autres hashtags concernent l’activité d’investissement présentant le crowdlending comme une solution alternative pour assurer de bons rendements.

P.S. : le crowdlending est en croissance

Le nombre total de tweets peut être un bon indicateur de la popularité actuelle d’un hashtag. En effet, plus il est utilisé, plus la popularité et l’intérêt à son égard augmentent. Pour cette raison, nous avons mesuré le nombre total de tweets étiquetés avec le crowdlending pour chaque année distincte et l’avons tracé.

De début 2014 à fin 2018, nous pouvons observer une nette tendance à la hausse. Le nombre de tweets sur le crowdlending a augmenté de près de 50 %. En d’autres termes, le crowdlending est un sujet qui suscite de plus en plus d’intérêt et de considération.

La courbe présente le même motif que celui obtenu ci-dessus. A savoir une constante augmentation avec une baisse en 2017.

Un petit mot concernant cette baisse : Nous pensons que c’est le résultat de la combinaison de différents éléments. Premièrement, Instagram, non seulement la plateforme est devenue l’un des réseaux sociaux le plus utilisés, mais elle est aussi devenue une plateforme importante pour les petites entreprises telles que les Fintechs qui peuvent utiliser le réseau pour leur publicité. Deuxièmement, comme toute activité Internet liée à l’argent, les transactions conduisent parfois inévitablement à des fraudes. Leur nombre a explosé au cours de l’année 2017, en particulier en Chine. Enfin, 2017 a été assez intense. Durant cette année le Brexit était en cours, Trump venait d’arriver au pouvoir, il y a eu une crise des sans-abri, des attaques terroristes et l’escalade de la situation en Corée du Nord. Tous ces événements ont réduit l’intérêt et donc le nombre de posts sur le crowdlending.

Echantillon de données

Nous avons utilisé le package python Get Old Tweet afin de rassembler tous les tweets du 01.01.2014 au 31.12.2019. En plus du texte publié approprié, nous avons également collecté pour chacun des 84 117 tweets la date, l’heure et les hashtags. Le tableau suivant résume le pourcentage de tweets écrits à l’origine en anglais pour chaque année :

* Un merci tout spécial à

*Un merci tout spécial à Cedric Higel, notre stagiaire data scientist au moment de la publication, qui a joué un rôle important dans la production et la rédaction de cet article.

Laisser un commentaire