Twitter spricht Crowdlending – Ein Fall zur Sentimentanalyse

Bei Acredius verwenden wir alternative Daten, um unsere proprietäre Kreditrisiko-Scorecard ständig zu verbessern. Eine der Quellen, die wir nutzen, ist Twitter. Tweets haben sich beim Verständnis von Trends als mächtiger erwiesen, als wir denken. In Verbindung mit geeigneten maschinellen Lerntechniken kann man großartige Erkenntnisse gewinnen. Als „Fun“-Projekt wollten wir sehen, was die Leute über unsere Branche denken. Also haben wir die allgemeine Meinung zum Thema „Crowdling“ untersucht.

Generell bilden wir uns aufgrund mehrerer Faktoren eine eigene Meinung. Sie können persönlich sein, zum Beispiel unsere vergangenen Erfahrungen oder unser gegenwärtiges Verständnis. Diese Faktoren können auch äußerlich sein wie die Nachrichten oder eine Person, die uns inspiriert.

All diese individuellen Meinungen, die einmal gesammelt und analysiert wurden, können ein starker Indikator in Marketing, Vertrieb, Risikobewertung und sogar in Dating-Apps sein.

Jeder Tweet repräsentiert eine Meinung zu einem bestimmten Zeitpunkt. Das Schöne daran ist, dass so viele Menschen aus unterschiedlichen Orten, mit unterschiedlichem Hintergrund und unterschiedlicher Demografie die gleichen Social-Media-Plattformen nutzen. Diese bilden ein Bild, das mit Vorsicht als allgemeine Meinung angenommen werden kann.

Versuchen wir, das globale Gefühl von Crowdlending zu analysieren, indem wir nur Tweets verwenden.

Stimmungsanalyse

Das Hauptziel besteht darin, die allgemeine Stimmung der Tweets von Crowdlending zu bestimmen. Dazu verwenden wir eine Sentimentanalyse und klassifizieren diese Tweets in drei Kategorien, nämlich: positiv, neutral und negativ.

Da nicht alle Tweets auf Englisch verfasst sind, haben wir unsere Analyse zweimal durchgeführt. Das erste Mal in der gesamten Reihe von Tweets, die einen Beitrag zum Crowdlending enthalten, unabhängig von der Sprache. Das zweite Mal ausschließlich auf Tweets, die in Englisch verfasst sind, was die häufigste Sprache in Bezug auf Crowdlending-Tweets ist.

In beiden Fällen können wir den gleichen Trend beobachten. Die große Mehrheit der Tweets wird als neutral eingestuft. Nur wenige werden als negativ gekennzeichnet, während fast ein Drittel als positiv eingestuft wird. Diese Ergebnisse zeigen einen deutlichen Mangel an Bewusstsein für diese neue Anlageklasse, da die Mehrheit der Tweets neutral ist, aber gute Aussichten, da diejenigen, die Position bezogen haben, hauptsächlich positiv sind (rund 75%, wenn wir die neutralen herausnehmen).

Diese Kennzeichnung erfolgt nach den Wörtern, aus denen der Tweet besteht. Manche Wörter wie „großartig“ oder „erstaunlich“ kommen hauptsächlich in positiven Sätzen vor. Je mehr positive Wörter in einem Tweet enthalten sind, desto höher ist der positive Koeffizient und damit die Chance, als positiv markiert zu werden.

Davon abgesehen sind die Prozentsätze von entweder positiv oder negativ im zweiten Fall höher. Der Grund für diesen Unterschied ist die Verwendung eines Übersetzers. Tatsächlich haben wir im zweiten Fall den Sentiment-Analyse-Algorithmus einfach nur für die ersten englischsprachigen Tweets ausgeführt. Während wir im ersten Fall einen Übersetzer auf jeden nicht-englischen geschriebenen Tweet angewendet haben und dann unsere Sentiment-Analyse für das gesamte Set durchgeführt haben. Daher haben wir durch die Übersetzung einen Teil der in der Originalsprache enthaltenen Semantik verloren. Dieser Verlust führt zu einer höheren Anzahl von Tweets, die der neutralen Klasse zugeordnet werden.

Wir hätten die Sentimentanalyse hier beenden können, aber da wir jedes einzelne Wort als positiv, negativ oder neutral gekennzeichnet haben, schauen wir uns die am häufigsten vorkommenden positiven Begriffe an.

Wir haben nur die ursprünglich auf Englisch verfassten Tweets verwendet und die am häufigsten vorkommenden positiv gekennzeichneten Wörter sowohl auf Jahresbasis als auch auf Gesamtbasis extrahiert.

Crowdlending ist eine junge Branche. Die meisten Tweets zeigen das gleiche Muster: Menschen über die Vorteile von Crowdlending zu informieren. Es ist zunächst auf einer Gesamtbasis zu sehen, bei der von den fünf am häufigsten verwendeten Wörtern „teilnehmen“ und „alternativ“ in den Bereich der Ermutigung zum Einstieg fallen, während „Vorteile“ und „Wachstum“ im Bereich der Förderung liegen.

Dieser Trend ist auch jährlich zu beobachten.

Im Jahr 2014 versuchten sie hauptsächlich, Menschen dazu zu bringen, sich der Community anzuschließen und das Bewusstsein für diese Branche zu schärfen. Ähnlich im Jahr 2016, wo die meisten positiven Beiträge das Wort „teilnehmen“ enthielten.

Dazwischen unterstrichen die meisten Tweets aus dem Jahr 2015, dass Crowdlending eine großartige Alternative zu traditionellen Formen der Investition oder Finanzierung ist. Während im Jahr 2017 die meisten Posts die Vorteile von Crowdlending wie die Diversifizierung eines Portfolios enthielten.

Fintech ist das am häufigsten vorkommende positive Wort des Jahres 2018, da sich die meisten Crowdlending-Firmen kürzlich als Fintech etabliert haben. Da Tweets nach Wörtern bewertet werden, die sie enthalten, gibt es definitiv andere positive Wörter, die Fintech an der Spitze erscheinen liessen. Tatsache ist jedoch, dass Fintech das häufigste Wort in allen positiven Tweets von 2018 war!

Schliesslich hoben 2019 die meisten positiven Beiträge das potenzielle zukünftige Wachstum der Crowdlending-Branche hervor. Es wird gut illustriert durch das Wort „Wachstum“, das am häufigsten verwendete positive Wort in diesem Jahr.

Nachdem wir nun einen klaren Überblick über die Stimmung der Tweets haben, werfen wir einen Blick auf den Kontext, in dem sie geschrieben wurden.

Top 3 #Crowdlending ähnliche Hashtags

Die erste Komponente eines Tweets sind die enthaltenen Hashtags. Sie werden verwendet, um den Inhalt des Beitrags zu kategorisieren und Benutzer dorthin zu führen. Da ein Post auf Twitter normalerweise mehr als einen Hashtag enthält, schauen wir uns die verschiedenen Hashtags an, die mit Crowdlending verbunden sind.

Die wichtigsten beim Crowdlending verwendeten Hashtags sind nach Wichtigkeit geordnet: Fintech, Invest und Alternative Investment.

Der am häufigsten vorkommende Hashtag ist Fintech, was nicht verwunderlich ist, da Crowdlending eine Aktivität ist, die Fintechs eigen ist. Alle anderen Tags beziehen sich auf die Investitionstätigkeit, die Crowdlending als alternative Lösung für hohe Renditen präsentiert.

P. S. : Crowdlending ist auf dem Vormarsch

Die Gesamtzahl der Tweets kann ein guter Indikator für die aktuelle Popularität eines Hashtags sein. Je mehr er nämlich verwendet wird, desto höher ist die Popularität und das Interesse daran. Aus diesem Grund haben wir die Gesamtzahl der mit Crowdlending getaggten Tweets für jedes einzelne Jahr gemessen und grafisch dargestellt.

Von Anfang 2014 bis Ende 2018 können wir einen deutlichen Aufwärtstrend beobachten. Die Zahl der Tweets zum Thema Crowdlending ist um fast 50 % gestiegen. Mit anderen Worten, Crowdlending ist ein Thema, das immer mehr Aufmerksamkeit erhält.

Die Kurve zeigt das gleiche Muster. Und zwar kontinuierlich steigend mit einem Rückgang im Jahr 2017.

Eine kurze Anmerkung zu diesem Rückgang: Wir denken, dass dies das Ergebnis verschiedener Elemente ist. Erstens entwickelte sich Instagram nicht nur zu einer der wichtigsten Social-Media-Plattformen, sondern auch zu einer wichtigen Werbeplattform für kleine Unternehmen wie Fintechs. Zweitens führen Transaktionen, wie bei jedem geldbezogenen Internetgeschäft, manchmal unweigerlich zu einigen Betrugsfällen. Ihre Zahl explodierte innerhalb des Zeitraums 2017, insbesondere in China. Drittens, das Jahr 2017 war ziemlich intensiv. Es umfasste den Brexit, Trumps erstes Jahr, eine Obdachlosenkrise, Terroranschläge und die Eskalation der Situation in Nordkoreas. All diese Ereignisse haben das Interesse und damit die Anzahl der Beiträge zum Thema Crowdlending reduziert.

Datenstichprobe

Wir haben das Python-Paket „Get Old Tweet“ verwendet, um alle Tweets vom 01.01.2014 bis zum 31.12.2019 zu sammeln. Zusätzlich zum eigentlichen geposteten Text haben wir für jeden der 84 117 Tweets auch das Datum, die Uhrzeit und die Hashtags gesammelt. Die folgende Tabelle fasst den prozentualen Anteil der ursprünglich englisch geschriebenen Tweets für jedes Jahr zusammen:

*Ein besonderer Dank geht an Cedric Higel, unseren Data Scientist Praktikanten zum Zeitpunkt der Veröffentlichung, der eine wichtige Rolle bei der Erstellung und dem Schreiben dieses Artikels gespielt hat.

Schreibe einen Kommentar