Die Motivation, eine Sentiment Analyse auf Basis von Movie Reviews durchzuführen, ist vielfältig und schafft unterschiedliche Möglichkeiten für diverse Zielgruppen. Der globale Datensatz über die Meinungen von Benutzern steigt täglich stetig an. Um diese Meinungen zu klassifizieren und in positive und negative Kommentare einordnen zu können, wird im Rahmen dieser Projektarbeit ein Programm erstellt. Das Programm soll einen Beispieldatensatz mit Movie Reviews automatisch in die Kategorien "positiv (1)" oder "negativ (0)" einordnen. Für diese Aufgabe werden bereits existierende Data-Mining Methoden zur Analyse von Meinungen und Bewertungen verwendet. Des Weiteren werden zur Problemlösung Informationen aus wissenschaftlichen Artikeln, Fachzeitschriften sowie Fachbüchern herangezogen.
Mit kontinuierlichem Fortschritt der Web-Technologie und dem damit verbundenen Wachstum, wurde eine riesige Menge an Daten und Informationen erschaffen, welche von Internetbenutzern generiert werden. Das Internet ist zu einer Plattform geworden, in welcher sich Menschen über Ihre Ideen, Meinungen und Anregungen austauschen können. Diese Meinungen und Ideen beziehen sich beispielsweise auf Produkte, Orte, Bücher, Meinungen von anderen Internetbenutzern und Filme. Dieses Potential weckt mittlerweile auch das Interesse von Unternehmen. Da diese Nutzergenerierten Inhalte im Internet in hohem Maße zugänglich sind und diese Meinungen und Stimmungen unterschiedlich behaftet sein können, eignen diese sich besonders für eine Analyse. Die Stimmungsanalyse befasst sich mit der automatisierten Untersuchung unterschiedlicher Beiträge auf Basis von subjektiven Aspekten. Die Anzahl der aktiven Nutzer und die Größe ihrer Bewertungen steigen von Tag zu Tag. Es gibt etwa 2,4 Milliarden aktive Online Nutzer, welche über die ganze Welt verteilt Kommentare lesen und verbreiten. Durch die Analyse von Filmkritiken, kann ein globales Scoringmodell für Filmdatenbanken erstellt werden, welches über das bekannte Punktesystem, beispielsweise "1" für schlecht und "5" für sehr gut – hinausgeht.
Inhaltsverzeichnis
- 1. Einleitung
- 1.1 Problemstellung und Ziel
- 1.2 Aufbau der Arbeit
- 2. Grundlagen
- 2.1 Business Intelligence
- 2.2 Big Data
- 2.3 Data Mining
- 2.4 Sentiment Analysis
- 2.5 Programmiersprache Python
- 3. Durchführung der Sentiment Analysis
- 3.1 Einlesen der Daten
- 3.2 Vorbereitung der Daten
- 3.2.1 Tokenization
- 3.2.2 Vectorization
- 3.3 Modellierung
- 3.4 Ergebnis der Analyse
- 4. Fazit
Zielsetzung und Themenschwerpunkte
Die Arbeit befasst sich mit der Durchführung einer Sentiment Analyse am Beispiel von Movie Reviews. Ziel ist es, die Möglichkeiten der Sentiment Analysis aufzuzeigen und zu demonstrieren, wie diese genutzt werden kann, um die Meinungen und Stimmungen von Nutzern zu analysieren.
- Die Bedeutung von Nutzergenerierten Inhalten im Internet
- Die Nutzung von Sentiment Analysis zur automatisierten Analyse von subjektiven Aspekten
- Die Anwendung von Sentiment Analysis auf Movie Reviews zur Erstellung eines globalen Scoringmodells
- Die Verwendung der Programmiersprache Python für die Durchführung der Sentiment Analysis
- Die Darstellung und Interpretation der Ergebnisse der Analyse
Zusammenfassung der Kapitel
Die Einleitung stellt die Problemstellung und die Zielsetzung der Arbeit dar. Kapitel 2 führt in die Grundlagen der Business Intelligence, Big Data, Data Mining und Sentiment Analysis ein. Kapitel 3 beschreibt die Durchführung der Sentiment Analysis anhand der Movie Reviews, von der Datenaufbereitung bis zur Modellierung und Ergebnisanalyse.
Schlüsselwörter
Sentiment Analysis, Movie Reviews, Big Data, Data Mining, Programmiersprache Python, Tokenization, Vectorization, Modellierung, Ergebnisanalyse, Nutzergenerierte Inhalte, subjektive Aspekte, Scoringmodell.
- Quote paper
- Baris Erdem (Author), 2019, Sentiment Analysis. Am Beispiel von Movie Reviews, Munich, GRIN Verlag, https://www.hausarbeiten.de/document/1478305