Анализ сообщений о музыкальных фестивалях

Анализ значимых для аудитории событий, визуализация данных о слушателях, построение графиков пользовательской активности, сопоставление фестивалей и артистов по популярности.

Задача

К нам обратилась компания IBM jStart (подразделение корпорации IBM Software Solutions Group) с задачей собрать в социальной сети Twitter сообщения по теме музыкальных фестивалей, выявить некие закономерности и визуализировать результаты исследования.

Итогом должна стать демонстрация возможностей сервиса BlueMix Insights и аналитических сервисов IBM Watson.

Решение

В течение трёх месяцев мы собирали и анализировали более 2000 твитов, в которых шла речь о фестивале Coachella и других музыкальных событиях, а также о популярных артистах из списка заказчика. Сбор данных проводился с помощью сервиса BlueMix Insights. Тональность сообщений анализировалась с применением инструмента BlueMix Watson Tone Analyzer.

Используя машинное обучение, мы создали модель, которая способна классифицировать твиты по определённым триггерам.

Технологии
IBM Twitter Insights
IBM Cloud Object Storage
Jupyter Notebook
Python
Apache Spark
Watson Tone Analyzer
Watson Personality Insights
Alchemy API
Функциональные возможности решения
1
Создание базы данных

С помощью сервиса BlueMix Insights мы собрали все твиты за год, в которых обсуждались фестивали или артисты из списка заказчика.

2
Анализ и визуализация данных

В исследовании применялись Apache Spark Notebook и Jupyter Notebook в Python.

3
Модель для классификации сообщений

НПрименяя технологии машинного обучения, мы создали модель для классификации твитов по определенным триггерам.

4
Сравнение различных музыкальных фестивалей и артистов

Мы выявили наиболее популярные фестивали и собрали сведения о том, как различные события влияют на обсуждение артистов.

5
Тональность сообщений

Для оценки успешности события нами применялся сервис анализа тональности BlueMix Watson Tone Analyzer.

Результат
В результате работы над проектом нам удалось выявить наиболее значимые для аудитории события, сопоставить фестивали и артистов по популярности, визуализировать данные о слушателях, выстроить графики пользовательской активности в зависимости от того или иного мероприятия, например, появления анонса фестиваля или релиза нового альбома.
Мы найдем лучшее решение вашей задачи