К нам обратилась компания IBM jStart (подразделение корпорации IBM Software Solutions Group) с задачей собрать в социальной сети Twitter сообщения по теме музыкальных фестивалей, выявить некие закономерности и визуализировать результаты исследования.
Итогом должна стать демонстрация возможностей сервиса BlueMix Insights и аналитических сервисов IBM Watson.
В течение трёх месяцев мы собирали и анализировали более 2000 твитов, в которых шла речь о фестивале Coachella и других музыкальных событиях, а также о популярных артистах из списка заказчика. Сбор данных проводился с помощью сервиса BlueMix Insights. Тональность сообщений анализировалась с применением инструмента BlueMix Watson Tone Analyzer.
Используя машинное обучение, мы создали модель, которая способна классифицировать твиты по определённым триггерам.
С помощью сервиса BlueMix Insights мы собрали все твиты за год, в которых обсуждались фестивали или артисты из списка заказчика.
В исследовании применялись Apache Spark Notebook и Jupyter Notebook в Python.
НПрименяя технологии машинного обучения, мы создали модель для классификации твитов по определенным триггерам.
Мы выявили наиболее популярные фестивали и собрали сведения о том, как различные события влияют на обсуждение артистов.
Для оценки успешности события нами применялся сервис анализа тональности BlueMix Watson Tone Analyzer.