Финальный проект специализации МФТИ и Яндекса "Машинное обучение и анализ данных"
В этом проекте вам предстоит решать задачи анализа тональности текстов в нескольких разных постановках. Начнется все с несложных экспериментов на отзывах на фильмы, в ходе которых вы построите простую модель и немного доработаете ее. Затем вам предстоит поучаствовать в соревновании по сентимент-анализу отзывов на товары и сделать интерактивную демонстрацию для своего алгоритма, которую можно будет показать даже тем, кто никогда не видел Python и машинное обучение. После этого вы поупражняетесь в парсинге веб-страниц и столкнетесь с жестокой реальностью - к вам придет заказчик, который захочет от вас сентимент-анализ отзывов на определенную категорию товаров, но вот выборку для обучения придется собирать самим. Как и угадывать, что же заказчик называет негативными отзывами, а что позитивными. В конце проекта вам потребуется сделать демонстрацию и для этого алгоритма, чтобы заказчик мог с ним поиграться, а не только лишь ориентироваться на качество из контеста.
- Анализ тональности отзывов на фильмы. Отзывы получены из архива nltk.
- Анализ тональности отзывов на сммартфоны, сотовые телефоны. Отзывы получены путем парсинга сайтов, на которых размещаются отзывы на товары. Демонстрация работы: https://github.com/APodolskiy/SentimentAnalysisMIPTCourse/tree/master/PhoneReview_final