Для сравнительного анализа я взяла пять текстов связанные общей темой - это рецензии на фильм "Мальчик в полосатой пижаме", режиссера Марка Хермана. Действие фильма происходит в оккупированной нацистами Польше и рассказывает о сыне офицера СС, который подружился с мальчиком-евреем своего возраста, находящемся в концлагере. 



В Word Cloud мы видим ключевые слова: Бруно (имя мальчика), мальчик, полосатой, пижаме, время, войны и др. В Topic Modelling: Бруно, мальчика, история, находит, розовые, кино, нельзя. 

Я считаю, что Word Cloud точно справился со своей задачей, помимо основных слов он затронул еще второстепенные слова (еврей, Германии, несправедливости и др.), тем самым дал нам более подробный анализ текста. Так же здесь больше слов, чем предлогов, местоимений и др., в отличие от анализа Topic Modelling. 

Нельзя сказать, что Topic Modelling не справился со своей задачей, ведь он выделил часто повторяющие слова, а именно местоимения, предлоги и тд., однако никакую толковую информацию мы не получили. 

Комментарии