Исследователи НИУ ВШЭ Пермь представили анализ социологии потребления с использованием модели BERT
21 июня м.н.с лаборатории Евгения Шенкман и доцент департамента менеджмента, к.социол. н. Юлия Папушина представили на научном семинаре департамента менеджмента НИУ ВШЭ Пермь свое исследование по теме «Тематика и динамика в социологии потребления с 1976 по 2023: автоматизированный анализ литературы с помощью модели глубокого обучения BERT».
Исследование, предварительные результаты которого были представлены на семинаре, представляет собой автоматизированный анализ публикаций по социологии потребления с 1976 по 2023 годы. Этот проект актуален, так как автоматизированный анализ текстов широко используется для изучения эволюции различных дисциплин, но в области социологии потребления таких исследований еще не проводилось. Методы машинного обучения помогают уменьшить субъективность традиционных обзоров литературы, которые требуют чтения большого количества статей, и позволяют охватить значительно больший объем материала, выявляя неочевидные тематические направления.
Социология потребления – это обширная и сложная область, включающая тысячи исследований, выполненных с использованием различных методологий. Провести полноценный литературный обзор без использования современных инструментов, основанных на машинном обучении, практически невозможно. Это исследование стало первым в своём роде, использующим модель BERTopic для тематического картирования социологии потребления, и демонстрирует возможности применения различных подходов, таких как анализ отдельных слов, биграмм и авторских ключевых слов.
В отличие от большинства исследований, использующих модель LDA для автоматизированного анализа литературы, представленное исследование применяет подход BERTopic (Grootendorst, 2022). Этот подход основан на последовательном применении предобученной языковой модели типа Sentence Transformer для создания векторного представления текста, кластеризации этих векторов и описания полученных кластеров-тем с помощью TF-IDF. Евгения Шенкман объяснила принципы работы, достоинства и ограничения подхода BERTopic в своей части выступления.
Во второй части семинара Юлия Папушина представила результаты проекта. Она ответила на основные вопросы исследования: какова общая динамика в исследуемый период? Сколько тематических сегментов можно выделить? К каким темам интерес ученых растёт, а к каким падает? Оказалось, что тематика социологии потребления организована вокруг девяти тем, которые можно сгруппировать по категориям устойчивости, социологии питания и потребительского поведения. Применительно к каждой теме докладчицы рассмотрели страновую принадлежность исследователей, публикующих по этой теме, наиболее популярные журналы и структуру потока текстов. Они также описали динамику публикаций по годам, что позволило понять, как меняется интерес к выделенным темам.
Важнейшие выводы исследования показывают, что анализ с использованием ключевых слов, биграмм и авторских ключевых слов даёт разные картины содержания тематических кластеров. В зависимости от темы, доминирование англоязычных стран оспаривают Китай, Индия и европейские страны. Темы, вызывающие устойчивый интерес последние 20 лет, включают «зелёный» маркетинг, систему питания и устойчивую моду. Темы, интерес к которым снижается, включают потребительские практики и идентичности, науку о маркетинге и циркулярную экономику.
После презентации развернулась активная дискуссия, где обсуждались вопросы о влиянии исходных данных на выводы, интерпретация результатов в контексте предыдущих исследований и перспективы дальнейших исследований.