Анализ поведения ИИ-агентов в игре на доверие: на семинаре IDLab выступил Никита Маткин
11 июля 2025 года в рамках регулярного научного семинара Международной лаборатории экономики нематериальных активов (МЛЭНА) с докладом выступил стажер-исследователь Никита Маткин, представивший результаты исследования поведения больших языковых моделей (LLM) в игре «Диктатор». Работа выполнена совместно с Евгенией Шенкман и Петром Паршаковым и посвящена анализу того, насколько модели искусственного интеллекта имитируют человеческие стратегии принятия решений в экономических экспериментах. Работа выполнена в рамках гранта РНФ № 25-18-00539.
Исследование основано на классической игре «Диктатор», где один участник (диктатор) распределяет определенную сумму денег между собой и партнером. В традиционных экспериментах люди в среднем отдают около 20–30% суммы, демонстрируя альтруизм, несмотря на отсутствие стратегических выгод. Было протестировано поведение 10 LLM, включая модели от OpenAI, Google, Meta, а также русскоязычные «YandexGPT» и «GigaChat», в различных условиях игры. Общее количество экспериментов составило 9 000, что позволило оценить устойчивость решений моделей к изменениям правил. Выяснилось, что модели предлагают 40–50% суммы, превышая человеческий уровень. Русскоязычные модели показали наибольшую щедрость — до 90%, оставаясь стабильными даже при возможности забирать средства, в отличие от людей, меняющих стратегии.
Анализ выявил, что LLM руководствуются принципами честности и равенства, тогда как слова, связанные с рациональностью, коррелировали с меньшими суммами передачи. Результаты важны для внедрения ИИ в экономические процессы (например, распределение ресурсов), но чрезмерная щедрость моделей может быть риском при оптимизации прибыли.
«Машины оказались добрее, чем люди, но менее гибки», — подчеркнул Никита Маткин. Исследователи планируют продолжить работу, изучив влияние социальных ролей (например, пола или возраста модели) на принятие решений и экспериментируя с температурой генерации ответов для повышения вариативности стратегий.