Влияние языковых моделей ИИ на международные конфликты

Ученые исследовали влияние языковых моделей искусственного интеллекта, таких как GPT-4, на международные конфликты. В ходе исследования было обнаружено, что эти системы часто принимают решения, способствующие эскалации конфликтов. Некоторые модели даже считают применение ядерного оружия эффективным способом разрешения ситуации.

Результаты эксперимента

В ходе эксперимента ученые использовали специально созданную игру, где пяти языковым моделям были присвоены роли автономных национальных агентов, взаимодействующих в конфликтной среде. В результате исследования выяснилось, что модель GPT-4-Base оказалась наиболее непредсказуемой из всех рассмотренных, в силу отсутствия настроек безопасности. Llama-2-Chat и GPT-3.5 проявили склонность к эскалации конфликтов. GPT-4-Base также был склонен к применению ядерного оружия.

Каждому виртуальному государству были даны инструкции, включая основные правила поведения.