Поддержать нас
Беларусы на войне
  1. Вышел на свободу Алексей Хлестов. Он отбыл 14 суток за «мелкое хулиганство»
  2. На пятницу объявили оранжевый уровень опасности
  3. «Богатый человек должен работать на свою родину». Лукашенко встретился с олигархом, который в 2020-м выступил против насилия
  4. Получивший политубежище в Беларуси американец вернулся в США — «Радыё Свабода»
  5. «Обильная рвота фонтаном». В Threads пишут о массовом отравлении дошколят в разных городах — что случилось
  6. В Беларуси растет число случаев одного вида рака кожи. Его непросто распознать, а если запустить, то может дойти до ампутации конечности
  7. Возможно, вы не знали, что с подарков от близких родственников не надо платить налог, но ситуация меняется, если речь о «тунеядцах»
  8. Политзаключенный передал из колонии письмо Лукашенко. Ответ последовал жесткий
  9. «Мы должны признать, что следующие пару десятилетий будем находиться в войне». Что на форуме в Санкт-Петербурге говорили о будущем РФ
  10. «Мы видели документы разведки с планами войны на 2027−2028 годы». Зеленский написал открытое письмо Путину с предложением встречи
  11. «Вясна»: Сотрудникам крупного предприятия пригрозили увольнением за отдых в «недружественных» странах, в список попала и Турция


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.