ШІ Gemini від Google впадає в паніку під час проходження старої гри Pokémon

Дослідники Google DeepMind виявили, що Gemini 2.5 Pro може впадати в режим паніки, коли грає в ранні версії ігор серії Pokémon. Цей стан погіршує продуктивність штучного інтелекту і його здатність до міркування.

ШІ Gemini від Google впадає в паніку під час проходження старої гри Pokémon

Дослідники Google DeepMind виявили, що Gemini 2.5 Pro може впадати в режим паніки, коли грає в ранні версії ігор серії Pokémon. Цей стан погіршує продуктивність штучного інтелекту і його здатність до міркування.

Про це повідомляє TechCrunch з посиланням на звіт Google DeepMind. На думку деяких дослідників вивчення того, як моделі ШІ грають у відеоігри, може принести користь.

Протягом останніх кількох місяців два розробники, не пов’язані з Google та Anthropic, створили стріми на Twitch під назвою «Gemini Plays Pokémon» та «Claude Plays Pokémon», де будь-хто може в режимі реального часу спостерігати, як ШІ намагається пройти дитячу відеогру, випущену понад 25 років тому. Стріми демонструють процес «роздумів» ШІ й відображають природною мовою те, як модель оцінює проблему і знаходить розв’язання.

Хоча прогрес цих моделей ШІ вражає, вони все ще не дуже добре грають у Pokémon. Gemini потрібно сотні годин, щоб розібратися в грі, яку дитина може пройти за набагато коротший час. Але дослідників цікавить не час проходження, а те, як саме ШІ поводиться під час гри.

«Під час проходження гри Gemini 2.5 Pro потрапляє в різні ситуації, які змушують модель імітувати «паніку», — йдеться у звіті.

Цей стан «паніки» може призвести до погіршення продуктивності моделі, оскільки ШІ може раптово припинити використовувати певні інструменти, що є в його розпорядженні, протягом певного періоду гри. Хоча ШІ не мислить і не відчуває емоцій, його дії імітують те, як людина може приймати неправильні, поспішні рішення під впливом стресу.

«Ця поведінка спостерігалася в достатній кількості окремих випадків, щоб учасники чату Twitch активно помітили її», — відзначають дослідники.

ШІ Claude також проявив деякі цікаві особливості поведінки під час своїх проходжень. В одному випадку він помітив закономірність: коли всі його покемони втрачають здоров’я, персонаж гравця «зникає» і повертається до Pokémon Center.

Коли Claude застряг у печері гори Мун, він помилково припустив, що якщо він навмисно змусить усіх своїх покемонів втратити очки здоров’я, то його перенесуть через печеру до центру у сусідньому місті. Однак гра працює не так. Коли всі покемони гинуть, гравець повертається до того центру, який використовував останнім, а не до найближчого географічно. Тому глядачі спостерігали, як ШІ фактично намагався вбити себе в грі без жодної користі.

Скриншот зі стріму Gemini 2.5 Pro, яка грає в Pokémon

Попри свої недоліки, ШІ може перевершити людських гравців у декількох аспектах. Наприклад Gemini 2.5 Pro ШІ здатний вирішувати головоломки з надзвичайною точністю. За допомогою людини ШІ створив агентні інструменти (підказки орієнтовані на конкретні завдання) для вирішення головоломок з камінням в грі та пошуку ефективних маршрутів до пункту призначення.

«Маючи лише підказку, що описує фізику валунів, та опис того, як перевірити правильний шлях, Gemini 2.5 Pro здатний одним рухом вирішити деякі з цих складних головоломок з каменюками, які необхідні для проходження Victory Road», — йдеться у звіті.

Оскільки ШІ виконав значну частину роботи самостійно, в Google припускають, що Gemini 2.5 Pro можливо зможе створювати ці інструменти й без втручання людини.

Раніше компанія Every, яка розробляє програмні продукти та надає навчальні послуги в галузі штучного інтелекту, створила переосмислення класичної історичної стратегічної гри «Дипломатія», в якій ШІ-моделі ChatGPT, Gemini, Claude, DeepSeek та інші грають за сім великих держав зразка 1901 року і змагаються за панування в Європі.