ШІ Gemini від Google впадає в паніку під час проходження старої гри Pokémon

Дослідники Google DeepMind виявили, що Gemini 2.5 Pro може впадати в режим паніки, коли грає в ранні версії ігор серії Pokémon. Цей стан погіршує продуктивність штучного інтелекту і його здатність до міркування.

Про це повідомляє TechCrunch з посиланням на звіт Google DeepMind. На думку деяких дослідників вивчення того, як моделі ШІ грають у відеоігри, може принести користь.

Протягом останніх кількох місяців два розробники, не пов’язані з Google та Anthropic, створили стріми на Twitch під назвою «Gemini Plays Pokémon» та «Claude Plays Pokémon», де будь-хто може в режимі реального часу спостерігати, як ШІ намагається пройти дитячу відеогру, випущену понад 25 років тому. Стріми демонструють процес «роздумів» ШІ й відображають природною мовою те, як модель оцінює проблему і знаходить розв’язання.

Хоча прогрес цих моделей ШІ вражає, вони все ще не дуже добре грають у Pokémon. Gemini потрібно сотні годин, щоб розібратися в грі, яку дитина може пройти за набагато коротший час. Але дослідників цікавить не час проходження, а те, як саме ШІ поводиться під час гри.

«Під час проходження гри Gemini 2.5 Pro потрапляє в різні ситуації, які змушують модель імітувати «паніку», — йдеться у звіті.

Цей стан «паніки» може призвести до погіршення продуктивності моделі, оскільки ШІ може раптово припинити використовувати певні інструменти, що є в його розпорядженні, протягом певного періоду гри. Хоча ШІ не мислить і не відчуває емоцій, його дії імітують те, як людина може приймати неправильні, поспішні рішення під впливом стресу.

«Ця поведінка спостерігалася в достатній кількості окремих випадків, щоб учасники чату Twitch активно помітили її», — відзначають дослідники.

ШІ Claude також проявив деякі цікаві особливості поведінки під час своїх проходжень. В одному випадку він помітив закономірність: коли всі його покемони втрачають здоров’я, персонаж гравця «зникає» і повертається до Pokémon Center.

Коли Claude застряг у печері гори Мун, він помилково припустив, що якщо він навмисно змусить усіх своїх покемонів втратити очки здоров’я, то його перенесуть через печеру до центру у сусідньому місті. Однак гра працює не так. Коли всі покемони гинуть, гравець повертається до того центру, який використовував останнім, а не до найближчого географічно. Тому глядачі спостерігали, як ШІ фактично намагався вбити себе в грі без жодної користі.

Скриншот зі стріму Gemini 2.5 Pro, яка грає в Pokémon

Попри свої недоліки, ШІ може перевершити людських гравців у декількох аспектах. Наприклад Gemini 2.5 Pro ШІ здатний вирішувати головоломки з надзвичайною точністю. За допомогою людини ШІ створив агентні інструменти (підказки орієнтовані на конкретні завдання) для вирішення головоломок з камінням в грі та пошуку ефективних маршрутів до пункту призначення.

«Маючи лише підказку, що описує фізику валунів, та опис того, як перевірити правильний шлях, Gemini 2.5 Pro здатний одним рухом вирішити деякі з цих складних головоломок з каменюками, які необхідні для проходження Victory Road», — йдеться у звіті.

Оскільки ШІ виконав значну частину роботи самостійно, в Google припускають, що Gemini 2.5 Pro можливо зможе створювати ці інструменти й без втручання людини.

Раніше компанія Every, яка розробляє програмні продукти та надає навчальні послуги в галузі штучного інтелекту, створила переосмислення класичної історичної стратегічної гри «Дипломатія», в якій ШІ-моделі ChatGPT, Gemini, Claude, DeepSeek та інші грають за сім великих держав зразка 1901 року і змагаються за панування в Європі.

ШІ Gemini від Google впадає в паніку під час проходження старої гри Pokémon

Пов’язаний запис

Екоактивіст мимоволі — українські розробники анонсували гру Condemned to Clean про прибирання пляжів

«Через гру ми розповідаємо світу про наш досвід війни». Як проходить розробка ізометричної гри Hollow Home, що розповідає про початок російського вторгнення

2,4 млн користувачів. Ukrainian Games Festival встановив рекорд відвідуваності