OpenAI переміг Grok Ілона Маска на турнірі з шахів для штучного інтелекту

13:56
11.08.2025

Модель штучного інтелекту OpenAI 03 від компанії-розробника ChatGPT без поразок перемогла на турнірі з шахів для штучного інтелекту.

Про це пише BBC.

У фіналі OpenAI 03 перевершила Grok 4 від xAI Ілона Маска. Модель Gemini від Google посіла третє місце, перемігши іншу модель OpenAI.

Турнір з шахів для штучного інтелекту відбувся на платформі Kaggle, що належить Google і дозволяє фахівцям з обробки даних оцінювати свої системи за допомогою змагань. Вісім великих американських мовних моделей від Anthropic, Google, OpenAI, xAI, а також китайські DeepSeek та Moonshot AI боролися одна з одною під час триденного турніру Kaggle.

Історично склалося так, що технологічні компанії часто використовували шахи для оцінки прогресу та можливостей компʼютера. Сучасні шахові машини на максимальних потужностях непереможні навіть проти найкращих гравців-людей.

Але в цих змаганнях не брали участь компʼютери, призначені для гри в шахи, — натомість вони проводилися між програмами штучного інтелекту, призначеними для щоденного використання. Ці штучні інтелекти, хоч й провідні та талановиті в багатьох повсякденних завданнях, все ще вдосконалюються в шахах Наприклад, Grok припустився низки помилок під час фінальних ігор, зокрема неодноразово втрачав ферзя.

Маск і Сем Альтман, обидва співзасновники OpenAI, стверджують, що їхні останні моделі є найрозумнішими у світі .

«До півфіналу здавалося, що ніщо не зможе зупинити Grok 4 на шляху до перемоги в цьому турнірі. Попри кілька моментів слабкості, ШІ [соціальної мережі] X здавався найсильнішим шахістом... Але ілюзія розвіялася в останній день турніру», — написав у своєму висвітленні журналіст Chess.com Педро Піньята.

«Grok припустився багатьох помилок у цих іграх, а OpenAI — ні», — сказав гросмейстер Хікару Накамура під час своєї прямої трансляції фіналу.

Перед фіналом Маск написав в X, що попередній успіх xAI у турнірі був «побічним ефектом», і компанія «майже не витрачала зусиль на шахи».

Розробники штучного інтелекту використовують тести, відомі як бенчмарки, щоб перевіряти навички своїх моделей у таких галузях, як міркування або кодування. Як складні стратегічні ігри, засновані на правилах, шахи та го часто використовувалися для оцінки здатності моделі навчитися найкраще досягати певного результату — у цьому випадку, перехитрити суперників для перемоги.