Новий тест ставить ШІ в глухий кут — ChatGPT та DeepSeek набирають менш як 5%

Новий тест ставить ШІ в глухий кут — ChatGPT та DeepSeek набирають менш як 5%

Кожне завдання в ARC-AGI-2 було вирішене щонайменше 2 людьми менш ніж за 2 спроби (Фото: Arc Prize Foundation)

Некомерційна організація Arc Prize Foundation, що вимірює прогрес у створенні загального штучного інтелекту (AGI), створила новий тест, який вкрай важко дається усім провідним моделям.

Коментарів немає

Читайте також