Архивы fail — Re: II — Искусственный интеллект и стартапы

Статус: fail

Инструменты

[R4.3] MiniMax-M2 — задача «Синие глаза»

Тест R4.3 показывает, что MiniMax-M2 в целом понимает common knowledge и индукцию на классических задачах, но при многократных прогонах даёт заметный дрейф интерпретации: иногда…

13.12.2025

Читать →