<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:media="http://search.yahoo.com/mrss/"
>

<channel>
	<title>Результаты тестов моделей искусственного интеллекта</title>
	<atom:link href="https://re-ii.ru/category/tests/feed/" rel="self" type="application/rss+xml" />
	<link>https://re-ii.ru/category/tests/</link>
	<description>Ре: ИИ медиапроект о технологиях искусственного интеллекта. Обновления российских и глобальных моделей, аналитика, глоссарий, обзоры AI</description>
	<lastBuildDate>Mon, 15 Dec 2025 16:33:41 +0000</lastBuildDate>
	<language>ru-RU</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>
	<item>
		<title>Тесты математики MiniMax M2: сильное мышление, слабый контроль исполнения</title>
		<link>https://re-ii.ru/tests/testy-matematiki-minimax-m2-otchet-3/</link>
					<comments>https://re-ii.ru/tests/testy-matematiki-minimax-m2-otchet-3/#respond</comments>
		
		<dc:creator><![CDATA[Вадим Копонов]]></dc:creator>
		<pubDate>Mon, 15 Dec 2025 16:33:39 +0000</pubDate>
				<category><![CDATA[Результаты тестов моделей]]></category>
		<guid isPermaLink="false">https://re-ii.ru/?p=953</guid>

					<description><![CDATA[<p>Протестировали MiniMax M2 на 25 математических задачах: от базовой арифметики до анализа, теории чисел и олимпиадных уравнений. Формальный pass-rate составил 76%, однако значительная часть «провалов» связана не с ошибками в вычислениях, а с нарушением формата ответа. Модель часто возвращает правильный результат, но сопровождает его пояснениями или развёрнутыми рассуждениями. Показательно, что сложные теоретические темы обрабатываются стабильнее, чем элементарные вычисления</p>
<p style="margin-top:12px">Источник: <a href="https://re-ii.ru/tests/testy-matematiki-minimax-m2-otchet-3/?utm_source=rss&utm_medium=syndication&utm_campaign=ai_news">Ре: ИИ</a></p>
<p>Сообщение <a href="https://re-ii.ru/tests/testy-matematiki-minimax-m2-otchet-3/">Тесты математики MiniMax M2: сильное мышление, слабый контроль исполнения</a> появились сначала на <a href="https://re-ii.ru">Ре: ИИ — Искусственный интеллект и стартапы</a>.</p>
]]></description>
		
					<wfw:commentRss>https://re-ii.ru/tests/testy-matematiki-minimax-m2-otchet-3/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<media:content url="https://re-ii.ru/wp-content/uploads/2025/12/mini_math.webp" medium="image" />
<enclosure url="https://re-ii.ru/wp-content/uploads/2025/12/mini_math.webp" length="0" type="image/webp" />
	</item>
		<item>
		<title>Тесты reasoning MiniMax M2: модель думает правильно, но нарушает формат</title>
		<link>https://re-ii.ru/tests/minimax-m2-reasoning-tests-format-vs-logic/</link>
					<comments>https://re-ii.ru/tests/minimax-m2-reasoning-tests-format-vs-logic/#respond</comments>
		
		<dc:creator><![CDATA[Вадим Копонов]]></dc:creator>
		<pubDate>Sun, 14 Dec 2025 11:36:07 +0000</pubDate>
				<category><![CDATA[Результаты тестов моделей]]></category>
		<guid isPermaLink="false">https://re-ii.ru/?p=919</guid>

					<description><![CDATA[<p>Во втором этапе тестирования MiniMax M2 мы сфокусировались на reasoning-задачах и получили важный результат: модель почти не ошибается по смыслу, но регулярно нарушает формат ответа. В логических и математических задачах MiniMax M2 стабильно приходит к правильному выводу, однако до 30–40% прогонов формально «проваливаются» из-за лишнего текста, пояснений или структуры вывода. При этом глубина рассуждений не деградирует с длиной цепочки, а реальная семантическая консистентность модели ближе к 90–95%. По поведению MiniMax M2 скорее выглядит как research-reasoner, а не как модель, оптимизированная под жёсткие API-контракты</p>
<p style="margin-top:12px">Источник: <a href="https://re-ii.ru/tests/minimax-m2-reasoning-tests-format-vs-logic/?utm_source=rss&utm_medium=syndication&utm_campaign=ai_news">Ре: ИИ</a></p>
<p>Сообщение <a href="https://re-ii.ru/tests/minimax-m2-reasoning-tests-format-vs-logic/">Тесты reasoning MiniMax M2: модель думает правильно, но нарушает формат</a> появились сначала на <a href="https://re-ii.ru">Ре: ИИ — Искусственный интеллект и стартапы</a>.</p>
]]></description>
		
					<wfw:commentRss>https://re-ii.ru/tests/minimax-m2-reasoning-tests-format-vs-logic/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<media:content url="https://re-ii.ru/wp-content/uploads/2025/12/mini_reasoning_result.webp" medium="image" />
<enclosure url="https://re-ii.ru/wp-content/uploads/2025/12/mini_reasoning_result.webp" length="0" type="image/webp" />
	</item>
		<item>
		<title>MiniMax M2: первые наблюдения из серии тестов модели</title>
		<link>https://re-ii.ru/tests/minimax-m2-first-series-tests/</link>
					<comments>https://re-ii.ru/tests/minimax-m2-first-series-tests/#respond</comments>
		
		<dc:creator><![CDATA[Вадим Копонов]]></dc:creator>
		<pubDate>Tue, 09 Dec 2025 20:50:29 +0000</pubDate>
				<category><![CDATA[Результаты тестов моделей]]></category>
		<guid isPermaLink="false">https://re-ii.ru/?p=825</guid>

					<description><![CDATA[<p>Мы начали серию системных тестов MiniMax M2 и сразу обнаружили характерные паттерны поведения: модель уверенно решает логические цепочки, но при увеличении токенов расширяет ответы, нарушает формат и «улучшает» код без запроса. Разбираем первые наблюдения</p>
<p style="margin-top:12px">Источник: <a href="https://re-ii.ru/tests/minimax-m2-first-series-tests/?utm_source=rss&utm_medium=syndication&utm_campaign=ai_news">Ре: ИИ</a></p>
<p>Сообщение <a href="https://re-ii.ru/tests/minimax-m2-first-series-tests/">MiniMax M2: первые наблюдения из серии тестов модели</a> появились сначала на <a href="https://re-ii.ru">Ре: ИИ — Искусственный интеллект и стартапы</a>.</p>
]]></description>
		
					<wfw:commentRss>https://re-ii.ru/tests/minimax-m2-first-series-tests/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<media:content url="https://re-ii.ru/wp-content/uploads/2025/12/test_1.webp" medium="image" />
<enclosure url="https://re-ii.ru/wp-content/uploads/2025/12/test_1.webp" length="0" type="image/webp" />
	</item>
	</channel>
</rss>
