Инференс, который не покидает территорию России.

Inferenca разворачивает MiniMax M-2.7 на своих серверах в ЦОД Москвы (резерв — Санкт-Петербург). Документы, запросы и ответы остаются в российской юрисдикции, как требует ч. 5 ст. 18 152-ФЗ.

152-ФЗ локализация ПДн
УЗ-2 сертифицированное СКЗИ
реестр РКН оператор ПДн
138 мс · до первого токена
287 ток/с · стриминг
0 байт · за рубеж
ЦОД ru-msk-1
minimax-m-2.7 регион: ru-msk-1 · Москва
U
Проанализируй вложенный договор на обработку ПДн (14 стр.). Укажи пункты, противоречащие ст. 6 и 9 152-ФЗ.
I
138 мс TTFT 287 ток/с 0 байт за рубеж
ru-msk-1 ✓
live · РФ
ru-msk-1 · 138 мс TTFT ru-msk-2 · 149 мс TTFT ru-spb-1 · 166 мс TTFT очередь: 0 запросов аптайм 30d · 99,97% последний инцидент · 14 дней назад инференсов за сегодня · 412 730 подписанных логов · в SIEM ru-msk-1 · 138 мс TTFT ru-msk-2 · 149 мс TTFT ru-spb-1 · 166 мс TTFT очередь: 0 запросов аптайм 30d · 99,97% последний инцидент · 14 дней назад инференсов за сегодня · 412 730 подписанных логов · в SIEM
01 — Бенчмарки

Одна модель. Развёрнута рядом с юрлицом, которое её использует.

Мы не держим каталог из 40 моделей. Мы держим MiniMax M-2.7 — модель, которая хорошо справляется с документами на русском и в юридических доменах. Цифры ниже — p50 за последние 30 дней, измерено внутри ru-msk-1.

До первого токена

p50 · мс
138мс
Измерено из сети МСК-IX. Запросы извне РФ отклоняются на границе, а не проксируются.
MSK-1
MSK-2
SPB
ср.

Пропускная способность

M-2.7
287ток/с
Стриминг, один запрос. В батче p50 достигает 1 420 ток/с при 32 параллельных.
Контекст
200 000 токенов
Макс. ответ
16 384 токена
Форматы входа
text · pdf · docx
Карточка модели
minimax-m-2.7 · sha 8f3e…a1
Бенчмарк
MiniMax M-2.7
GPT-4.1 mini
DeepSeek V3
GigaChat Pro
MMLU-Pro общее рассуждение · %
74,1
77,8
75,9
68,4
LegalBench договоры и регуляторика · %
82,6
81,2
78,7
71,0
DocVQA извлечение из документов · %
89,4
91,1
87,2
80,3
Needle-in-200k поиск в длинном контексте · %
99,2
98,7
96,5
н/д · 32k ctx
TTFT в регионе p50 · мс · меньше лучше
138
310
280
195
Обработка ПДн в РФ 152-ФЗ, ч. 5 ст. 18
да
нет
нет
да
Без сохранения по умолчанию
да
по заявке
нет
по заявке
Источники: карточки моделей · внутренний тестовый стенд · апрель 2026 · замеры из ru-msk-1. M-2.7 на Inferenca · российский периметр
Где уступаем

Мы не первые в MMLU-Pro и DocVQA — и не будем делать вид, что первые. GPT-4.1 mini выигрывает в общем рассуждении примерно на 4 пункта.

Где выигрываем

В задачах, которые реально решают юристы и комплаенс: работа с длинным документом, извлечение пунктов, задержка внутри РФ. А главное — легально для обработки ПДн без зарубежного трансфера.

Размещение

РФ · изолированный контур
MSK-1 · Москва
MSK-2 · Москва
SPB · СПб
EKB ⟶ Q3
NSK ⟶ Q4
только РФ
02 — Песочница

Вставьте документ. Он останется в контуре РФ.

Демо обращается к MiniMax M-2.7 в ru-msk-1. Ничего из введённого не сохраняется.

Ввод · документ или вопрос
Ответ · стриминг из ru-msk-1
Ответ будет появляться здесь. Соединение остаётся в выбранном ЦОД.
ожидание
03 — Юрисдикция и безопасность

Построено под российское законодательство — и под вашу ИБ-службу.

Данные и код не покидают РФ. Проверка РКН и согласование с ИБ — становятся формальностью.

152-ФЗ · ч. 5 ст. 18

Локализация ПДн

Хранение и обработка — только на серверах в РФ. Физически не располагаем мощностями за рубежом.

Без сохранения

Не пишем на диск

Запросы, ответы и KV-кэш живут в RAM. Ни в датасет обучения, ни в логи сервиса они не попадают — закреплено в договоре.

Реестр РКН · ФСТЭК

Документы для проверки

В реестре операторов ПДн. Типовое ДПН, УЗ-2, СКЗИ — документы для согласования с ИБ в комплекте при подключении.

Санкционные риски

Оплата в рублях

Договор с российским юрлицом. Не нужны зарубежные карты, прокси и объяснения банку.

Непрерывность

Сервис не отключат извне

Модель развёрнута локально. Блокировки и геоограничения зарубежных провайдеров не остановят CI и разработку.

Аудит

Подписанные логи в ваш SIEM

Каждый вызов — запись с подписью Ed25519, стрим по mTLS. Ключи у вас.

04 — Архитектура

Ваш документ входит в российский контур. И не выходит.

Каждый запрос привязан к ключу локализации на границе. Планировщик отказывается маршрутизировать за пределы РФ — даже при переключении на резерв.

01 · Вход

Российский edge

TLS завершается внутри контура арендатора. Ключ локализации проверяется до парсинга тела запроса.

02 · Изоляция

Отдельный VPC

Изолированное сетевое пространство и свой ключ на СКЗИ. Общий батчинг между арендаторами исключён.

03 · Инференс

M-2.7 on-prem

Веса закреплены в ЦОД. KV-кэш только в оперативной памяти. Очищается при закрытии сессии.

04 · Аудит

Подписанные логи

Каждый вызов создаёт запись с подписью Ed25519. Стрим в ваш SIEM по mTLS. Ключи у вас.

05 — Каталог

Сейчас — одна модель. Что появится дальше — решают клиенты.

Inferenca в раннем доступе. Мы стартовали с MiniMax M-2.7, потому что на ней удобно работать с документами и русским юридическим контекстом. Следующие модели добавляем по запросу — порядок формирует голосование тех, кто уже подключён.

сейчас

MiniMax M-2.7

200k контекст · сильна на длинных документах и извлечении пунктов. Доступна с первого дня.

доступ · сегодня
в очереди · Q3

Llama 3.3 70B

Открытые веса, лучший общий reasoning. Железо под неё уже заказано — ждём поставки GPU.

запросили 47 команд
в очереди · Q4

GLM 5.1

Сильный русский, хорошо идёт на переводных и мультиязычных задачах. Готовим тюнинг под юр. домен.

запросили 29 команд
ваш голос

Что развернуть ещё?

Если нужна конкретная модель с открытыми весами — напишите. 20+ запросов запускают закупку железа.

предложить модель →
06 — Что дальше

Две вещи, над которыми мы работаем сейчас.

Направления, которые естественно продолжают логику «модель рядом с юрлицом». Не анонс — ранние доступы откроем тем, кто уже подключён к инференсу.

в разработке

Secure Compute

Инференс внутри доверенной среды (TEE): входные и выходные токены не видит никто — ни мы, ни оператор ЦОД, ни администратор хоста. Только владелец ключа. Подтверждается аттестацией — проверяемо на стороне клиента.

ранний доступ · лето 2026
в разработке

Serverless GPU

Запускайте свои контейнеры с моделями в нашем облаке — без заботы о железе. Холодный старт секунды, оплата по GPU-секундам, размещение в том же российском контуре, что и каталог.

ранний доступ · осень 2026
07 — Тарифы

Цена за миллион токенов. Без внезапных списаний.

Все тарифы включают локализацию в РФ, подписанные логи и отсутствие сохранения по умолчанию. Enterprise добавляет выделенные GPU и именного SRE.

Старт

Общая мощность

60 ₽ / 1М вход
180 ₽ / 1М выход · один ЦОД (ru-msk-1)
Один регион размещения Контекст 200k, полный доступ к модели Хранение логов 7 дней Поддержка по почте
Начать со «Старта»
Enterprise

Выделенный контур

По запросу
годовой контракт · выделенные GPU
Single-tenant GPU, ваш VPC Размещение в вашем ЦОД (on-prem) Хранение логов бессрочно + SIEM Именной SRE, 24/7 on-call Развёртывание в закрытом контуре
Обсудить

Запускайте модель внутри юрисдикции. Не рядом с ней.

API-ключ с привязкой к ЦОД в РФ — за две минуты. 100 000 токенов на тест без карты и без сделки.

Tweaks
Палитра блоков
Насыщенность
Плотность
Serif в display