Инференс, который не покидает территорию России.
Inferenca разворачивает MiniMax M-2.7 на своих серверах в ЦОД Москвы (резерв — Санкт-Петербург). Документы, запросы и ответы остаются в российской юрисдикции, как требует ч. 5 ст. 18 152-ФЗ.
Одна модель. Развёрнута рядом с юрлицом, которое её использует.
Мы не держим каталог из 40 моделей. Мы держим MiniMax M-2.7 — модель, которая хорошо справляется с документами на русском и в юридических доменах. Цифры ниже — p50 за последние 30 дней, измерено внутри ru-msk-1.
До первого токена
p50 · мсПропускная способность
M-2.7- Контекст
- 200 000 токенов
- Макс. ответ
- 16 384 токена
- Форматы входа
- text · pdf · docx
- Карточка модели
- minimax-m-2.7 · sha 8f3e…a1
Где уступаем
Мы не первые в MMLU-Pro и DocVQA — и не будем делать вид, что первые. GPT-4.1 mini выигрывает в общем рассуждении примерно на 4 пункта.
Где выигрываем
В задачах, которые реально решают юристы и комплаенс: работа с длинным документом, извлечение пунктов, задержка внутри РФ. А главное — легально для обработки ПДн без зарубежного трансфера.
Размещение
РФ · изолированный контурВставьте документ. Он останется в контуре РФ.
Демо обращается к MiniMax M-2.7 в ru-msk-1. Ничего из введённого не сохраняется.
Ввод · документ или вопрос
Ответ · стриминг из ru-msk-1
Построено под российское законодательство — и под вашу ИБ-службу.
Данные и код не покидают РФ. Проверка РКН и согласование с ИБ — становятся формальностью.
Локализация ПДн
Хранение и обработка — только на серверах в РФ. Физически не располагаем мощностями за рубежом.
Не пишем на диск
Запросы, ответы и KV-кэш живут в RAM. Ни в датасет обучения, ни в логи сервиса они не попадают — закреплено в договоре.
Документы для проверки
В реестре операторов ПДн. Типовое ДПН, УЗ-2, СКЗИ — документы для согласования с ИБ в комплекте при подключении.
Оплата в рублях
Договор с российским юрлицом. Не нужны зарубежные карты, прокси и объяснения банку.
Сервис не отключат извне
Модель развёрнута локально. Блокировки и геоограничения зарубежных провайдеров не остановят CI и разработку.
Подписанные логи в ваш SIEM
Каждый вызов — запись с подписью Ed25519, стрим по mTLS. Ключи у вас.
Ваш документ входит в российский контур. И не выходит.
Каждый запрос привязан к ключу локализации на границе. Планировщик отказывается маршрутизировать за пределы РФ — даже при переключении на резерв.
Российский edge
TLS завершается внутри контура арендатора. Ключ локализации проверяется до парсинга тела запроса.
Отдельный VPC
Изолированное сетевое пространство и свой ключ на СКЗИ. Общий батчинг между арендаторами исключён.
M-2.7 on-prem
Веса закреплены в ЦОД. KV-кэш только в оперативной памяти. Очищается при закрытии сессии.
Подписанные логи
Каждый вызов создаёт запись с подписью Ed25519. Стрим в ваш SIEM по mTLS. Ключи у вас.
Сейчас — одна модель. Что появится дальше — решают клиенты.
Inferenca в раннем доступе. Мы стартовали с MiniMax M-2.7, потому что на ней удобно работать с документами и русским юридическим контекстом. Следующие модели добавляем по запросу — порядок формирует голосование тех, кто уже подключён.
MiniMax M-2.7
200k контекст · сильна на длинных документах и извлечении пунктов. Доступна с первого дня.
доступ · сегодняLlama 3.3 70B
Открытые веса, лучший общий reasoning. Железо под неё уже заказано — ждём поставки GPU.
запросили 47 командGLM 5.1
Сильный русский, хорошо идёт на переводных и мультиязычных задачах. Готовим тюнинг под юр. домен.
запросили 29 командЧто развернуть ещё?
Если нужна конкретная модель с открытыми весами — напишите. 20+ запросов запускают закупку железа.
предложить модель →Две вещи, над которыми мы работаем сейчас.
Направления, которые естественно продолжают логику «модель рядом с юрлицом». Не анонс — ранние доступы откроем тем, кто уже подключён к инференсу.
Secure Compute
Инференс внутри доверенной среды (TEE): входные и выходные токены не видит никто — ни мы, ни оператор ЦОД, ни администратор хоста. Только владелец ключа. Подтверждается аттестацией — проверяемо на стороне клиента.
ранний доступ · лето 2026Serverless GPU
Запускайте свои контейнеры с моделями в нашем облаке — без заботы о железе. Холодный старт секунды, оплата по GPU-секундам, размещение в том же российском контуре, что и каталог.
ранний доступ · осень 2026Цена за миллион токенов. Без внезапных списаний.
Все тарифы включают локализацию в РФ, подписанные логи и отсутствие сохранения по умолчанию. Enterprise добавляет выделенные GPU и именного SRE.
Общая мощность
Резерв мощности
Выделенный контур
Запускайте модель внутри юрисдикции. Не рядом с ней.
API-ключ с привязкой к ЦОД в РФ — за две минуты. 100 000 токенов на тест без карты и без сделки.