Пилотируем ИИ без потерь. Платите — только за результат.

Быстрые ML/LLM‑пилоты под 152‑ФЗ с измеримым ROI и минимальным риском

Рынок в РФ созрел: бюджетная осторожность, дефицит экспертизы и GPU, требования локализации. PolyGon AI — co‑creation‑лаборатория: проверим ценность за 3–4 недели, внедрим PoC за 6–10, развернём безопасную песочницу в VPC/on‑prem/air‑gap. Success‑fee по заранее согласованным KPI.

Запустить пилот Тарифы и экономика

RAG CV Табличные Синтетика Безопасность MLOps

Success‑fee работает, если инфраструктура/данные на стороне клиента и KPI согласованы заранее.
Мы нормируем риск лимитами и депозитом на твёрдые затраты.

Sandbox • 3–4 недели

● Качество ≥ целевого KPI

152‑ФЗ

● Локализация ПДн • VPC/on‑prem

GPU

А100: до 120 ч • Лимиты зафиксированы

Success‑fee

Оплата по результату при достижении KPI

Проблематика и актуальность

Бизнес‑потребность

Давление на эффективность: автоматизация документооборота, логистики, планирования и контроля качества.
Снижение зависимости от импорта ПО; интерес к open‑source и on‑prem LLM/RAG.
Запрос на быстрые пилоты с измеримым ROI и без «бесконечного ресерча».

Болевые точки

Кадровый дефицит MLE/MLOps/Data Eng; высокая цена ошибки в выборе стеков/моделей.
Дефицит и стоимость GPU; неясный TCO для ИИ‑инициатив.
Данные распределены по системам, нет дата‑контрактов, сложная очистка.
Регуляторика: 152‑ФЗ, ФСТЭК/РКН, безопасные контуры и аудит трейлов.

Почему PolyGon AI (AI‑LAB)

Быстро проверяет ценность без капитальных затрат клиента.
«Песочница» с безопасными контурами: VPC‑изоляция, on‑prem, air‑gap.
Генерация синтетики для обучения без ПДн.
Прозрачные KPI и оплата за результат минимизируют риск.

Модель success‑fee работает, когда: KPI согласованы заранее, инфраструктура/данные на стороне клиента, а наш риск нормирован лимитами и депозитом на твёрдые затраты.

Как это работает

1) Инициация

3–5 пресейл‑интервью, shortlist кейсов, NDA/DPA.
Quick‑scan данных, согласование KPI и SoW.
Выбор контура: on‑prem / локальное облако / air‑gap.

2) Sandbox (3–4 недели)

Два спринта: прототип → замер KPI на тест‑сэмпле.
Генсинтетика при ограничениях по ПДн.
Отчёт по качеству, TCO‑оценка роллаута.

3) Pilot/Co‑creation

Полноценный PoC: интеграция, мониторинг, MLOps.
2–3 кейса с опытной эксплуатацией и планом масштаба.
Success‑fee по KPI и зафиксированным контрольным периодам.

Процессы и артефакты

Data Contracts, схемы и профили данных.
MLflow/DVC для экспериментов и датасетов; Airflow/Kubernetes для оркестрации.
CI/CD для моделей, верифицируемые билды, audit trail.
Отчёты: качество, бенчмарки, bias/дрейф, TCO/ROI.

Безопасность и 152‑ФЗ

Контуры

On‑prem у клиента, частный кластер в локальном облаке РФ, или air‑gapped стенд.
Локализация ПДн, DPIA, договоры поручения обработки.

Доступ и секреты

IAM по ролям, KMS/HSM, шифрование в покое/транзите.
Политика секретов (Vault), IP allow‑list, журналирование.

Процессы и аудит

Data masking/анонимизация, контроль версий данных.
Audit trail и верифицируемые билды, экспорт артефактов.

Больше о комплаенсе

ФСТЭК/РКН: режимы защищённой разработки, отчётность.
Внешние API применяются только при отсутствии ПДн или через прокси с анонимизацией.

Демо: живые сценарии на синтетических данных

Call & Support Summarizer

Автосаммари диалогов, классификация причин обращений, Next Best Action.

Сокращение AHT: $AHT_{base} - AHT_{new}$; эффект: $E = \Delta AHT \cdot N_{calls} \cdot C_{min}$

Точность классификации: $F1 \geq F1_{target}$ на hold‑out; доля автоклассификаций ≥ X%

Качество саммари: QAS/BLEU/ROUGE ≥ целевых; manual accept‑rate ≥ Y%

NBA uplift: $U = (CR_{NBA}-CR_{base}) \cdot N_{offers} \cdot GM$

Мини‑пример (синтетика)

Диалог: «Глючит доставка, приложение виснет».
Саммари: «Проблема с доставкой и стабильностью приложения; предложен перенос слота, эскалация в DevOps.»

Класс причины: «Логистика/Сбой приложения».
NBA: «Перенос на +1 слот, скидка 10%, тикет в команде мобильного клиента.»

RAG‑ассистент по базе знаний

Поиск по регламентам/FAQ/Confluence с цитированием и контролем галлюцинаций.

Exact‑match answer rate: $EM \geq EM_{target}$ на валидсете

Faithfulness/Attribution: доля ответов с корректными цитатами ≥ X%

Контроль галлюцинаций: $H \leq H_{max}$; self‑check/contradiction‑rate ↓

Эффект: $E = \Delta FCR \cdot N_{tickets} \cdot C_{touch}$; TTR ↓

Мини‑пример (синтетика)

Вопрос: «Как оформить возврат для B2B?»
Ответ: «Верните в течение 14 дней…»
Источник: «Политика возвратов v3.2, §4.1».

Механика: BM25+Hybrid, rerank, контекст ≤ 2k токенов, цитирование и риск‑скоринг.

Все демонстрации используют синтетические данные.

Техстек

Инфраструктура

Yandex Cloud VK Cloud SberCloud Selectel On‑prem (VPC/air‑gap)

Модели

GigaChat API YandexGPT Llama/Mistral RU‑LLM on‑prem RAG

Хранилища

S3‑совместимые ClickHouse Greenplum PostgreSQL Qdrant/pgvector

Оркестрация/MLOps

MLflow DVC Airflow Kubernetes Keycloak Vault

Безопасность

KMS IAM Audit trail IP allow‑list Шифрование в покое/транзите

Экономика и тарифы

Sandbox • 3–4 недели

Быстрый чек идеи

0.9–1.4 млн ₽

Команда: DE 0.5, MLE 0.5, PM 0.25
GPU: 40 ч V100/A100; Storage: 200 ГБ
Success: метрика на тест‑сэмпле, готовность к масштабу

Расчёт

$C_{labor} = 300k \cdot 0.5 \cdot 1 + 400k \cdot 0.5 \cdot 1 + 250k \cdot 0.25 \cdot 1 = 150k + 200k + 62.5k = 412.5k$ ₽
$C_{labor,oh} = 412.5k \cdot 1.3 \approx 536k$ ₽
$C_{gpu} \approx 40 \cdot 350 = 14k$ ₽ (V100) или $40 \cdot 800 = 32k$ ₽ (A100)
$C_{other} \approx 10k$ ₽
$C_{total} \approx 560k$ ₽ (с A100 — ~578k)
$P = C_{total} \cdot 1.4 \approx 0.78{-}0.81$ млн ₽

Клиент покрывает инфру или депозит 150–250k ₽.

Pilot • 6–10 недель

Полноценный PoC (1 кейс)

2.2–3.5 млн ₽

Команда: DE 1.0, MLE 0.75, MLOps 0.25, PM 0.5
GPU: 80–120 ч A100; Storage: 0.5–1 ТБ
Опция success‑fee: 0.8–1.5 млн ₽ или 1–3% годовой выгоды

Расчёт

$C_{labor} = 300k \cdot 1 \cdot 2 + 400k \cdot 0.75 \cdot 2 + 300k \cdot 0.25 \cdot 2 + 250k \cdot 0.5 \cdot 2$
$= 600k + 600k + 150k + 250k = 1.6$ млн ₽
$C_{labor,oh} = 1.6 \cdot 1.3 \approx 2.08$ млн ₽
$C_{gpu} = 100 \cdot 800 = 80k$ ₽; $C_{other} \approx 40k$ ₽
$C_{total} \approx 2.2$ млн ₽; $P = 2.2 \cdot 1.4 \approx 3.1$ млн ₽

Депозит 300–500k ₽ на твёрдые затраты.

Enterprise Co‑creation • 12–16 недель

2–3 кейса + опытн. эксплуатация

10–15 млн ₽ пакетно или 5–9 млн ₽/кейс

Команда: DE 2.0, MLE 2.0, MLOps 1.0, PM 1.0, UX/FE 0.5
GPU: 250–400 ч A100; Storage: 2–3 ТБ
Success‑fee: 2–5% годовой выгоды или фикс 5–15 млн ₽

Расчёт

$C_{labor} = 300k \cdot 2 \cdot 3.5 + 400k \cdot 2 \cdot 3.5 + 300k \cdot 1 \cdot 3.5 + 250k \cdot 1 \cdot 3.5 + 220k \cdot 0.5 \cdot 3.5$
$= 2.1 + 2.8 + 1.05 + 0.875 + 0.385 \approx 7.21$ млн ₽
$C_{labor,oh} \approx 7.21 \cdot 1.3 \approx 9.37$ млн ₽
$C_{gpu} \approx 300 \cdot 800 = 240k$ ₽; $C_{other} \approx 150k$ ₽
$C_{total} \approx 9.76$ млн ₽; $P = 9.76 \cdot 1.4 \approx 13.7$ млн ₽

Снижение ставок при совместном финансировании/ресурсах клиента.

Опция «бесплатно при неуспехе». До старта фиксируем: метрику, датасет, сценарий внедрения, контрольные периоды, кто и как считает выгоду. Ограничиваем риск лимитами человеко‑недель и GPU‑часов. Клиент покрывает инфраструктуру/разметку/лицензии или вносит возвратный депозит. В случае фейла — передаём код, отчёты и модель.

Быстрый калькулятор выгоды и success‑fee

Тип кейса

Объём в месяц (штук/часов)

Экономия на единицу (₽) / Δконверсия

Маржа/стоимость (₽)

Оценка годовой выгоды (приблизительно)

—

Ориентир success‑fee: 1–5% от выгоды (с потолком по SoW)

Показатели ориентировочные и не являются офертой.

Кейсы и KPI

Контакт‑центр

AHT −15–25%, FCR +5–10 п.п., качество саммари ≥ целевого.
Экономия: $E \approx \Delta AHT \cdot N_{calls} \cdot C_{min}$

Внутренний RAG

EM +15–30 п.п., снижение времени ответа ×2–×4.
Эффект: $E \approx \Delta FCR \cdot N_{tickets} \cdot C_{touch}$

Документооборот

Автоклассификация, извлечение, маршрутизация.
Снижение ручного труда на 30–60% с контролем качества.

Как фиксируем KPI

Метрики, выборки и методика подсчёта согласуются и фиксируются в SoW.
Порог успеха, контрольные периоды, объём пилота и критерии «готов к масштабу» — до старта работ.
Дашборд прогресса и отчёты: качество, стабильность, дрейф.

FAQ

Сроки

Sandbox: 3–4 недели; Pilot: 6–10; Enterprise: 12–16.

Инфраструктура

Предпочтительно — клиентская. Можем привезти «мобильный кластер» или арендовать в локальном облаке.

Модели и API

Используем локальные/on‑prem модели. Внешние API — только без ПДн или через прокси с анонимизацией.

Интеллектуальная собственность

Заказчик получает неисключительные права на артефакты PoC. Библиотечный код остаётся нашей IP.

Как стартовать за 30 дней

Неделя 1

3–5 пресейл‑интервью, shortlist кейсов, NDA/DPA.

Неделя 2

Data quick‑scan, KPI/SoW, выбор контура (on‑prem/облако).

Неделя 3

Запуск Sandbox для 1–2 кейсов.

Неделя 4

Метрики и TCO‑оценка роллаута, план пилота.

Контакты

PolyGon AI

Email: mk@karimco.ru
Telegram: @karimcoceo
Местонахождение: РФ
Часы работы: Пн–Пт 10:00–19:00 МСК

Предпочтительно старт в клиентской инфраструктуре или в выделенном приватном контуре локального облака (RUS).