Пилотируем ИИ без потерь. Платите — только за результат.
Быстрые ML/LLM‑пилоты под 152‑ФЗ с измеримым ROI и минимальным риском
Рынок в РФ созрел: бюджетная осторожность, дефицит экспертизы и GPU, требования локализации. PolyGon AI — co‑creation‑лаборатория: проверим ценность за 3–4 недели, внедрим PoC за 6–10, развернём безопасную песочницу в VPC/on‑prem/air‑gap. Success‑fee по заранее согласованным KPI.
RAG CV Табличные Синтетика Безопасность MLOps
- Success‑fee работает, если инфраструктура/данные на стороне клиента и KPI согласованы заранее.
- Мы нормируем риск лимитами и депозитом на твёрдые затраты.
Sandbox • 3–4 недели
● Качество ≥ целевого KPI
152‑ФЗ
● Локализация ПДн • VPC/on‑prem
GPU
А100: до 120 ч • Лимиты зафиксированы
Success‑fee
Оплата по результату при достижении KPI
Проблематика и актуальность
Бизнес‑потребность
- Давление на эффективность: автоматизация документооборота, логистики, планирования и контроля качества.
- Снижение зависимости от импорта ПО; интерес к open‑source и on‑prem LLM/RAG.
- Запрос на быстрые пилоты с измеримым ROI и без «бесконечного ресерча».
Болевые точки
- Кадровый дефицит MLE/MLOps/Data Eng; высокая цена ошибки в выборе стеков/моделей.
- Дефицит и стоимость GPU; неясный TCO для ИИ‑инициатив.
- Данные распределены по системам, нет дата‑контрактов, сложная очистка.
- Регуляторика: 152‑ФЗ, ФСТЭК/РКН, безопасные контуры и аудит трейлов.
Почему PolyGon AI (AI‑LAB)
- Быстро проверяет ценность без капитальных затрат клиента.
- «Песочница» с безопасными контурами: VPC‑изоляция, on‑prem, air‑gap.
- Генерация синтетики для обучения без ПДн.
- Прозрачные KPI и оплата за результат минимизируют риск.
Модель success‑fee работает, когда: KPI согласованы заранее, инфраструктура/данные на стороне клиента, а наш риск нормирован лимитами и депозитом на твёрдые затраты.
Как это работает
1) Инициация
- 3–5 пресейл‑интервью, shortlist кейсов, NDA/DPA.
- Quick‑scan данных, согласование KPI и SoW.
- Выбор контура: on‑prem / локальное облако / air‑gap.
2) Sandbox (3–4 недели)
- Два спринта: прототип → замер KPI на тест‑сэмпле.
- Генсинтетика при ограничениях по ПДн.
- Отчёт по качеству, TCO‑оценка роллаута.
3) Pilot/Co‑creation
- Полноценный PoC: интеграция, мониторинг, MLOps.
- 2–3 кейса с опытной эксплуатацией и планом масштаба.
- Success‑fee по KPI и зафиксированным контрольным периодам.
Процессы и артефакты
- Data Contracts, схемы и профили данных.
- MLflow/DVC для экспериментов и датасетов; Airflow/Kubernetes для оркестрации.
- CI/CD для моделей, верифицируемые билды, audit trail.
- Отчёты: качество, бенчмарки, bias/дрейф, TCO/ROI.
Безопасность и 152‑ФЗ
Контуры
- On‑prem у клиента, частный кластер в локальном облаке РФ, или air‑gapped стенд.
- Локализация ПДн, DPIA, договоры поручения обработки.
Доступ и секреты
- IAM по ролям, KMS/HSM, шифрование в покое/транзите.
- Политика секретов (Vault), IP allow‑list, журналирование.
Процессы и аудит
- Data masking/анонимизация, контроль версий данных.
- Audit trail и верифицируемые билды, экспорт артефактов.
Больше о комплаенсе
- ФСТЭК/РКН: режимы защищённой разработки, отчётность.
- Внешние API применяются только при отсутствии ПДн или через прокси с анонимизацией.
Демо: живые сценарии на синтетических данных
Call & Support Summarizer
Автосаммари диалогов, классификация причин обращений, Next Best Action.
Сокращение AHT: $AHT_{base} - AHT_{new}$; эффект: $E = \Delta AHT \cdot N_{calls} \cdot C_{min}$
Точность классификации: $F1 \geq F1_{target}$ на hold‑out; доля автоклассификаций ≥ X%
Качество саммари: QAS/BLEU/ROUGE ≥ целевых; manual accept‑rate ≥ Y%
NBA uplift: $U = (CR_{NBA}-CR_{base}) \cdot N_{offers} \cdot GM$
Мини‑пример (синтетика)
Диалог: «Глючит доставка, приложение виснет».
Саммари: «Проблема с доставкой и стабильностью приложения; предложен перенос слота, эскалация в DevOps.»
Саммари: «Проблема с доставкой и стабильностью приложения; предложен перенос слота, эскалация в DevOps.»
Класс причины: «Логистика/Сбой приложения».
NBA: «Перенос на +1 слот, скидка 10%, тикет в команде мобильного клиента.»
NBA: «Перенос на +1 слот, скидка 10%, тикет в команде мобильного клиента.»
RAG‑ассистент по базе знаний
Поиск по регламентам/FAQ/Confluence с цитированием и контролем галлюцинаций.
Exact‑match answer rate: $EM \geq EM_{target}$ на валидсете
Faithfulness/Attribution: доля ответов с корректными цитатами ≥ X%
Контроль галлюцинаций: $H \leq H_{max}$; self‑check/contradiction‑rate ↓
Эффект: $E = \Delta FCR \cdot N_{tickets} \cdot C_{touch}$; TTR ↓
Мини‑пример (синтетика)
Вопрос: «Как оформить возврат для B2B?»
Ответ: «Верните в течение 14 дней…»
Источник: «Политика возвратов v3.2, §4.1».
Ответ: «Верните в течение 14 дней…»
Источник: «Политика возвратов v3.2, §4.1».
Механика: BM25+Hybrid, rerank, контекст ≤ 2k токенов, цитирование и риск‑скоринг.
Все демонстрации используют синтетические данные.
Техстек
Инфраструктура
Yandex Cloud VK Cloud SberCloud Selectel On‑prem (VPC/air‑gap)
Модели
GigaChat API YandexGPT Llama/Mistral RU‑LLM on‑prem RAG
Хранилища
S3‑совместимые ClickHouse Greenplum PostgreSQL Qdrant/pgvector
Оркестрация/MLOps
MLflow DVC Airflow Kubernetes Keycloak Vault
Безопасность
KMS IAM Audit trail IP allow‑list Шифрование в покое/транзите
Экономика и тарифы
Sandbox • 3–4 недели
Быстрый чек идеи
0.9–1.4 млн ₽
- Команда: DE 0.5, MLE 0.5, PM 0.25
- GPU: 40 ч V100/A100; Storage: 200 ГБ
- Success: метрика на тест‑сэмпле, готовность к масштабу
Расчёт
$C_{labor} = 300k \cdot 0.5 \cdot 1 + 400k \cdot 0.5 \cdot 1 + 250k \cdot 0.25 \cdot 1 = 150k + 200k + 62.5k = 412.5k$ ₽
$C_{labor,oh} = 412.5k \cdot 1.3 \approx 536k$ ₽
$C_{gpu} \approx 40 \cdot 350 = 14k$ ₽ (V100) или $40 \cdot 800 = 32k$ ₽ (A100)
$C_{other} \approx 10k$ ₽
$C_{total} \approx 560k$ ₽ (с A100 — ~578k)
$P = C_{total} \cdot 1.4 \approx 0.78{-}0.81$ млн ₽
$C_{labor,oh} = 412.5k \cdot 1.3 \approx 536k$ ₽
$C_{gpu} \approx 40 \cdot 350 = 14k$ ₽ (V100) или $40 \cdot 800 = 32k$ ₽ (A100)
$C_{other} \approx 10k$ ₽
$C_{total} \approx 560k$ ₽ (с A100 — ~578k)
$P = C_{total} \cdot 1.4 \approx 0.78{-}0.81$ млн ₽
Клиент покрывает инфру или депозит 150–250k ₽.
Pilot • 6–10 недель
Полноценный PoC (1 кейс)
2.2–3.5 млн ₽
- Команда: DE 1.0, MLE 0.75, MLOps 0.25, PM 0.5
- GPU: 80–120 ч A100; Storage: 0.5–1 ТБ
- Опция success‑fee: 0.8–1.5 млн ₽ или 1–3% годовой выгоды
Расчёт
$C_{labor} = 300k \cdot 1 \cdot 2 + 400k \cdot 0.75 \cdot 2 + 300k \cdot 0.25 \cdot 2 + 250k \cdot 0.5 \cdot 2$
$= 600k + 600k + 150k + 250k = 1.6$ млн ₽
$C_{labor,oh} = 1.6 \cdot 1.3 \approx 2.08$ млн ₽
$C_{gpu} = 100 \cdot 800 = 80k$ ₽; $C_{other} \approx 40k$ ₽
$C_{total} \approx 2.2$ млн ₽; $P = 2.2 \cdot 1.4 \approx 3.1$ млн ₽
$= 600k + 600k + 150k + 250k = 1.6$ млн ₽
$C_{labor,oh} = 1.6 \cdot 1.3 \approx 2.08$ млн ₽
$C_{gpu} = 100 \cdot 800 = 80k$ ₽; $C_{other} \approx 40k$ ₽
$C_{total} \approx 2.2$ млн ₽; $P = 2.2 \cdot 1.4 \approx 3.1$ млн ₽
Депозит 300–500k ₽ на твёрдые затраты.
Enterprise Co‑creation • 12–16 недель
2–3 кейса + опытн. эксплуатация
10–15 млн ₽ пакетно или 5–9 млн ₽/кейс
- Команда: DE 2.0, MLE 2.0, MLOps 1.0, PM 1.0, UX/FE 0.5
- GPU: 250–400 ч A100; Storage: 2–3 ТБ
- Success‑fee: 2–5% годовой выгоды или фикс 5–15 млн ₽
Расчёт
$C_{labor} = 300k \cdot 2 \cdot 3.5 + 400k \cdot 2 \cdot 3.5 + 300k \cdot 1 \cdot 3.5 + 250k \cdot 1 \cdot 3.5 + 220k \cdot 0.5 \cdot 3.5$
$= 2.1 + 2.8 + 1.05 + 0.875 + 0.385 \approx 7.21$ млн ₽
$C_{labor,oh} \approx 7.21 \cdot 1.3 \approx 9.37$ млн ₽
$C_{gpu} \approx 300 \cdot 800 = 240k$ ₽; $C_{other} \approx 150k$ ₽
$C_{total} \approx 9.76$ млн ₽; $P = 9.76 \cdot 1.4 \approx 13.7$ млн ₽
$= 2.1 + 2.8 + 1.05 + 0.875 + 0.385 \approx 7.21$ млн ₽
$C_{labor,oh} \approx 7.21 \cdot 1.3 \approx 9.37$ млн ₽
$C_{gpu} \approx 300 \cdot 800 = 240k$ ₽; $C_{other} \approx 150k$ ₽
$C_{total} \approx 9.76$ млн ₽; $P = 9.76 \cdot 1.4 \approx 13.7$ млн ₽
Снижение ставок при совместном финансировании/ресурсах клиента.
Опция «бесплатно при неуспехе». До старта фиксируем: метрику, датасет, сценарий внедрения, контрольные периоды, кто и как считает выгоду. Ограничиваем риск лимитами человеко‑недель и GPU‑часов. Клиент покрывает инфраструктуру/разметку/лицензии или вносит возвратный депозит. В случае фейла — передаём код, отчёты и модель.
Быстрый калькулятор выгоды и success‑fee
Оценка годовой выгоды (приблизительно)
—
Ориентир success‑fee: 1–5% от выгоды (с потолком по SoW)
Показатели ориентировочные и не являются офертой.
Кейсы и KPI
Контакт‑центр
- AHT −15–25%, FCR +5–10 п.п., качество саммари ≥ целевого.
- Экономия: $E \approx \Delta AHT \cdot N_{calls} \cdot C_{min}$
Внутренний RAG
- EM +15–30 п.п., снижение времени ответа ×2–×4.
- Эффект: $E \approx \Delta FCR \cdot N_{tickets} \cdot C_{touch}$
Документооборот
- Автоклассификация, извлечение, маршрутизация.
- Снижение ручного труда на 30–60% с контролем качества.
Как фиксируем KPI
- Метрики, выборки и методика подсчёта согласуются и фиксируются в SoW.
- Порог успеха, контрольные периоды, объём пилота и критерии «готов к масштабу» — до старта работ.
- Дашборд прогресса и отчёты: качество, стабильность, дрейф.
FAQ
Сроки
Sandbox: 3–4 недели; Pilot: 6–10; Enterprise: 12–16.
Инфраструктура
Предпочтительно — клиентская. Можем привезти «мобильный кластер» или арендовать в локальном облаке.
Модели и API
Используем локальные/on‑prem модели. Внешние API — только без ПДн или через прокси с анонимизацией.
Интеллектуальная собственность
Заказчик получает неисключительные права на артефакты PoC. Библиотечный код остаётся нашей IP.
Как стартовать за 30 дней
Неделя 1
3–5 пресейл‑интервью, shortlist кейсов, NDA/DPA.
Неделя 2
Data quick‑scan, KPI/SoW, выбор контура (on‑prem/облако).
Неделя 3
Запуск Sandbox для 1–2 кейсов.
Неделя 4
Метрики и TCO‑оценка роллаута, план пилота.
Контакты
PolyGon AI
- Email: mk@karimco.ru
- Telegram: @karimcoceo
- Местонахождение: РФ
- Часы работы: Пн–Пт 10:00–19:00 МСК
Предпочтительно старт в клиентской инфраструктуре или в выделенном приватном контуре локального облака (RUS).
