ЗАЯВКА НА ГРАНТ SELECTEL

От разрозненных AI-контуров к единому AI-runtime

2А развивает десятки прикладных ML-систем для флексопечати и производственных процессов. На лендинге показаны 5 разных кейсов, уже работающих внутри компании. Цель гранта — собрать единый ресурс для инференса, обучения и экспериментов: GPU, storage, очереди batch-задач и self-hosted LLM-контур.

  • Одна общая потребность: собрать единый runtime вместо разрозненной инфраструктуры
  • Внутренние данные и heavy inference требуют self-hosted контура
Внутренний контур перегружен количеством вендоров, которые мы применяем для задач мониторинга, выкладки, хранения чувствительных данных, тестов и обучения моделей
DINO / CV / Homography GigaAM / Pyannote / Speaker ID CatBoost / ResNet / PDF Qdrant / RAG / Rerank KNN / Pricing / Bitrix
Упаковка 2А как основной визуальный образ лендинга
2А · ACTIVE AI STACK

Сначала коротко: где AI уже используется внутри 2А

Ниже — пять уже работающих систем: сначала их можно быстро просканировать, затем перейти к инфраструктурной логике и детальным кейсам по каждому направлению.

01

Flexotechcard

PDF-макеты превращаются в техкарту через ResNet, bouncing-проверки и каскад CatBoost.

Нужен GPU для batch-inference и переобучения
02

Flexo RAG

Технологи получают ответы по техкартам и дефектологии в рабочем контуре через локальный retrieval.

Нужен self-hosted LLM и runtime для индексов
03

Audioanaliz

ASR, speaker identity и оценка качества превращают звонки в масштабируемый QA-контур.

Нужен GPU для массовой обработки и локальной LLM-оценки
04

Synaplex / DINO CV

Система выравнивает макеты и изображения, находит расхождения и информирует о изменениях.

Нужен ресурс для DINO/Open-CD train и infer
05

Cost / KNN / Bitrix

ML достраивает недостающие параметры заказа, а формульное ядро считает себестоимость и бизнес-логику.

Нужна единая среда для масштабирования расчётов

Наша разработка завязана на data-driven, мы находимся в узкой доменной области и нуждаемся в постоянном обучении моделей.

Все продукты работают на внутренних чувствительных производственных данных: макеты, техкарты, заказы, голоса операторов, дефектология, расчёты. Компания постоянно дообучает модели, переоценивает качество и имеет стабильный загруженный инференс. Для нас является важным шагом обьединение всех контуров в единую инфраструктуру.

TRAIN

Постоянное обучение

DINO обучалась на макетах компании, GigaAM дообучалась на внутренних звонках, CatBoost и KNN опираются на производственную историю. Пайплайн обновляется по мере появления новых данных.

INFERENCE

Постоянный inference

CV, ASR, retrieval и калькуляторы уже задействованы в рабочих задачах. Нужен стабильный compute-контур.

DATA

Внутренние данные

Звонки, макеты, техкарты и себестоимость остаются внутри компании. Это требует self-hosted среды для модели, индексов, артефактов и чекпоинтов, необходимо минимизировать зависимость от сторонних вендеров LLM.

RUNTIME

Единая платформа

Грант Selectel нужен, чтобы собрать единый AI-runtime: GPU, S3-совместимое хранение, выделенные сервисы для retrieval и безопасные среды для train/staging.

Поток данных и упаковки
DATA → TRAIN → TESTS → PREDICT
PDF ResNet CatBoost Bounce Detector

Техкарта как производственный рецепт

Стек собирает сигналы из нескольких контуров: ResNet достаёт визуальные признаки из PDF-макета, bouncing-проверка ищет опасные зоны стыка и перекрытий, а каскад CatBoost-моделей доводит это до техкарты для печати.

Не единый классификатор, а ветковидный производственный пайплайн: visual features, физические ограничения, доменная логика и post-processing должны жить в одном стабильном runtime.

BOTTLENECK

Batch inference по PDF-макетам и переобучение визуального контура упираются в compute.

SELECTEL

GPU для train/infer по макетам, S3 для моделей, чекпоинтов и исторических feature-артефактов.

NEXT

Ускорить цикл переобучения и протестировать более тяжёлые backbone вместо упора в CPU-only сценарии.

Флексографский вал и признаки макета
RESNET FEATURES · CATBOOST HEADS
BOUNCING ANALYSIS
Граф технологических знаний флексопечати
RECIPE GRAPH · 0 nodes
FastAPI Qdrant Hybrid Search RRF Fusion

Доменный агент по флексопечати

Локальный RAG-сервис для технологов и печатников. Поиск по исторческим техкартам, рецептам и дефектологии -> ответ в рабочем контуре через Bitrix

Hybrid search реализован следующим образом: dense + sparse ветки, RRF fusion, metadata filters, delete-by-source при reingest и eval-утилиты Recall/MRR/nDCG. Санитизированная SQLite-база техкарт содержит 407151 строку, следующий шаг — заменить внешний inference собственным доменным обученным LLM-контуром.

BOTTLENECK

LLM inference и суммаризация зависят от внешних вендоров, а vector-контур живёт отдельно от общего runtime.

SELECTEL

GPU под Qwen-class inference и fine-tune, выделенный runtime для Qdrant, storage для индексов и эмбеддингов.

NEXT

Обучить доменную LLM на базе техкарт и дефектологии, убрать зависимость от внешнего API в production.

RAG CHAT
При печати на BOPP с высокой суммарной заливкой и мелким растром появляется грязная печать, локальное забивание растров и нестабильный перенос в зоне перехода плашка-растр. Как диагностически отделить влияние анилокса от влияния вязкости краски, давления ракеля, температуры сушки и раннего подсыхания на форме?
1. Сначала разделить геометрию переноса и реологию: сверить line count и volume анилокса с фактической coverage в дефектной зоне, не меняя остальные параметры. 2. Затем отдельно пройти по механике ракельной камеры: давление, износ полотна, стабильность контакта и равномерность съёма по ширине. 3. После этого проверить химико-технологический блок: вязкость, температуру, скорость потока и окно подсыхания, особенно если дефект усиливается на переходах плашка-растр.
QdrantRerankBitrix
ASR Speaker ID Pyannote Qwen Distillation

Звонки: ASR, speaker identity и оценка качества

Контур анализирует звонки отделов: распознаёт речь, отделяет оператора от клиента, привязывает результат к конкретному голосовому отпечатку и формирует оценку качества. Стек: pyannote, nvidia nemotron, silero vad. GigaAM v3 работает локально и дообучалась на внутренних звонках компании.

ASR · SPEAKER ID · QA SCORE

Enrollment вместо generic diarization

Speaker identity идёт через галерею операторов, embeddings и KNN/PLDA-контур. Это позволяет оценивать качество по конкретному сотруднику и формировать понятный отчет в конце месяца по каждому сотруднику.

GigaAM дообучена на звонках компании

ASR построен на GigaAM v3 e2e RNN-T, адаптированной на внутренних разговорах. Silero VAD убирает тишину, на выходе - timestamp транскрибация с отчетом по ключевым критерям.

AGENTIC specialist

LLM заполняет долгосрочную память по звонкам, формирует графовую память по каждому сотруднику.

План дистилляции Qwen

Уже обработанные GPT-отчёты используются как teacher-сигнал. Следующий этап — дистиллировать Qwen для массовой локальной оценки качества без дорогого внешнего inference.

BOTTLENECK

GigaAM и pyannote требуют GPU для приемлемой скорости, а массовая оценка качества пока слишком дорога на внешнем inference из-за LLM.

SELECTEL

GPU для batch-обработки звонков, S3 для аудио-артефактов и отчётов, ресурс под дистилляцию Qwen на размеченных данных.

NEXT

Перевести QA-оценку звонков в локальный контур и масштабировать анализ на весь поток звонков.

DINO v3 Open-CD Homography Change Detection

Контроль макетов и расхождений

Synaplex сравнивает цифровой макет и контрольное изображение, выравнивает пары через alignment pipeline и строит heatmap расхождений. DINO дообучена на макетах компании и используется как производственный feature-контур.

Синтетический датасет для дообучения, полностью локальный контур проверки, путь от homography > dino change detection > yolo text detector > OCR > проверка орфографии fuzzy алгоритмами

BOTTLENECK

DINO inference и дообучение change-detection контура слишком тяжёлые для текущих ресурсов.

SELECTEL

GPU для DINO/Open-CD train/infer, S3 для отчетов, alignment-артефактов и checkpoint storage.

NEXT

Собрать CV-контур для станков и перейти от единичных проверок к системному batch-контролю макетов.

CV-контроль макетов и synthetic changes
DINO FEATURES · CHANGE MAP
KNN Pricing Bitrix Handoff

ML достраивает входы, формулы считают деньги

Калькулятор себестоимости продукции, модель предсказывает недостающие печатные параметры по историческим заказам для новых заказчиков. Дальше расчёт идёт через детерминированное формульное ядро и формирует бизнес-процесс.

BOTTLENECK

Нужен общий ресурс для масштабирования расчётов на большее число сценариев и построения ML-контура вокруг экономики заказов.

SELECTEL

CPU/staging-серверы, S3 для истории заказов и ML-артефактов, отдельная среда для экспериментов с формулами и моделями.

NEXT

Контур будет масштабироваться на все расчёты компании, формируя сетку моделей для предсказания экономических показателей: себестоимость, чувствительность к параметрам заказа, поведение материалов и отклонения от ожидаемой маржи.

Здесь нужны трансформеры для работы с разнородными таблично-текстовыми входами, историей заказов, спецификациями и последующего извлечения скрытых экономических зависимостей между типом заказа, материалом, печатью и итоговой экономикой.

Контур расчета себестоимости и производственный поток
KNN → FORMULAS → BITRIX
KNN NEIGHBOR SEARCH
Инфраструктурный стек для моделей 2А
SELECTEL STACK

Что именно даст грант работающим AI-контурам

Грант необходим на сборку общего слоя для уже работающих систем: единый GPU/runtime для train+infer, self-hosted inference и доменные модели, а также дальнейшее масштабирование AI-контуров на новые производственные и экономические задачи.

3 MONTHS

Единый GPU/runtime для train+infer

Поднять общий GPU-контур для DINO, ASR и тяжёлого inference, вынести артефакты и датасеты в общий storage и собрать повторяемый batch-runtime для обучения и эксплуатации.

6 MONTHS

Self-hosted inference и доменные модели

Запустить дистилляцию Qwen, укрепить retrieval без внешнего API и перевести часть inference в собственный доменный model layer.

12 MONTHS

Масштабирование на новые производственные и экономические задачи

Расширить AI-runtime на новые контуры компании: доменная LLM, CV-контуры для станков и сетка моделей для расчётных, производственных и аналитических сценариев.

grant_plan.yaml