Вход в MAIA
Standalone-режим использует admin token самого сервиса.
Дашборд
MAIA
admin

Multimodal Artificial Intelligence Assistant - управление и настройка

Состояние сервиса
Загрузка...
Расход за 24 часа
HDE pipeline
Средняя стоимость за 24 часа
на обращение
Ошибки за 24 часа
по обращениям
Обработано за 24 часа
обращений HDE
Среднее время за 24 часа
обработка обращения
P95 за 24 часа
обработка обращения
Профили
Редактор профиля
Цепочка моделей
1 основная + до 2 fallback. Настройки каждой модели редактируются отдельно.
0 символов
Промпты
Редактор промпта
0 символов
HelpDeskEddy
Статус
API key
Департаменты
Webhook только ставит задачу в очередь. Worker обрабатывает разные тикеты параллельно в пределах лимита, один тикет не запускается дважды одновременно.
По одному на строку. Проверяется по user_id, email и имени отправителя до запуска AI.
По одной подстроке на строку. Проверяется только новый необработанный клиентский текст, без учёта регистра.
Добавляет последние внутренние комментарии HDE только в контекст prompt. RAG-поиск и обработка вложений используют клиентские публичные сообщения отдельно.
0 символов
Инструкция перед HDE-контекстом. Здесь фиксируется, какой блок является объектом решения, без привязки backend к конкретной JSON-схеме.
Необработанный блок клиента — объект решения MAIA. Контекст переписки — только справка. Если текст длиннее лимита, сохраняются начало и конец с маркером обрезки.
История ищется только по user_id клиента, затем каждый прошлый тикет превращается в краткий Summary history.
S
Модель для Summary history прошлых тикетов
Сколько прошлых тикетов одновременно отправлять в summary-модель.
0 символов
0 символов
Этот текст попадёт в prompt Main LLM перед summary прошлых тикетов.
Если сообщение длиннее лимита, сохраняются начало и конец сообщения с явным маркером обрезки. Cache hit не добавляет стоимость к текущему запросу.
Новая заявка
Для JSON HDE это не используется: действия берутся из правил конструктора.
Новое сообщение клиента
Для JSON HDE это не используется: действия берутся из правил конструктора.
Работают только для системного профиля JSON HDE. JSON path вводится вручную, конечные варианты выбираются из списков с пояснениями.
Тест по заявке
Последние события
ВремяСобытиеЗаявкаСтатус

Gatekeeper

Лёгкий первый этап HDE: быстро отсеивает спам, пустые обращения и финальные благодарности до основного пайплайна.
Цепочка моделей Gatekeeper
Первая модель основная, следующие используются при ошибке.
0 символов
Поведение

Telemed

Приём события о готовом AI artifact, транскрибация и генерация протокола консультации.
Используется общий ключ OpenRouter из настроек сервиса

Транскрибация

Artifact скачивается из Telemed, при необходимости конвертируется ffmpeg и отправляется в OpenRouter Audio Transcriptions API.
1 основная + до 2 fallback. Выбор через общий каталог моделей.

Протоколирование

Транскрипт передаётся в OpenRouter-модель, результат сохраняется в job и опционально отправляется callback-ом.
1 основная + до 2 fallback. Настройки основной модели редактируются отдельно.
0 символов

Очередь и callback

Результат всегда хранится в Telemed job. Callback можно включить позже, когда будет выбран экран/сущность в telemed.
Настройки RAG
Retrieval, rerank и дефолты для HDE и Wiki.
Дистилляция
Преобразует сырой контекст обращения в короткий поисковый query перед RAG.
Цепочка моделей дистилляции
Первая модель основная, следующие используются при ошибке.
0 символов
0 символов
При смене embedding model будет пересчитан индекс.
Цепочка rerank-моделей
Порядок определяет failover: первая модель основная, следующие используются при ошибке.
Тест retrieval
Проверка поиска и rerank без вызова Main LLM.
Статус сервиса
API
Qdrant
Переиндексация
idle
Синхронизация
idle
Внутренний чат
Ответы сотрудникам по KB, wiki и истории тикетов. Не связан с HDE-автоответами.
Открыть чат
Цепочка моделей ответа
Та же модельная схема, что в остальных разделах: основная + до 2 fallback.
0 символов
RAG и источники
Отдельная политика поиска для внутреннего чата.
Router RAG
Решает, нужен ли retrieval для сообщения, и готовит поисковый query.
Основная модель + fallback-и через общий model picker.
0 символов
История и summary
Старый контекст диалога сжимается, последние сообщения остаются целиком.
0 символов

Медиа

Извлечение полезного контекста из вложений HDE перед вызовом Main LLM.
Модели обработки медиа
Fallback-модели используются автоматически при ошибках модели/provider-а, включая HTTP 400.
0 символов

Типы файлов

Лимиты защищают основной prompt от слишком больших вложений и лишних расходов.

Images

PDF

PDF сначала разбирается локально. Если текст не извлечён, файл передаётся media-модели напрямую.

Audio

Video

Документы

Локальное извлечение текста из документов и краткое summary отдельной моделью перед Main LLM.
Модель summary документов
Fallback-модели используются автоматически при ошибках модели/provider-а, включая HTTP 400.
0 символов

Типы документов

Лимиты применяются к локальному извлечению текста до summary-модели.

PDF с текстовым слоем

DOCX

Text / JSON / XML

CSV / XLSX

ZIP

Расход
HDE-обращения
Средняя стоимость обращения
весь pipeline
Среднее время обработки
HDE pipeline
P95 обработки
обработка обращения
Ошибки
С вложениями
media или документы
Успешность
по всем запросам
Расходы по периоду
Структура расходов
Обработки обращений
Время обработки
Модели и провайдеры
Провайдеры
Самые дорогие запросы
Самые долгие запросы
Последние записи
Время МСК Тикет Аккаунт / логин Профиль Вариант Статус Оценка Тайминги Итого Фрагмент
Общие настройки
Системные дефолты закреплены в сервисе: логи хранятся 3 года, полный request/response сохраняется.
OpenRouter
Кабинет
Обслуживание
Сервисные операции и ручная диагностика.
Тестовый прогон
Проверка профиля без внешних интеграций.