Multimodal Artificial Intelligence Assistant - управление и настройка

Кабинет OpenRouter

Состояние сервиса

Загрузка...

Расход за 24 часа

—

HDE pipeline

Средняя стоимость за 24 часа

—

на обращение

Ошибки за 24 часа

—

по обращениям

Обработано за 24 часа

—

обращений HDE

Среднее время за 24 часа

—

обработка обращения

P95 за 24 часа

—

обработка обращения

Профили

Редактор профиля

Код

Название

Описание

Промпт

Формат ответа

Статус Профиль активен

Override системного промпта

0 символов

Промпты

Редактор промпта

Код

Название

Описание

System prompt

0 символов

Промпт активен

HelpDeskEddy

Статус

—

API key

—

Департаменты

—

Интеграция включена Dry-run: не писать в HDE

HDE base URL

API email

API key

Webhook secret

Политика безопасности

Задержка вебхука, сек

Лимит автоответов на тикет

Департаменты

Очередь обработки

Параллельно тикетов

Lock job, сек

Попыток

Retry backoff, сек

Webhook только ставит задачу в очередь. Worker обрабатывает разные тикеты параллельно в пределах лимита, один тикет не запускается дважды одновременно.

Фильтры до обработки

Заблокированные отправители

По одному на строку. Проверяется по user_id, email и имени отправителя до запуска AI.

Блокировать по подстроке

По одной подстроке на строку. Проверяется только новый необработанный клиентский текст, без учёта регистра.

Префикс внутреннего комментария

Включать внутренние комментарии в контекст

Добавляет последние внутренние комментарии HDE только в контекст prompt. RAG-поиск и обработка вложений используют клиентские публичные сообщения отдельно.

Контекст для Main LLM

0 символов

Инструкция перед HDE-контекстом. Здесь фиксируется, какой блок является объектом решения, без привязки backend к конкретной JSON-схеме.

Заголовок необработанного блока

Если необработанного блока нет

Заголовок контекста заявки

Заголовок сообщений в заявке

Если сообщений в заявке нет

Заголовок истории клиента

Заголовок контекста вложений

Лимиты prompt-контекста

Необработанный блок клиента

Одно необработанное сообщение

Контекст переписки

Одно сообщение истории

Необработанный блок клиента — объект решения MAIA. Контекст переписки — только справка. Если текст длиннее лимита, сохраняются начало и конец с маркером обрезки.

Добавлять историю клиента из предыдущих тикетов

История ищется только по user_id клиента, затем каждый прошлый тикет превращается в краткий Summary history.

—

Модель для Summary history прошлых тикетов

Период истории, дней

Макс. прошлых тикетов

Макс. символов в одном сообщении истории

Параллельных summary

Сколько прошлых тикетов одновременно отправлять в summary-модель.

Prompt для summary-модели

0 символов

Инструкция для блока Summary history

0 символов

Этот текст попадёт в prompt Main LLM перед summary прошлых тикетов.

Если сообщение длиннее лимита, сохраняются начало и конец сообщения с явным маркером обрезки. Cache hit не добавляет стоимость к текущему запросу.

Политики по событиям

Новая заявка

Активно

Профиль

Куда писать ответ обычного профиля

Для JSON HDE это не используется: действия берутся из правил конструктора.

Промпт B

Промпт C

Новое сообщение клиента

Активно

Профиль

Куда писать ответ обычного профиля

Для JSON HDE это не используется: действия берутся из правил конструктора.

Промпт B

Промпт C

Webhook URL

—

Новая заявка

—

Новое сообщение клиента

—

Безопасность

—

Тест по заявке

Ticket ID

Только сгенерировать, не писать в HDE

—

Dry-run правил на JSON

Событие

—

Последние события

Время	Событие	Заявка	Статус

Gatekeeper

Лёгкий первый этап HDE: быстро отсеивает спам, пустые обращения и финальные благодарности до основного пайплайна.

Gatekeeper включён

—

Промпт Gatekeeper

0 символов

Поведение

—

Telemed

Приём события о готовом AI artifact, транскрибация и генерация протокола консультации.

Интеграция включена

Telemed API URL

Webhook secret

Telemed admin token

OpenRouter key

Используется общий ключ OpenRouter из настроек сервиса

Webhook URL для telemed

—

Транскрибация

Artifact скачивается из Telemed, при необходимости конвертируется ffmpeg и отправляется в OpenRouter Audio Transcriptions API.

Протоколирование

Транскрипт передаётся в OpenRouter-модель, результат сохраняется в job и опционально отправляется callback-ом.

Prompt протоколирования

0 символов

Очередь и callback

Результат всегда хранится в Telemed job. Callback можно включить позже, когда будет выбран экран/сущность в telemed.

Параллельно artifacts

Lock job, сек

Попыток

Retry backoff, сек

Макс. artifact, MB

Макс. audio chunk, MB

Длина chunk, сек

Callback token

Callback URL

Сводка

—

Последние задачи

Транскрибация и протоколирование Telemed artifacts.

Время	Запись	Тип	Статус

Настройки RAG

Retrieval, rerank и дефолты для HDE и Wiki.

RAG включён Использовать в HDE

База знаний по умолчанию

Типы источников

Макс. контекст, символов

Макс. фрагмент, символов

Факты из одного вложения, символов

Дистилляция

Преобразует сырой контекст обращения в короткий поисковый query перед RAG.

Включить

Промпт дистилляции

0 символов

Инструкция для RAG-контекста

0 символов

Активная embedding model

—

Target embedding model

Переиндексация

При смене embedding model будет пересчитан индекс.

Top K в контекст

Candidate K из Qdrant

Min KB, %

Min Wiki, %

Min tickets, %

Rerank включён

Тест retrieval

Проверка поиска и rerank без вызова Main LLM.

Запрос

—

Статус сервиса

—

API

—

Qdrant

—

Модели

—

Retrieval policy

—

Переиндексация

idle

—

Синхронизация

idle

—

Автообновление

Время автообновления, UTC

—

Внутренний чат

Ответы сотрудникам по KB, wiki и истории тикетов. Не связан с HDE-автоответами.

Открыть чат

Чат включён

System prompt

0 символов

RAG и источники

Отдельная политика поиска для внутреннего чата.

KB HDE Wiki Тикеты

Top K

Candidate K

Min KB, %

Min Wiki, %

Min tickets, %

Router RAG

Решает, нужен ли retrieval для сообщения, и готовит поисковый query.

Режим

Промпт Router RAG

0 символов

История и summary

Старый контекст диалога сжимается, последние сообщения остаются целиком.

Лимит истории до summary, символов

Последних сообщений целиком

Промпт summary

0 символов

Медиа

Извлечение полезного контекста из вложений HDE перед вызовом Main LLM.

Обработка медиа включена Использовать для HDE

Prompt для медиа-модели

0 символов

Типы файлов

Лимиты защищают основной prompt от слишком больших вложений и лишних расходов.

Images

Включено

Макс. файлов

Макс. размер, MB

Макс. извлечённый текст, символов

PDF

Включено

Макс. файлов

Макс. размер, MB

Макс. извлечённый текст, символов

PDF сначала разбирается локально. Если текст не извлечён, файл передаётся media-модели напрямую.

Audio

Включено

Макс. файлов

Макс. размер, MB

Макс. извлечённый текст, символов

Video

Включено

Макс. файлов

Макс. размер, MB

Макс. извлечённый текст, символов

Расход

—

HDE-обращения

—

Средняя стоимость обращения

—

весь pipeline

Среднее время обработки

—

HDE pipeline

P95 обработки

—

обработка обращения

Ошибки

—

С вложениями

—

media или документы

Успешность

—

по всем запросам

Расходы по периоду

Структура расходов

Обработки обращений

Время обработки

Модели и провайдеры

Провайдеры

Самые дорогие запросы

Самые долгие запросы

Время МСК	Тикет	Аккаунт / логин	Профиль	Вариант	Статус	Оценка	Тайминги	Итого	Фрагмент

Общие настройки

Системные дефолты закреплены в сервисе: логи хранятся 3 года, полный request/response сохраняется.

OpenRouter

—

Кабинет

API key

Обслуживание

Сервисные операции и ручная диагностика.

Тестовый прогон

Проверка профиля без внешних интеграций.

Профиль

Сообщение

Результат

—

Multimodal Artificial Intelligence Assistant - управление и настройка

Gatekeeper

Telemed

Транскрибация

Протоколирование

Очередь и callback

Медиа

Типы файлов

Images

PDF

Audio

Video

Документы

Типы документов

PDF с текстовым слоем

DOCX

Text / JSON / XML

CSV / XLSX

ZIP