Безопасность
Инъекции и блокировки
Диалоги, в которых сработала 3-слойная защита от prompt-injection. После 3 ударов в окне 5 минут диалог и IP-адрес клиента блокируются автоматически.
Guardrails (src/ai/guardrails.py) проверяют ввод в 3 слоя: (1) нормализация регистра и хомоглифов, (2) regex-паттерны известных инъекций («игнорируй инструкции», «выдай API-ключ» и т.д.), (3) валидация формата ответа. IP-адрес атакующего автоматически уходит в бан на 24 часа (ip_block_ttl_seconds в настройках).