---
type: system
title: Grounded RAG-ассистент в продакшене
domain: ai
services: [ai-automation, ai-dev-culture]
skills: [RAG, LLM Integration, Prompt Engineering, Guardrails, Go]
technologies: [Go, Astro, OpenRouter, RAG, SSE, MCP]
problem: Посетители хотят быстро и честно понять, есть ли fit — но обычные чат-боты галлюцинируют, раскрывают системный промпт и уязвимы к инструкциям, спрятанным в сообщениях пользователя (prompt injection).
approach: Построил grounded RAG-ассистент, который отвечает, используя только базу знаний по каждому языку, собранную из контента самого сайта. Он устойчив к prompt-injection (игнорирует инструкции внутри пользовательских сообщений), отказывается выдумывать метрики, клиентов и доступность, санитизирует историю диалога и ведёт структурированную квалификацию лида. Роутинг модели и кэш базы знаний держат стоимость диалога ограниченной.
result: Живая, self-hosted production-LLM-система — не демо — обслуживает реальный трафик посетителей на этом сайте, достаточно заземлённая, чтобы ссылаться на источники, и достаточно безопасная, чтобы отказывать на out-of-scope или инъекционные запросы.
evidence: Работает вживую на этой странице — откройте панель ассистента и попробуйте, в том числе попытку prompt-injection.
public_links: []
available_for: живое демо
language: ru
canonical: https://asmanmalikov.com/ru/proof/rag-assistant/
---

# Grounded RAG-ассистент в продакшене

- **Problem:** Посетители хотят быстро и честно понять, есть ли fit — но обычные чат-боты галлюцинируют, раскрывают системный промпт и уязвимы к инструкциям, спрятанным в сообщениях пользователя (prompt injection).
- **Approach:** Построил grounded RAG-ассистент, который отвечает, используя только базу знаний по каждому языку, собранную из контента самого сайта. Он устойчив к prompt-injection (игнорирует инструкции внутри пользовательских сообщений), отказывается выдумывать метрики, клиентов и доступность, санитизирует историю диалога и ведёт структурированную квалификацию лида. Роутинг модели и кэш базы знаний держат стоимость диалога ограниченной.
- **Result:** Живая, self-hosted production-LLM-система — не демо — обслуживает реальный трафик посетителей на этом сайте, достаточно заземлённая, чтобы ссылаться на источники, и достаточно безопасная, чтобы отказывать на out-of-scope или инъекционные запросы.
- **Evidence:** Работает вживую на этой странице — откройте панель ассистента и попробуйте, в том числе попытку prompt-injection.
