sidebar_position: 9 title: "Context Engine Plugins" description: "How to build a context engine plugin that replaces the built-in ContextCompressor" lang: ru
Создание плагина контекстного движка
Плагины механизма контекста заменяют встроенный ContextCompressor альтернативной стратегией управления контекстом разговора. Например, механизм управления контекстом без потерь (LCM), который создает базу данных знаний вместо обобщения с потерями.
Как это работает
Управление контекстом агента построено на ContextEngine ABC (agent/context_engine.py). Встроенный ContextCompressor является реализацией по умолчанию. Механизмы плагинов должны реализовывать один и тот же интерфейс.
Одновременно может быть активен только один механизм контекста. Выбор зависит от конфигурации:
# config.yaml
context:
engine: "compressor" # default built-in
engine: "lcm" # activates a plugin engine named "lcm"
Механизмы плагинов никогда не активируются автоматически — пользователь должен явно указать context.engine для имени плагина.
Структура каталогов
Каждый контекстный движок находится в plugins/context_engine/<name>/:
plugins/context_engine/lcm/
├── __init__.py # exports the ContextEngine subclass
├── plugin.yaml # metadata (name, description, version)
└── ... # any other modules your engine needs
Азбука ContextEngine
Ваш движок должен реализовать следующие обязательные методы:
from agent.context_engine import ContextEngine
class LCMEngine(ContextEngine):
@property
def name(self) -> str:
"""Short identifier, e.g. 'lcm'. Must match config.yaml value."""
return "lcm"
def update_from_response(self, usage: dict) -> None:
"""Called after every LLM call with the usage dict.
Update self.last_prompt_tokens, self.last_completion_tokens,
self.last_total_tokens from the response.
"""
def should_compress(self, prompt_tokens: int = None) -> bool:
"""Return True if compaction should fire this turn."""
def compress(self, messages: list, current_tokens: int = None,
focus_topic: str = None) -> list:
"""Compact the message list and return a new (possibly shorter) list.
The returned list must be a valid OpenAI-format message sequence.
``focus_topic`` is an optional topic string from manual
``/compress <focus>``; engines that support guided compression should
prioritise preserving information related to it, others may ignore it.
"""
Атрибуты класса, которые должен поддерживать ваш движок
Агент считывает их непосредственно для отображения и регистрации:
last_prompt_tokens: int = 0
last_completion_tokens: int = 0
last_total_tokens: int = 0
threshold_tokens: int = 0 # when compression triggers
context_length: int = 0 # model's full context window
compression_count: int = 0 # how many times compress() has run
Дополнительные методы
У них есть разумные значения по умолчанию в ABC. Переопределите при необходимости:
| Метод | По умолчанию | Переопределить, когда |
|---|---|---|
on_session_start(session_id, **kwargs) |
Нет операции | Вам необходимо загрузить постоянное состояние (DAG, DB) |
on_session_end(session_id, messages) |
Нет операции | Вам нужно очистить состояние, закрыть соединения |
on_session_reset() |
Сбрасывает счетчики токенов | Вам нужно очистить состояние каждого сеанса |
update_model(model, context_length, ...) |
Обновления context_length + порог | Вам необходимо пересчитать бюджеты при смене модели |
get_tool_schemas() |
Возвращает [] |
Ваш движок предоставляет инструменты, вызываемые агентом (например, lcm_grep) |
handle_tool_call(name, args, **kwargs) |
Возвращает ошибку JSON | Вы реализуете обработчики инструментов |
should_compress_preflight(messages) |
Возвращает False |
Вы можете сделать дешевую оценку перед вызовом API |
get_status() |
Стандартный токен/пороговый словарь | У вас есть специальные метрики для раскрытия |
Инструменты двигателя
Механизмы контекста могут предоставлять инструменты, которые агент вызывает напрямую. Возвращать схемы из get_tool_schemas() и обрабатывать вызовы из handle_tool_call():
def get_tool_schemas(self):
return [{
"name": "lcm_grep",
"description": "Search the context knowledge graph",
"parameters": {
"type": "object",
"properties": {
"query": {"type": "string", "description": "Search query"}
},
"required": ["query"],
},
}]
def handle_tool_call(self, name, args, **kwargs):
if name == "lcm_grep":
results = self._search_dag(args["query"])
return json.dumps({"results": results})
return json.dumps({"error": f"Unknown tool: {name}"})
Инструменты ядра добавляются в список инструментов агента при запуске и отправляются автоматически — регистрация в реестре не требуется.
Регистрация
Через каталог (рекомендуется)
Поместите свой движок в plugins/context_engine/<name>/. __init__.py должен экспортировать подкласс ContextEngine. Система обнаружения автоматически находит и создает экземпляр.
Через общую систему плагинов
Общий плагин также может зарегистрировать контекстный движок:
def register(ctx):
engine = LCMEngine(context_length=200000)
ctx.register_context_engine(engine)
Можно зарегистрировать только один двигатель. Второй плагин, пытающийся зарегистрироваться, отклонен с предупреждением.
Жизненный цикл
1. Engine instantiated (plugin load or directory discovery)
2. on_session_start() — conversation begins
3. update_from_response() — after each API call
4. should_compress() — checked each turn
5. compress() — called when should_compress() returns True
6. on_session_end() — session boundary (CLI exit, /reset, gateway expiry)
on_session_reset() вызывается на /new или /reset для очистки состояния каждого сеанса без полного завершения работы.
Конфигурация
Пользователи выбирают ваш движок через hermes plugins → Плагины провайдера → Context Engine или редактируя config.yaml:
context:
engine: "lcm" # must match your engine's name property
Блок конфигурации compression (compression.threshold, compression.protect_last_n и т. д.) предназначен для встроенного ContextCompressor. При необходимости ваш движок должен определить свой собственный формат конфигурации, считывая из config.yaml во время инициализации.
Тестирование
from agent.context_engine import ContextEngine
def test_engine_satisfies_abc():
engine = YourEngine(context_length=200000)
assert isinstance(engine, ContextEngine)
assert engine.name == "your-name"
def test_compress_returns_valid_messages():
engine = YourEngine(context_length=200000)
msgs = [{"role": "user", "content": "hello"}]
result = engine.compress(msgs)
assert isinstance(result, list)
assert all("role" in m for m in result)
См. tests/agent/test_context_engine.py для полного набора тестов контракта ABC.
См. также
- Сжатие и кэширование контекста — как работает встроенный компрессор.
- Плагины провайдера памяти — аналогичная система плагинов с одним выбором для памяти.
- Плагины — общий обзор системы плагинов.