sidebar_position: 3 lang: ru
Настройка моделей
Hermes использует два типа слотов для моделей:
- Основная модель — чем думает агент. Каждое пользовательское сообщение, каждый цикл вызова инструмента, каждый потоковый ответ проходит через эту модель.
- Вспомогательные модели — небольшие дополнительные работы, которые агент разгружает. Сжатие контекста, видение (анализ изображений), обобщение веб-страниц, поиск сеансов, оценка одобрения, маршрутизация инструментов MCP, генерация названий сеансов и поиск навыков. Каждый из них имеет свой собственный слот и может быть переопределен независимо.
На этой странице описана настройка обоих с панели управления. Если вы предпочитаете файлы конфигурации или CLI, перейдите к Альтернативные методы внизу.
Страница моделей
Откройте панель управления и нажмите Модели на боковой панели. Вы получаете два раздела:
- Настройки модели — верхняя панель, где вы назначаете модели слотам.
- Аналитика использования – ранжированные карточки, показывающие каждую модель, запустившую сеанс в выбранный период, с указанием количества токенов, стоимости и значков возможностей.

Верхняя карточка — это панель Настройки модели. В главной строке всегда показано, что агент будет раскручивать для новых сессий. Нажмите Изменить, чтобы открыть окно выбора.
Установка основной модели
Нажмите Изменить в строке «Основная модель»:

В средстве выбора есть два столбца:
- Слева — проверенные поставщики. Здесь отображаются только поставщики, которых вы настроили (набор ключей API, OAuth или определенные как настраиваемая конечная точка). Если поставщик отсутствует, перейдите в раздел Ключи и добавьте его учетные данные.
- Право — список курируемых моделей для выбранного поставщика. Это агентные модели, которые Hermes рекомендует для этого провайдера, а не необработанный дамп
/models(который на OpenRouter включает более 400 моделей, включая TTS, генераторы изображений и средства изменения ранжирования).
Введите в поле фильтра, чтобы сузить список по имени поставщика, пулу или идентификатору модели.
Выберите модель, нажмите Переключить, и Гермес запишет ее в ~/.hermes/config.yaml в разделе model. Это относится только к новым сеансам — любая вкладка чата, которая у вас уже открыта, продолжает работать в той же модели, с которой она началась. Чтобы выполнить горячую замену текущего чата, используйте внутри него косую черту /model.
Установка вспомогательных моделей
Нажмите Показать вспомогательные, чтобы отобразить восемь слотов для задач:

Для каждой вспомогательной задачи по умолчанию используется auto — это означает, что Hermes также использует вашу основную модель для этой работы. Отмените конкретную задачу, если вам нужна более дешевая или быстрая модель для подработки.
Общие шаблоны переопределения
| Задача | Когда переопределить |
|---|---|
| Титул Gen | Почти всегда. Флэш-модель стоимостью 0,10 доллара за миллион записывает названия сессий так же хорошо, как и Opus. В конфигурации по умолчанию для этого параметра установлено значение google/gemini-3-flash-preview на OpenRouter. |
| Видение | Когда ваша основная модель — это модель кодирования без видения (например, Кими, DeepSeek). Наведите его на google/gemini-2.5-flash или gpt-4o-mini. |
| Сжатие | Когда вы сжигаете жетоны рассуждений на Opus/M2.7, просто чтобы обобщить контекст. Модель быстрого чата выполняет работу за 1/50 стоимости. |
| Поиск сеанса | Когда запросы отзыва разветвляются, max_concurrency по умолчанию равен 3. Дешевая модель делает счет предсказуемым. |
| Одобрение | Для approval_mode: smart — быстрая/дешевая модель (haiku, flash, gpt-5-mini) решает, следует ли автоматически утверждать команды с низким уровнем риска. Дорогие модели здесь – это мусор. |
| Веб-извлечение | Когда вы активно используете web_extract. Та же логика, что и при сжатии — обобщение не требует рассуждений. |
| Центр навыков | hermes skills search использует это. Обычно нормально в auto. |
| MCP | Маршрутизация инструмента MCP. Обычно нормально в auto. |
Переопределение для каждой задачи
Нажмите Изменить в любой вспомогательной строке. Откроется то же средство выбора, то же поведение — выберите поставщика + модель, нажмите «Переключить». Строка обновится и отобразит provider · model вместо auto (use main model).
Сбросить все в автоматический режим
Если вы перенастроили и хотите начать заново, нажмите Сбросить все в автоматический режим вверху вспомогательного раздела. Каждый слот возвращается к использованию вашей основной модели.
Ярлык «Использовать как»
На каждой карточке модели на странице есть раскрывающийся список Использовать как. Это быстрый путь — выберите модель, которую вы видите в своей аналитике, нажмите Использовать как и одним щелчком мыши назначьте ее основному слоту или любой конкретной вспомогательной задаче:

В раскрывающемся списке есть:
- Основная модель — то же самое, что нажать «Изменить» в главной строке.
- Все вспомогательные задачи — назначает эту модель сразу на все 8 дополнительных слотов. Полезно, когда вам просто нужна дополнительная работа на дешевой флеш-модели.
- Индивидуальные параметры задачи — «Видение», «Веб-извлечение», «Сжатие» и т. д. Назначенная в данный момент модель для каждой задачи помечается
current.
Карты имеют значок main или aux · <task>, когда они в данный момент чему-то назначены, поэтому вы можете сразу увидеть, какая из ваших исторических моделей куда подключена.
Что будет записано на config.yaml
При сохранении через панель управления Гермес пишет на ~/.hermes/config.yaml:
Основная модель:
model:
provider: openrouter
default: anthropic/claude-opus-4.7
base_url: '' # cleared on provider switch
api_mode: chat_completions
Вспомогательное переопределение (пример — видение на Gemini-Flash):
auxiliary:
vision:
provider: openrouter
model: google/gemini-2.5-flash
base_url: ''
api_key: ''
timeout: 120
extra_body: {}
download_timeout: 30
Вспомогательный режим в автоматическом режиме (по умолчанию):
auxiliary:
compression:
provider: auto
model: ''
base_url: ''
# ... other fields unchanged
provider: auto с model: '' указывает Hermes использовать основную модель для этой задачи.
Когда это вступит в силу?
- CLI (
hermes chat): следующий вызовhermes chat. - Шлюз (Telegram, Discord, Slack и т. д.): следующий новый сеанс. Существующие сеансы сохраняют свою модель. Перезапустите шлюз (
hermes gateway restart), если вы хотите, чтобы все сеансы приняли изменения. - Вкладка чата на панели управления (
/chat): следующий новый PTY. Открытый в данный момент чат сохраняет свою модель — используйте внутри него/modelдля горячей замены.
Изменения никогда не делают недействительными кэши подсказок во время запущенных сеансов. Это намеренно: замена основной модели внутри сеанса требует сброса кэша (системное приглашение содержит контент, специфичный для модели), и мы резервируем это для явной команды косой черты /model внутри чата.
Устранение неполадок
«Нет проверенных поставщиков» в средстве выбора
Hermes перечисляет поставщика только в том случае, если у него есть рабочие полномочия. Проверьте Ключи на боковой панели: вы должны увидеть одно из следующих значений: ключ API, успешный OAuth или собственный URL-адрес конечной точки. Если нужного вам провайдера нет, запустите hermes setup, чтобы подключить его, или перейдите в раздел Ключи и добавьте переменную env.
Основная модель не изменилась в моем беговом чате
Ожидается. На приборной панели пишется config.yaml, который считываются новыми сеансами. Открытый в данный момент чат — это процесс живого агента — он сохраняет любую модель, с которой был создан. Используйте /model <name> внутри чата, чтобы выполнить горячую замену этого конкретного сеанса.
Вспомогательное переопределение «не вступило в силу»
Три вещи, которые нужно проверить:
- Вы начали новый сеанс? Существующие чаты не перечитывают конфигурацию.
- Настроено ли для
providerзначение, отличное отauto? Если в поле указаноauto, задача по-прежнему использует вашу основную модель. Нажмите Изменить и выберите реального провайдера. - Аутентифицирован ли поставщик? Если вы назначили
minimaxзадаче, но у вас нет ключа API MiniMax, эта задача возвращается к настройкам по умолчанию openrouter и регистрирует предупреждение вagent.log.
Я выбрал модель, но Hermes переключил меня на провайдера
В OpenRouter (или любом агрегаторе) имена голых моделей сначала разрешаются внутри агрегатора. Таким образом, claude-sonnet-4 на OpenRouter становится anthropic/claude-sonnet-4.6, оставаясь при вашей аутентификации OpenRouter. Но если вы наберете claude-sonnet-4 при встроенной аутентификации Anthropic, она останется как claude-sonnet-4-6. Если вы видите неожиданное переключение поставщика, убедитесь, что ваш текущий поставщик соответствует вашим ожиданиям — средство выбора всегда показывает текущий основной поставщик в верхней части диалогового окна.
Альтернативные методы
Команда косой черты CLI
Внутри любого сеанса hermes chat:
/model gpt-5.4 --provider openrouter # session-only
/model gpt-5.4 --provider openrouter --global # also persists to config.yaml
--global делает то же самое, что и кнопка Изменить на информационной панели, плюс переключает текущий сеанс на месте.
hermes model субкоманда
hermes model list # list authenticated providers + models
hermes model set anthropic/claude-opus-4.7 --provider openrouter
Прямое редактирование конфигурации
Отредактируйте ~/.hermes/config.yaml и перезапустите все, что его читает. Полную схему см. в Справочнике по конфигурации.
ОТДЫХ API
Панель мониторинга использует три конечные точки. Полезно для сценариев:
# List authenticated providers + curated model lists
curl -H "X-Hermes-Session-Token: $TOKEN" http://localhost:PORT/api/model/options
# Read current main + auxiliary assignments
curl -H "X-Hermes-Session-Token: $TOKEN" http://localhost:PORT/api/model/auxiliary
# Set the main model
curl -X POST -H "Content-Type: application/json" -H "X-Hermes-Session-Token: $TOKEN" \
-d '{"scope":"main","provider":"openrouter","model":"anthropic/claude-opus-4.7"}' \
http://localhost:PORT/api/model/set
# Override a single auxiliary task
curl -X POST -H "Content-Type: application/json" -H "X-Hermes-Session-Token: $TOKEN" \
-d '{"scope":"auxiliary","task":"vision","provider":"openrouter","model":"google/gemini-2.5-flash"}' \
http://localhost:PORT/api/model/set
# Assign one model to every auxiliary task
curl -X POST -H "Content-Type: application/json" -H "X-Hermes-Session-Token: $TOKEN" \
-d '{"scope":"auxiliary","task":"","provider":"openrouter","model":"google/gemini-2.5-flash"}' \
http://localhost:PORT/api/model/set
# Reset all auxiliary tasks to auto
curl -X POST -H "Content-Type: application/json" -H "X-Hermes-Session-Token: $TOKEN" \
-d '{"scope":"auxiliary","task":"__reset__","provider":"","model":""}' \
http://localhost:PORT/api/model/set
Токен сеанса вводится в HTML-код панели управления при запуске и меняется при каждом перезапуске сервера. Загрузите его из инструментов разработчика браузера (window.__HERMES_SESSION_TOKEN__), если вы пишете сценарии для работающей информационной панели.