sidebar_position: 3 lang: ru


Настройка моделей

Hermes использует два типа слотов для моделей:

На этой странице описана настройка обоих с панели управления. Если вы предпочитаете файлы конфигурации или CLI, перейдите к Альтернативные методы внизу.

Страница моделей

Откройте панель управления и нажмите Модели на боковой панели. Вы получаете два раздела:

  1. Настройки модели — верхняя панель, где вы назначаете модели слотам.
  2. Аналитика использования – ранжированные карточки, показывающие каждую модель, запустившую сеанс в выбранный период, с указанием количества токенов, стоимости и значков возможностей.

Обзор страницы моделей

Верхняя карточка — это панель Настройки модели. В главной строке всегда показано, что агент будет раскручивать для новых сессий. Нажмите Изменить, чтобы открыть окно выбора.

Установка основной модели

Нажмите Изменить в строке «Основная модель»:

Диалоговое окно выбора модели

В средстве выбора есть два столбца:

Введите в поле фильтра, чтобы сузить список по имени поставщика, пулу или идентификатору модели.

Выберите модель, нажмите Переключить, и Гермес запишет ее в ~/.hermes/config.yaml в разделе model. Это относится только к новым сеансам — любая вкладка чата, которая у вас уже открыта, продолжает работать в той же модели, с которой она началась. Чтобы выполнить горячую замену текущего чата, используйте внутри него косую черту /model.

Установка вспомогательных моделей

Нажмите Показать вспомогательные, чтобы отобразить восемь слотов для задач:

Вспомогательная панель развернута

Для каждой вспомогательной задачи по умолчанию используется auto — это означает, что Hermes также использует вашу основную модель для этой работы. Отмените конкретную задачу, если вам нужна более дешевая или быстрая модель для подработки.

Общие шаблоны переопределения

Задача Когда переопределить
Титул Gen Почти всегда. Флэш-модель стоимостью 0,10 доллара за миллион записывает названия сессий так же хорошо, как и Opus. В конфигурации по умолчанию для этого параметра установлено значение google/gemini-3-flash-preview на OpenRouter.
Видение Когда ваша основная модель — это модель кодирования без видения (например, Кими, DeepSeek). Наведите его на google/gemini-2.5-flash или gpt-4o-mini.
Сжатие Когда вы сжигаете жетоны рассуждений на Opus/M2.7, просто чтобы обобщить контекст. Модель быстрого чата выполняет работу за 1/50 стоимости.
Поиск сеанса Когда запросы отзыва разветвляются, max_concurrency по умолчанию равен 3. Дешевая модель делает счет предсказуемым.
Одобрение Для approval_mode: smart — быстрая/дешевая модель (haiku, flash, gpt-5-mini) решает, следует ли автоматически утверждать команды с низким уровнем риска. Дорогие модели здесь – это мусор.
Веб-извлечение Когда вы активно используете web_extract. Та же логика, что и при сжатии — обобщение не требует рассуждений.
Центр навыков hermes skills search использует это. Обычно нормально в auto.
MCP Маршрутизация инструмента MCP. Обычно нормально в auto.

Переопределение для каждой задачи

Нажмите Изменить в любой вспомогательной строке. Откроется то же средство выбора, то же поведение — выберите поставщика + модель, нажмите «Переключить». Строка обновится и отобразит provider · model вместо auto (use main model).

Сбросить все в автоматический режим

Если вы перенастроили и хотите начать заново, нажмите Сбросить все в автоматический режим вверху вспомогательного раздела. Каждый слот возвращается к использованию вашей основной модели.

Ярлык «Использовать как»

На каждой карточке модели на странице есть раскрывающийся список Использовать как. Это быстрый путь — выберите модель, которую вы видите в своей аналитике, нажмите Использовать как и одним щелчком мыши назначьте ее основному слоту или любой конкретной вспомогательной задаче:

Использовать как раскрывающийся список

В раскрывающемся списке есть:

Карты имеют значок main или aux · <task>, когда они в данный момент чему-то назначены, поэтому вы можете сразу увидеть, какая из ваших исторических моделей куда подключена.

Что будет записано на config.yaml

При сохранении через панель управления Гермес пишет на ~/.hermes/config.yaml:

Основная модель:

model:
  provider: openrouter
  default: anthropic/claude-opus-4.7
  base_url: ''        # cleared on provider switch
  api_mode: chat_completions

Вспомогательное переопределение (пример — видение на Gemini-Flash):

auxiliary:
  vision:
    provider: openrouter
    model: google/gemini-2.5-flash
    base_url: ''
    api_key: ''
    timeout: 120
    extra_body: {}
    download_timeout: 30

Вспомогательный режим в автоматическом режиме (по умолчанию):

auxiliary:
  compression:
    provider: auto
    model: ''
    base_url: ''
    # ... other fields unchanged

provider: auto с model: '' указывает Hermes использовать основную модель для этой задачи.

Когда это вступит в силу?

Изменения никогда не делают недействительными кэши подсказок во время запущенных сеансов. Это намеренно: замена основной модели внутри сеанса требует сброса кэша (системное приглашение содержит контент, специфичный для модели), и мы резервируем это для явной команды косой черты /model внутри чата.

Устранение неполадок

«Нет проверенных поставщиков» в средстве выбора

Hermes перечисляет поставщика только в том случае, если у него есть рабочие полномочия. Проверьте Ключи на боковой панели: вы должны увидеть одно из следующих значений: ключ API, успешный OAuth или собственный URL-адрес конечной точки. Если нужного вам провайдера нет, запустите hermes setup, чтобы подключить его, или перейдите в раздел Ключи и добавьте переменную env.

Основная модель не изменилась в моем беговом чате

Ожидается. На приборной панели пишется config.yaml, который считываются новыми сеансами. Открытый в данный момент чат — это процесс живого агента — он сохраняет любую модель, с которой был создан. Используйте /model <name> внутри чата, чтобы выполнить горячую замену этого конкретного сеанса.

Вспомогательное переопределение «не вступило в силу»

Три вещи, которые нужно проверить:

  1. Вы начали новый сеанс? Существующие чаты не перечитывают конфигурацию.
  2. Настроено ли для provider значение, отличное от auto? Если в поле указано auto, задача по-прежнему использует вашу основную модель. Нажмите Изменить и выберите реального провайдера.
  3. Аутентифицирован ли поставщик? Если вы назначили minimax задаче, но у вас нет ключа API MiniMax, эта задача возвращается к настройкам по умолчанию openrouter и регистрирует предупреждение в agent.log.

Я выбрал модель, но Hermes переключил меня на провайдера

В OpenRouter (или любом агрегаторе) имена голых моделей сначала разрешаются внутри агрегатора. Таким образом, claude-sonnet-4 на OpenRouter становится anthropic/claude-sonnet-4.6, оставаясь при вашей аутентификации OpenRouter. Но если вы наберете claude-sonnet-4 при встроенной аутентификации Anthropic, она останется как claude-sonnet-4-6. Если вы видите неожиданное переключение поставщика, убедитесь, что ваш текущий поставщик соответствует вашим ожиданиям — средство выбора всегда показывает текущий основной поставщик в верхней части диалогового окна.

Альтернативные методы

Команда косой черты CLI

Внутри любого сеанса hermes chat:

/model gpt-5.4 --provider openrouter             # session-only
/model gpt-5.4 --provider openrouter --global    # also persists to config.yaml

--global делает то же самое, что и кнопка Изменить на информационной панели, плюс переключает текущий сеанс на месте.

hermes model субкоманда

hermes model list                   # list authenticated providers + models
hermes model set anthropic/claude-opus-4.7 --provider openrouter

Прямое редактирование конфигурации

Отредактируйте ~/.hermes/config.yaml и перезапустите все, что его читает. Полную схему см. в Справочнике по конфигурации.

ОТДЫХ API

Панель мониторинга использует три конечные точки. Полезно для сценариев:

# List authenticated providers + curated model lists
curl -H "X-Hermes-Session-Token: $TOKEN" http://localhost:PORT/api/model/options

# Read current main + auxiliary assignments
curl -H "X-Hermes-Session-Token: $TOKEN" http://localhost:PORT/api/model/auxiliary

# Set the main model
curl -X POST -H "Content-Type: application/json" -H "X-Hermes-Session-Token: $TOKEN" \
  -d '{"scope":"main","provider":"openrouter","model":"anthropic/claude-opus-4.7"}' \
  http://localhost:PORT/api/model/set

# Override a single auxiliary task
curl -X POST -H "Content-Type: application/json" -H "X-Hermes-Session-Token: $TOKEN" \
  -d '{"scope":"auxiliary","task":"vision","provider":"openrouter","model":"google/gemini-2.5-flash"}' \
  http://localhost:PORT/api/model/set

# Assign one model to every auxiliary task
curl -X POST -H "Content-Type: application/json" -H "X-Hermes-Session-Token: $TOKEN" \
  -d '{"scope":"auxiliary","task":"","provider":"openrouter","model":"google/gemini-2.5-flash"}' \
  http://localhost:PORT/api/model/set

# Reset all auxiliary tasks to auto
curl -X POST -H "Content-Type: application/json" -H "X-Hermes-Session-Token: $TOKEN" \
  -d '{"scope":"auxiliary","task":"__reset__","provider":"","model":""}' \
  http://localhost:PORT/api/model/set

Токен сеанса вводится в HTML-код панели управления при запуске и меняется при каждом перезапуске сервера. Загрузите его из инструментов разработчика браузера (window.__HERMES_SESSION_TOKEN__), если вы пишете сценарии для работающей информационной панели.