Spaces:

Yash030
/

agentmemory-python

Running

App Files Files Community

agentmemory-python / READMEs /README.ru-RU.md

Yash030

Initialize Hugging Face Space deployment for AgentMemory Python (clean without assets)

b2d9e47 3 days ago

preview code

raw

history blame contribute delete

99.3 kB

	<p align="center">
	<img src="../assets/banner.png" alt="agentmemory — Постоянная память для ИИ-агентов программирования" width="720" />
	</p>

	<p align="center">
	<strong>
	Ваш агент программирования помнит всё. Больше не нужно объяснять заново.
	Built on <a href="https://github.com/iii-hq/iii">iii engine</a>
	</strong><br/>
	Постоянная память для Claude Code, Cursor, Gemini CLI, Codex CLI, Hermes, OpenClaw, pi, OpenCode и любого MCP-клиента.
	</p>

	<p align="center">
	<a href="../README.md">English</a> \|
	<a href="README.zh-CN.md">简体中文</a> \|
	<a href="README.zh-TW.md">繁體中文</a> \|
	<a href="README.ja-JP.md">日本語</a> \|
	<a href="README.ko-KR.md">한국어</a> \|
	<a href="README.es-ES.md">Español</a> \|
	<a href="README.tr-TR.md">Türkçe</a> \|
	Русский \|
	<a href="README.hi-IN.md">हिन्दी</a> \|
	<a href="README.pt-BR.md">Português</a> \|
	<a href="README.fr-FR.md">Français</a> \|
	<a href="README.de-DE.md">Deutsch</a>
	</p>

	<p align="center">
	<a href="https://trendshift.io/repositories/25123" target="_blank"><img src="https://trendshift.io/api/badge/repositories/25123" alt="rohitg00/agentmemory \| Trendshift" width="250" height="55"/></a>
	</p>

	<p align="center">
	<a href="https://www.star-history.com/?repos=rohitg00%2Fagentmemory&type=date&legend=top-left">
	<picture>
	<source media="(prefers-color-scheme: dark)" srcset="https://api.star-history.com/chart?repos=rohitg00/agentmemory&type=date&theme=dark&legend=top-left" />
	<source media="(prefers-color-scheme: light)" srcset="https://api.star-history.com/chart?repos=rohitg00/agentmemory&type=date&legend=top-left" />
	<img alt="Star History Chart" src="https://api.star-history.com/chart?repos=rohitg00/agentmemory&type=date&legend=top-left" />
	</picture>
	</a>
	</p>

	<p align="center">
	<a href="https://gist.github.com/rohitg00/2067ab416f7bbe447c1977edaaa681e2"><img src="https://img.shields.io/badge/Viral%20GitHub%20Gist-1200%20stars%20%2F%20172%20forks-FF6B35?style=for-the-badge&logo=github&logoColor=white&labelColor=1a1a1a" alt="Документ проекта: 1200 звёзд / 172 форка в гисте" /></a>
	</p>

	<p align="center">
	<em>Этот gist расширяет шаблон LLM Wiki от Karpathy: confidence-оценкой, жизненным циклом, графами знаний и гибридным поиском — agentmemory является его реализацией.</em>
	</p>

	<p align="center">
	<a href="https://www.npmjs.com/package/@agentmemory/agentmemory"><img src="https://img.shields.io/npm/v/@agentmemory/agentmemory?color=CB3837&label=npm&style=for-the-badge&logo=npm" alt="npm version" /></a>
	<a href="https://www.npmjs.com/package/@agentmemory/agentmemory"><img src="https://img.shields.io/npm/dm/@agentmemory/agentmemory?color=CB3837&label=downloads&style=for-the-badge&logo=npm" alt="npm downloads" /></a>
	<a href="https://github.com/rohitg00/agentmemory/actions"><img src="https://img.shields.io/github/actions/workflow/status/rohitg00/agentmemory/ci.yml?label=tests&style=for-the-badge&logo=github" alt="CI" /></a>
	<a href="https://github.com/rohitg00/agentmemory/blob/main/LICENSE"><img src="https://img.shields.io/github/license/rohitg00/agentmemory?color=blue&style=for-the-badge" alt="License" /></a>
	<a href="https://github.com/rohitg00/agentmemory/stargazers"><img src="https://img.shields.io/github/stars/rohitg00/agentmemory?style=for-the-badge&color=yellow&logo=github" alt="Stars" /></a>
	</p>

	<p align="center">
	<picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/stat-recall.svg"><img src="../assets/tags/stat-recall.svg" alt="95.2% retrieval R@5" height="38" /></picture>
	<picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/stat-tokens.svg"><img src="../assets/tags/stat-tokens.svg" alt="92% fewer tokens" height="38" /></picture>
	<picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/stat-tools.svg"><img src="../assets/tags/stat-tools.svg" alt="53 MCP tools" height="38" /></picture>
	<picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/stat-hooks.svg"><img src="../assets/tags/stat-hooks.svg" alt="12 auto hooks" height="38" /></picture>
	<picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/stat-deps.svg"><img src="../assets/tags/stat-deps.svg" alt="0 external DBs" height="38" /></picture>
	<picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/stat-tests.svg"><img src="../assets/tags/stat-tests.svg" alt="950+ tests passing" height="38" /></picture>
	</p>

	<p align="center">
	<img src="../assets/demo.gif" alt="Демо agentmemory" width="720" />
	</p>

	<p align="center">
	<a href="#install">Установка</a> •
	<a href="#quick-start">Быстрый старт</a> •
	<a href="#benchmarks">Бенчмарки</a> •
	<a href="#vs-competitors">Сравнение</a> •
	<a href="#works-with-every-agent">Агенты</a> •
	<a href="#how-it-works">Как это работает</a> •
	<a href="#mcp-server">MCP</a> •
	<a href="#real-time-viewer">Просмотрщик</a> •
	<a href="#iii-console">iii Console</a> •
	<a href="#powered-by-iii">Powered by iii</a> •
	<a href="#configuration">Конфигурация</a> •
	<a href="#api">API</a>
	</p>

	---

	## Install

	```bash
	npm install -g @agentmemory/agentmemory # once — bare `agentmemory` on PATH
	# If you hit EACCES on macOS/Linux system Node installs, retry with:
	# sudo npm install -g @agentmemory/agentmemory
	agentmemory # start the memory server on :3111
	agentmemory demo # seed sample sessions + prove recall
	agentmemory connect claude-code # wire your agent (also: codex, cursor, gemini-cli, ...)
	```

	Или через `npx` (без установки):

	```bash
	npx @agentmemory/agentmemory
	```

	Внимание: npx кеширует пакеты по версиям. Если простой `npx @agentmemory/agentmemory` выдаёт более старый релиз, принудительно возьмите свежий через `npx -y @agentmemory/agentmemory@latest` или однократно очистите кеш: `rm -rf ~/.npm/_npx` (macOS/Linux; на Windows удалите `%LOCALAPPDATA%\npm-cache\_npx`). Начиная с v0.9.16+, при первом запуске npx предлагает поставить пакет глобально прямо в строке — после этого простая команда `agentmemory` будет работать повсюду.

	Полный список опций — в разделе [Быстрый старт](#quick-start) ниже. Привязка конкретного агента — в разделе [Работает с каждым агентом](#works-with-every-agent).

	---

	<h2 id="works-with-every-agent"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-agents.svg"><img src="../assets/tags/section-agents.svg" alt="Работает с каждым агентом" height="32" /></picture></h2>

	agentmemory работает с любым агентом, поддерживающим хуки, MCP или REST API. Все агенты используют один и тот же сервер памяти.

	<table>
	<tr>
	<td align="center" width="12.5%">
	<a href="https://claude.com/product/claude-code"><img src="https://matthiasroder.com/content/images/2026/01/Claude.png?size=120" alt="Claude Code" width="48" height="48" /></a><br/>
	<strong>Claude Code</strong><br/>
	<sub>нативный плагин + 12 хуков + MCP</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="https://github.com/openai/codex"><img src="https://github.com/openai.png?size=120" alt="Codex CLI" width="48" height="48" /></a><br/>
	<strong>Codex CLI</strong><br/>
	<sub>нативный плагин + 6 хуков + MCP</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="../integrations/openclaw/"><img src="https://github.com/openclaw.png?size=120" alt="OpenClaw" width="48" height="48" /></a><br/>
	<strong>OpenClaw</strong><br/>
	<sub>нативный плагин + MCP</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="../integrations/hermes/"><img src="https://github.com/NousResearch.png?size=120" alt="Hermes" width="48" height="48" /></a><br/>
	<strong>Hermes</strong><br/>
	<sub>нативный плагин + MCP</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="../integrations/pi/"><img src="../assets/agents/pi.svg" alt="pi" width="48" height="48" /></a><br/>
	<strong>pi</strong><br/>
	<sub>нативный плагин + MCP</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="https://github.com/tinyhumansai/openhuman"><img src="https://raw.githubusercontent.com/tinyhumansai/openhuman/main/app/src-tauri/icons/128x128.png" alt="OpenHuman" width="48" height="48" /></a><br/>
	<strong>OpenHuman</strong><br/>
	<sub>нативный бэкенд трейта Memory</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="https://cursor.com"><img src="https://www.freelogovectors.net/wp-content/uploads/2025/06/cursor-logo-freelogovectors.net_.png" alt="Cursor" width="48" height="48" /></a><br/>
	<strong>Cursor</strong><br/>
	<sub>MCP-сервер</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="https://github.com/google-gemini/gemini-cli"><img src="https://github.com/google-gemini.png?size=120" alt="Gemini CLI" width="48" height="48" /></a><br/>
	<strong>Gemini CLI</strong><br/>
	<sub>MCP-сервер</sub>
	</td>
	</tr>
	<tr>
	<td align="center" width="12.5%">
	<a href="https://github.com/opencode-ai/opencode"><img src="https://github.com/opencode-ai.png?size=120" alt="OpenCode" width="48" height="48" /></a><br/>
	<strong>OpenCode</strong><br/>
	<sub>22 хука + MCP + плагин</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="https://github.com/cline/cline"><img src="https://github.com/cline.png?size=120" alt="Cline" width="48" height="48" /></a><br/>
	<strong>Cline</strong><br/>
	<sub>MCP-сервер</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="https://github.com/block/goose"><img src="https://github.com/block.png?size=120" alt="Goose" width="48" height="48" /></a><br/>
	<strong>Goose</strong><br/>
	<sub>MCP-сервер</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="https://github.com/Kilo-Org/kilocode"><img src="https://github.com/Kilo-Org.png?size=120" alt="Kilo Code" width="48" height="48" /></a><br/>
	<strong>Kilo Code</strong><br/>
	<sub>MCP-сервер</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="https://github.com/Aider-AI/aider"><img src="https://github.com/Aider-AI.png?size=120" alt="Aider" width="48" height="48" /></a><br/>
	<strong>Aider</strong><br/>
	<sub>REST API</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="https://claude.ai/download"><img src="https://github.com/anthropics.png?size=120" alt="Claude Desktop" width="48" height="48" /></a><br/>
	<strong>Claude Desktop</strong><br/>
	<sub>MCP-сервер</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="https://windsurf.com"><img src="https://exafunction.github.io/public/brand/windsurf-black-symbol.svg?size=120" alt="Windsurf" width="48" height="48" /></a><br/>
	<strong>Windsurf</strong><br/>
	<sub>MCP-сервер</sub>
	</td>
	<td align="center" width="12.5%">
	<a href="https://github.com/RooCodeInc/Roo-Code"><img src="https://github.com/RooCodeInc.png?size=120" alt="Roo Code" width="48" height="48" /></a><br/>
	<strong>Roo Code</strong><br/>
	<sub>MCP-сервер</sub>
	</td>
	</tr>
	</table>

	<p align="center">
	<sub>Работает с <strong>любым</strong> агентом, который говорит на MCP или HTTP. Один сервер — общая память для всех.</sub>
	</p>

	---

	Вы заново объясняете архитектуру в каждой сессии. Вы заново находите те же баги. Вы заново обучаете агента тем же предпочтениям. Встроенная память (CLAUDE.md, .cursorrules) упирается в 200 строк и устаревает. agentmemory это решает. Он тихо собирает то, что делает ваш агент, сжимает это в индексируемую память и подмешивает нужный контекст при старте следующей сессии. Одна команда. Работает между агентами.

	Что меняется: В сессии 1 вы настраиваете JWT-аутентификацию. В сессии 2 просите добавить rate limiting. Агент уже знает, что аутентификация использует middleware jose в `src/middleware/auth.ts`, что ваши тесты покрывают валидацию токенов, и что вы выбрали jose, а не jsonwebtoken, из-за совместимости с Edge. Никаких повторных объяснений. Никакого копирования-вставки. Агент просто знает.

	```bash
	npx @agentmemory/agentmemory
	```

	> Новое в v0.9.0 — Лендинг по адресу [agent-memory.dev](https://agent-memory.dev), коннектор файловой системы (`@agentmemory/fs-watcher`), автономный MCP теперь проксирует к работающему серверу, поэтому хуки и просмотрщик согласованы, политика аудита кодифицирована для каждого пути удаления, проверка состояния больше не помечает `memory_critical` на маленьких Node-процессах. Полные заметки в [CHANGELOG.md](../CHANGELOG.md#090--2026-04-18).

	---

	<h2 id="benchmarks"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-benchmarks.svg"><img src="../assets/tags/section-benchmarks.svg" alt="Бенчмарки" height="32" /></picture></h2>

	<table>
	<tr>
	<td width="50%">

	### Точность извлечения

	coding-agent-life-v1 (внутренний корпус, воспроизводимо в sandbox)

	\| Адаптер \| P@5 \| R@5 \| Top-5 hit rate \| p50-задержка \|
	\|---\|---\|---\|---\|---\|
	\| agentmemory hybrid \| 0.578 \| 0.967 \| 15 / 15 \| 14 мс \|
	\| Базовый grep \| 0.267 \| 0.967 \| 15 / 15 \| 0 мс \|

	100 % попаданий в top-5. 2,2× выше точность, чем у grep-базы, на тех же входах. Полная разбивка по типам: [`docs/benchmarks/2026-05-20-coding-agent-life-v1.md`](../docs/benchmarks/2026-05-20-coding-agent-life-v1.md).

	LongMemEval-S (ICLR 2025, 500 вопросов)

	\| Система \| R@5 \| R@10 \| MRR \|
	\|---\|---\|---\|---\|
	\| agentmemory \| 95.2% \| 98.6% \| 88.2% \|
	\| Fallback только BM25 \| 86.2% \| 94.6% \| 71.5% \|

	</td>
	<td width="50%">

	### Экономия токенов

	\| Подход \| Токенов в год \| Стоимость в год \|
	\|---\|---\|---\|
	\| Вставлять весь контекст \| 19,5М+ \| Невозможно (выходит за окно) \|
	\| LLM-резюме \| ~650K \| ~500 $ \|
	\| agentmemory \| ~170K \| ~10 $ \|
	\| agentmemory + локальные эмбеддинги \| ~170K \| 0 $ \|

	</td>
	</tr>
	</table>

	> Модель эмбеддингов: `all-MiniLM-L6-v2` (локальная, бесплатная, без API-ключа). Полные отчёты: [`benchmark/LONGMEMEVAL.md`](../benchmark/LONGMEMEVAL.md), [`benchmark/QUALITY.md`](../benchmark/QUALITY.md), [`benchmark/SCALE.md`](../benchmark/SCALE.md). Сравнение с конкурентами: [`benchmark/COMPARISON.md`](../benchmark/COMPARISON.md) — agentmemory против mem0, Letta, Khoj, claude-mem, Hippo.

	Воспроизведите локально: [`eval/README.md`](../eval/README.md) — harness с подключаемыми адаптерами для LongMemEval `_s` (публичный, 500 вопросов) и `coding-agent-life-v1` (внутренний корпус из 15 сессий). Адаптеры grep / vector / agentmemory сравниваются бок о бок, вывод NDJSON, опубликованные scorecard'ы попадают в [`docs/benchmarks/`](../docs/benchmarks/).

	Хорошо сочетается с [codegraph](https://github.com/colbymchenry/codegraph), [Understand Anything](https://github.com/Lum1104/Understand-Anything) и [Graphify](https://github.com/safishamsi/graphify). Индексация кодового графа, мультиагентные конвейеры сборки и более широкие графы знаний по докам / PDF / изображениям / видео. agentmemory запоминает работу; эти три проекта подсвечивают остальное в слое контекста. Рецепты и таблица маршрутизации вопросов: [`docs/recipes/pairings.md`](../docs/recipes/pairings.md).

	---

	<h2 id="vs-competitors"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-competitors.svg"><img src="../assets/tags/section-competitors.svg" alt="Сравнение с конкурентами" height="32" /></picture></h2>

	<table>
	<tr>
	<th width="20%"></th>
	<th width="20%">agentmemory</th>
	<th width="20%">mem0 (53K ⭐)</th>
	<th width="20%">Letta / MemGPT (22K ⭐)</th>
	<th width="20%">Встроенное (CLAUDE.md)</th>
	</tr>
	<tr>
	<td><strong>Тип</strong></td>
	<td>Движок памяти + MCP-сервер</td>
	<td>API уровня памяти</td>
	<td>Полноценный агентский runtime</td>
	<td>Статический файл</td>
	</tr>
	<tr>
	<td><strong>R@5 при извлечении</strong></td>
	<td><strong>95.2%</strong></td>
	<td>68.5% (LoCoMo)</td>
	<td>83.2% (LoCoMo)</td>
	<td>Н/Д (grep)</td>
	</tr>
	<tr>
	<td><strong>Авто-захват</strong></td>
	<td>12 хуков (никаких ручных усилий)</td>
	<td>Ручные вызовы <code>add()</code></td>
	<td>Агент сам редактирует</td>
	<td>Ручное редактирование</td>
	</tr>
	<tr>
	<td><strong>Поиск</strong></td>
	<td>BM25 + векторный + граф (RRF-слияние)</td>
	<td>Векторный + граф</td>
	<td>Векторный (архивный)</td>
	<td>Загружает всё в контекст</td>
	</tr>
	<tr>
	<td><strong>Мультиагентность</strong></td>
	<td>MCP + REST + lease'ы + сигналы</td>
	<td>API (без координации)</td>
	<td>Только внутри runtime Letta</td>
	<td>Отдельные файлы на агента</td>
	</tr>
	<tr>
	<td><strong>Привязка к фреймворку</strong></td>
	<td>Нет (любой MCP-клиент)</td>
	<td>Нет</td>
	<td>Высокая (нужен Letta)</td>
	<td>Формат на агента</td>
	</tr>
	<tr>
	<td><strong>Внешние зависимости</strong></td>
	<td>Нет (SQLite + iii-engine)</td>
	<td>Qdrant / pgvector</td>
	<td>Postgres + векторная БД</td>
	<td>Нет</td>
	</tr>
	<tr>
	<td><strong>Жизненный цикл памяти</strong></td>
	<td>4-уровневая консолидация + затухание + авто-забывание</td>
	<td>Пассивное извлечение</td>
	<td>Управляется агентом</td>
	<td>Ручное усечение</td>
	</tr>
	<tr>
	<td><strong>Эффективность по токенам</strong></td>
	<td>~1 900 токенов/сессия (10 $/год)</td>
	<td>Зависит от интеграции</td>
	<td>Core memory в контексте</td>
	<td>22K+ токенов при 240 наблюдениях</td>
	</tr>
	<tr>
	<td><strong>Просмотрщик в реальном времени</strong></td>
	<td>Да (порт 3113)</td>
	<td>Облачная панель</td>
	<td>Облачная панель</td>
	<td>Нет</td>
	</tr>
	<tr>
	<td><strong>Self-hosted</strong></td>
	<td>Да (по умолчанию)</td>
	<td>Опционально</td>
	<td>Опционально</td>
	<td>Да</td>
	</tr>
	</table>

	---

	<h2 id="quick-start"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-quickstart.svg"><img src="../assets/tags/section-quickstart.svg" alt="Быстрый старт" height="32" /></picture></h2>

	Совместимость: этот релиз нацелен на стабильный `iii-sdk` `^0.11.0` и iii-engine v0.11.x.

	### Попробуйте за 30 секунд

	```bash
	# Terminal 1: start the server
	npx @agentmemory/agentmemory

	# Terminal 2: seed sample data and see recall in action
	npx @agentmemory/agentmemory demo
	```

	`demo` заполняет 3 реалистичные сессии (JWT-аутентификация, исправление N+1-запроса, rate limiting) и запускает по ним семантический поиск. Вы увидите, как находится «N+1 query fix», когда вы ищете «database performance optimization» — keyword-сопоставление так не умеет.

	Откройте `http://localhost:3113`, чтобы видеть построение памяти в реальном времени.

	### Рекомендуется: глобальная установка

	`npx` кеширует пакеты по версиям. Если на прошлой неделе вы запускали `npx @agentmemory/agentmemory@0.9.14`, простой `npx @agentmemory/agentmemory` может выдать застаревшую 0.9.14 из `~/.npm/_npx/`, а не последний релиз. Установите один раз — и команда `agentmemory` будет работать везде:

	```bash
	npm install -g @agentmemory/agentmemory
	# If you hit EACCES on macOS/Linux system Node installs, retry with:
	# sudo npm install -g @agentmemory/agentmemory
	agentmemory # start the server (same as the npx form)
	agentmemory stop # tear it down
	agentmemory remove # uninstall everything we created
	agentmemory connect claude-code # wire one agent
	agentmemory doctor # interactive diagnostics + fix prompts
	```

	Начиная с v0.9.16, первый запуск npx предлагает установку глобально в той же строке — ответьте `Y` один раз, и готово. Если вы пропустили шаг, воспользуйтесь любым из этих вариантов для свежего скачивания:

	```bash
	npx -y @agentmemory/agentmemory@latest # forces latest from npm (cross-platform)
	rm -rf ~/.npm/_npx && npx @agentmemory/agentmemory # macOS/Linux only (POSIX shell)
	```

	В Windows / PowerShell эквивалент очистки кеша — `Remove-Item -Recurse -Force "$env:LOCALAPPDATA\npm-cache\_npx"`, а вариант выше `npx -y ...@latest` остаётся кросс-платформенным.

	### Воспроизведение сессий

	Каждую сессию, которую записывает agentmemory, можно воспроизвести. Откройте просмотрщик, выберите вкладку Replay и пролистывайте таймлайн: промпты, вызовы инструментов, результаты вызовов и ответы отображаются как отдельные события с play/pause, регулировкой скорости (0,5×–4×) и горячими клавишами (пробел переключает, стрелки — пошаговое перемещение).

	Уже есть старые JSONL-расшифровки Claude Code, которые хотите подгрузить?

	```bash
	# Import everything under the default ~/.claude/projects
	npx @agentmemory/agentmemory import-jsonl

	# Or import a single file
	npx @agentmemory/agentmemory import-jsonl ~/.claude/projects/-my-project/abc123.jsonl
	```

	Импортированные сессии появятся в Replay-пикере рядом с нативными. Под капотом каждая запись проходит через iii-функции `mem::replay::load`, `mem::replay::sessions` и `mem::replay::import-jsonl` — никаких побочных серверов.

	### Обновление / Обслуживание

	Используйте команду обслуживания, когда специально хотите обновить локальный runtime:

	```bash
	npx @agentmemory/agentmemory upgrade
	```

	Внимание: команда меняет текущее рабочее окружение / runtime. Она может обновлять JavaScript-зависимости, может запустить `cargo install iii-engine --force`, может стянуть Docker-образы.

	Детали реализации — в `src/cli.ts` (см. `runUpgrade` в районе `src/cli.ts:544-595`).

	### Claude Code (один блок, вставьте его)

	```text
	Install agentmemory: run `npx @agentmemory/agentmemory` in a separate terminal to start the memory server. Then run `/plugin marketplace add rohitg00/agentmemory` and `/plugin install agentmemory` — the plugin registers all 12 hooks, 4 skills, AND auto-wires the `@agentmemory/mcp` stdio server via its `.mcp.json`, so you get 53 MCP tools (memory_smart_search, memory_save, memory_sessions, memory_governance_delete, etc.) without any extra config step. Verify with `curl http://localhost:3111/agentmemory/health`. The real-time viewer is at http://localhost:3113.
	```

	#### Claude Code без установки плагина (путь MCP-standalone)

	Если подключать MCP-сервер agentmemory через `~/.claude.json` напрямую, минуя `/plugin install`, Claude Code никогда не разрешит `${CLAUDE_PLUGIN_ROOT}`, и в `~/.claude/settings.json` придётся прописывать абсолютные пути к скриптам хуков. Эти пути обычно включают версию agentmemory (например, `~/.codex/plugins/cache/agentmemory/agentmemory/0.9.21/scripts/…`), так что следующее обновление тихо ломает каждый хук ([#508](https://github.com/rohitg00/agentmemory/issues/508)).

	Обходное решение:

	```bash
	agentmemory connect claude-code --with-hooks
	```

	Это вливает те же команды хуков в `~/.claude/settings.json` с абсолютными путями, разрешёнными в каталог `plugin/` текущего установленного пакета `@agentmemory/agentmemory`. После обновления agentmemory запустите команду ещё раз, чтобы освежить пути. Записи пользователя в этом файле сохраняются; заменяются только предыдущие записи agentmemory. Рекомендуемым способом остаётся путь через `/plugin install`.
	Для удалённых или защищённых развертываний запускайте Claude Code с заданными `AGENTMEMORY_URL` и `AGENTMEMORY_SECRET`. Плагин пробрасывает обе переменные во встроенный MCP-сервер; если `AGENTMEMORY_URL` пуст, MCP-shim использует `http://localhost:3111`.

	### Codex CLI (платформа плагинов Codex)

	```bash
	# 1. start the memory server in a separate terminal
	npx @agentmemory/agentmemory

	# 2. register the agentmemory marketplace and install the plugin
	codex plugin marketplace add rohitg00/agentmemory
	codex plugin add agentmemory@agentmemory
	```

	Плагин Codex поставляется из того же каталога `plugin/`, что и плагин Claude Code. Он регистрирует:

	- `@agentmemory/mcp` как MCP-сервер (проксирует все 51 инструмент, когда `AGENTMEMORY_URL` указывает на работающий сервер agentmemory; локально откатывается к 7 инструментам, если сервер недоступен)
	- 6 хуков жизненного цикла: `SessionStart`, `UserPromptSubmit`, `PreToolUse`, `PostToolUse`, `PreCompact`, `Stop`
	- 4 skill'а: `/recall`, `/remember`, `/session-history`, `/forget`

	Хук-движок Codex подставляет `CLAUDE_PLUGIN_ROOT` в подпроцессы хуков (см. [`codex-rs/hooks/src/engine/discovery.rs`](https://github.com/openai/codex/blob/main/codex-rs/hooks/src/engine/discovery.rs)), поэтому одни и те же скрипты хуков работают на обоих хостах без дублирования. События Subagent / SessionEnd / Notification / TaskCompleted / PostToolUseFailure доступны только в Claude Code и для Codex не регистрируются.

	#### Codex Desktop: хуки плагинов сейчас тихие (есть обходное решение)

	`CodexHooks` и `PluginHooks` оба стабильны и включены по умолчанию в [`codex-rs/features/src/lib.rs`](https://github.com/openai/codex/blob/main/codex-rs/features/src/lib.rs), но текущие сборки Codex Desktop не диспатчат локальный `hooks.json` плагина ([openai/codex#16430](https://github.com/openai/codex/issues/16430)). Инструменты MCP по-прежнему работают; не хватает только наблюдений жизненного цикла.

	Пока upstream не подвезёт фикс, продублируйте те же команды хуков в глобальный `~/.codex/hooks.json`:

	```bash
	agentmemory connect codex --with-hooks
	```

	Это добавляет идемпотентный блок в `~/.codex/hooks.json` со ссылками на абсолютные пути к встроенным скриптам (раскрывать `${CLAUDE_PLUGIN_ROOT}` на уровне пользователя не нужно). После обновления agentmemory запустите ту же команду ещё раз, чтобы освежить пути. Записи пользователя в этом файле сохраняются; заменяются только предыдущие записи agentmemory.

	<details>
	<summary><b>OpenClaw (вставьте этот промпт)</b></summary>

	```text
	Install agentmemory for OpenClaw. Run `npx @agentmemory/agentmemory` in a separate terminal to start the memory server on localhost:3111. Then add this to my OpenClaw MCP config so agentmemory is available with all 51 memory tools:

	{
	"mcpServers": {
	"agentmemory": {
	"command": "npx",
	"args": ["-y", "@agentmemory/mcp"],
	"env": {
	"AGENTMEMORY_URL": "http://localhost:3111"
	}
	}
	}
	}

	Restart OpenClaw. Verify with `curl http://localhost:3111/agentmemory/health`. Open http://localhost:3113 for the real-time viewer. For deeper memory-slot integration, copy `integrations/openclaw` to `~/.openclaw/extensions/agentmemory` and enable `plugins.slots.memory = "agentmemory"` in `~/.openclaw/openclaw.json`.
	```

	Полное руководство: [`integrations/openclaw/`](../integrations/openclaw/)

	</details>

	<details>
	<summary><b>Hermes Agent (вставьте этот промпт)</b></summary>

	```text
	Install agentmemory for Hermes. Run `npx @agentmemory/agentmemory` in a separate terminal to start the memory server on localhost:3111. Then add this to ~/.hermes/config.yaml so Hermes can use agentmemory as an MCP server with all 51 memory tools:

	mcp_servers:
	agentmemory:
	command: npx
	args: ["-y", "@agentmemory/mcp"]

	memory:
	provider: agentmemory

	Verify with `curl http://localhost:3111/agentmemory/health`. Open http://localhost:3113 for the real-time viewer. For deeper 6-hook memory provider integration (pre-LLM context injection, turn capture, MEMORY.md mirroring, system prompt block), copy integrations/hermes from the agentmemory repo to ~/.hermes/plugins/agentmemory.
	```

	Полное руководство: [`integrations/hermes/`](../integrations/hermes/)

	</details>

	### Другие агенты

	Запустите сервер памяти: `npx @agentmemory/agentmemory`

	Запись agentmemory — это один и тот же блок MCP-сервера для всех хостов, использующих формат `mcpServers` (Cursor, Claude Desktop, Cline, Roo Code, Windsurf, Gemini CLI, OpenClaw):

	```json
	"agentmemory": {
	"command": "npx",
	"args": ["-y", "@agentmemory/mcp"],
	"env": {
	"AGENTMEMORY_URL": "${AGENTMEMORY_URL}",
	"AGENTMEMORY_SECRET": "${AGENTMEMORY_SECRET}"
	}
	}
	```

	Вставьте эту запись в существующий объект `mcpServers` в файле конфигурации хоста — не заменяйте сам файл. Если там уже есть другие серверы, добавьте `agentmemory` рядом с ними как новый ключ внутри `mcpServers`. Если `mcpServers` отсутствует совсем, вставьте блок внутрь `{ "mcpServers": { ... } }`. Подстановки `${VAR}` наследуют `AGENTMEMORY_URL` / `AGENTMEMORY_SECRET` из shell в момент запуска MCP-сервера — незаданные переменные передаются пустыми, и shim откатывается на `http://localhost:3111`. Одна подключённая запись покрывает как локальные, так и удалённые (k8s / reverse-proxied) развертывания.

	\| Агент \| Файл конфигурации \| Заметки \|
	\|---\|---\|---\|
	\| Cursor \| `~/.cursor/mcp.json` \| Добавить в `mcpServers`. Также доступен deeplink в один клик на сайте. \|
	\| Claude Desktop \| `claude_desktop_config.json` (Application Support) \| Добавить в `mcpServers`. После правки перезапустить Claude Desktop. \|
	\| Cline / Roo Code / Kilo Code \| Настройки MCP в Cline (Settings UI → MCP Servers → Edit) \| Тот же блок `mcpServers`. \|
	\| Windsurf \| `~/.codeium/windsurf/mcp_config.json` \| Тот же блок `mcpServers`. \|
	\| Gemini CLI \| `~/.gemini/settings.json` \| `gemini mcp add agentmemory npx -y @agentmemory/mcp --scope user` (автоматическое слияние). \|
	\| OpenClaw \| MCP-конфиг OpenClaw \| Тот же блок `mcpServers`, либо более глубокий [memory-плагин](../integrations/openclaw/). \|
	\| Codex CLI (только MCP) \| `.codex/config.toml` \| Формат TOML: `codex mcp add agentmemory -- npx -y @agentmemory/mcp`, либо добавьте `[mcp_servers.agentmemory]` вручную. \|
	\| Codex CLI (полный плагин) \| Маркетплейс плагинов Codex \| `codex plugin marketplace add rohitg00/agentmemory`, затем `codex plugin add agentmemory@agentmemory`. Регистрирует MCP + 6 хуков жизненного цикла (SessionStart, UserPromptSubmit, PreToolUse, PostToolUse, PreCompact, Stop) + 4 skill'а. На Codex Desktop дополнительно запустите `agentmemory connect codex --with-hooks`, пока не зарелизят [openai/codex#16430](https://github.com/openai/codex/issues/16430) — хуки плагина там пока тихие. \|
	\| OpenCode (только MCP) \| `opencode.json` \| Другая форма — корневой ключ `mcp`, команда задаётся массивом: `{"mcp": {"agentmemory": {"type": "local", "command": ["npx", "-y", "@agentmemory/mcp"], "enabled": true}}}`. \|
	\| OpenCode (полный плагин) \| `plugin/opencode/` \| 22 хука авто-захвата по жизненному циклу сессии, сообщениям, инструментам и ошибкам. Две slash-команды (`/recall`, `/remember`). Скопируйте `plugin/opencode/` в свой рабочий каталог OpenCode и добавьте запись плагина в `opencode.json`. Полная таблица хуков и анализ пробелов — в [`plugin/opencode/README.md`](../plugin/opencode/README.md). \|
	\| pi \| `~/.pi/agent/extensions/agentmemory` \| Скопируйте [`integrations/pi`](../integrations/pi/) и перезапустите pi. \|
	\| Hermes Agent \| `~/.hermes/config.yaml` \| Используйте более глубокий [плагин провайдера памяти](../integrations/hermes/) с `memory.provider: agentmemory`. \|
	\| Qwen Code \| `~/.qwen/settings.json` \| `agentmemory connect qwen` записывает стандартный блок `mcpServers`. Payload хуков по полям совместим с Claude Code, поэтому существующие 12 скриптов хуков работают без изменений — подключите их через секцию `hooks` в том же `settings.json`. \|
	\| Antigravity (заменяет Gemini CLI) \| `mcp_config.json` (в каталоге User у Antigravity) \| `agentmemory connect antigravity` записывает стандартный блок `mcpServers`. macOS: `~/Library/Application Support/Antigravity/User/`. Linux: `~/.config/Antigravity/User/`. Использовать после отключения Gemini CLI 2026-06-18. \|
	\| Kiro \| `~/.kiro/settings/mcp.json` \| `agentmemory connect kiro` записывает конфиг на уровне пользователя. Workspace-переопределения — в `.kiro/settings/mcp.json` рядом с кодом. \|
	\| Goose \| UI настроек MCP в Goose \| Тот же блок `mcpServers`. \|
	\| Aider \| н/д \| Разговаривайте напрямую с REST API: `curl -X POST http://localhost:3111/agentmemory/smart-search -d '{"query": "auth"}'`. \|
	\| Любой агент (32+) \| н/д \| `npx skillkit install agentmemory` сам определит хост и сольёт настройки. \|

	MCP-клиенты в sandbox (Flatpak / Snap / ограничивающие контейнеры), которые не могут добраться до `localhost` хоста: дополнительно установите `"AGENTMEMORY_FORCE_PROXY": "1"` в блоке `env` и укажите `AGENTMEMORY_URL` на маршрут, до которого sandbox действительно может дотянуться (например, IP в локальной сети). См. [#234](https://github.com/rohitg00/agentmemory/issues/234) для пошаговой диагностики.

	### Программный доступ (Python / Rust / Node)

	agentmemory регистрирует свои основные операции как iii-функции (`mem::remember`, `mem::observe`, `mem::context`, `mem::smart-search`, `mem::forget`). Любой язык с SDK для iii может вызывать их напрямую через `ws://localhost:49134` — отдельный REST-клиент на каждый язык не требуется.

	```bash
	pip install iii-sdk # Python
	cargo add iii-sdk # Rust
	npm install iii-sdk # Node
	```

	```python
	from iii import register_worker

	iii = register_worker("ws://localhost:49134")
	iii.connect()

	iii.trigger({
	"function_id": "mem::smart-search",
	"payload": {"project": "demo", "query": "how do tokens refresh"},
	})
	```

	Рабочий пример: [`examples/python/`](../examples/python/) (быстрый старт + поток наблюдения/извлечения). REST на `:3111` остаётся доступным для хостов без iii-runtime.

	### Из исходников

	```bash
	git clone https://github.com/rohitg00/agentmemory.git && cd agentmemory
	npm install && npm run build && npm start
	```

	Это поднимает agentmemory с локальным `iii-engine`, если `iii` уже установлен, либо откатывается к Docker Compose, если есть Docker. REST, стримы и просмотрщик по умолчанию слушают на `127.0.0.1`.

	Установите `iii-engine` вручную. agentmemory сейчас зафиксирован на `iii-engine` `v0.11.2` — `v0.11.6` вводит новую модель «всё через `iii worker add` в sandbox», под которую agentmemory ещё не отрефакторен. Закрепление снимется, как только рефакторинг будет завершён. Переопределите через `AGENTMEMORY_III_VERSION=<version>`, если вы вручную перешли на sandbox-модель.

	- macOS arm64: `mkdir -p ~/.local/bin && curl -fsSL https://github.com/iii-hq/iii/releases/download/iii/v0.11.2/iii-aarch64-apple-darwin.tar.gz \| tar -xz -C ~/.local/bin && chmod +x ~/.local/bin/iii`
	- macOS x64: замените `aarch64-apple-darwin` на `x86_64-apple-darwin`
	- Linux x64: замените на `x86_64-unknown-linux-gnu`
	- Linux arm64: замените на `aarch64-unknown-linux-gnu`
	- Windows: скачайте `iii-x86_64-pc-windows-msvc.zip` из [iii-hq/iii releases v0.11.2](https://github.com/iii-hq/iii/releases/tag/iii%2Fv0.11.2), распакуйте `iii.exe`, добавьте в PATH

	Либо используйте Docker (входящий в комплект `docker-compose.yml` тянет `iiidev/iii:0.11.2`). Полная документация: [iii.dev/docs](https://iii.dev/docs).

	### Windows

	agentmemory работает на Windows 10/11, но одного Node.js-пакета мало — также нужен runtime `iii-engine` (отдельный нативный бинарь) как фоновый процесс. Официальный upstream-установщик — это `sh`-скрипт, на сегодня нет ни PowerShell-установщика, ни пакета scoop/winget, поэтому у пользователей Windows два пути:

	Вариант A — Готовый Windows-бинарь (рекомендуется):

	```powershell
	# 1. Open https://github.com/iii-hq/iii/releases/tag/iii%2Fv0.11.2 in your browser
	# (we pin to v0.11.2 until agentmemory refactors for the new sandbox
	# model that engine v0.11.6+ requires)
	# 2. Download iii-x86_64-pc-windows-msvc.zip
	# (or iii-aarch64-pc-windows-msvc.zip if you're on an ARM machine)
	# 3. Extract iii.exe somewhere on PATH, or place it at:
	# %USERPROFILE%\.local\bin\iii.exe
	# (agentmemory checks that location automatically)
	# 4. Verify:
	iii --version
	# Should print: 0.11.2

	# 5. Then run agentmemory as usual:
	npx -y @agentmemory/agentmemory
	```

	Вариант B — Docker Desktop:

	```powershell
	# 1. Install Docker Desktop for Windows
	# 2. Start Docker Desktop and make sure the engine is running
	# 3. Run agentmemory — it will auto-start the bundled compose file:
	npx -y @agentmemory/agentmemory
	```

	Вариант C — только standalone MCP (без движка): если вам нужны только MCP-инструменты для агента и не нужны REST API, просмотрщик или cron-задачи, пропустите движок целиком:

	```powershell
	npx -y @agentmemory/agentmemory mcp
	# or via the shim package:
	npx -y @agentmemory/mcp
	```

	Диагностика на Windows: если `npx @agentmemory/agentmemory` падает, перезапустите с `--verbose`, чтобы увидеть реальный stderr движка. Частые сценарии сбоя:

	\| Симптом \| Что делать \|
	\|---\|---\|
	\| `iii-engine process started`, затем `did not become ready within 15s` \| Движок упал при старте — перезапустите с `--verbose`, проверьте stderr \|
	\| `Could not start iii-engine` \| Не установлены ни `iii.exe`, ни Docker. См. варианты A или B выше \|
	\| Конфликт порта \| `netstat -ano \\| findstr :3111`, чтобы понять, что занимает порт, затем убить процесс или использовать `--port <N>` \|
	\| Откат на Docker пропускается, хотя Docker установлен \| Убедитесь, что Docker Desktop действительно запущен (иконка в трее) \|

	> Примечание: команды `cargo install iii-engine` нет — `iii` не публикуется на crates.io. Поддерживаются только три способа установки: готовый бинарь выше, upstream-`sh`-скрипт (только macOS/Linux) и Docker-образ.

	---

	<h2 id="deploy">Развёртывание</h2>

	Шаблоны в один клик для managed-хостов. Каждый поставляет автономный
	Dockerfile, который тянет `@agentmemory/agentmemory` из npm и копирует
	бинарь iii engine из официального образа `iiidev/iii` на Docker
	Hub — собственный преcобранный образ agentmemory не нужен. Постоянное
	хранилище монтируется в `/data`; entrypoint при первом запуске
	перезаписывает поставляемый npm'ом iii-конфиг (который слушает на
	`127.0.0.1`) на deploy-вариант, слушающий на `0.0.0.0` и
	использующий абсолютные пути `/data`, генерирует HMAC-секрет,
	а затем понижает привилегии с `root` до `node` через `gosu`
	перед запуском CLI agentmemory.

	<p>
	<a href="https://fly.io/launch?repo=https://github.com/rohitg00/agentmemory&path=deploy/fly"><img src="https://img.shields.io/badge/Deploy%20to-fly.io-8b5cf6?style=for-the-badge&logo=fly.io&logoColor=white" alt="Deploy to fly.io" /></a>
	<a href="https://railway.com/new/template?template=https%3A%2F%2Fgithub.com%2Frohitg00%2Fagentmemory&rootDirectory=deploy%2Frailway"><img src="https://img.shields.io/badge/Deploy%20to-Railway-0B0D0E?style=for-the-badge&logo=railway&logoColor=white" alt="Deploy to Railway" /></a>
	</p>

	Кнопке Render «деплой в один клик» нужен `render.yaml` в корне репозитория, который мы намеренно держим чистым. Используйте схему через Render Blueprint, описанную в [`deploy/render/`](./deploy/render/README.md), чтобы вручную указать на in-repo blueprint.

	Полные детали настройки (захват HMAC, SSH-туннель к просмотрщику, ротация, бэкап, нижние пороги стоимости) — в [`deploy/`](./deploy/README.md):

	- [`deploy/fly`](./deploy/fly/README.md) — одна машина с
	`auto_stop_machines = "stop"`; дешевле всего в простое.
	- [`deploy/railway`](./deploy/railway/README.md) — фиксированный тариф Hobby,
	том в панели.
	- [`deploy/render`](./deploy/render/README.md) — поток Blueprint,
	автоматические снапшоты диска на платных тарифах.
	- [`deploy/coolify`](./deploy/coolify/README.md) — self-hosted на собственном
	VPS через [Coolify](https://coolify.io/self-hosted); тот же Docker
	Compose-стек, хост и данные у вас.

	Публикуется только порт `3111`. Просмотрщик на `3113` остаётся
	привязанным к loopback внутри контейнера — в README каждого шаблона
	описан паттерн SSH-туннеля, чтобы до него достучаться.

	---

	<h2 id="why-agentmemory"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-why.svg"><img src="../assets/tags/section-why.svg" alt="Зачем agentmemory" height="32" /></picture></h2>

	Каждый агент программирования забывает всё, когда сессия заканчивается. Вы тратите первые 5 минут каждой сессии на повторное объяснение своего стека. agentmemory работает в фоне и устраняет это полностью.

	```text
	Session 1: "Add auth to the API"
	Agent writes code, runs tests, fixes bugs
	agentmemory silently captures every tool use
	Session ends -> observations compressed into structured memory

	Session 2: "Now add rate limiting"
	Agent already knows:
	- Auth uses JWT middleware in src/middleware/auth.ts
	- Tests in test/auth.test.ts cover token validation
	- You chose jose over jsonwebtoken for Edge compatibility
	Zero re-explaining. Starts working immediately.
	```

	### vs встроенная память агента

	Каждый ИИ-агент программирования поставляется со встроенной памятью — у Claude Code есть `MEMORY.md`, у Cursor — notepad'ы, у Cline — memory bank. Это работает как стикеры. agentmemory — индексируемая база данных за этими стикерами.

	\| \| Встроенная (CLAUDE.md) \| agentmemory \|
	\|---\|---\|---\|
	\| Масштаб \| Потолок в 200 строк \| Без ограничений \|
	\| Поиск \| Загружает всё в контекст \| BM25 + векторный + граф (только top-K) \|
	\| Цена в токенах \| 22K+ при 240 наблюдениях \| ~1 900 токенов (на 92 % меньше) \|
	\| Между агентами \| Файлы на каждого агента \| MCP + REST (любой агент) \|
	\| Координация \| Нет \| Lease'ы, сигналы, action'ы, routine'ы \|
	\| Наблюдаемость \| Читать файлы вручную \| Просмотрщик в реальном времени на :3113 \|

	---

	<h2 id="how-it-works"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-how.svg"><img src="../assets/tags/section-how.svg" alt="Как это работает" height="32" /></picture></h2>

	### Конвейер памяти

	```text
	PostToolUse hook fires
	-> SHA-256 dedup (5min window)
	-> Privacy filter (strip secrets, API keys)
	-> Store raw observation
	-> LLM compress -> structured facts + concepts + narrative
	-> Vector embedding (6 providers + local)
	-> Index in BM25 + vector

	Stop / SessionEnd hook fires
	-> Summarize session
	-> Knowledge graph extraction (if GRAPH_EXTRACTION_ENABLED=true)
	-> Slot reflection (if SLOT_REFLECT_ENABLED=true)

	SessionStart hook fires
	-> Load project profile (top concepts, files, patterns)
	-> Hybrid search (BM25 + vector + graph)
	-> Token budget (default: 2000 tokens)
	-> Inject into conversation
	```

	### 4-уровневая консолидация памяти

	Вдохновлено тем, как мозг человека обрабатывает воспоминания — похоже на консолидацию во время сна.

	\| Уровень \| Что \| Аналогия \|
	\|------\|------\|---------\|
	\| Working \| Сырые наблюдения от использования инструментов \| Кратковременная память \|
	\| Episodic \| Сжатые краткие итоги сессий \| «Что произошло» \|
	\| Semantic \| Извлечённые факты и закономерности \| «Что я знаю» \|
	\| Procedural \| Workflow'ы и паттерны принятия решений \| «Как это сделать» \|

	Воспоминания затухают со временем (кривая Эббингауза). Часто используемые воспоминания усиливаются. Устаревшие — автоматически вытесняются. Противоречия обнаруживаются и разрешаются.

	### Что захватывается

	\| Хук \| Захватывает \|
	\|------\|----------\|
	\| `SessionStart` \| Путь к проекту, идентификатор сессии \|
	\| `UserPromptSubmit` \| Пользовательские промпты (с приватным фильтром) \|
	\| `PreToolUse` \| Паттерны доступа к файлам + обогащённый контекст \|
	\| `PostToolUse` \| Имя инструмента, вход, выход \|
	\| `PostToolUseFailure` \| Контекст ошибки \|
	\| `PreCompact` \| Заново подмешивает память перед компакцией \|
	\| `SubagentStart/Stop` \| Жизненный цикл подагентов \|
	\| `Stop` \| Итог в конце сессии \|
	\| `SessionEnd` \| Маркер завершения сессии \|

	### Ключевые возможности

	\| Возможность \| Описание \|
	\|---\|---\|
	\| Автоматический захват \| Каждое использование инструмента записывается через хуки — никаких ручных усилий \|
	\| Семантический поиск \| BM25 + векторный + граф знаний со слиянием RRF \|
	\| Эволюция памяти \| Версионирование, supersession, графы связей \|
	\| Авто-забывание \| Истечение TTL, обнаружение противоречий, вытеснение по важности \|
	\| Privacy first \| API-ключи, секреты, теги `<private>` вырезаются до сохранения \|
	\| Самовосстановление \| Circuit breaker, цепочка fallback-провайдеров, мониторинг состояния \|
	\| Claude bridge \| Двусторонняя синхронизация с MEMORY.md \|
	\| Граф знаний \| Извлечение сущностей + обход BFS \|
	\| Командная память \| Отдельные namespace'ы для общего и приватного у участников команды \|
	\| Происхождение цитат \| Любую запись памяти можно проследить до исходных наблюдений \|
	\| Git-снапшоты \| Версионирование, откат и diff состояния памяти \|

	---

	<h2 id="search"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-search.svg"><img src="../assets/tags/section-search.svg" alt="Поиск" height="32" /></picture></h2>

	Тройной поток извлечения, объединяющий три сигнала:

	\| Поток \| Что делает \| Когда \|
	\|---\|---\|---\|
	\| BM25 \| Сопоставление по стеммированным ключевым словам с расширением синонимами \| Всегда включён \|
	\| Vector \| Косинусное сходство по плотным эмбеддингам \| Если настроен embedding-провайдер \|
	\| Graph \| Обход графа знаний по сопоставлению сущностей \| Если в запросе обнаружены сущности \|

	Сливаются через Reciprocal Rank Fusion (RRF, k=60) и диверсифицируются по сессиям (не более 3 результатов на сессию).

	BM25 «из коробки» токенизирует греческий, кириллицу, иврит, арабский и латиницу с диакритикой. Для записей на китайском / японском / корейском поставьте опциональные сегментаторы (`npm install @node-rs/jieba tiny-segmenter`), чтобы CJK-последовательности разбивались на токены уровня слова; без них agentmemory мягко откатывается к токенизации целых последовательностей и выводит одноразовую подсказку в stderr.

	### Провайдеры эмбеддингов

	agentmemory автоматически определяет вашего провайдера. Для лучших результатов поставьте локальные эмбеддинги (бесплатно):

	```bash
	npm install @xenova/transformers
	```

	\| Провайдер \| Модель \| Стоимость \| Заметки \|
	\|---\|---\|---\|---\|
	\| Локально (рекомендуется) \| `all-MiniLM-L6-v2` \| Бесплатно \| Офлайн, +8 пп recall по сравнению только с BM25 \|
	\| Gemini \| `gemini-embedding-001` \| Бесплатный тариф \| 100+ языков, размерности 768/1536/3072 (MRL), вход 2048 токенов. Заменяет `text-embedding-004` ([устарел, отключение 14 янв. 2026](https://ai.google.dev/gemini-api/docs/deprecations)) \|
	\| OpenAI \| `text-embedding-3-small` \| 0,02 $/1M \| Высочайшее качество \|
	\| Voyage AI \| `voyage-code-3` \| Платно \| Оптимизирован под код \|
	\| Cohere \| `embed-english-v3.0` \| Бесплатная пробная версия \| Общего назначения \|
	\| OpenRouter \| Любая модель \| Зависит \| Мульти-модельный прокси \|

	---

	<h2 id="mcp-server"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-mcp.svg"><img src="../assets/tags/section-mcp.svg" alt="MCP-сервер" height="32" /></picture></h2>

	53 инструмента, 6 ресурсов, 3 промпта и 4 skill'а — самый исчерпывающий MCP-набор для памяти любого агента.

	> MCP-shim против полного сервера: опубликованный пакет `@agentmemory/mcp` — это тонкий shim. Он раскрывает полную поверхность из 51 инструмента только если может достучаться до работающего сервера agentmemory через `AGENTMEMORY_URL` (режим прокси). Если сервер недоступен, shim откатывается к локальному набору из 7 инструментов (`memory_save`, `memory_recall`, `memory_smart_search`, `memory_sessions`, `memory_export`, `memory_audit`, `memory_governance_delete`). Переменная окружения `AGENTMEMORY_TOOLS=core\|all` — серверный флаг; задавать её в блоке `env` shim'а бесполезно. Если в Cursor / OpenCode / Gemini CLI видно только 7 инструментов, запустите `npx @agentmemory/agentmemory` (или Docker-стек) и установите `AGENTMEMORY_URL=http://localhost:3111`.

	### 51 инструмент

	<details>
	<summary>Базовые инструменты (всегда доступны)</summary>

	\| Инструмент \| Описание \|
	\|------\|-------------\|
	\| `memory_recall` \| Искать в прошлых наблюдениях \|
	\| `memory_compress_file` \| Сжимать markdown-файлы с сохранением структуры \|
	\| `memory_save` \| Сохранить инсайт, решение или паттерн \|
	\| `memory_patterns` \| Выявить повторяющиеся паттерны \|
	\| `memory_smart_search` \| Гибридный семантический + keyword-поиск \|
	\| `memory_file_history` \| Прошлые наблюдения о конкретных файлах \|
	\| `memory_sessions` \| Список последних сессий \|
	\| `memory_timeline` \| Хронологические наблюдения \|
	\| `memory_profile` \| Профиль проекта (концепции, файлы, паттерны) \|
	\| `memory_export` \| Экспортировать все данные памяти \|
	\| `memory_relations` \| Запрос к графу связей \|

	</details>

	<details>
	<summary>Расширенные инструменты (всего 51 — задайте AGENTMEMORY_TOOLS=all)</summary>

	\| Инструмент \| Описание \|
	\|------\|-------------\|
	\| `memory_patterns` \| Выявить повторяющиеся паттерны \|
	\| `memory_timeline` \| Хронологические наблюдения \|
	\| `memory_relations` \| Запрос к графу связей \|
	\| `memory_graph_query` \| Обход графа знаний \|
	\| `memory_consolidate` \| Запустить 4-уровневую консолидацию \|
	\| `memory_claude_bridge_sync` \| Синхронизация с MEMORY.md \|
	\| `memory_team_share` \| Поделиться с участниками команды \|
	\| `memory_team_feed` \| Недавно расшаренные элементы \|
	\| `memory_audit` \| Аудит-журнал операций \|
	\| `memory_governance_delete` \| Удалить с записью в аудит-журнал \|
	\| `memory_snapshot_create` \| Снапшот, версионированный в git \|
	\| `memory_action_create` \| Создать задачи с зависимостями \|
	\| `memory_action_update` \| Обновить статус action \|
	\| `memory_frontier` \| Разблокированные action'ы, отсортированные по приоритету \|
	\| `memory_next` \| Самый важный следующий action \|
	\| `memory_lease` \| Эксклюзивные lease'ы для action'ов (мультиагентность) \|
	\| `memory_routine_run` \| Инстанцировать workflow-routine'ы \|
	\| `memory_signal_send` \| Межагентный обмен сообщениями \|
	\| `memory_signal_read` \| Чтение сообщений с подтверждениями \|
	\| `memory_checkpoint` \| Внешние условные шлюзы \|
	\| `memory_mesh_sync` \| P2P-синхронизация между инстансами \|
	\| `memory_sentinel_create` \| События-наблюдатели \|
	\| `memory_sentinel_trigger` \| Запустить sentinel'ы извне \|
	\| `memory_sketch_create` \| Эфемерные графы action'ов \|
	\| `memory_sketch_promote` \| Перевести в постоянное состояние \|
	\| `memory_crystallize` \| Сжать цепочки action'ов \|
	\| `memory_diagnose` \| Проверки состояния \|
	\| `memory_heal` \| Авто-исправление зависшего состояния \|
	\| `memory_facet_tag` \| Теги вида измерение:значение \|
	\| `memory_facet_query` \| Запрос по фасет-тегам \|
	\| `memory_verify` \| Трассировка происхождения \|

	</details>

	### 6 ресурсов · 3 промпта · 4 skill'а

	\| Тип \| Имя \| Описание \|
	\|------\|------\|-------------\|
	\| Ресурс \| `agentmemory://status` \| Состояние, число сессий, число записей памяти \|
	\| Ресурс \| `agentmemory://project/{name}/profile` \| Интеллект на уровне проекта \|
	\| Ресурс \| `agentmemory://memories/latest` \| 10 последних активных записей памяти \|
	\| Ресурс \| `agentmemory://graph/stats` \| Статистика графа знаний \|
	\| Промпт \| `recall_context` \| Поиск + возврат контекстных сообщений \|
	\| Промпт \| `session_handoff` \| Передача данных между агентами \|
	\| Промпт \| `detect_patterns` \| Анализ повторяющихся паттернов \|
	\| Skill \| `/recall` \| Поиск по памяти \|
	\| Skill \| `/remember` \| Сохранение в долговременную память \|
	\| Skill \| `/session-history` \| Краткие итоги последних сессий \|
	\| Skill \| `/forget` \| Удаление наблюдений / сессий \|

	### Standalone MCP

	Запуск без полного сервера — для любого MCP-клиента. Подойдёт любое:

	```bash
	npx -y @agentmemory/agentmemory mcp # canonical (always available)
	npx -y @agentmemory/mcp # shim package alias
	```

	Или добавьте в MCP-конфиг своего агента:

	Большинство агентов (Cursor, Claude Desktop, Cline, Roo Code, Windsurf, Gemini CLI):
	```json
	{
	"mcpServers": {
	"agentmemory": {
	"command": "npx",
	"args": ["-y", "@agentmemory/mcp"],
	"env": {
	"AGENTMEMORY_URL": "http://localhost:3111"
	}
	}
	}
	}
	```

	Вставьте запись `agentmemory` в существующий объект `mcpServers` хоста, а не заменяйте файл. Для sandbox-клиентов, которые не могут добраться до `localhost` хоста, добавьте `"AGENTMEMORY_FORCE_PROXY": "1"` в блок env и укажите `AGENTMEMORY_URL` на маршрут, доступный из sandbox.

	OpenCode (`opencode.json`):
	```json
	{
	"mcp": {
	"agentmemory": {
	"type": "local",
	"command": ["npx", "-y", "@agentmemory/mcp"],
	"enabled": true
	}
	},
	"plugin": ["./plugins/agentmemory-capture.ts"]
	}
	```

	Скопируйте файл плагина из репозитория:
	```bash
	mkdir -p ~/.config/opencode/plugins
	cp plugin/opencode/agentmemory-capture.ts ~/.config/opencode/plugins/
	cp plugin/opencode/commands/*.md ~/.config/opencode/commands/
	```

	---

	<h2 id="real-time-viewer"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-viewer.svg"><img src="../assets/tags/section-viewer.svg" alt="Просмотрщик реального времени" height="32" /></picture></h2>

	Автоматически запускается на порту `3113`. Живой поток наблюдений, обозреватель сессий, браузер по памяти, визуализация графа знаний и панель состояния.

	```bash
	open http://localhost:3113
	```

	Сервер просмотрщика по умолчанию слушает на `127.0.0.1`. Эндпоинт `/agentmemory/viewer`, отдаваемый REST'ом, подчиняется обычным правилам bearer-токена `AGENTMEMORY_SECRET`. Заголовки CSP используют nonce скрипта на ответ и отключают inline-атрибуты-обработчики (`script-src-attr 'none'`).

	---

	<h2 id="iii-console"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-viewer.svg"><img src="../assets/tags/section-viewer.svg" alt="iii Console" height="32" /></picture></h2>

	Просмотрщик на `:3113` показывает, что ваш агент запомнил. [iii console](https://iii.dev/docs/console) показывает, что ваш агент сделал — каждая операция памяти как трейс OpenTelemetry, каждая запись KV редактируема, каждая функция вызываема, каждый стрим тэппится. Два окна на одну и ту же память: одно повёрнуто к продукту, другое к движку.

	Наблюдайте, как срабатывает `memory_smart_search`, и видите BM25-скан → поиск эмбеддингов → RRF-слияние → reranker в виде waterfall. Отредактируйте зависший таймер консолидации в браузере KV. Воспроизведите хук `PostToolUse` с изменённым payload. Пин WebSocket-стрима — и смотрите, как наблюдения прилетают в реальном времени.

	agentmemory отдаёт это бесплатно, потому что каждая функция, триггер, scope состояния и стрим — это примитив iii: ничего самописного, нечего инструментировать.

	<p align="center">
	<img src="../assets/iii-console/workers.png" alt="Страница Workers в iii console — подключённые воркеры, включая инстансы agentmemory, с живым числом функций и метаданными runtime" width="720" />
	<br/>
	<em>Страница Workers: каждый подключённый воркер — включая сам agentmemory — с PID, количеством функций, runtime и временем последнего появления.</em>
	</p>

	Уже установлено. Console поставляется вместе с `iii` — отдельный установщик не нужен.

	Запускать рядом с agentmemory:

	```bash
	# agentmemory viewer holds port 3113, so run the console on 3114.
	# Engine REST (3111), WebSocket (3112), and bridge (49134) defaults match agentmemory.
	iii console --port 3114
	```

	Затем откройте `http://localhost:3114`. Добавьте `--enable-flow` для экспериментальной страницы графа архитектуры.

	Переопределяйте эндпоинты движка только если вы их перенесли:

	```bash
	iii console --port 3114 \
	--engine-port 3111 \
	--ws-port 3112 \
	--bridge-port 49134
	```

	Что можно делать из console:

	\| Страница \| Зачем \|
	\|------\|-----------\|
	\| Workers \| Видеть каждый подключённый воркер и его живые метрики — включая сам воркер agentmemory. \|
	\| Functions \| Напрямую вызывать любую функцию agentmemory с JSON-payload — удобно для тестов `memory.recall`, `memory.consolidate`, `graph.query` без подключения клиента. \|
	\| Triggers \| Воспроизводить HTTP-, cron-, event- и state-триггеры — запустить cron консолидации вручную, повторить HTTP-маршрут, эмитировать изменение состояния. \|
	\| States \| KV-браузер с полным CRUD — сессии, слоты памяти, lifecycle-таймеры, индекс эмбеддингов — редактирование значений на месте. \|
	\| Streams \| Живой WebSocket-монитор для записей памяти, событий хуков и обновлений наблюдений по мере их прохождения через iii-стримы. \|
	\| Queues \| Долговечные топики очередей + управление dead-letter. Повтор или сброс упавших job'ов эмбеддинга / компрессии. \|
	\| Traces \| Виды waterfall / flame / разбивка по сервисам в OpenTelemetry. Фильтр по `trace_id` показывает, какие функции, обращения к БД и embedding-запросы породил отдельный `memory.search`. \|
	\| Logs \| Структурированные OTEL-логи, фильтруемые и коррелируемые с trace-/span-ID. \|
	\| Config \| Конфигурация runtime — какие именно воркеры, провайдеры и порты использует ваш движок. \|
	\| Flow \| (Опционально, `--enable-flow`) Интерактивный граф архитектуры из всех воркеров, триггеров и стримов. \|

	<p align="center">
	<img src="../assets/iii-console/traces-waterfall.png" alt="Просмотр trace-waterfall в iii console с длительностью каждого span" width="720" />
	<br/>
	<em>Traces: waterfall / flame / разбивка по сервисам для каждой операции памяти.</em>
	</p>

	Traces уже включены:

	`iii-config.yaml` поставляется с включённым воркером `iii-observability` (`exporter: memory`, `sampling_ratio: 1.0`, метрики + логи). Дополнительная настройка не нужна — как только agentmemory запускается, каждая операция памяти эмитит trace-span и структурированный лог, который консоль читает.

	Если хотите экспортировать в Jaeger/Honeycomb/Grafana Tempo, измените `exporter: memory` на `exporter: otlp` и укажите эндпоинт коллектора согласно документации по observability в iii.

	> Внимание: на самой console аутентификация не применяется — держите её привязанной к `127.0.0.1` (по умолчанию) и никогда не выставляйте наружу.

	---

	<h2 id="powered-by-iii"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-architecture.svg"><img src="../assets/tags/section-architecture.svg" alt="Powered by iii" height="32" /></picture></h2>

	agentmemory — это уже работающий инстанс [iii](https://iii.dev). Функции, триггеры, KV-состояние, стримы, OTEL-трейсы — всё это примитивы iii. Вы не ставили Postgres, Redis, Express, pm2 или Prometheus, потому что iii их заменяет.

	Это значит, что одна дополнительная команда расширяет agentmemory целой новой возможностью.

	### Расширить agentmemory одной командой

	```bash
	iii worker add iii-pubsub # fan memory writes out to every connected instance
	iii worker add iii-cron # scheduled consolidation, decay sweeps, snapshot rotation
	iii worker add iii-queue # durable retries for embedding + compression jobs
	iii worker add iii-observability # OTEL traces on every memory op (default on)
	iii worker add iii-sandbox # run recalled code inside an isolated microVM
	iii worker add iii-database # swap in a SQL-backed state adapter
	iii worker add mcp # generic MCP host alongside the agentmemory MCP
	```

	Каждый `iii worker add` регистрирует новые функции и триггеры в том же движке, где уже работает agentmemory. Просмотрщик и console подхватывают их мгновенно — без перезагрузки, новой интеграции или нового контейнера.

	\| `iii worker add` \| Что получаете сверху к agentmemory \|
	\|---\|---\|
	\| [`iii-pubsub`](https://workers.iii.dev/workers/iii-pubsub) \| Память на множестве инстансов: каждое `remember` разлетается, каждое `search` читает объединение \|
	\| [`iii-cron`](https://workers.iii.dev/workers/iii-cron) \| Жизненный цикл по расписанию — ночная консолидация, еженедельные снапшоты, decay по фиксированному таймеру \|
	\| [`iii-queue`](https://workers.iii.dev/workers/iii-queue) \| Надёжные повторы: упавшие job'ы эмбеддинга и компрессии переживают перезапуск, наблюдения не теряются \|
	\| [`iii-observability`](https://workers.iii.dev/workers/iii-observability) \| OTEL-трейсы, метрики, логи на каждой функции — подключены в `iii-config.yaml` с первого дня \|
	\| [`iii-sandbox`](https://workers.iii.dev/workers/iii-sandbox) \| Код, пришедший из `memory_recall`, исполняется внутри одноразовой VM, а не в вашем shell \|
	\| [`iii-database`](https://workers.iii.dev/workers/iii-database) \| SQL-адаптер состояния, когда дефолтная in-memory KV уже мала \|
	\| [`mcp`](https://workers.iii.dev/workers/mcp) \| Поднять дополнительные MCP-серверы рядом с MCP'ом agentmemory, на одном и том же движке \|

	Полный реестр: [workers.iii.dev](https://workers.iii.dev). Каждый воркер там собирается из тех же примитивов, что и agentmemory — и тот agentmemory, который у вас уже есть, — один из них.

	### Что заменяет iii

	\| Традиционный стек \| agentmemory использует \|
	\|---\|---\|
	\| Express.js / Fastify \| iii HTTP Triggers \|
	\| SQLite / Postgres + pgvector \| iii KV State + векторный индекс в памяти \|
	\| SSE / Socket.io \| iii Streams (WebSocket) \|
	\| pm2 / systemd \| Супервизия воркеров движка iii \|
	\| Prometheus / Grafana \| iii OTEL + монитор состояния \|
	\| Самописные плагинные системы \| `iii worker add <name>` \|

	118 исходных файлов · ~21 800 LOC · 950+ тестов · 123 функции · 34 KV-scope'а — всё на трёх примитивах. Никакого `agentmemory plugin install`. Плагинная система — это сам iii.

	---

	<h2 id="configuration"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-config.svg"><img src="../assets/tags/section-config.svg" alt="Конфигурация" height="32" /></picture></h2>

	### LLM-провайдеры

	agentmemory автоопределяет провайдера по окружению. По умолчанию никакие вызовы LLM не выполняются, пока вы не настроите провайдера или явно не включите fallback на подписку Claude.

	\| Провайдер \| Конфигурация \| Заметки \|
	\|----------\|--------\|-------\|
	\| No-op (по умолчанию) \| Настройка не нужна \| LLM-сжатие/резюме ВЫКЛЮЧЕНО. Синтетическое BM25-сжатие и recall продолжают работать. Если вы раньше полагались на fallback подписки Claude — см. `AGENTMEMORY_ALLOW_AGENT_SDK` ниже. \|
	\| Anthropic API \| `ANTHROPIC_API_KEY` \| Поминутная (token-based) оплата \|
	\| MiniMax \| `MINIMAX_API_KEY` \| Совместим с Anthropic \|
	\| Gemini \| `GEMINI_API_KEY` \| Дополнительно включает эмбеддинги \|
	\| OpenRouter \| `OPENROUTER_API_KEY` \| Любая модель \|
	\| Fallback на подписку Claude \| `AGENTMEMORY_ALLOW_AGENT_SDK=true` \| Только по согласию. Запускает сессии `@anthropic-ai/claude-agent-sdk` — раньше приводил к неограниченной рекурсии Stop-хука (продолжение #149), потому больше не по умолчанию. \|

	### Выбор модели с учётом стоимости

	Фоновое сжатие выполняется на каждом наблюдении, поэтому выбор модели заметно влияет на ежемесячные расходы. Замеренные данные нагрузки: 635 запросов / 888K токенов / 35 часов активного использования, прогон против трёх моделей OpenRouter по ценам на 2026-05-23.

	\| Уровень \| Модель \| Вход / 1M \| Выход / 1M \| Стоимость за зафиксированные 35 ч \| Заметки \|
	\|------\|-------\|------------\|-------------\|---------------------------\|-------\|
	\| Рекомендовано \| `deepseek/deepseek-v4-pro` \| 0,435 $ \| 0,87 $ \| ~0,46 $ \| Хорошее качество сжатия и резюмирования при стоимости ~10× ниже Sonnet. \|
	\| Рекомендовано \| `deepseek/deepseek-chat` \| 0,27 $ \| 1,10 $ \| ~0,40 $ \| Постарше, но для рабочих нагрузок только на сжатие по-прежнему годится. \|
	\| Рекомендовано \| `qwen/qwen3-coder` \| 0,45 $ \| 1,80 $ \| ~0,55 $ \| Сильное code-reasoning, если ваши сессии сильно завязаны на код. \|
	\| Premium \| `anthropic/claude-sonnet-4.6` \| 3,00 $ \| 15,00 $ \| ~5,02 $ \| Высокое качество, но дорого для постоянной фоновой работы. \|
	\| Premium \| `openai/gpt-4o` \| 2,50 $ \| 10,00 $ \| ~4,20 $ \| Класс, схожий с Sonnet. \|
	\| Избегать \| `anthropic/claude-opus-4.6` \| 15,00 $ \| 75,00 $ \| ~25+ $ \| Модель класса reasoning; колоссальный перерасход на сжатие. \|

	agentmemory выводит runtime-предупреждение, когда `OPENROUTER_MODEL` совпадает с шаблоном premium-уровня. Установите `AGENTMEMORY_SUPPRESS_COST_WARNING=1`, чтобы заглушить его, как только сделаете осознанный выбор.

	Компромисс качество/цена для работы с памятью: сжатие — это задача резюмирования с относительно мягкими требованиями к качеству (резюме перечитывает агент, не пользователь). DeepSeek-V4-Pro / Qwen3-Coder ложатся на этой задаче в пределах погрешности от Sonnet, стоя примерно в 10 раз дешевле. Премиум-модели оставляйте для запросов, которые читаете напрямую.

	Источники: [цены OpenRouter на Sonnet 4.6](https://openrouter.ai/anthropic/claude-sonnet-4.6/pricing), [DeepSeek V4 Pro](https://openrouter.ai/deepseek/deepseek-v4-pro), [заметки о ценах DeepSeek](https://api-docs.deepseek.com/quick_start/pricing/).

	### Мультиагентная память (`AGENT_ID` + `AGENTMEMORY_AGENT_SCOPE`)

	В мультиагентных конфигурациях, где несколько ролей делят один сервер agentmemory (architect / developer / reviewer / researcher / support-agent), `AGENT_ID` помечает каждую запись ролью, которая её сделала. `AGENTMEMORY_AGENT_SCOPE` управляет тем, фильтрует ли recall по этому тегу.

	```env
	TEAM_ID=company
	USER_ID=engineering-team
	AGENT_ID=architect
	AGENTMEMORY_AGENT_SCOPE=isolated # optional; default "shared"
	```

	Два режима:

	\| Режим \| Помечать записи \| Фильтровать recall \| Когда использовать \|
	\|------\|------------\|---------------\|-------------\|
	\| `shared` (по умолчанию) \| да \| нет \| Общий контекст между агентами с аудит-журналом. Architect видит, что отметил developer, но каждая запись фиксирует, кто это сказал. \|
	\| `isolated` \| да \| да \| Строгое разделение. Architect никогда не увидит наблюдения / записи памяти / сессии developer'а. \|

	Что помечается, когда `AGENT_ID` задан: `Session.agentId`, `RawObservation.agentId`, `CompressedObservation.agentId`, `Memory.agentId`. Роль течёт по `api::session::start` → `mem::observe` → `mem::compress` → KV.

	Что фильтруется в режиме `isolated`: `mem::smart-search`, `/agentmemory/memories`, `/agentmemory/observations`, `/agentmemory/sessions`. Каждый эндпоинт принимает `?agentId=<role>` для переопределения на конкретный запрос и `?agentId=*`, чтобы полностью выйти из env-scope. `/memories` дополнительно принимает `?includeOrphans=true`, чтобы поднять «доисторические» записи памяти, у которых `agentId` не определён.

	Переопределение в самом вызове на уровне SDK / REST: каждый мутирующий эндпоинт (`/session/start`, `/remember`) принимает поле `agentId` в теле запроса, которое выигрывает у env. Полезно для runtime'ов, прогоняющих много ролей через один серверный процесс.

	Когда `AGENT_ID` не задан, память остаётся без scope (legacy-поведение: ни тегов, ни фильтров).

	### Порты

	agentmemory + iii-engine по умолчанию занимают четыре порта. Если перезапуск падает с `port in use`, эта таблица подскажет, какой процесс искать.

	\| Порт \| Процесс \| Назначение \| Override через env \|
	\|------\|---------\|---------\|--------------\|
	\| `3111` \| agentmemory \| REST API + MCP HTTP + `/agentmemory/health` + `/agentmemory/livez` \| `III_REST_PORT` \|
	\| `3112` \| iii-engine \| Внутренний streams-воркер (используется agentmemory + просмотрщиком) \| `III_STREAMS_PORT` \|
	\| `3113` \| agentmemory \| Просмотрщик в реальном времени (`http://localhost:3113`) \| `AGENTMEMORY_VIEWER_PORT` \|
	\| `49134` \| iii-engine \| WebSocket — воркеры регистрируются здесь, по нему же течёт OTel-телеметрия \| `III_ENGINE_URL` (полный URL, по умолчанию `ws://localhost:49134`) \|

	Очистка зависших процессов, если порты остаются занятыми после падения:

	```bash
	# macOS / Linux — find whatever is on each port and kill it
	lsof -i :3111,3112,3113,49134
	pkill -f agentmemory \|\| true
	pkill -f 'iii ' \|\| true

	# Windows
	netstat -ano \| findstr ":3111 :3112 :3113 :49134"
	taskkill /F /PID <pid>
	```

	`agentmemory stop` корректно вычищает и воркер, и pidfile движка при штатном завершении (#640, #474). Ручная очистка выше нужна только в посткрэшевом сценарии, когда ни один pidfile не остался.

	### Конфигурационный файл

	Помещайте runtime-конфигурацию agentmemory в `~/.agentmemory/.env`, а не экспортируйте переменные в каждой сессии shell. Если просмотрщик показывает подсказку настройки вида `export ANTHROPIC_API_KEY=...`, скопируйте её в этот файл как `ANTHROPIC_API_KEY=...` без префикса `export`, затем перезапустите agentmemory.

	Переменные окружения процесса по-прежнему работают и имеют приоритет над значениями из файла.

	В Windows тот же файл лежит в `%USERPROFILE%\.agentmemory\.env`:

	```powershell
	New-Item -ItemType Directory -Force $HOME\.agentmemory
	notepad $HOME\.agentmemory\.env
	```

	Чтобы протестировать с подпиской Claude Code Pro/Max вместо API-ключа, включите её явно:

	```env
	AGENTMEMORY_ALLOW_AGENT_SDK=true
	AGENTMEMORY_AUTO_COMPRESS=true
	```

	В этом же файле включите возможности графа или консолидации, если они нужны:

	```env
	GRAPH_EXTRACTION_ENABLED=true
	CONSOLIDATION_ENABLED=true
	```

	### Переменные окружения

	Создайте `~/.agentmemory/.env`:

	```env
	# LLM provider (pick one — default is the no-op provider: no LLM calls)
	# ANTHROPIC_API_KEY=sk-ant-...
	# ANTHROPIC_BASE_URL=... # Optional: Anthropic-compatible proxy / Azure
	# GEMINI_API_KEY=...
	# OPENROUTER_API_KEY=...
	# MINIMAX_API_KEY=...
	# OPENAI_API_KEY=*** # NOTE: this same key auto-activates BOTH the
	# # OpenAI LLM provider (here) AND the OpenAI
	# # embedding provider (further below). Set
	# # OPENAI_API_KEY_FOR_LLM=false to scope it
	# # to embeddings only.
	# OPENAI_BASE_URL=https://api.openai.com # Optional: override for Azure / vLLM / LM Studio / proxies
	# # Azure: https://<resource>.openai.azure.com/openai/deployments/<deployment>
	# # Auto-detected from `.openai.azure.com` hostname; uses
	# # api-key header + api-version query param.
	# OPENAI_API_VERSION=2024-08-01-preview # Optional: Azure api-version query param
	# OPENAI_MODEL=gpt-4o-mini # Optional: default model
	# OPENAI_TIMEOUT_MS=60000 # Optional: OpenAI-scoped alias for the outbound fetch
	# # timeout. Takes precedence over AGENTMEMORY_LLM_TIMEOUT_MS
	# # for back-compat with v0.9.17. New configs should
	# # prefer the global AGENTMEMORY_LLM_TIMEOUT_MS below.
	# OPENAI_REASONING_EFFORT=none # Optional: "low" \| "medium" \| "high" \| "none"
	# # Honored only by OpenAI's reasoning models (o1, o3,
	# # gpt-*-reasoning) and providers that mirror that
	# # schema (Ollama Cloud thinking models). Standard
	# # chat models reject this field with 400. Set to
	# # "none" for thinking models that return reasoning
	# # but no content.
	# OPENAI_API_KEY_FOR_LLM=false # Optional: set to false to skip OpenAI auto-detection
	# # for LLM (useful if you only want OpenAI for embeddings)
	# Opt-in Claude-subscription fallback (spawns @anthropic-ai/claude-agent-sdk);
	# leave OFF unless you understand the Stop-hook recursion risk (#149 follow-up):
	# AGENTMEMORY_ALLOW_AGENT_SDK=true

	# Embedding provider (auto-detected, or override)
	# EMBEDDING_PROVIDER=local
	# VOYAGE_API_KEY=...
	# OPENAI_API_KEY=sk-...
	# OPENAI_BASE_URL=https://api.openai.com # Override for Azure / vLLM / LM Studio / proxies
	# OPENAI_EMBEDDING_MODEL=text-embedding-3-small
	# OPENAI_EMBEDDING_DIMENSIONS=1536 # Required when the model is not in the known-models table

	# Outbound LLM / embedding timeout
	# AGENTMEMORY_LLM_TIMEOUT_MS=60000 # Default: 60 000 ms (60 s). Applies to every
	# raw-fetch provider (Gemini, OpenRouter, MiniMax,
	# OpenAI LLM, OpenAI/Cohere/Voyage/OpenRouter
	# embedding). For the OpenAI LLM path, the
	# OpenAI-scoped OPENAI_TIMEOUT_MS alias (above)
	# takes precedence when set, for back-compat
	# with v0.9.17.
	# Increase for slow networks or large batch calls;
	# decrease to fail-fast on rate-limit holds.

	# Search tuning
	# BM25_WEIGHT=0.4
	# VECTOR_WEIGHT=0.6
	# TOKEN_BUDGET=2000

	# Auth
	# AGENTMEMORY_SECRET=your-secret

	# Ports (defaults: 3111 API, 3113 viewer)
	# III_REST_PORT=3111

	# Features
	# AGENTMEMORY_AUTO_COMPRESS=false # OFF by default (#138). When on,
	# every PostToolUse hook calls your
	# LLM provider to compress the
	# observation — expect significant
	# token spend on active sessions.
	# AGENTMEMORY_SLOTS=false # OFF by default. Editable pinned
	# memory slots — persona,
	# user_preferences, tool_guidelines,
	# project_context, guidance,
	# pending_items, session_patterns,
	# self_notes. Size-limited; agent
	# edits via memory_slot_* tools.
	# Pinned slots addressable for
	# SessionStart injection.
	# AGENTMEMORY_REFLECT=false # OFF by default. Requires SLOTS=on.
	# Stop hook fires mem::slot-reflect:
	# scans recent observations, auto-
	# appends TODOs to pending_items,
	# counts patterns in
	# session_patterns, records touched
	# files in project_context. Fire-
	# and-forget; does not block.
	# AGENTMEMORY_INJECT_CONTEXT=false # OFF by default (#143). When on:
	# - SessionStart may inject ~1-2K
	# chars of project context into
	# the first turn of each session
	# (this is what actually reaches
	# the model — Claude Code treats
	# SessionStart stdout as context)
	# - PreToolUse fires /agentmemory/enrich
	# on every file-touching tool call
	# (resource cleanup, not a token
	# fix — PreToolUse stdout is debug
	# log only per Claude Code docs)
	# Observations are still captured via
	# PostToolUse regardless of this flag.
	# GRAPH_EXTRACTION_ENABLED=false
	# CONSOLIDATION_ENABLED=true
	# LESSON_DECAY_ENABLED=true
	# OBSIDIAN_AUTO_EXPORT=false
	# AGENTMEMORY_EXPORT_ROOT=~/.agentmemory
	# CLAUDE_MEMORY_BRIDGE=false
	# SNAPSHOT_ENABLED=false

	# Team
	# TEAM_ID=
	# USER_ID=
	# TEAM_MODE=private

	# Tool visibility: "core" (8 tools) or "all" (51 tools)
	# AGENTMEMORY_TOOLS=core
	```

	---

	<h2 id="api"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-api.svg"><img src="../assets/tags/section-api.svg" alt="API" height="32" /></picture></h2>

	124 эндпоинта на порту `3111`. REST API по умолчанию слушает на `127.0.0.1`. Защищённые эндпоинты требуют `Authorization: Bearer <secret>`, когда установлен `AGENTMEMORY_SECRET`, а эндпоинты mesh-синхронизации требуют `AGENTMEMORY_SECRET` на обоих узлах.

	<details>
	<summary>Ключевые эндпоинты</summary>

	\| Метод \| Путь \| Описание \|
	\|--------\|------\|-------------\|
	\| `GET` \| `/agentmemory/health` \| Проверка состояния (всегда публична) \|
	\| `POST` \| `/agentmemory/session/start` \| Запуск сессии + получение контекста \|
	\| `POST` \| `/agentmemory/session/end` \| Завершение сессии \|
	\| `POST` \| `/agentmemory/observe` \| Захват наблюдения \|
	\| `POST` \| `/agentmemory/smart-search` \| Гибридный поиск \|
	\| `POST` \| `/agentmemory/context` \| Генерация контекста \|
	\| `POST` \| `/agentmemory/remember` \| Сохранить в долговременную память \|
	\| `POST` \| `/agentmemory/forget` \| Удалить наблюдения \|
	\| `POST` \| `/agentmemory/enrich` \| Контекст файла + записи памяти + баги \|
	\| `GET` \| `/agentmemory/profile` \| Профиль проекта \|
	\| `GET` \| `/agentmemory/export` \| Экспорт всех данных \|
	\| `POST` \| `/agentmemory/import` \| Импорт из JSON \|
	\| `POST` \| `/agentmemory/graph/query` \| Запрос к графу знаний \|
	\| `POST` \| `/agentmemory/team/share` \| Расшарить в команду \|
	\| `GET` \| `/agentmemory/audit` \| Аудит-журнал \|

	Полный список эндпоинтов: [`src/triggers/api.ts`](../src/triggers/api.ts)

	</details>

	---

	<h2 id="development"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-development.svg"><img src="../assets/tags/section-development.svg" alt="Разработка" height="32" /></picture></h2>

	```bash
	npm run dev # Hot reload
	npm run build # Production build
	npm test # 950+ tests
	npm run test:integration # API tests (requires running services)
	```

	Требования: Node.js >= 20, [iii-engine](https://iii.dev/docs) или Docker

	<h2 id="license"><picture><source media="(prefers-color-scheme: dark)" srcset="../assets/tags/light/section-license.svg"><img src="../assets/tags/section-license.svg" alt="Лицензия" height="32" /></picture></h2>

	[Apache-2.0](../LICENSE)