Graphify для Claude Code и OpenClaw: реальный тест на 78 файлах

Граф знаний из 214 узлов и 24 кластеров, построенный graphify
Интерактивный граф знаний после прогона graphify на 78 заметках

Graphify — это новый open source skill для Claude Code и OpenClaw, который превращает любую папку (код, документы, PDF, картинки) в навигируемый граф знаний с кластеризацией и интерактивным HTML. Установка в одну команду, запуск через /graphify внутри агента, никаких векторных баз и конфигов. Я поставил его, прогнал на собственном архиве из 78 markdown-заметок и в этой статье делюсь честным разбором: что реально работает, что приукрашено, и зачем это нужно конкретно тебе.

⚡ Что это вообще такое

Идея пришла из workflow Андрея Карпатого: бросаешь в папку /raw всё подряд — статьи, твиты, скриншоты, заметки, код — и получаешь структурированный граф, который показывает связи, о которых ты сам не догадывался. Карпати написал об этом 5 апреля 2026, а через двое суток на GitHub появился safishamsi/graphify и сразу собрал 2 тысячи звёзд.

Что делает graphify такого, чего сам Claude или OpenClaw не делает:

  • 🧠 Постоянный граф. Связи между сущностями сохраняются в graphify-out/graph.json и переживают сессию. Можно вернуться через две недели и задавать вопросы без переписывания всех файлов.
  • 📋 Честный аудит. Каждая связь помечается как EXTRACTED (явно в источнике), INFERRED (логичный вывод) или AMBIGUOUS (под вопросом). Сразу видно, что найдено, а что выдумано.
  • 🔍 Кросс-документные сюрпризы. Алгоритм community detection находит связи между концептами в разных файлах, о которых ты бы сам не подумал спросить.

🛠️ Установка за минуту

Самый быстрый путь — через pipx (нужен Python 3.10+):

pipx install graphifyy
graphify install

Внимание: пакет на PyPI пока называется graphifyy с двумя «y» — авторы временно держат это имя, пока перезахватывают graphify. CLI после установки всё равно зовётся graphify.

Команда graphify install копирует skill в ~/.claude/skills/graphify/ и добавляет нужный блок в CLAUDE.md. Для OpenClaw используй флаг: graphify install --platform claw.

После этого в любом проекте набираешь /graphify . — и пайплайн запускается на текущей папке. Поддержка форматов:

  • 💻 Код: 13 языков через AST (Python, TypeScript, Go, Rust, Java и др.)
  • 📄 Документы: Markdown, txt
  • 📚 Научные статьи: PDF
  • 🖼️ Картинки: через Claude Vision (UI-скриншоты, диаграммы, графики, рукописные доски)

📊 Реальный тест: 78 заметок → граф из 217 узлов

Чтобы не пересказывать README, я скормил graphify свой реальный архив: 78 markdown-файлов с ежедневными заметками за два месяца. Это смешанный контент — дневник, идеи проектов, технические записи по OpenClaw, наброски постов, инфраструктурные решения. Около 26 тысяч слов в сумме.

Интерактивный граф знаний из 214 узлов и 263 связей, построенный graphify из 78 markdown-заметок
Интерактивный граф из 214 узлов и 263 связей. Каждый цвет — отдельный кластер, размер узла — количество связей.

Что вышло на выходе:

  • 📦 214 узлов (концептов и сущностей)
  • 🔗 263 связи (плюс 12 гиперсвязей для групп из 3+ узлов)
  • 🎨 24 кластера, выделенных автоматически по плотности связей
  • ⏱️ ~4 минуты от запуска до готового HTML

Топ кластеров после анализа:

КластерУзловО чём
База знаний и subagent-ы26Notion, скрипты синхронизации, агентский стек
Инфраструктура и приватность22VPS, WireGuard, AmneziaWG, Mac mini
Контентный пайплайн20Brave → Sonar → Claude → Gemini → Ghost
OpenClaw Fixer18сервис починки агентов и связанные продукты
Продуктовые решения17когорты обучения, стиль постов, паузы инициатив

Самое интересное — это не сами цифры, а то, что кластеры совпали с реальной структурой работы. Не по датам, не по тегам, а именно по смыслу. Инструмент сам нашёл, что «инфраструктура» и «контент» — это разные ветки, хотя я об этом нигде явно не писал.

🎯 Что работает, а что приукрашено

Реклама обещает «71.5x меньше токенов на запрос». Звучит как маркетинговая дичь, но я залез в исходники: цифра честная, только она про запросы к готовому графу, а не про его построение. Когда ты строишь граф первый раз — платишь полным объёмом токенов на чтение. Зато потом любой вопрос вида «что связано с X» отрабатывает по BFS-обходу одного кластера, а не перечитыванием всех файлов. Вот тут и появляется десятикратная экономия.

Что реально зашло:

  • ✅ Кластеризация работает по смыслу, не по структуре. Файлы не сгруппированы по датам или папкам — а по тому, о чём они на самом деле.
  • ✅ Центральные узлы (top by degree) сразу показывают, чем ты на самом деле занимаешься. У меня в топ-3 вышли OpenClaw и Karamazov Bot — и это правда главные проекты последних месяцев.
  • ✅ Интерактивный HTML с поиском и деталями по клику работает в любом браузере, без сервера.
  • ✅ Аудит-метки EXTRACTED/INFERRED/AMBIGUOUS — отличная штука. Сразу видно, где модель угадала, а где сделала натяжку.

Что приукрашено или ограничено:

  • ⚠️ Пайплайн жёстко завязан на параллельные subagent-ы внутри Claude Code. Без них работать не будет — это не standalone-утилита.
  • ⚠️ Дубликаты узлов. Разные subagent-ы могут дать одной сущности слегка разные id (например OpenClaw и OpenClaw_framework). Лечится повторным прогоном с флагом --update, но из коробки не дедуплицирует.
  • ⚠️ Чистый код-режим (только AST) пока не такой мощный — для real value нужны и доки, и код вместе.

🚀 Когда это реально нужно

Это не «давайте поставим всем». Graphify заходит в трёх ситуациях:

  • 📦 Большой архив записей. Если у тебя за полгода накопилось 50+ заметок и ты уже не помнишь, что с чем связано — это твой кейс. У меня сработало именно так.
  • 🧩 Незнакомая кодовая база. Прогнать на чужом репозитории, чтобы за минуты понять архитектуру и найти центральные модули, не читая каждый файл.
  • 📚 Reading list по теме. Сложить статьи + твиты + скриншоты + свои заметки в одну папку и получить связанную карту области.

Для проекта из 5 файлов смысла нет — обычное чтение быстрее. И для красивых демо «смотрите какой граф» тоже не стоит. Это рабочий инструмент, не игрушка.

❓ FAQ

Сколько токенов уходит на построение графа?
Зависит от объёма. На моих 78 файлах (26 тысяч слов) ушло около 170 тысяч токенов в сумме на четыре параллельных subagent-а. Дальше каждый запрос к графу обходится в районе 1500–3000 токенов вместо чтения всего корпуса.

Нужна ли векторная база (Pinecone, Chroma, Qdrant)?
Нет. Graphify использует именно граф, а не эмбеддинги. Это другой подход с другими сильными сторонами: он лучше для структурных и причинных связей, хуже для нечёткого семантического поиска.

Поддерживает ли OpenClaw?
Да, из коробки. Команда установки: graphify install --platform claw. Skill автоматически подцепляется к OpenClaw-сессии и команда /graphify работает так же, как в Claude Code.

Можно ли запускать инкрементально, не перестраивая всё?
Да, флаг --update переиндексирует только изменённые и новые файлы. Подходит для постоянного добавления новых заметок в одну папку.

Что с приватностью? Файлы куда-то уходят?
Содержимое уходит в Claude (через subagent-ов), как и при обычном использовании Claude Code. Локально на диск пишется только результат — JSON и HTML. Файлы с пометкой sensitive (например .env, ключи) автоматически пропускаются на этапе detection.

В чём разница с обычным RAG?
RAG ищет похожие куски текста по векторам. Graphify строит явный граф сущностей и связей, и при запросе обходит этот граф. Для вопросов «что связано с X», «что между X и Y» graph-подход даёт более структурный и объяснимый ответ. Для свободного семантического поиска — RAG всё ещё сильнее.

Какие выходные форматы?
Из коробки: интерактивный HTML, JSON для GraphRAG, Markdown-отчёт. Опционально: SVG (для встраивания в Notion и GitHub), GraphML (Gephi, yEd), Cypher для Neo4j, MCP-сервер для прямого подключения других агентов.


Если хочешь следить за такими разборами по AI-агентам, OpenClaw и автоматизации — подписывайся на канал @aaakalsin. Там я выкладываю всё, что реально тестирую, без хайпа и маркетинговой ваты.