autorytatywna warstwa pamięci · OpenClaw

Pamięć, która
się uczy i kalibruje.

jhonny's brain to wspólny mózg agentów OpenClaw. Nie notatnik — silnik pamięci: fakty, decyzje, graf teorii, eksperymenty i proweniencja w jednej bazie. Wyszukiwanie semantyczne łapie to, czego grep nigdy nie znajdzie, a każda pewność jest mierzona.

Substrat
Postgres + pgvector
Embedding
4096 dim · Qwen3
Interfejs
MCP · mcp__jhonnys-brain__*
Kalibracja
0.388 Brier
Czym jest

Jeden plugin. Pięć komponentów. Jedna prawda.

Cała trwała wiedza agentów — decyzje, fakty, skille, encje kodu, węzły teorii, zdarzenia sesji, konflikty przekonań, proweniencja — żyje w schemacie openclaw na Postgresie (localhost:5432) i jest wystawiona przez narzędzia MCP. Graf jest szybszy, tańszy w tokenach i daje kontekst strukturalny (kto woła, co zależy, jakie były wcześniejsze decyzje, znane tryby porażki), którego skanowanie plików nie da.

Architektura

Pięć warstw, jeden rdzeń synaptyczny

L1 · FUNDAMENT

Memory bank + RAG

Pamięć epizodyczna (wpisy agentów) i fakty strukturalne (topic / scope / confidence). Zapis sprzężony z embeddingiem — każdy wpis dostaje wektor i trafia do indeksu ANN.

memory_searchfact_queryrag_query
L2 · POŁĄCZENIE

Most do Claude Code

Dwukierunkowy bridge przez stream-json + ACP. Agent OpenClaw deleguje do Claude Code i odbiera wynik — pamięć i runtime spięte w jeden obieg.

stream-jsonACP
L3 · KATALOG

Wspólny katalog + obserwowalność

Kanoniczne dokumenty, skille i narzędzia (postgres-authoritative), dziennik zdarzeń projektu, profile agentów oraz graf encji kodu z zależnościami (kto woła kogo).

shared_docsproject_eventscode_dependencies
L4 · ORKIESTRACJA

Routing + magistrala zdarzeń

Warstwa orkiestracji: routing zadań, śledzenie zakończeń asynchronicznych i event bus spinający wielu agentów oraz runtime'y.

routingasync trackingevent bus
L5 · ŚWIADOMOŚĆ

Drugi mózg

Graf teorii (przekonania i hipotezy), eksperymenty (trials), pętla feedbacku, kalibracja Brier i DAG proweniencji. Tu pamięć przestaje być archiwum, a zaczyna być modelem świata, który sam się weryfikuje.

theory_graphexperiment_logcalibration
Jak działa zapis i recall

Od tekstu do wektora do odpowiedzi

01

Embed

Tekst → wektor 4096-dim modelem Qwen3-Embedding-8B na GPU.

localhost:8080/v1/embeddings
02

Store

Wpis ląduje w Postgresie z wektorem (halfvec HNSW), topic, scope i confidence.

schema openclaw · pgvector
03

Recall

Zapytanie → semantyczne top-K przez HNSW (synonimy, parafrazy — nie tylko substring).

memory_search · rag_query
04

Rerank

Warunkowy re-ranking par query+dokument cross-encoderem Nemotron 1B dla precyzji.

192.168.1.72:8082/rerank
Powierzchnia MCP

Narzędzia jako aparatura

Wszystko pod namespace mcp__jhonnys-brain__*. Cztery rodziny: czytanie, zapis, drugi mózg i kod/agenci.

Recall — czytanie

  • memory_searchsemantyczne nad epizodami
  • fact_queryfakty po topic/scope/confidence
  • project_events_query„co robiłem wczoraj?"
  • theory_graph_searchprzekonania i hipotezy
  • code_entity_searchklasy/funkcje + callers

Write — zapis

  • memory_storenotatka / decyzja / wynik
  • fact_addfakt z confidence ≥0.8
  • theory_node_addnowa relacja przyczynowa
  • experiment_logtrial → auto-flip krawędzi
  • fact_provenance_setDAG „skąd to wiem"

Drugi mózg — jakość

  • theory_calibration_reportBrier per relacja
  • experiment_proposeprotokół z luk grafu
  • skill_efficacy_reportktóre skille działają
  • belief_conflicts_listsprzeczności semantyczne
  • fact_lineagespacer po proweniencji

Katalog + agenci

  • shared_docs_listkanoniczne docs
  • shared_skills_listrejestr skilli
  • agent_profile_getpersony + model bindings
  • code_dependenciescallers / callees
  • conversation_appenddialog cross-runtime
Protokół obowiązkowy

Memory-first: pętla, która zamyka uczenie

Reguła jest twarda: przed każdym lookupem, decyzją czy debugiem — najpierw pytaj pamięć. Po każdym nietrywialnym wyniku — pisz z powrotem. Następna sesja startuje ze stanu obecnego, nie od zera.

PRZED

Pytaj graf, nie grep

Hosty, tokeny, wcześniejsze decyzje, architektura, znane incydenty → memory_search + fact_query + project_events_query. Pliki dopiero gdy graf nie pokrywa.

PODCZAS

Kalibruj zanim twierdzisz

Przed stemplem pewności ≥0.9 → theory_calibration_report. Przed nowym faktem na znanym temacie → belief_conflicts_list (80% konfliktów to redundantne dopiski).

PO

Zamknij pętlę

Zwalidowany fakt → fact_add. Wynik → memory_store. Eksperyment → experiment_log (trigger auto-aktualizuje status krawędzi teorii).

Automatyka

Hooki, które pracują w tle

~/.claude/scripts · PreToolUse / PostToolUse
PreToolUseprefetch-memory.sh — embeduje kontekst narzędzia i wstrzykuje top-K wspomnień ZANIM odpali Grep/Bash/Read.
PostToolUselog-claude-activity.sh — każdy Write/Edit/Bash/Task/MCP → wiersz w project_events (audyt).
PostToolUserecord-tool-outcome.sh — sukces/porażka + czas → zasila skill_efficacy i kalibrację.
PostToolUseupdate-code-graph.sh — zmiana pliku auto-odświeża graf encji kodu.
trigger SQLtrg_facts_conflict_detect — wykrywa duplikaty semantyczne ≥0.85 cosine przy każdym zapisie wiedzy.
Drugi mózg

Pewność jest mierzona, nie deklarowana

0.388
Brier score (overall)
delta +0.256
nadmiernie pewny
8 krawędzi testowanych · 2026-04-17

Kalibracja zamyka lukę między „brzmi pewnie" a „jest pewne"

Każda relacja w grafie teorii ma policzony Brier score — miarę, jak trafne były dotychczasowe priory. Obecny system jest overconfident o +0.256, więc świeże priory dyskontuje się o tę deltę.

Eksperymenty (experiment_log) auto-przełączają status krawędzi teorii. Konflikty przekonań są wykrywane semantycznie. Proweniencja (tool_outcomes → events → facts → trials) jest audytowalna przez fact_lineage. To nie magazyn — to model świata, który się falsyfikuje.

Dlaczego to ma znaczenie

Czego grep nigdy nie zrobi

Decyzji nie ma w kodzie

„Dlaczego X, a nie Y" żyje tylko w pamięci — nie da się tego odtworzyć ze skanu plików.

Zdarzenia = uczciwy audyt

git log gubi intencję, czat jest stratny. project_events to jedyny pełny ślad.

Semantyka > substring

4096-dim embeddingi łapią synonimy i parafrazy, których grep nie złapie.

Zapis zamyka pętlę

Następna sesja startuje ze stanu obecnego, a nie od zera.

Kalibracja jest dowodem

Brier mówi wprost, czy priory są godne zaufania — i o ile je zdyskontować.

Konflikty same się zgłaszają

Trigger flaguje duplikaty ≥0.85 cosine, zanim dorzucisz redundantny fakt.