jhonny's brain

autorytatywna warstwa pamięci · OpenClaw

Pamięć, która
się uczy i kalibruje.

jhonny's brain to wspólny mózg agentów OpenClaw. Nie notatnik — silnik pamięci: fakty, decyzje, graf teorii, eksperymenty i proweniencja w jednej bazie. Wyszukiwanie semantyczne łapie to, czego grep nigdy nie znajdzie, a każda pewność jest mierzona.

Substrat

Postgres + pgvector

Embedding

4096 dim · Qwen3

Interfejs

MCP · mcp__jhonnys-brain__*

Kalibracja

0.388 Brier

Czym jest

Jeden plugin. Pięć komponentów. Jedna prawda.

Cała trwała wiedza agentów — decyzje, fakty, skille, encje kodu, węzły teorii, zdarzenia sesji, konflikty przekonań, proweniencja — żyje w schemacie openclaw na Postgresie (localhost:5432) i jest wystawiona przez narzędzia MCP. Graf jest szybszy, tańszy w tokenach i daje kontekst strukturalny (kto woła, co zależy, jakie były wcześniejsze decyzje, znane tryby porażki), którego skanowanie plików nie da.

Architektura

Pięć warstw, jeden rdzeń synaptyczny

L1 · FUNDAMENT

Memory bank + RAG

Pamięć epizodyczna (wpisy agentów) i fakty strukturalne (topic / scope / confidence). Zapis sprzężony z embeddingiem — każdy wpis dostaje wektor i trafia do indeksu ANN.

memory_searchfact_queryrag_query

L2 · POŁĄCZENIE

Most do Claude Code

Dwukierunkowy bridge przez stream-json + ACP. Agent OpenClaw deleguje do Claude Code i odbiera wynik — pamięć i runtime spięte w jeden obieg.

stream-jsonACP

L3 · KATALOG

Wspólny katalog + obserwowalność

Kanoniczne dokumenty, skille i narzędzia (postgres-authoritative), dziennik zdarzeń projektu, profile agentów oraz graf encji kodu z zależnościami (kto woła kogo).

shared_docsproject_eventscode_dependencies

L4 · ORKIESTRACJA

Routing + magistrala zdarzeń

Warstwa orkiestracji: routing zadań, śledzenie zakończeń asynchronicznych i event bus spinający wielu agentów oraz runtime'y.

routingasync trackingevent bus

L5 · ŚWIADOMOŚĆ

Drugi mózg

Graf teorii (przekonania i hipotezy), eksperymenty (trials), pętla feedbacku, kalibracja Brier i DAG proweniencji. Tu pamięć przestaje być archiwum, a zaczyna być modelem świata, który sam się weryfikuje.

theory_graphexperiment_logcalibration

Jak działa zapis i recall

Od tekstu do wektora do odpowiedzi

Embed

Tekst → wektor 4096-dim modelem Qwen3-Embedding-8B na GPU.

localhost:8080/v1/embeddings

Store

Wpis ląduje w Postgresie z wektorem (halfvec HNSW), topic, scope i confidence.

schema openclaw · pgvector

Recall

Zapytanie → semantyczne top-K przez HNSW (synonimy, parafrazy — nie tylko substring).

memory_search · rag_query

Rerank

Warunkowy re-ranking par query+dokument cross-encoderem Nemotron 1B dla precyzji.

192.168.1.72:8082/rerank

Powierzchnia MCP

Narzędzia jako aparatura

Wszystko pod namespace mcp__jhonnys-brain__*. Cztery rodziny: czytanie, zapis, drugi mózg i kod/agenci.

⌕

Recall — czytanie

memory_searchsemantyczne nad epizodami
fact_queryfakty po topic/scope/confidence
project_events_query„co robiłem wczoraj?"
theory_graph_searchprzekonania i hipotezy
code_entity_searchklasy/funkcje + callers

✎

Write — zapis

memory_storenotatka / decyzja / wynik
fact_addfakt z confidence ≥0.8
theory_node_addnowa relacja przyczynowa
experiment_logtrial → auto-flip krawędzi
fact_provenance_setDAG „skąd to wiem"

◎

Drugi mózg — jakość

theory_calibration_reportBrier per relacja
experiment_proposeprotokół z luk grafu
skill_efficacy_reportktóre skille działają
belief_conflicts_listsprzeczności semantyczne
fact_lineagespacer po proweniencji

⌗

Katalog + agenci

shared_docs_listkanoniczne docs
shared_skills_listrejestr skilli
agent_profile_getpersony + model bindings
code_dependenciescallers / callees
conversation_appenddialog cross-runtime

Protokół obowiązkowy

Memory-first: pętla, która zamyka uczenie

Reguła jest twarda: przed każdym lookupem, decyzją czy debugiem — najpierw pytaj pamięć. Po każdym nietrywialnym wyniku — pisz z powrotem. Następna sesja startuje ze stanu obecnego, nie od zera.

PRZED

Pytaj graf, nie grep

Hosty, tokeny, wcześniejsze decyzje, architektura, znane incydenty → memory_search + fact_query + project_events_query. Pliki dopiero gdy graf nie pokrywa.

PODCZAS

Kalibruj zanim twierdzisz

Przed stemplem pewności ≥0.9 → theory_calibration_report. Przed nowym faktem na znanym temacie → belief_conflicts_list (80% konfliktów to redundantne dopiski).

Zamknij pętlę

Zwalidowany fakt → fact_add. Wynik → memory_store. Eksperyment → experiment_log (trigger auto-aktualizuje status krawędzi teorii).

Automatyka

Hooki, które pracują w tle

~/.claude/scripts · PreToolUse / PostToolUse

PreToolUseprefetch-memory.sh — embeduje kontekst narzędzia i wstrzykuje top-K wspomnień ZANIM odpali Grep/Bash/Read.

PostToolUselog-claude-activity.sh — każdy Write/Edit/Bash/Task/MCP → wiersz w project_events (audyt).

PostToolUserecord-tool-outcome.sh — sukces/porażka + czas → zasila skill_efficacy i kalibrację.

PostToolUseupdate-code-graph.sh — zmiana pliku auto-odświeża graf encji kodu.

trigger SQLtrg_facts_conflict_detect — wykrywa duplikaty semantyczne ≥0.85 cosine przy każdym zapisie wiedzy.

Drugi mózg

Pewność jest mierzona, nie deklarowana

0.388

Brier score (overall)

delta +0.256
nadmiernie pewny
8 krawędzi testowanych · 2026-04-17

Kalibracja zamyka lukę między „brzmi pewnie" a „jest pewne"

Każda relacja w grafie teorii ma policzony Brier score — miarę, jak trafne były dotychczasowe priory. Obecny system jest overconfident o +0.256, więc świeże priory dyskontuje się o tę deltę.

Eksperymenty (experiment_log) auto-przełączają status krawędzi teorii. Konflikty przekonań są wykrywane semantycznie. Proweniencja (tool_outcomes → events → facts → trials) jest audytowalna przez fact_lineage. To nie magazyn — to model świata, który się falsyfikuje.

Dlaczego to ma znaczenie

Czego grep nigdy nie zrobi

Decyzji nie ma w kodzie

„Dlaczego X, a nie Y" żyje tylko w pamięci — nie da się tego odtworzyć ze skanu plików.

Zdarzenia = uczciwy audyt

git log gubi intencję, czat jest stratny. project_events to jedyny pełny ślad.

Semantyka > substring

4096-dim embeddingi łapią synonimy i parafrazy, których grep nie złapie.

Zapis zamyka pętlę

Następna sesja startuje ze stanu obecnego, a nie od zera.

Kalibracja jest dowodem

Brier mówi wprost, czy priory są godne zaufania — i o ile je zdyskontować.

Konflikty same się zgłaszają

Trigger flaguje duplikaty ≥0.85 cosine, zanim dorzucisz redundantny fakt.

Pamięć, którasię uczy i kalibruje.

Jeden plugin. Pięć komponentów. Jedna prawda.

Pięć warstw, jeden rdzeń synaptyczny

Memory bank + RAG

Most do Claude Code

Wspólny katalog + obserwowalność

Routing + magistrala zdarzeń

Drugi mózg

Od tekstu do wektora do odpowiedzi

Embed

Store

Recall

Rerank

Narzędzia jako aparatura

Recall — czytanie

Write — zapis

Drugi mózg — jakość

Katalog + agenci

Memory-first: pętla, która zamyka uczenie

Pytaj graf, nie grep

Kalibruj zanim twierdzisz

Zamknij pętlę

Hooki, które pracują w tle

Pewność jest mierzona, nie deklarowana

Kalibracja zamyka lukę między „brzmi pewnie" a „jest pewne"

Czego grep nigdy nie zrobi

Decyzji nie ma w kodzie

Zdarzenia = uczciwy audyt

Semantyka > substring

Zapis zamyka pętlę

Kalibracja jest dowodem

Konflikty same się zgłaszają

Pamięć, która
się uczy i kalibruje.