MemGpt

Idee

Ergebnisse

Architektur

Speicherhierarchie:

  1. Hauptkontext (RAM-Analogie):
    • Systemanweisungen: Schreibgeschützt, steuert MemGPT
    • Arbeitskontext: Lese-/Schreibzugriff für Benutzer-/Agentendaten
    • FIFO-Warteschlange: Nachrichtenverlauf mit Systemmeldungen/Funktionsaufrufen
  2. Externer Kontext (Festplatten-Analogie):
    • Recall-Speicher: Nachrichtendatenbank
    • Archivspeicher: Lese-/Schreibfähige Datenbank für Textobjekte

Systemkomponenten

  1. Queue Manager:
    • Fügt neue Nachrichten zur FIFO-Warteschlange hinzu
    • Löst LLM-Inferenz aus
    • Steuert Context Overflow durch Löschungsrichtlinie
    • Memory Pressure Warning bei Token-Überschreitung
    • Queue Flush bei vollem Kontextfenster
  2. Function Executor:
    • Orchestriert Datenbewegung zwischen Haupt- und externem Kontext
    • Ermöglicht Speicheraktualisierung/-suchen
  3. Kontrollfluss und Funktionsverkettung:
    • Ereignisse starten LLM-Denkprozess
    • Mehrere Funktionen können vor Nutzerantwort verkettet werden

Relevanz

Verwandte Arbeiten

Offene Fragen

Weitere Notizen

Conversion Agents

Fixed Context Baselines

Deep Memory Retrieval (DMR)

Nested Key-Value Retrieval