NOTES
-
Agent Workflow Memory
Agents die aus Erfahrungen lernen um Workflows zu extrahieren
-
Building Effective Agents
Workflow Typen um einfache & effektive Agents zu bauen
-
Cognitive Architectures for Language Agents
Terminologien und Framework für einheitliche Sprachagenten
-
HuggingGPT
Nutzung von LLMs als Controller zur Steuerung von KI-Modellen
-
Voyager
Agent der selbstständig Minecraft erkundet, Fähigkeiten erwirbt und Entdeckungen macht
-
MemGpt
LLM-System mit hierarchischem Speichersystem zur Kontextfensterverwaltung
-
react reasoning & acting
Methode, die Reasoning (Denken) und Acting (Handeln) in LLMs kombiniert um Aufgaben besser lösen zu können
-
swe-bench
Die Hauptidee ist es, einen realistischen Benchmark für Coding-Aufgaben zu entwickeln, der real-world Software-Engineering-Probleme aus GitHub-Repositories abbildet. Anders als bisherige Coding-Benchmarks, die meist einfache, isolierte Programmieraufgaben umfassen, zielt swe darauf ab, die Fähigkeiten von LLMs in komplexeren, kontextreichen Software-Entwicklungsszenarien zu testen.