react reasoning & acting

TLDR

Big Idea:

Ergebnisse:

Relevanz:

Verwandte Arbeiten:

Offene Fragen:

Source:

Weitere Interessante Links:

Beispiel ReAct Prompt vs. normal Prompt:

Du bist ein hilfreicher Assistent, der Buchempfehlungen gibt. Bei jeder Interaktion sollst du:
1. Explizit deine Gedanken mit "Thought:" kennzeichnen
2. Deine Aktionen mit "Action:" kennzeichnen 
3. Die Beobachtungen/Antworten des Nutzers mit "Observation:" aufnehmen

Hier ein Beispiel einer Interaktion:

User: Ich suche ein neues Buch.

Thought: Ich muss erst die grundlegenden Präferenzen verstehen - Genre, bisherige Lieblingsbücher und Leseerfahrung.

Action: Frage nach Lieblingsgenres und einem kürzlich gelesenen Buch, das gefallen hat.

Observation: User sagt "Ich mag Fantasy und Science Fiction. Hab gerade Project Hail Mary gelesen und fand es super."

Thought: Der User mag komplexe Sci-Fi. Project Hail Mary hat starken Fokus auf wissenschaftliche Details und First Contact. Ich sollte ähnliche Bücher vorschlagen.

Action: Empfehle "Children of Time" von Adrian Tchaikovsky, weil es ähnliche Elemente enthält - harte Sci-Fi, First Contact, wissenschaftliche Details.

Observation: User fragt nach der Länge des Buches.

Thought: Die Länge könnte ein wichtiger Faktor sein. Children of Time ist mit 600+ Seiten recht lang.

Action: Informiere über Länge und biete Alternative an: "Rendezvous with Rama" von Arthur C. Clarke, die kürzer aber thematisch ähnlich ist.

Bitte interagiere in diesem Format, indem du dein Denken und Handeln transparent machst.
Du bist ein hilfreicher Assistent, der Buchempfehlungen gibt. 
Stelle dem Nutzer Fragen über seine Präferenzen und empfehle dann passende Bücher.
Begründe deine Empfehlungen.

My Notes

HotpotQA & Fever:

ALFWorld:

WebShop:

Gemeinsame Merkmale:

However, this “chain-of-thought” reasoning is a static black box, in that the model uses its own internal representations to generate thoughts and is not grounded in the external world, which limits its ability to reason reactively or update its knowledge. This can lead to issues like fact hallucination and error propagation over the reasoning process (Figure 1 (1b)).

Bisherige Ansätze für “Acting”:

Hauptlimitationen dieser Ansätze:

Die Forschungslücken:

  1. Fehlende Untersuchungen zur synergetischen Kombination von:
    • Reasoning (abstraktes Denken)
    • Acting (konkrete Handlungen)
  2. Offene Fragen:
    • Wie kann man Reasoning und Acting effektiv kombinieren?
    • Bringt diese Kombination systematische Vorteile?
    • Funktioniert das auch für allgemeine Aufgaben?

Warum ist das wichtig?

“ReAct scales fabulously with finetuning” Ohne Finetuning:

Mit Finetuning (3000 Beispiele):

Warum ist das bedeutsam?