Raționamentul automat și folosirea instrumentelor (ART)
Prezentare generală
Combinarea promptării CoT și instrumentelor într-un mod intercalat s-a dovedit a fi o abordare puternică și robustă pentru a aborda multe sarcini cu LLM-uri. Aceste abordări necesită de obicei crearea manuală de demonstrații specifice sarcinilor și intercalarea cu grijă a generărilor modelului cu folosirea instrumentelor. Paranjape et al., (2023) propun un nou cadru care folosește un LLM înghețat pentru a genera automat pașii de raționament intermediari ca un program.
Cum funcționează
ART funcționează după cum urmează:
- Selecția demonstrațiilor: Având în vedere o sarcină nouă, selectează demonstrații de raționament în mai mulți pași și folosirea instrumentelor dintr-o bibliotecă de sarcini
- Integrarea instrumentelor: La momentul testării, oprește generarea ori de câte ori sunt apelate instrumente externe și integrează ieșirea lor înainte de a relua generarea
- Generalizarea: ART încurajează modelul să generalizeze din demonstrații pentru a descompune o sarcină nouă și să folosească instrumentele în locurile potrivite, într-un mod zero-shot
În plus, ART este extensibil deoarece permite de asemenea oamenilor să corecteze greșelile din pașii de raționament sau să adauge instrumente noi prin simpla actualizare a bibliotecilor de sarcini și instrumente. Procesul este demonstrat mai jos:

Sursa imaginii: Paranjape et al., (2023)
Rezultatele de performanță
ART îmbunătățește substanțial promptarea cu câteva exemple și CoT automat pe sarcini nevăzute în benchmark-urile BigBench și MMLU, și depășește performanța prompturilor CoT create manual când feedback-ul uman este încorporat.
Mai jos este un tabel care demonstrează performanța ART pe sarcinile BigBench și MMLU:

Sursa imaginii: Paranjape et al., (2023)
Beneficii cheie
- Generalizarea Zero-shot: Funcționează pe sarcini nevăzute fără reantrenare
- Raționamentul automat: Generează automat pașii de raționament intermediari
- Integrarea instrumentelor: Integrează fără probleme instrumente externe și API-uri
- Supravegherea umană: Permite intervenția și corectarea umană
- Cadru extensibil: Ușor de adăugat instrumente și sarcini noi
Aplicații
- Sarcini de raționament complexe care necesită informații externe
- Rezolvarea problemelor în mai mulți pași
- Modele de limbaj augmentate cu instrumente
- Sisteme de raționament automatizate
- Descompunerea sarcinilor și planificarea
Subiecte conexe
- Promptarea Chain-of-Thought - Înțelegerea tehnicilor de promptare CoT
- Promptarea ReAct - Combinarea raționamentului și acțiunii
- Ghidul de inginerie a prompturilor - Tehnici generale de inginerie a prompturilor
Referințe
- Paranjape et al., (2023) - ART: Automatic Reasoning and Tool-use
