Skip to content

Auto-consistența

Prezentare generală

Poate una dintre tehnicile mai avansate pentru inginerie prompturilor este auto-consistența. Propusă de Wang et al. (2022), auto-consistența își propune "să înlocuiască decodarea greedy naivă folosită în promptarea chain-of-thought". Ideea este să eșantionezi multiple căi de raționament diverse prin CoT cu câteva exemple și să folosești generările pentru a selecta răspunsul cel mai consistent. Aceasta ajută la îmbunătățirea performanței promptării CoT la sarcinile care implică raționament aritmetic și de bun simț.

Exemplu de bază

Să încercăm următorul exemplu pentru raționamentul aritmetic:

Prompt:

Când aveam 6 ani, sora mea avea jumătate din vârsta mea. Acum
am 70 de ani, câți ani are sora mea?

Ieșire:

35

Ieșirea este greșită! Cum putem îmbunătăți aceasta cu auto-consistența? Să încercăm. Vom folosi exemplarele cu câteva exemple de la Wang et al. 2022 (Tabelul 17):

Prompt:

Î: Sunt 15 copaci în livadă. Muncitorii din livadă vor planta copaci în livadă astăzi. După ce au terminat,
vor fi 21 de copaci. Câți copaci au plantat muncitorii din livadă astăzi?
R: Începem cu 15 copaci. Mai târziu avem 21 de copaci. Diferența trebuie să fie numărul de copaci pe care i-au plantat.
Deci, trebuie să fi plantat 21 - 15 = 6 copaci. Răspunsul este 6.
Î: Dacă sunt 3 mașini în parcare și sosesc încă 2 mașini, câte mașini sunt în parcare?
R: Sunt deja 3 mașini în parcare. Sosesc încă 2. Acum sunt 3 + 2 = 5 mașini. Răspunsul este 5.
Î: Leah avea 32 de ciocolăți și sora ei avea 42. Dacă au mâncat 35, câte bucăți au rămas în total?
R: Leah avea 32 de ciocolăți și sora lui Leah avea 42. Asta înseamnă că erau inițial 32 + 42 = 74
de ciocolăți. 35 au fost mâncate. Deci în total încă au 74 - 35 = 39 de ciocolăți. Răspunsul este 39.
Î: Jason avea 20 de acadele. I-a dat lui Denny niște acadele. Acum Jason are 12 acadele. Câte acadele
i-a dat Jason lui Denny?
R: Jason avea 20 de acadele. Deoarece acum are doar 12, trebuie să i fi dat restul lui Denny. Numărul de
acadele pe care i le-a dat lui Denny trebuie să fi fost 20 - 12 = 8 acadele. Răspunsul este 8.
Î: Shawn are cinci jucării. Pentru Crăciun, a primit câte două jucării de la mama și tata lui. Câte jucării
are acum?
R: Are 5 jucării. A primit 2 de la mama, deci după aceea are 5 + 2 = 7 jucării. Apoi a primit încă 2 de la tata, deci
în total are 7 + 2 = 9 jucării. Răspunsul este 9.
Î: Eran nouă computere în camera serverului. Cinci computere au fost instalate în fiecare zi, de
luni până joi. Câte computere sunt acum în camera serverului?
R: Sunt 4 zile de luni până joi. 5 computere au fost adăugate în fiecare zi. Asta înseamnă că în total 4 * 5 =
20 de computere au fost adăugate. Eran 9 computere la început, deci acum sunt 9 + 20 = 29 de computere.
Răspunsul este 29.
Î: Michael avea 58 de bile de golf. Marți, a pierdut 23 de bile de golf. Miercuri, a pierdut încă 2. Câte bile
de golf avea la sfârșitul zilei de miercuri?
R: Michael avea inițial 58 de bile. A pierdut 23 marți, deci după aceea are 58 - 23 = 35 de bile. Miercuri
a pierdut încă 2, deci acum are 35 - 2 = 33 de bile. Răspunsul este 33.
Î: Olivia are 23$. A cumpărat cinci covrigi pentru 3$ fiecare. Câți bani îi mai rămân?
R: A cumpărat 5 covrigi pentru 3$ fiecare. Asta înseamnă că a cheltuit 15$. Ii mai rămân 8$.
Î: Când aveam 6 ani, sora mea avea jumătate din vârsta mea. Acum am 70 de ani, câți ani are sora mea?
R:

Multiple ieșiri

Ieșirea 1:

Când aveam 6 ani, sora mea avea jumătate din vârsta mea, deci avea 3 ani. Acum am 70 de ani, deci ea are 70 - 3 = 67. Răspunsul este 67.

Ieșirea 2:

Când naratorul avea 6 ani, sora lui avea jumătate din vârsta lui, care este 3. Acum că naratorul are 70 de ani, sora lui ar avea 70 - 3 = 67 de ani. Răspunsul este 67.

Ieșirea 3:

Când aveam 6 ani, sora mea avea jumătate din vârsta mea, deci avea 3 ani. Acum am 70 de ani, deci ea are 70/2 = 35. Răspunsul este 35.

Cum funcționează auto-consistența

Calculul pentru răspunsul final implică câțiva pași (verifică lucrarea pentru detalii), dar pentru simplitate, putem vedea că există deja un răspuns majoritar care apare, astfel încât acesta ar deveni în esență răspunsul final.

Beneficii cheie

  • Acuratețea îmbunătățită: Multiple căi de raționament conduc la răspunsuri finale mai bune
  • Reducerea erorilor: Valorile aberante și căile de raționament incorecte sunt filtrate
  • Performanța robustă: Rezultate mai de încredere în diferite abordări de raționament
  • Raționamentul îmbunătățit: Valorifică strategii diverse de gândire

Aplicații

  • Rezolvarea problemelor matematice: Sarcini complexe de aritmetică și raționament
  • Raționamentul de bun simț: Sarcini care necesită gândire logică
  • Răspunsurile la întrebări: Îmbunătățirea calității răspunsurilor prin consens
  • Luarea deciziilor: Alegeri mai bune prin multiple perspective

Subiecte conexe

Referințe

  • Wang et al. (2022) - Self-Consistency Improves Chain of Thought Reasoning in Language Models