Probleemoplossend vermogen is een van de aangeboren capaciteiten van mensen. Sinds onze primitieve dagen, toen onze grootste uitdagingen in het leven niet waren om opgegeten te worden door een prooidier, tot de hedendaagse tijd om iets snel thuisbezorgd te krijgen, combineren we onze creativiteit, logisch redeneren en intelligentie om oplossingen te bedenken voor conflicten.
Nu we getuige zijn van de genese van AI-senients, worden we geconfronteerd met nieuwe uitdagingen met betrekking tot hun besluitvormingsvermogen. Terwijl het vorige decennium draaide om het vieren van de mogelijkheden en het potentieel van AI-modellen en -toepassingen, gaat dit decennium over het een stap verder gaan: het in twijfel trekken van de legitimiteit van beslissingen die door dergelijke modellen worden genomen en het afleiden van de redenering erachter.
Nu verklaarbare kunstmatige intelligentie (XAI) steeds belangrijker wordt, is dit het moment om een sleutelconcept te bespreken bij de ontwikkeling van AI-modellen die we Chain-of-Thought-aansporingenIn dit artikel zullen we uitgebreid de betekenis hiervan en eenvoudige termen ontcijferen en ontmystificeren.
Wat is Chain-of-Thought Prompting?
Wanneer de menselijke geest klaar is voor een uitdaging of een complex probleem, probeert hij het op natuurlijke wijze op te splitsen in fragmenten van kleinere opeenvolgende stappen. Gedreven door logica legt de geest verbanden en simuleert oorzaak-en-gevolgscenario's om de best mogelijke oplossing voor de uitdaging te bedenken.
Het proces om dit te repliceren in een AI-model of -systeem is Chain-of-Thought-prompts.
Zoals de naam al doet vermoeden, genereert een AI-model een serie of een keten van logische gedachten (of stappen) om een query of conflict aan te pakken. Visualiseer dit als het geven van een turn-by-turn instructie aan iemand die vraagt om een route naar een bestemming.
Dit is de dominante techniek die wordt ingezet in de redeneermodellen van OpenAI. Omdat ze zijn ontworpen om te denken voordat ze een reactie of antwoord genereren, zijn ze in staat geweest om competitieve examens die door mensen zijn afgenomen, te kraken.
[Lees ook: Alles wat u moet weten over LLM]
Voordelen van Chain-of-Thought Prompting
Alles wat logisch is aangestuurd levert een significante voorsprong op. Op dezelfde manier bieden modellen die zijn getraind op chain-of-thought prompting niet alleen nauwkeurigheid en relevantie, maar ook een breed scala aan voordelen, waaronder:
Verbeterde probleemoplossing capaciteiten, waarbij hun belang cruciaal is in vakgebieden zoals gezondheidszorg en financiën. LLM's die gebruikmaken van chain-of-thought prompting begrijpen expliciete en onderliggende uitdagingen beter en genereren reacties na het overwegen van verschillende waarschijnlijkheden en worstcasescenario's.
Verzachtend veronderstellingen en resultaten die voortkomen uit aannames, omdat modellen logisch en sequentieel denken en verwerken om conclusies te trekken in plaats van overhaaste conclusies te trekken.
Verhoogde veelzijdigheid omdat modellen niet rigoureus getraind hoeven te worden op een nieuw gebruiksscenario, omdat ze gebaseerd zijn op logica en niet op een doel.
Geoptimaliseerde samenhang bij taken waarbij de antwoorden uit meerdere delen bestaan.
De anatomie van de werking van de Chain-of-Thought Prompting-techniek
Als u bekend bent met de monolithische softwarearchitectuur, dan weet u dat de gehele softwaretoepassing wordt ontwikkeld als één samenhangende eenheid. Het vereenvoudigen van zo'n complexe belasting kwam met de microservicesarchitectuurmethode die het opsplitsen van software in onafhankelijke services omvatte. Dit resulteerde in een snellere ontwikkeling van producten en ook in naadloze functionaliteit.
CoT-aanwijzingen in AI is vergelijkbaar, waarbij LLM's door een reeks opeenvolgende redeneerprocessen worden geleid om een reactie te genereren. Dit gebeurt via:
- Expliciete instructies, waarbij modellen rechtstreeks instructies krijgen om een probleem sequentieel aan te pakken via eenvoudige opdrachten.
- Impliciete instructie is subtieler en genuanceerder in zijn aanpak. Hierbij wordt een model door de logica van een soortgelijke taak gehaald en worden de inferentie- en begripsmogelijkheden ervan benut om de logica voor de gepresenteerde problemen te repliceren.
- Demonstratieve voorbeelden, waarbij een model stapsgewijs redeneert en incrementele inzichten genereert om een probleem op te lossen.
3 Real-world voorbeelden waarin CoT-prompting wordt gebruikt
Financiële beslissingsmodellen
| Multimodale CoT in bots
| Gezondheidszorg
|
|---|---|---|
| In deze zeer volatiele sector kan CoT-aanwijzingen worden gebruikt om de potentiële financiële koers van een bedrijf te begrijpen, risicobeoordelingen van kredietzoekers uit te voeren en meer | Chatbots die voor bedrijven worden ontwikkeld en ingezet, vereisen nichefunctionaliteiten. Ze moeten vaardigheden tonen in het begrijpen van verschillende formaten van invoer. CoT-prompting werkt het beste in dergelijke gevallen, waarbij bots tekst- en afbeeldingprompts moeten combineren om antwoorden op query's te genereren. | Van het stellen van diagnoses aan de hand van medische gegevens tot het opstellen van gepersonaliseerde behandelplannen voor patiënten: CoT-prompts kunnen de gezondheidsdoelen van klinieken en ziekenhuizen ondersteunen. |
Voorbeeld
Klantvraag: Ik heb een transactie op mijn account opgemerkt die ik niet herken, mijn debitcard is verloren en ik wil meldingen instellen voor mijn accounttransacties. Kunt u mij helpen met deze problemen?
Stap 1: Identificeer en categoriseer de problemen
- Onbekende transactie.
- Betaalpas verloren.
- Transactiewaarschuwingen instellen.
Stap 2: Pak de niet-herkende transactie aan
Vraag om details: Kunt u de datum en het bedrag van de transactie doorgeven?
- Tak 1: Indien er details worden verstrekt:
- Controleer de transactie. Als er sprake is van fraude, vraag dan of de klant het wil betwisten.
- Tak 2: Indien geen details:
- Bied aan om een lijst met recente transacties te verstrekken.
Stap 3: Pak de verloren betaalpas aan
Bevries de kaart: Het is raadzaam om het product onmiddellijk in te vriezen.
- Tak 1: Indien de klant akkoord gaat:
- Blokkeer de kaart en vraag of ze een vervanging willen. Bevestig het verzendadres.
- Tak 2: Indien de klant weigert:
- Adviseer om de rekening in de gaten te houden op ongeautoriseerde transacties.
Stap 4: Stel transactiewaarschuwingen in
Kies waarschuwingsmethode: SMS, e-mail of beide?
- Tak 1: Als een klant kiest voor:
- Stel waarschuwingen in voor transacties boven een bepaald bedrag. Vraag naar het bedrag.
- Tak 2: Indien u het niet zeker weet:
- Stel een standaardbedrag voor (bijv. $ 50) en bevestig dit.
Stap 5: Geef een samenvatting en volgende stappen
- Onderzoek naar de niet-herkende transactie.
- Blokkeren van de betaalpas en eventueel verstrekken van een vervangende kaart.
- Transactiemeldingen instellen zoals gevraagd.
Grondgedachte:
Dit proces behandelt efficiënt meerdere klantvragen via duidelijke stappen en beslissingslijnen, waardoor uitgebreide oplossingen worden gegarandeerd.
Beperkingen van CoT-prompting

Chain-of-thought is inderdaad effectief, maar het is ook afhankelijk van het gebruiksscenario waarop het wordt toegepast en verschillende andere factoren. Er zijn specifieke uitdagingen verbonden aan CoT-prompts bij AI die voorkomen dat stakeholders het potentieel ervan volledig benutten. Laten we eens kijken naar de veelvoorkomende knelpunten:
Maak eenvoudige taken te ingewikkeld
Hoewel CoT-prompting het beste werkt voor complexe taken, kan het simpele taken compliceren en verkeerde antwoorden genereren. Voor taken die geen redenering vereisen, werken directe-antwoordmodellen het beste.
Verhoogde rekenlast
De verwerking van CoT-prompting vereist een aanzienlijke rekenlast en als de techniek wordt ingezet op kleinere modellen die zijn gebouwd met beperkte verwerkingsmogelijkheden, kan het deze overbelasten. Gevolgen van dergelijke implementaties kunnen zijn: langzamere responstijden, slechte efficiëntie, incoherentie en meer.
Kwaliteit van AI Prompt Engineering
CoT-aanwijzingen in AI werkt onder de aanname (of het principe) dat een specifieke prompt goed geformuleerd, gestructureerd en duidelijk is. Als een prompt deze factoren mist, verliest CoT-prompting het vermogen om de vereiste te vatten, wat resulteert in de generatie van irrelevante opeenvolgende stappen en uiteindelijk reacties.
[Lees ook: Wat zijn kleine taalmodellen? Praktijkvoorbeelden en trainingsgegevens]
Verminderde capaciteiten op schaal
Stakeholders kunnen merken dat hun modellen in de problemen komen als ze chain-of-thought prompting moeten gebruiken voor enorme volumes aan datasets of complexiteiten van problemen. Voor taken met grotere redeneerstappen kan de techniek de responstijd vertragen, waardoor deze ongeschikt wordt voor toepassingen of use cases die realtime responsgeneratie vereisen.
CoT-prompting is een fenomenale techniek voor het optimaliseren van de prestaties van Grote taalmodellen. Als dergelijke tekortkomingen kunnen worden aangepakt en opgelost door middel van optimalisatietechnieken of workarounds, kunnen ze ongelooflijke resultaten opleveren. Naarmate de technologie vordert, zal het interessant zijn om te zien hoe Chain-of-Thought prompting evolueert en eenvoudiger maar ook meer niche wordt.





