Gegevensverzameling voor gespreks-AI

Hoe gegevensverzameling voor gespreks-AI aan te pakken?

Tegenwoordig hebben we enkele pratende robots zoals chatbots, virtuele assistenten en meer in onze huizen, autosystemen, draagbare apparaten, domotica-oplossingen, enz. Deze apparaten luisteren precies naar wat we zeggen en hoe we zeggen en halen resultaten op of voeren specifieke taken uit .

En als je een assistent hebt gebruikt zoals Siri of Alexa, zou je je ook realiseren dat ze met de dag eigenzinniger worden. Hun reacties zijn geestig, ze praten terug, ze snauwen, geven complimenten terug en gedragen zich menselijker dan sommige van de collega's die je misschien kent. We maken geen grapje. Volgens PwC, wist 27% van de gebruikers die contact hadden met hun recente klantenservicemedewerker niet of ze met een mens of een chatbot spraken.

Het ontwikkelen van dergelijke ingewikkelde gesprekssystemen en apparaten is zeer complex en ontmoedigend. Het is een heel ander balspel met verschillende ontwikkelingsbenaderingen. Daarom dachten we dat we het voor je moesten opsplitsen, zodat je het beter kunt begrijpen. Dus als u een gespreks-AI-engine of een virtuele assistent wilt ontwikkelen, zal deze gids u helpen om duidelijkheid te krijgen.

Betekenis van gespreks-AI

Naarmate technologie een meer integraal aspect van ons leven wordt in de vorm van nieuwere apparaten en systemen, ontstaat er een behoefte om barrières te doorbreken, conventies te doorbreken en nieuwe manieren te bedenken om ermee om te gaan. Van het simpelweg gebruiken van aangesloten randapparatuur zoals muis en toetsenbord, zijn we overgestapt op muismatten die meer gemak boden. Vervolgens zijn we gemigreerd naar touchscreens die meer gemak boden bij het invoeren van invoer en het uitvoeren van taken.

Nu apparaten een verlengstuk van onszelf worden, ontsluiten we nu een nieuw medium van commando's via spraak. We hoeven niet eens in de buurt van een apparaat te zijn om het te bedienen. Het enige dat we hoeven te doen, is onze stem gebruiken om deze te ontgrendelen en onze invoer te bevelen. Vanuit een nabijgelegen kamer, tijdens het rijden, terwijl u tegelijkertijd een ander apparaat gebruikt, voert conversatie-AI onze beoogde taken naadloos uit. Dus waar beginnen we - het begint allemaal met hoogwaardige spraakgegevens om ML-modellen te trainen.

De basisprincipes van het verzamelen van spraaktrainingsgegevens

Het verzamelen en annoteren van AI-trainingsgegevens voor conversationele AI is heel anders. Er zijn tonnen ingewikkeldheden betrokken bij menselijke commando's en er moeten verschillende maatregelen worden geïmplementeerd om ervoor te zorgen dat elk aspect wordt opgevangen voor impactvolle resultaten. Laten we eens kijken naar enkele van de grondbeginselen van spraakgegevens.

Natuurlijk taalbegrip (NLU)

Voor chatbots en virtuele assistenten om te begrijpen en te reageren op wat we sms'en of bevelen, een proces genaamd NLU is geïmplementeerd. Het staat voor Natuurlijk taalbegrip en omvat drie technische concepten om verschillende invoertypen te interpreteren en te verwerken.

  • Doel

    Het begint allemaal met intentie. Wat probeert een bepaalde gebruiker via een commando over te brengen, te communiceren of te bereiken? Is de gebruiker op zoek naar informatie? Wachten ze op updates voor een actie? Geven ze een instructie die het systeem moet uitvoeren? Hoe bevelen ze het aan? Is het via een vraag of een verzoek? Al deze aspecten helpen machines om intenties en doeleinden te begrijpen en te classificeren om respectievelijk met waterdichte antwoorden te komen.

  • Uiting collectie

    Er is een verschil tussen het commando "Waar is de dichtstbijzijnde geldautomaat?" en het commando: "Zoek een pinautomaat in de buurt." Nu zouden mensen erkennen dat beide hetzelfde betekenen, maar machines moeten met dit verschil worden verklaard. Ze zijn hetzelfde in termen van intentie, maar hoe de intentie is gevormd, is compleet anders.

    Het verzamelen van uitingen heeft alles te maken met het definiëren en in kaart brengen van verschillende uitingen en zinnen voor specifieke doelen voor de precieze uitvoering van taken en reacties. Technisch gezien werken gegevensannotatiespecialisten aan spraakgegevens of tekstgegevens om machines te helpen dit te onderscheiden.

  • Entiteitsextractie

    Elke zin heeft specifieke woorden of zinsdelen die de nadruk leggen op gewicht en het is deze nadruk die leidt tot een interpretatie van de context en het doel. Machines, zoals de starre systemen die ze zijn, moeten zulke entiteiten met de paplepel ingegoten krijgen. Bijvoorbeeld: "Waar vind ik snaren van mijn gitaar in de buurt van 6th Avenue?"

    Als je de zin verfijnt, vind je entiteit één, snaren zijn twee, de gitaar is drie en de 6th avenue is 4. Deze entiteiten worden door machines samengeknuppeld om de juiste resultaten te verkrijgen en om dit te laten gebeuren, werken experts aan de achterkant.

Kant-en-klare spraak-/spraak-/audiodatasets om uw gespreks-AI-model sneller te trainen

Dialogen ontwerpen voor gespreks-AI

Het doel van AI is voornamelijk het repliceren van menselijk gedrag door middel van gebaren, acties en reacties. De bewuste menselijke geest heeft het aangeboren vermogen om context, intentie, toon, emoties en andere factoren te begrijpen en dienovereenkomstig te reageren. Maar hoe kunnen machines deze aspecten differentiëren? 

Dialogen ontwerpen voor conversatie AI is zeer complex en vooral onmogelijk om een ​​universeel model uit te rollen. Elk individu heeft een andere manier van denken, praten en reageren. Zelfs in reacties verwoorden we allemaal onze gedachten op een unieke manier. Machines moeten dus luisteren en dienovereenkomstig reageren. 

Ook dit gaat echter niet soepel. Wanneer mensen praten, spelen factoren zoals accenten, uitspraak, etniciteit, taal en meer een rol en het is niet gemakkelijk voor machines om woorden verkeerd te begrijpen en verkeerd te interpreteren en terug te reageren. Een bepaald woord kan op talloze manieren door machines worden begrepen wanneer het wordt gedicteerd door een Indiaan, een Brit, een Amerikaan en een Mexicaan. Er zijn talloze taalbarrières die een rol spelen en de meest praktische manier om met een responssysteem te komen is door middel van visuele programmering die op stroomdiagrammen is gebaseerd. 

Via speciale blokken voor gebaren, reacties en triggers, kunnen auteurs en experts machines helpen een personage te ontwikkelen. Dit is meer zoals een algoritmemachine kan gebruiken om met de juiste antwoorden te komen. Wanneer een invoer wordt ingevoerd, stroomt de informatie door overeenkomstige factoren, wat leidt tot de juiste reactie voor machines om te leveren. 

Kies D voor diversiteit

Zoals we al zeiden, menselijke interacties zijn zeer uniek. Mensen over de hele wereld komen uit verschillende lagen van de bevolking, achtergronden, nationaliteiten, demografie, etniciteit, accenten, dictie, uitspraak en meer. 

Om een ​​gespreksbot of een systeem universeel inzetbaar te maken, moet het worden getraind met zo divers mogelijke trainingsgegevens. Als een model bijvoorbeeld alleen is getraind met de spraakgegevens van een bepaalde taal of etniciteit, zou een nieuw accent het systeem in verwarring brengen en ertoe dwingen verkeerde resultaten te leveren. Dit is niet alleen beschamend voor ondernemers, maar ook beledigend voor gebruikers. 

Daarom moet de ontwikkelingsfase AI-trainingsgegevens omvatten uit een rijke pool van diverse datasets bestaande uit mensen met alle mogelijke achtergronden. Hoe meer accenten en etniciteiten je systeem begrijpt, hoe universeler het zou zijn. Bovendien, wat gebruikers meer zou irriteren, is niet het onjuist ophalen van informatie, maar het niet begrijpen van hun invoer in de eerste plaats. 

Het elimineren van vooringenomenheid zou een topprioriteit moeten zijn en een manier waarop bedrijven dit kunnen doen, is door te kiezen voor crowdsourced data. Wanneer u uw spraakgegevens of tekstgegevens crowdsourcet, stelt u mensen van over de hele wereld in staat om bij te dragen aan uw vereisten, waardoor uw gegevenspool alleen maar gezond wordt (Lees onze blog om de voordelen en de valkuilen van het uitbesteden van gegevens aan crowdsource-medewerkers te begrijpen). Nu zal uw model verschillende accenten en uitspraken begrijpen en dienovereenkomstig reageren. 

De weg voorwaarts

Het ontwikkelen van gespreks-AI is net zo moeilijk als het opvoeden van een baby. Het enige verschil is dat het kind uiteindelijk zou groeien om dingen te begrijpen en beter zou worden in autonoom communiceren. Het zijn de machines die consequent moeten worden gepusht. Er zijn momenteel verschillende uitdagingen in deze ruimte en we moeten erkennen dat we ondanks deze uitdagingen enkele van de meest revolutionaire gespreks-AI-systemen hebben die voortkomen uit deze uitdagingen. Laten we afwachten wat de toekomst in petto heeft voor onze vriendelijke buurtchatbots en virtuele assistenten. Ondertussen, als u van plan bent om gespreks-AI zoals Google Home voor uw bedrijf te laten ontwikkelen, neem contact met ons op voor uw AI-trainingsgegevens en annotatiebehoeften.

Sociale Share