Op spraak gebaseerde UPI-betaalprompts: diversiteit vastleggen voor verbeterde AI-modellen
We maken gebruik van Shaip's expertise op het gebied van snelle creatie en diverse audio-opnames om spraakgestuurde UPI-betalingssystemen te ondersteunen met hoogwaardige, cultureel diverse gegevens.
project Overzicht
Shaip werkte samen met een toonaangevend fintechbedrijf om een spraakgestuurde betalingsapplicatie te ontwikkelen door diverse UPI-betalingsaanwijzingen te creëren en op te nemen. Het project omvatte de creatie van 2,500 unieke aanwijzingen en 87,000 gediversifieerde aanwijzingen over 13 betalingsgerelateerde intenties, zoals geld verzenden, geld aanvragen, saldo-opvragen en rekeningen betalen. Deze aanwijzingen werden gedurende 200 uur opgenomen door 45 sprekers uit verschillende regio's, achtergronden en leeftijdsgroepen, wat zorgde voor een breed scala aan taalkundige en omgevingsdiversiteit.
Het doel van het project was om hoogwaardige trainingsgegevens te ontwikkelen voor een AI-model dat spraakopdrachten met betrekking tot UPI-betalingen in de praktijk kan herkennen en erop kan reageren.
Key Stats
Audio-uren van UPI-betalingsverzoeken opgenomen
200
Sprekers met diverse achtergronden (leeftijd, opleiding, regio)
45
Intenties gedekt, met meer dan 87,000 gevarieerde prompts
13
talen: Engels, met sprekers met verschillende moedertaalachtergronden (Kumaoni, Bengaals, Malayalam, Gujarati, Hindi, Marathi etc.)
Project bereik
Snelle creatie
De scope omvatte het creëren van unieke prompts voor een op spraak gebaseerd UPI-betalingssysteem. Prompts werden ontworpen om meerdere intenties te dekken, en zorgden ervoor dat ze divers waren in structuur, vocabulaire en benoemde entiteiten. Enkele belangrijke aspecten waren:
13 kernpunten, waaronder:
- Stuur geld: 65,653 unieke en gevarieerde prompts
- Saldo-onderzoek: 3,052 aanwijzingen
- Om geld vragen: 26,972 aanwijzingen
- Transactiegeschiedenis, opladen, rekeningen betalen, etc.
Audio opname
Om authenticiteit en toepasbaarheid in de echte wereld te garanderen, werden prompts opgenomen door 45 sprekers met verschillende taalkundige achtergronden. De diversiteit die werd vastgelegd via verschillende moedertalen, regionale dialecten en omgevingen (binnen en buiten) hielp de trainingsgegevens te verbeteren.
- Taaldiversiteit: Gebruikers spreken vloeiend Engels, maar hebben ook verschillende moedertalen, zoals Kumaoni, Gujarati, Hindi, Bangla, Marathi en Malayalam.
- Leeftijd, geslacht en opleidingsniveau: De gegevens omvatten een breed scala aan demografische gegevens.
- Sprekers uit stedelijke en landelijke gebieden: Om het echte leven te weerspiegelen, werden zowel stedelijke als landelijke sprekers opgenomen.
- Opnameomgeving: Er werden audio-opnames gemaakt, zowel binnen als buiten, waarbij rekening werd gehouden met verschillende achtergrondgeluiden.
Challenges
Taalkundige en regionale diversiteit
Om ervoor te zorgen dat de prompts de verschillende regionale dialecten en sprekerskenmerken weerspiegelden, was een zorgvuldige planning en uitvoering vereist.
Natuurlijke audiovariaties
Het omgaan met achtergrondgeluiden en omgevingsomstandigheden (binnen versus buiten) was cruciaal voor de toepassing in de praktijk.
Diverse sprekersprofielen
Doordat sprekers uit verschillende leeftijdsgroepen, met verschillende opleidingsniveaus en uit verschillende stedelijke/plattelandsgebieden kwamen, werd het verzamelen van authentieke gegevens complexer.
Het resultaat
Shaip leverde een oplossing die de uitdagingen van het project aanpakte door geavanceerde NLP-technieken toe te passen en zorgvuldig te plannen, zowel bij het opstellen als bij het vastleggen van prompts. Belangrijke aspecten van de oplossing waren onder meer:
Snelle creatie
- 2,500 Er werden unieke opdrachten gecreëerd, elk met een eigen structuur en woordenschat.
- 13 Er werd aandacht besteed aan allerlei doeleinden, variërend van eenvoudige betalingsverzoeken tot complexere vragen, zoals het opvragen van transactiegeschiedenis en het betalen van rekeningen.
Audio opname
- 200 uur van audio-opnames werden uitgevoerd door 45 gebruikers, waarbij diversiteit wordt gewaarborgd wat betreft moedertalen, omgevingen en demografie van de sprekers.
- Voor de opnames werden zowel binnen- als buitenomgevingen gebruikt om een natuurlijke audiovariatie te garanderen.
- Sprekers vertegenwoordigden een scala aan regionale dialecten, wat zorgde voor een nauwkeurige taalkundige weergave.
| Doel | Verstuur | Balans onderzoek | Om geld vragen | Transactie Geschiedenis |
|---|---|---|---|---|
| prompt | Betaal een bedrag van twintighonderd aan Sumatri voor de huur van een huis | Ik wil weten wat het huidige saldo op mijn spaarrekening is. | Kunt u voor een noodgeval Raji, driehonderdachttien roepies, aanvragen? | Toon mij de transactiegeschiedenis van mijn debitcard. |
| Gujarati | Ik denk dat het een goede keuze is | Ik denk dat het een goede keuze is Ik denk dat dat zo is. | Ik denk dat het een goede keuze is Wil je meer weten? | Ik denk dat dit een goede oplossing is. |
| Hindi | Ik denk dat ik het goed heb gedaan Ik denk dat het goed is | Ik denk dat ik het goed heb gedaan Ik ben blij | Ik denk dat ik het goed heb gedaan Wil je meer weten? | Ik denk dat ik het goed heb gedaan |
| Malayalam | Meer informatie Ik denk dat het goed is. | Ik denk dat het goed is Ik denk dat het goed is. | Ik denk dat het goed is Wil je meer weten? | Het apparaat kan niet worden gebruikt. |
| Telugu | Ik denk dat het een goede keuze is Ja | Ik denk dat ik het goed kan doen Ik denk dat het goed is. | Meer informatie Wil je weten wat? | Ik denk dat het een goede keuze is Ja. |
| Bangla (বাংলা) | Ik denk dat dit een goede keuze is, Dat is waar | Ik denk dat het goed is জানতে চাই। | Ik denk dat het een goede keuze is Wil je weten wat je wilt? | Ik denk dat het een goede keuze is |
| marathi | Ik denk dat ik het goed heb gedaan Ik denk dat het goed is. | Ik denk dat ik het goed heb gedaan Ik denk dat het goed is. | Ik denk dat ik het goed heb gedaan Wil je weten wat? | Ik denk dat het goed is. |
De uitkomst
De hoogwaardige, diverse audiogegevens die Shaip leverde, stelden de klant in staat een AI-gestuurd spraakgebaseerd UPI-betalingssysteem te ontwikkelen dat in staat is om opdrachten in verschillende dialecten, omgevingen en contexten te herkennen. De gegevens hielpen bij het verbeteren van:
- Realtime spraakherkenning in complexe omgevingen.
- Nauwkeurigere UPI-transactie voor een breder scala aan gebruikers.
- schaalbaarheid: Het project legt een stevige basis voor de uitbreiding naar andere Indiase talen.
Deliverables
- 200 uur van audiobestanden (8 kHz PCM WAV-formaat, mono)
- 87,000+ gediversifieerde prompts met unieke intenties
- metadata: Sprekerprofielen, omgevingsdetails en transcriptienauwkeurigheid
Shaip's vermogen om de diversiteit van India vast te leggen door middel van unieke prompts en authentieke audio-opnames is een game-changer geweest voor ons op spraak gebaseerde UPI-betalingssysteem. Hun team zorgde ervoor dat elk aspect van het project – van promptcreatie tot opnamekwaliteit – met precisie werd afgehandeld, wat ons hielp een inclusiever, robuuster spraakherkenningsmodel te bouwen.