Op spraak gebaseerde UPI-betaalprompts: diversiteit vastleggen voor verbeterde AI-modellen

We maken gebruik van Shaip's expertise op het gebied van snelle creatie en diverse audio-opnames om spraakgestuurde UPI-betalingssystemen te ondersteunen met hoogwaardige, cultureel diverse gegevens.

Op spraak gebaseerde upi-betalingsverzoeken

project Overzicht

Shaip werkte samen met een toonaangevend fintechbedrijf om een ​​spraakgestuurde betalingsapplicatie te ontwikkelen door diverse UPI-betalingsaanwijzingen te creëren en op te nemen. Het project omvatte de creatie van 2,500 unieke aanwijzingen en 87,000 gediversifieerde aanwijzingen over 13 betalingsgerelateerde intenties, zoals geld verzenden, geld aanvragen, saldo-opvragen en rekeningen betalen. Deze aanwijzingen werden gedurende 200 uur opgenomen door 45 sprekers uit verschillende regio's, achtergronden en leeftijdsgroepen, wat zorgde voor een breed scala aan taalkundige en omgevingsdiversiteit.

Het doel van het project was om hoogwaardige trainingsgegevens te ontwikkelen voor een AI-model dat spraakopdrachten met betrekking tot UPI-betalingen in de praktijk kan herkennen en erop kan reageren.

Betaling via upi via spraak

Key Stats

Audio-uren van UPI-betalingsverzoeken opgenomen

200

Sprekers met diverse achtergronden (leeftijd, opleiding, regio)

45

Intenties gedekt, met meer dan 87,000 gevarieerde prompts

13

talen: Engels, met sprekers met verschillende moedertaalachtergronden (Kumaoni, Bengaals, Malayalam, Gujarati, Hindi, Marathi etc.)

Project bereik

Snelle creatie

De scope omvatte het creëren van unieke prompts voor een op spraak gebaseerd UPI-betalingssysteem. Prompts werden ontworpen om meerdere intenties te dekken, en zorgden ervoor dat ze divers waren in structuur, vocabulaire en benoemde entiteiten. Enkele belangrijke aspecten waren:

13 kernpunten, waaronder:

  • Stuur geld: 65,653 unieke en gevarieerde prompts
  • Saldo-onderzoek: 3,052 aanwijzingen
  • Om geld vragen: 26,972 aanwijzingen
  • Transactiegeschiedenis, opladen, rekeningen betalen, etc.

Audio opname

Om authenticiteit en toepasbaarheid in de echte wereld te garanderen, werden prompts opgenomen door 45 sprekers met verschillende taalkundige achtergronden. De diversiteit die werd vastgelegd via verschillende moedertalen, regionale dialecten en omgevingen (binnen en buiten) hielp de trainingsgegevens te verbeteren.

  • Taaldiversiteit: Gebruikers spreken vloeiend Engels, maar hebben ook verschillende moedertalen, zoals Kumaoni, Gujarati, Hindi, Bangla, Marathi en Malayalam.
  • Leeftijd, geslacht en opleidingsniveau: De gegevens omvatten een breed scala aan demografische gegevens.
  • Sprekers uit stedelijke en landelijke gebieden: Om het echte leven te weerspiegelen, werden zowel stedelijke als landelijke sprekers opgenomen.
  • Opnameomgeving: Er werden audio-opnames gemaakt, zowel binnen als buiten, waarbij rekening werd gehouden met verschillende achtergrondgeluiden.

Challenges

Taalkundige en regionale diversiteit

Om ervoor te zorgen dat de prompts de verschillende regionale dialecten en sprekerskenmerken weerspiegelden, was een zorgvuldige planning en uitvoering vereist.

Natuurlijke audiovariaties

Het omgaan met achtergrondgeluiden en omgevingsomstandigheden (binnen versus buiten) was cruciaal voor de toepassing in de praktijk.

Diverse sprekersprofielen

Doordat sprekers uit verschillende leeftijdsgroepen, met verschillende opleidingsniveaus en uit verschillende stedelijke/plattelandsgebieden kwamen, werd het verzamelen van authentieke gegevens complexer.

Het resultaat

Shaip leverde een oplossing die de uitdagingen van het project aanpakte door geavanceerde NLP-technieken toe te passen en zorgvuldig te plannen, zowel bij het opstellen als bij het vastleggen van prompts. Belangrijke aspecten van de oplossing waren onder meer:

Snelle creatie

  • 2,500 Er werden unieke opdrachten gecreëerd, elk met een eigen structuur en woordenschat.
  • 13 Er werd aandacht besteed aan allerlei doeleinden, variërend van eenvoudige betalingsverzoeken tot complexere vragen, zoals het opvragen van transactiegeschiedenis en het betalen van rekeningen.

Audio opname

  • 200 uur van audio-opnames werden uitgevoerd door 45 gebruikers, waarbij diversiteit wordt gewaarborgd wat betreft moedertalen, omgevingen en demografie van de sprekers.
  • Voor de opnames werden zowel binnen- als buitenomgevingen gebruikt om een ​​natuurlijke audiovariatie te garanderen.
  • Sprekers vertegenwoordigden een scala aan regionale dialecten, wat zorgde voor een nauwkeurige taalkundige weergave.
Doel Verstuur Balans onderzoek Om geld vragen Transactie Geschiedenis
prompt Betaal een bedrag van twintighonderd aan Sumatri voor de huur van een huis Ik wil weten wat het huidige saldo op mijn spaarrekening is. Kunt u voor een noodgeval Raji, driehonderdachttien roepies, aanvragen? Toon mij de transactiegeschiedenis van mijn debitcard.
Gujarati Ik denk dat het een goede keuze is Ik denk dat het een goede keuze is Ik denk dat dat zo is. Ik denk dat het een goede keuze is Wil je meer weten? Ik denk dat dit een goede oplossing is.
Hindi Ik denk dat ik het goed heb gedaan Ik denk dat het goed is Ik denk dat ik het goed heb gedaan Ik ben blij Ik denk dat ik het goed heb gedaan Wil je meer weten? Ik denk dat ik het goed heb gedaan
Malayalam Meer informatie Ik denk dat het goed is. Ik denk dat het goed is Ik denk dat het goed is. Ik denk dat het goed is Wil je meer weten? Het apparaat kan niet worden gebruikt.
Telugu Ik denk dat het een goede keuze is Ja Ik denk dat ik het goed kan doen Ik denk dat het goed is. Meer informatie Wil je weten wat? Ik denk dat het een goede keuze is Ja.
Bangla (বাংলা) Ik denk dat dit een goede keuze is, Dat is waar Ik denk dat het goed is জানতে চাই। Ik denk dat het een goede keuze is Wil je weten wat je wilt? Ik denk dat het een goede keuze is
marathi Ik denk dat ik het goed heb gedaan Ik denk dat het goed is. Ik denk dat ik het goed heb gedaan Ik denk dat het goed is. Ik denk dat ik het goed heb gedaan Wil je weten wat? Ik denk dat het goed is.

De uitkomst

De hoogwaardige, diverse audiogegevens die Shaip leverde, stelden de klant in staat een AI-gestuurd spraakgebaseerd UPI-betalingssysteem te ontwikkelen dat in staat is om opdrachten in verschillende dialecten, omgevingen en contexten te herkennen. De gegevens hielpen bij het verbeteren van:

  • Realtime spraakherkenning in complexe omgevingen.
  • Nauwkeurigere UPI-transactie voor een breder scala aan gebruikers.
  • schaalbaarheid: Het project legt een stevige basis voor de uitbreiding naar andere Indiase talen.

Deliverables

  • 200 uur van audiobestanden (8 kHz PCM WAV-formaat, mono)
  • 87,000+ gediversifieerde prompts met unieke intenties
  • metadata: Sprekerprofielen, omgevingsdetails en transcriptienauwkeurigheid

Shaip's vermogen om de diversiteit van India vast te leggen door middel van unieke prompts en authentieke audio-opnames is een game-changer geweest voor ons op spraak gebaseerde UPI-betalingssysteem. Hun team zorgde ervoor dat elk aspect van het project – van promptcreatie tot opnamekwaliteit – met precisie werd afgehandeld, wat ons hielp een inclusiever, robuuster spraakherkenningsmodel te bouwen.

Gouden 5-sterren