Aangepaste en merkgebonden wake word trainingsgegevensverzameling

Ontwikkel spraakgestuurde apps die altijd luisteren met aangepaste trainingsdata voor het activeringswoord. Hogere detectienauwkeurigheid, minder valse alarmen.

Wake word-training gegevensverzameling

Een gateway bouwen tussen u en uw spraakproducten met nauwkeurige en aangepaste wekwoorden en het verbeteren van de woorddetectiemogelijkheden van spraakassistenten om u te helpen de concurrentie voor te blijven.

Spraakassistenten hebben de manier waarop klanten met hun apparaten omgaan drastisch veranderd. Ze hebben het voor gebruikers gemakkelijker gemaakt om producten en diensten te verkennen - snel en efficiënt. Luistert de spraaktoepassing echter? Om deze applicaties in een hoge drive te zetten, moeten ze worden gewekt en overgaan van passief naar actief luisteren met behulp van WAKE WORDS. 'Alexa' en 'Hey Siri' zijn twee van de meest populaire wake-woorden ter wereld.

Statista

Tegen 2024 wordt voorspeld dat het aantal digitale spraakassistenten zal bereiken 8.4 miljard eenheden – meer dan de wereldbevolking.

Markten & Markten

De markt voor spraakassistent-apps zal naar verwachting groeien van $ 2.8 miljard in 2021 naar $ 11.2 miljard in 2026, met een CAGR van 32.4%.

Wat is een Wake Word en zijn voorbeelden? 

Een wake-woord is een specifiek woord of een specifieke zin, zoals 'Hey Siri', 'Oké Google' en 'Alexa', bedoeld om een ​​spraakgestuurd apparaat te activeren en te laten reageren wanneer het wordt uitgesproken. Een wake-woord dat altijd actief is en lokaal in het apparaat is geïntegreerd, verkort de reactietijd aanzienlijk en verhoogt de nauwkeurigheid van de identificatie en verwerking van het wake-woord, zelfs zonder internetverbinding. Shaip verzamelt trainingsgegevens voor wake-woorden in meer dan 100 talen, met diverse accenten, leeftijdsgroepen en in realistische geluidsomgevingen om de detectienauwkeurigheid te maximaliseren en valse activering te minimaliseren. Ze staan ​​ook bekend als:

  • Triggerwoorden
  • Activeringswoorden
  • Hotwoorden
  • Wake-zinnen
  • Activeringszinnen
  • Wekopdrachten
  • Activeringsopdrachten
  • Voice Commands
  • Uiting collectie
  • Zoekwoordenverzameling
  • Sleutelzincollectie
  • & meer….

Hoe Shaip kan helpen?

Met Shaip's aanbiedingen altijd luisterende wake-word-training, zijn uw stemassistent-modellen altijd afgestemd om naar het wake-word te luisteren, maar zonder daadwerkelijk gegevens op te nemen of naar de cloud te verzenden. Samenwerken met Shaip geeft u het voordeel om met experts te werken. Met onze uitgebreide ervaring met het gebruik van AI- en ML-technologie bij het ontwikkelen van training voor stemassistenten, helpen we u privacyrisico's te elimineren, de gebruikerservaring te verbeteren, de ontwikkelingskosten te verlagen en de schaalbaarheid te vergroten.

Gegevensverzameling uiting

Belangrijkste mogelijkheden

Aangepaste en merkgebonden wake-woorden

Aangepaste en merkgebonden wake-woorden

Shaip genereert trainingsdata voor volledig merkgebonden activeringswoorden, zodat klanten uw merknaam uitspreken – en niet een generieke spraakassistent. Elke dataset is afgestemd op uw exacte activeringszin, waardoor de merkherkenning bij elke interactie wordt versterkt en de spraakervaring binnen uw eigen ecosysteem blijft.

Gegevensverzameling op het apparaat zelf, met privacy als prioriteit.

Gegevensverzameling op het apparaat zelf, met privacy als prioriteit.

Shaip ondersteunt altijd actieve wake-word-modellen die lokaal op het apparaat draaien zonder audio op te nemen of naar de cloud te verzenden. Trainingsdata voor wake-words op het apparaat zelf verminderen de latentie, verlagen het privacyrisico en zorgen ervoor dat de detectie betrouwbaar blijft werken, zelfs zonder internetverbinding.

Meertaligheid en diversiteit aan accenten

Shaip verzamelt spraakfragmenten van activeringswoorden in meer dan 100 talen en regionale accenten — Schots, Canadees, Australisch, Indiaas Engels en meer — zodat de detectienauwkeurigheid wereldwijd behouden blijft en niet afneemt voor niet-moedertaalsprekers.

Ruis en robuustheid op grote afstand

Ruis en robuustheid op grote afstand

Shaip registreert gegevens over spraaksignalen in stille, lawaaierige, auto-, buiten- en verre-veldomstandigheden. Training met realistische akoestische variaties vermindert valse afwijzingen wanneer gebruikers van een afstand spreken of in een lawaaierige omgeving.

Zinsherkenning en ingebedde detectie

Naast het activeringswoord levert Shaip gegevens over spraak en woordgroepen, waardoor apparaten langere spraakopdrachten met een lage latentie kunnen verwerken. De ingebouwde trefwoorddetectiegegevens ondersteunen verwerking in de browser en op de chip voor hoge nauwkeurigheid en privacy.

Waardevolle tips voor het kiezen van de juiste ontwaakwoorden / triggerwoorden

Kies woorden met verschillende geluiden

Verschillende fonemen zorgen over het algemeen voor een duidelijkere signatuur en zorgen voor een betere nauwkeurigheid in de resultaten. Kies daarom frases in uw data die verschillende geluiden produceren.

Maak gebruik van een geschikt voorvoegsel met uw woorden

Maak wake-woorden effectiever door ze te voorzien van voorvoegsels zoals 'Hallo', 'Hallo', 'Hey' of 'OK'. Het houdt het wake-woord ondubbelzinnig en zorgt ervoor dat er geen toevallige matching plaatsvindt bij het gebruik van het trigger-woord in normale spraak.

Gebruik fonemen om uw triggerwoorden op te bouwen

Maak je wake-woorden een combinatie van ten minste zes fonemen die gemakkelijk te onderscheiden zijn door een machine en gemakkelijk uit te spreken zijn voor mensen. "Alexa" heeft bijvoorbeeld zes fenomenen, terwijl "Ok Google" acht fenomenen heeft.

Vermijd het gebruik van één woord

Maak niet de fout om een ​​enkel woord als uw wake-woord te gebruiken. Wake-woorden moeten lang genoeg zijn om te onderscheiden.

Eenvoudige en unieke woorden

Zorg ervoor dat de triggerwoorden die u maakt eenvoudig en uniek moeten zijn, zodat ze gemakkelijk kunnen worden onthouden.

Vermijd lange zinnen

Langere wake-frasen met meerdere woorden zijn moeilijk uit te spreken en maken het proces onnodig moeilijker.

Beperkingen van Wake Word-trainingsgegevens

Verwarring door gebruik van meerdere uitingen

Een wake-word-model is over het algemeen getraind om een ​​nee te herkennen. van verschillende uitingen, zodat het kan reageren op verschillende aanroepen. Als u echter te veel verschillende wake-woorden heeft, kan de spraakpijplijn eenvoudig worden geactiveerd zonder dat u weet welke uiting de gebruiker heeft uitgesproken.

Minder nauwkeurige resultaten door externe omgeving

Factoren zoals ruis, afstand en variaties in accenten en taal maken nauwkeurige hotword-detectie moeilijker en complexer voor uw AI-model.

Nauwkeurige wekwoorden bouwen voor uw merk

Trainen
Trainen

Onze ervaring met spraaktechnologie helpt ons om snel luisterende, op maat gemaakte wake-woorden en branded wake-frases te ontwikkelen. Met spraakherkenning in combinatie met begrip van natuurlijke taalverwerking, helpen ML-algoritmen om spraak te transcriberen en spraakopdrachten effectief uit te voeren.

Ontwikkelen
Ontwikkelen

We richten ons op het snel ontwikkelen van prototypes van wake-words om ervoor te zorgen dat het merkwoord op maat wordt gemaakt. Een prototype fungeert als proof of concept en helpt bij nauwkeurige training, snellere time-to-market, versneld testen en eliminatie van risico's.

Grow
Grow

Ervaar ononderbroken groei en ongehinderde klantbetrokkenheid met een uitzonderlijke spraakassistent. We bieden meertalige spraakherkenningsmogelijkheden, zodat de toepassing woorden en zinnen nauwkeurig kan herkennen, zelfs in omgevingen met veel ruis.

Het concept van gegevensdiversiteit begrijpen

Wat is datadiversiteit?

Het is een manier om cruciale gebruikersgegevens te verzamelen, zoals hun identiteit, land van herkomst, leeftijd, geslacht, taal, accenten, enz. Gegevensdiversiteit wordt gebruikt om gebruikersgerichte algoritmen te verbeteren om nauwkeurigere resultaten te bereiken.

Gegevens hebben meestal de neiging om ingebouwde vooroordelen te genereren. Daarom, wanneer we gegevens uit verschillende bronnen verzamelen, vermindert de vertekening in de resultaten aanzienlijk.

Hier zijn een paar parameters van gegevensdiversiteit die Shaip aanpakt bij het bouwen van wake-woorden en andere conversatiecommando's.

Data diversiteit
Ras en etniciteit Hindoe, moslim, christen, Afrikaans, Europeanen
Opleidingsniveau Undergraduate, Graduate, Ph.D., Masters
Land China, Japan, India, Korea, Dubai, Nigeria, VS, Canada
Sekse Man, vrouw
Leeftijd Minder dan 10 jaar, 10-15, 15-25, 25-45, 45 jaar en ouder
Taal Engels, Japans, Turks, Chinees, Thais, Hindi
Milieu Stil, lawaaierig, achtergrondmuziek, achtergrondgeluid/spraak, binnen, buiten, theater, stadion, cafetaria, in de auto, kantoor, winkelcentrum, huiselijk lawaai, trappenhuis, straat/weg, kust (winderig)
Accenten (Engels) Schots Engels, Welsh Engels, Iers Engels, Canadees Engels, Australisch Engels, Nieuw-Zeelands Engels
Spreekstijl Snel/Normaal/Langzaam, Hoog/Normaal/Zacht volume, Formeel/Informeel
Apparaatposities Handbediend, Desktop

Branches en use cases

Slimme woning / elektronica

Wake word-data voor luidsprekers, tv's en apparaten die direct moeten activeren en achtergrondgeluiden moeten onderdrukken.

Auto- en autospraak

Datasets met robuuste, verre-veld-activeringswoorden voor handsfree assistenten in de cabine.

Draagbare en hoorbare apparaten

Compacte wakeword-data voor apparaten die altijd aan staan ​​en een beperkte batterijduur hebben.

Conversationele AI

Aangepaste activeringswoorden en spraakgegevens om spraakassistenten te lokaliseren in verschillende talen en dialecten.

Gezondheidszorg en medische hulpmiddelen

Privacygerichte, op het apparaat zelf opgeslagen activeringsgegevens voor handsfree gebruik in klinische en patiëntomgevingen.

Robotica en belichaamde AI

Multimodale wake word- en commando-data voor robots die in realtime reageren zonder cloud.

Hoe het werkt

1. Bepaal je activeringswoord/uitspraak

Shaip werkt met u samen om een ​​fonetisch onderscheidend, merkgericht activeringswoord te selecteren en richtlijnen voor de collectie vast te stellen.

2. Verzamel diverse uitingen

Het wereldwijde team van Shaip registreert het activeringswoord in de vereiste talen, accenten, leeftijden, apparaten en geluidsomgevingen.

3. Label en kwaliteitscontrole van de dataset

Elke uitspraak wordt getranscribeerd, gelabeld en gecontroleerd op kwaliteit aan de hand van uw acceptatiecriteria.

4. Lever trainingsklare gegevens aan

Shaip levert gestructureerde, op beleid gebaseerde trainingsgegevens voor wake-words, geformatteerd voor uw modelpipeline.

Waarom Shaip

Om uw AI-initiatief effectief in te zetten, hebt u grote hoeveelheden gespecialiseerde trainingsdatasets nodig. Shaip is een van de weinige bedrijven op de markt die zorgt voor betrouwbare trainingsgegevens van wereldklasse op schaal die voldoen aan de wettelijke/GDPR-vereisten.

Mogelijkheden voor gegevensverzameling

Creëer, beheer en verzamel op maat gemaakte datasets (tekst, spraak, afbeelding, video) uit meer dan 100 landen over de hele wereld op basis van aangepaste richtlijnen.

Flexibel personeel

Maak gebruik van ons wereldwijde personeelsbestand van meer dan 30,000 ervaren en erkende bijdragers. Flexibele taaktoewijzing en realtime personeelscapaciteit, efficiëntie en voortgangsbewaking.

Kwaliteit​

Ons eigen platform en geschoolde arbeidskrachten gebruiken meerdere kwaliteitscontrolemethoden om te voldoen aan de kwaliteitsnormen die zijn vastgesteld voor het verzamelen van AI-trainingsdatasets of deze te overtreffen.

Divers, nauwkeurig en snel

Ons proces stroomlijnt het verzamelproces door eenvoudiger taakverdeling, beheer en gegevensregistratie rechtstreeks vanuit de app en webinterface.

Gegevensveiligheid

Handhaaf volledige vertrouwelijkheid van gegevens door privacy onze prioriteit te maken. We zorgen ervoor dat gegevensindelingen beleidsgestuurd en behouden blijven.

Domein specificiteit

Beheerde domeinspecifieke gegevens verzameld uit branchespecifieke bronnen op basis van richtlijnen voor het verzamelen van klantgegevens.

Uitgelichte klanten

Teams in staat stellen om toonaangevende AI-producten te bouwen.

Google Microsoft Amazon-webservices

AI gebruiken om de bedrijfsprestaties te verbeteren door middel van klantervaring

Een wake-woord is een specifiek woord of een specifieke zin – zoals 'Alexa', 'Oké Google' of een aangepaste, merkgebonden zin – waarmee een spraakgestuurd apparaat wordt geactiveerd en van passief naar actief luisteren wordt overgeschakeld. Het apparaat luistert continu lokaal naar het wake-woord en begint pas met het verwerken van een verzoek zodra het wake-woord is gedetecteerd.

Trainingsdata voor het activeren van spraak zijn gelabelde spraakopnames die worden gebruikt om een ​​model te leren de activeringszin te herkennen. Effectieve trainingsdata voor het activeren van spraak omvatten veel verschillende sprekers, accenten, leeftijden, apparaten en omgevingsgeluiden, zodat het model betrouwbaar reageert en spraak die erop lijkt, afwijst.

Een activeringswoord werkt door een klein, continu actief detectiemodel te laten draaien dat de binnenkomende audio scant op de betreffende zin. Wanneer het model het activeringswoord met voldoende zekerheid herkent, wordt het apparaat geactiveerd en begint het de gebruikersaanvraag te verwerken met behulp van spraakherkenning en natuurlijke taalverwerking.

Een sterk, op maat gemaakt activeringswoord gebruikt diverse fonemen, bevat minstens drie tot vier lettergrepen en vermijdt veelvoorkomende alledaagse woorden om valse activering te voorkomen. Het toevoegen van een voorvoegsel zoals 'Hey' of 'OK' verbetert de onderscheidbaarheid. Shaip helpt bij het selecteren en valideren van activeringswoorden tijdens de projectconfiguratie.

Ja. Detectie van het activeringswoord op het apparaat zelf voert het activeringsmodel lokaal uit, waardoor audio niet wordt opgenomen of naar de cloud wordt verzonden. Dit verlaagt de latentie, beschermt de privacy en zorgt ervoor dat de detectie ook offline blijft werken. Shaip verzamelt trainingsgegevens die specifiek geschikt zijn voor implementatie op het apparaat zelf en in embedded systemen.

Shaip verzamelt trainingsgegevens voor activeringswoorden in meer dan 100 talen en een breed scala aan regionale accenten, afkomstig van een wereldwijd team van medewerkers in meer dan 100 landen. Deze brede dekking verkleint de nauwkeurigheidskloof voor niet-moedertaalsprekers en ondersteunt wereldwijde productlanceringen.

Shaip past meerdere kwaliteitscontroles toe — transcriptiebeoordeling, acceptatiecriteria en monitoring van het personeel — zodat datasets aan de beoogde nauwkeurigheid voldoen vóór levering. Diverse, hoogwaardige data verminderen zowel het aantal fout-acceptaties als het aantal fout-afwijzingen in het geïmplementeerde model.

Een activeringswoord activeert het apparaat; een uiting is het gesproken verzoek dat daarop volgt. Het detecteren van activeringswoorden is een specifieke, continue taak, terwijl het begrijpen van uitingen het interpreteren van diverse formuleringen in natuurlijke taal vereist. Shaip levert trainingsdata voor zowel het detecteren van activeringswoorden als het verzamelen van uitingen.

Een uiting is een zin die een gebruiker uitspreekt om een ​​verzoek te doen aan spraakbesturingssoftware. De software herkent de intentie van de gebruiker aan de hand van de uiting en reageert dienovereenkomstig. In tegenstelling tot een volledige zin is een uiting een spraakeenheid die mogelijk geen volledige gedachte overbrengt en vaak pauzes bevat. Voorbeelden: "Laat me de nieuwste film zien - die van vorige week" of "Is de winkel op 22nd Street nu open?"

Een aanroepnaam is het trefwoord dat wordt gebruikt om een ​​specifieke 'vaardigheid' binnen spraaksoftware te activeren. Het kan namen van personen of plaatsen bevatten en worden gecombineerd met een actie, commando of vraag. Elke aangepaste vaardigheid heeft een aanroepnaam nodig om te kunnen worden gestart.

Wake words worden ook wel trigger words, hot words, activation words, invocation words, wake phrases of utterances genoemd.

Alexa gebruikt meerdere ingebouwde microfoons om het activeringswoord te detecteren en tegelijkertijd achtergrondgeluiden te filteren. Om valse positieven en negatieven te voorkomen, begint Alexa pas actief te luisteren nadat ze "Alexa" heeft gedetecteerd.