Bankcheque dataset (document AI)
Synthetische bankcheque
Use case: OCR
Formaat: .jpg
Count: 2023
annotatie: Nee
Beschrijving: De Bank Cheque Dataset (Document AI): Synthetische bankcheques bestaan uit kunstmatig gegenereerde cheque-afbeeldingen die zijn ontworpen om het uiterlijk en de inhoud van echte cheques te repliceren. Het bevat verschillende elementen zoals namen van begunstigden, bedragen, data, handtekeningen en chequenummers. Deze dataset wordt gebruikt voor het trainen en evalueren van Document AI-systemen in taken zoals optische tekenherkenning (OCR), chequeverwerking en geautomatiseerde gegevensextractie, waardoor een gecontroleerde omgeving wordt geboden voor modelontwikkeling zonder de privacyzorgen van echte cheques.
Opnamevoorwaarde: - Geklikte afbeeldingen - Gescand - Webscrapper
Bankafschriftgegevensset (Document AI)
Synthetische bankafschriften
Use case: OCR
Formaat: .jpg, png
Count: 5366
annotatie: Nee
Beschrijving: De Bank Statement Dataset (Document AI): Synthetische bankafschriften bevatten kunstmatig gegenereerde bankafschriften die zijn ontworpen om echte financiële documenten te simuleren. Het bevat verschillende transactiegegevens, datums, bedragen en rekeninggegevens, gestructureerd om echte formaten en inhoud te weerspiegelen. Deze dataset wordt gebruikt voor het trainen en evalueren van Document AI-systemen in taken zoals optische tekenherkenning (OCR), gegevensextractie en documentanalyse, en biedt een gecontroleerde omgeving zonder de privacyproblemen van echte financiële gegevens.
Opnamevoorwaarde: - Gescand - Bankafschrift - Webscrapper
Chinese rekeningen dataset
Omkaderingsvak+Tekst
Use case: OCR
Formaat: Beeld
Count: 6k
annotatie: Ja
Beschrijving: De Chinese Bills Dataset bevat afbeeldingen of tekstvoorbeelden van verschillende soorten rekeningen, zoals facturen, ontvangstbewijzen en verklaringen, geschreven in het Chinees. Het bevat diverse formaten en inhoud, waaronder artikelbeschrijvingen, bedragen en datums. Deze dataset wordt gebruikt voor taken zoals optische tekenherkenning (OCR), financiële documentverwerking en geautomatiseerde gegevensextractie.
Gegevensset loonstrookjes (document AI)
Use case: OCR
Formaat: .jpg
Count: 2010
annotatie: Nee
Beschrijving: De Pay Slips Dataset (Document AI): Synthetic Pay Slips bestaat uit afbeeldingen van kunstmatig gegenereerde loonstroken zonder enige annotaties. Het bevat verschillende loonstrookformaten en details zoals namen van werknemers, salarissen en data, gebruikt voor het trainen en testen van Document AI-systemen in taken zoals OCR en documentverwerking.
Opnamevoorwaarde: - Gescand - Webscrapper
Gedrukte reguliere/cursieve tekstdataset (Document AI)
Use case: Document-AI
Formaat: HEIC (afbeeldingen) & .mov (video's)
Count: 23930
annotatie: Nee
Beschrijving: Live foto's met handgeschreven tekst voor Japans, Koreaans en Russisch
Opname apparaat: iPhone- en iPad-camera
Opnamevoorwaarde: - Agressieve verlichting/schittering - Cameraflits aan - Gekleurd licht - Weinig licht, geen cameraflits - Normaal