Bankcheque dataset (document AI)

Synthetische bankcheque

Bankcheque dataset (document AI)

Use case: OCR

Formaat: .jpg

Count: 2023

annotatie: Nee

X

Beschrijving: De Bank Cheque Dataset (Document AI): Synthetische bankcheques bestaan ​​uit kunstmatig gegenereerde cheque-afbeeldingen die zijn ontworpen om het uiterlijk en de inhoud van echte cheques te repliceren. Het bevat verschillende elementen zoals namen van begunstigden, bedragen, data, handtekeningen en chequenummers. Deze dataset wordt gebruikt voor het trainen en evalueren van Document AI-systemen in taken zoals optische tekenherkenning (OCR), chequeverwerking en geautomatiseerde gegevensextractie, waardoor een gecontroleerde omgeving wordt geboden voor modelontwikkeling zonder de privacyzorgen van echte cheques.

Opnamevoorwaarde: - Geklikte afbeeldingen - Gescand - Webscrapper

Bankafschriftgegevensset (Document AI)

Synthetische bankafschriften

Bankafschriftgegevensset (Document AI)

Use case: OCR

Formaat: .jpg, png

Count: 5366

annotatie: Nee

X

Beschrijving: De Bank Statement Dataset (Document AI): Synthetische bankafschriften bevatten kunstmatig gegenereerde bankafschriften die zijn ontworpen om echte financiële documenten te simuleren. Het bevat verschillende transactiegegevens, datums, bedragen en rekeninggegevens, gestructureerd om echte formaten en inhoud te weerspiegelen. Deze dataset wordt gebruikt voor het trainen en evalueren van Document AI-systemen in taken zoals optische tekenherkenning (OCR), gegevensextractie en documentanalyse, en biedt een gecontroleerde omgeving zonder de privacyproblemen van echte financiële gegevens.

Opnamevoorwaarde: - Gescand - Bankafschrift - Webscrapper

Chinese rekeningen dataset

Omkaderingsvak+Tekst

Chinese rekeningen dataset

Use case: OCR

Formaat: Beeld

Count: 6k

annotatie: Ja

X

Beschrijving: De Chinese Bills Dataset bevat afbeeldingen of tekstvoorbeelden van verschillende soorten rekeningen, zoals facturen, ontvangstbewijzen en verklaringen, geschreven in het Chinees. Het bevat diverse formaten en inhoud, waaronder artikelbeschrijvingen, bedragen en datums. Deze dataset wordt gebruikt voor taken zoals optische tekenherkenning (OCR), financiële documentverwerking en geautomatiseerde gegevensextractie.

Gegevensset loonstrookjes (document AI)

Gegevensset loonstrookjes (document AI)

Use case: OCR

Formaat: .jpg

Count: 2010

annotatie: Nee

X

Beschrijving: De Pay Slips Dataset (Document AI): Synthetic Pay Slips bestaat uit afbeeldingen van kunstmatig gegenereerde loonstroken zonder enige annotaties. Het bevat verschillende loonstrookformaten en details zoals namen van werknemers, salarissen en data, gebruikt voor het trainen en testen van Document AI-systemen in taken zoals OCR en documentverwerking.

Opnamevoorwaarde: - Gescand - Webscrapper

Gedrukte reguliere/cursieve tekstdataset (Document AI)

Gedrukte reguliere/cursieve tekstdataset (Document AI)

Use case: Document-AI

Formaat: HEIC (afbeeldingen) & .mov (video's)

Count: 23930

annotatie: Nee

X

Beschrijving: Live foto's met handgeschreven tekst voor Japans, Koreaans en Russisch

Opname apparaat: iPhone- en iPad-camera

Opnamevoorwaarde: - Agressieve verlichting/schittering - Cameraflits aan - Gekleurd licht - Weinig licht, geen cameraflits - Normaal