Bankcheque dataset (document AI)
Use case: OCR
Formaat: .jpg
Count: 2023
annotatie: Nee
Beschrijving: De Bank Cheque Dataset (Document AI): Synthetische bankcheques bestaan uit kunstmatig gegenereerde cheque-afbeeldingen die zijn ontworpen om het uiterlijk en de inhoud van echte cheques te repliceren. Het bevat verschillende elementen zoals namen van begunstigden, bedragen, data, handtekeningen en chequenummers. Deze dataset wordt gebruikt voor het trainen en evalueren van Document AI-systemen in taken zoals optische tekenherkenning (OCR), chequeverwerking en geautomatiseerde gegevensextractie, waardoor een gecontroleerde omgeving wordt geboden voor modelontwikkeling zonder de privacyzorgen van echte cheques.
Opnamevoorwaarde: - Geklikte afbeeldingen - Gescand - Webscrapper
Bankafschriftgegevensset (Document AI)
Use case: OCR
Formaat: .jpg, png
Count: 5366
annotatie: Nee
Beschrijving: De Bank Statement Dataset (Document AI): Synthetische bankafschriften bevatten kunstmatig gegenereerde bankafschriften die zijn ontworpen om echte financiële documenten te simuleren. Het bevat verschillende transactiegegevens, datums, bedragen en rekeninggegevens, gestructureerd om echte formaten en inhoud te weerspiegelen. Deze dataset wordt gebruikt voor het trainen en evalueren van Document AI-systemen in taken zoals optische tekenherkenning (OCR), gegevensextractie en documentanalyse, en biedt een gecontroleerde omgeving zonder de privacyproblemen van echte financiële gegevens.
Opnamevoorwaarde: - Gescand - Bankafschrift - Webscrapper
Chinese rekeningen dataset
Use case: OCR
Formaat: Beeld
Count: 6k
annotatie: Ja
Beschrijving: De Chinese Bills Dataset bevat afbeeldingen of tekstvoorbeelden van verschillende soorten rekeningen, zoals facturen, ontvangstbewijzen en verklaringen, geschreven in het Chinees. Het bevat diverse formaten en inhoud, waaronder artikelbeschrijvingen, bedragen en datums. Deze dataset wordt gebruikt voor taken zoals optische tekenherkenning (OCR), financiële documentverwerking en geautomatiseerde gegevensextractie.
Documenten / OCR – Arabische en Engelse OCR-inhoudsdataset
Use case: Documenten / OCR
Formaat: Afbeeldingen
Count: 1,321
annotatie: Nee
Beschrijving: Arabische en Engelse contentafbeeldingenverzameling: afbeelding + annotatie voor OCR
Documenten / OCR – Barcodevideo's Dataset

Use case: Documenten / OCR
Formaat: Video's
Count: 2,767
annotatie: Nee
Beschrijving: Barcodevideo's (Code128, UPC/EAN, PDF417, Aztec, Multi-code)
Documenten / OCR – Gebogen gedrukte tekstdataset

Use case: Documenten / OCR
Formaat: Afbeeldingen
Count: 18,986
annotatie: Nee
Beschrijving: Gebogen gedrukte tekst: Verzamel afbeeldingen met gebogen tekst of tekst met een niet-lineaire basislijn
Documenten / OCR – Financiële documenten (bank, loonstrook, belasting, VS)

Use case: Documenten / OCR
Formaat: Afbeeldingen
Count: 26,446
annotatie: Nee
Beschrijving: Financiële documenten: bankafschrift, cheque, loonstrook, belasting, hypotheek, verzekeringsclaims (VS)
Documenten / OCR – Financiële documenten (Fase 1 – Hypotheek)
Use case: Documenten / OCR
Formaat: Afbeeldingen
Count: 9,192
annotatie: Nee
Beschrijving: Financiële documenten (fase 1) Hypotheekdataset – afdrukken, scannen, fotograferen
Documenten / OCR – Financiële documenten (Fase 2 – Verzekeringen)

Use case: Documenten / OCR
Formaat: Afbeeldingen
Count: 7,636
annotatie: Nee
Beschrijving: Financiële documenten (fase 2) Verzekeringsdataset – printen, scannen, fotograferen
Documenten / OCR – Handgeschreven tekstdataset (JP/KR/RU)

Use case: Documenten / OCR
Formaat: Afbeeldingen
Count: 106,313
annotatie: Nee
Beschrijving: Handgeschreven tekst: LivePhotos met handgeschreven tekst (Japans, Koreaans, Russisch)
Documenten / OCR – Factuurdataset met begrenzende kaderannotatie

Use case: Documenten / OCR
Formaat: Afbeeldingen
Count: 87
annotatie: Ja
Beschrijving: Factuurdatasets met omkaderde aantekeningen bevatten gescande of digitale facturen waarbij belangrijke velden, zoals factuurnummer, datum, leveranciersgegevens, posten en totaalbedragen, zijn voorzien van omkaderde vakjes. Zo kunnen AI-modellen gestructureerde informatie nauwkeurig detecteren en extraheren uit ongestructureerde documenten.
Documenten / OCR – LivePhotos met gedrukte tekst (JP/KR/RU)
Use case: Documenten / OCR
Formaat: Afbeeldingen
Count: 4,944
annotatie: Nee
Beschrijving: LivePhotos met gedrukte tekst (Japans, Koreaans, Russisch)
Documenten / OCR - Dataset met meertalige ontvangstbewijzen/facturen

Use case: Documenten / OCR
Formaat: Afbeeldingen
Count: 8,961
annotatie: Nee
Beschrijving: De dataset met meertalige bonnen en facturen bevat uiteenlopende financiële documenten in meerdere talen, waardoor AI-modellen kunnen trainen op het herkennen van tekst in meerdere talen, het extraheren van sleutelvelden en het begrijpen van documenten.
Documenten / OCR – Synthetische bankafschriften (40 sjablonen)

Use case: Documenten / OCR
Formaat: Afbeeldingen
Count: 1,290
annotatie: Nee
Beschrijving: Bankafschriften - Unieke sjabloon - 40: Synthetische bankafschriften
Documenten / OCR – Synthetische loonstroken (60 sjablonen)

Use case: Documenten / OCR
Formaat: Afbeeldingen
Count: 2,010
annotatie: Nee
Beschrijving: Cheque - Unieke sjabloon - 60: Synthetische loonstrookjes
Documenten / OCR – Synthetische loonstroken (130 sjablonen)

Use case: Documenten / OCR
Formaat: Afbeeldingen
Count: 2,023
annotatie: Nee
Beschrijving: Loonstrookjes - Unieke sjabloon - 130: Synthetische bankcheque
Gegevensset loonstrookjes (document AI)

Use case: OCR
Formaat: .jpg
Count: 2010
annotatie: Nee
Beschrijving: De Pay Slips Dataset (Document AI): Synthetic Pay Slips bestaat uit afbeeldingen van kunstmatig gegenereerde loonstroken zonder enige annotaties. Het bevat verschillende loonstrookformaten en details zoals namen van werknemers, salarissen en data, gebruikt voor het trainen en testen van Document AI-systemen in taken zoals OCR en documentverwerking.
Opnamevoorwaarde: - Gescand - Webscrapper

