Bankcheque dataset (document AI)

Bankcheque dataset (document AI)

Use case: OCR

Formaat: .jpg

Count: 2023

annotatie: Nee

X

Beschrijving: De Bank Cheque Dataset (Document AI): Synthetische bankcheques bestaan ​​uit kunstmatig gegenereerde cheque-afbeeldingen die zijn ontworpen om het uiterlijk en de inhoud van echte cheques te repliceren. Het bevat verschillende elementen zoals namen van begunstigden, bedragen, data, handtekeningen en chequenummers. Deze dataset wordt gebruikt voor het trainen en evalueren van Document AI-systemen in taken zoals optische tekenherkenning (OCR), chequeverwerking en geautomatiseerde gegevensextractie, waardoor een gecontroleerde omgeving wordt geboden voor modelontwikkeling zonder de privacyzorgen van echte cheques.

Opnamevoorwaarde: - Geklikte afbeeldingen - Gescand - Webscrapper

Bankafschriftgegevensset (Document AI)

Bankafschriftgegevensset (Document AI)

Use case: OCR

Formaat: .jpg, png

Count: 5366

annotatie: Nee

X

Beschrijving: De Bank Statement Dataset (Document AI): Synthetische bankafschriften bevatten kunstmatig gegenereerde bankafschriften die zijn ontworpen om echte financiële documenten te simuleren. Het bevat verschillende transactiegegevens, datums, bedragen en rekeninggegevens, gestructureerd om echte formaten en inhoud te weerspiegelen. Deze dataset wordt gebruikt voor het trainen en evalueren van Document AI-systemen in taken zoals optische tekenherkenning (OCR), gegevensextractie en documentanalyse, en biedt een gecontroleerde omgeving zonder de privacyproblemen van echte financiële gegevens.

Opnamevoorwaarde: - Gescand - Bankafschrift - Webscrapper

Chinese rekeningen dataset

Chinese rekeningen dataset

Use case: OCR

Formaat: Beeld

Count: 6k

annotatie: Ja

X

Beschrijving: De Chinese Bills Dataset bevat afbeeldingen of tekstvoorbeelden van verschillende soorten rekeningen, zoals facturen, ontvangstbewijzen en verklaringen, geschreven in het Chinees. Het bevat diverse formaten en inhoud, waaronder artikelbeschrijvingen, bedragen en datums. Deze dataset wordt gebruikt voor taken zoals optische tekenherkenning (OCR), financiële documentverwerking en geautomatiseerde gegevensextractie.

Documenten / OCR – Arabische en Engelse OCR-inhoudsdataset

Documenten / OCR – Arabische en Engelse OCR-inhoudsdataset

Use case: Documenten / OCR

Formaat: Afbeeldingen

Count: 1,321

annotatie: Nee

X

Beschrijving: Arabische en Engelse contentafbeeldingenverzameling: afbeelding + annotatie voor OCR

Documenten / OCR – Barcodevideo's Dataset

Documenten / OCR – Barcodevideo's Dataset

Use case: Documenten / OCR

Formaat: Video's

Count: 2,767

annotatie: Nee

X

Beschrijving: Barcodevideo's (Code128, UPC/EAN, PDF417, Aztec, Multi-code)

Documenten / OCR – Gebogen gedrukte tekstdataset

Documenten / OCR – Gebogen gedrukte tekstdataset

Use case: Documenten / OCR

Formaat: Afbeeldingen

Count: 18,986

annotatie: Nee

X

Beschrijving: Gebogen gedrukte tekst: Verzamel afbeeldingen met gebogen tekst of tekst met een niet-lineaire basislijn

Documenten / OCR – Financiële documenten (bank, loonstrook, belasting, VS)

Documenten / OCR – Financiële documenten (bank, loonstrook, belasting, VS)

Use case: Documenten / OCR

Formaat: Afbeeldingen

Count: 26,446

annotatie: Nee

X

Beschrijving: Financiële documenten: bankafschrift, cheque, loonstrook, belasting, hypotheek, verzekeringsclaims (VS)

Documenten / OCR – Financiële documenten (Fase 1 – Hypotheek)

Documenten / OCR – Financiële documenten (Fase 1 – Hypotheek)

Use case: Documenten / OCR

Formaat: Afbeeldingen

Count: 9,192

annotatie: Nee

X

Beschrijving: Financiële documenten (fase 1) Hypotheekdataset – afdrukken, scannen, fotograferen

Documenten / OCR – Financiële documenten (Fase 2 – Verzekeringen)

Documenten / OCR – Financiële documenten (Fase 2 – Verzekeringen)

Use case: Documenten / OCR

Formaat: Afbeeldingen

Count: 7,636

annotatie: Nee

X

Beschrijving: Financiële documenten (fase 2) Verzekeringsdataset – printen, scannen, fotograferen

Documenten / OCR – Handgeschreven tekstdataset (JP/KR/RU)

Documenten / OCR – Handgeschreven tekstdataset (JP/KR/RU)

Use case: Documenten / OCR

Formaat: Afbeeldingen

Count: 106,313

annotatie: Nee

X

Beschrijving: Handgeschreven tekst: LivePhotos met handgeschreven tekst (Japans, Koreaans, Russisch)

Documenten / OCR – Factuurdataset met begrenzende kaderannotatie

Documenten / OCR – Factuurdataset met begrenzende kaderannotatie

Use case: Documenten / OCR

Formaat: Afbeeldingen

Count: 87

annotatie: Ja

X

Beschrijving: Factuurdatasets met omkaderde aantekeningen bevatten gescande of digitale facturen waarbij belangrijke velden, zoals factuurnummer, datum, leveranciersgegevens, posten en totaalbedragen, zijn voorzien van omkaderde vakjes. Zo kunnen AI-modellen gestructureerde informatie nauwkeurig detecteren en extraheren uit ongestructureerde documenten.

Documenten / OCR – LivePhotos met gedrukte tekst (JP/KR/RU)

Documenten / OCR – LivePhotos met gedrukte tekst (JP/KR/RU)

Use case: Documenten / OCR

Formaat: Afbeeldingen

Count: 4,944

annotatie: Nee

X

Beschrijving: LivePhotos met gedrukte tekst (Japans, Koreaans, Russisch)

Documenten / OCR - Dataset met meertalige ontvangstbewijzen/facturen

Documenten / OCR - Dataset met meertalige ontvangstbewijzen/facturen

Use case: Documenten / OCR

Formaat: Afbeeldingen

Count: 8,961

annotatie: Nee

X

Beschrijving: De dataset met meertalige bonnen en facturen bevat uiteenlopende financiële documenten in meerdere talen, waardoor AI-modellen kunnen trainen op het herkennen van tekst in meerdere talen, het extraheren van sleutelvelden en het begrijpen van documenten.

Documenten / OCR – Synthetische bankafschriften (40 sjablonen)

Documenten / OCR – Synthetische bankafschriften (40 sjablonen)

Use case: Documenten / OCR

Formaat: Afbeeldingen

Count: 1,290

annotatie: Nee

X

Beschrijving: Bankafschriften - Unieke sjabloon - 40: Synthetische bankafschriften

Documenten / OCR – Synthetische loonstroken (60 sjablonen)

Documenten / OCR – Synthetische loonstroken (60 sjablonen)

Use case: Documenten / OCR

Formaat: Afbeeldingen

Count: 2,010

annotatie: Nee

X

Beschrijving: Cheque - Unieke sjabloon - 60: Synthetische loonstrookjes

Documenten / OCR – Synthetische loonstroken (130 sjablonen)

Documenten / OCR – Synthetische loonstroken (130 sjablonen)

Use case: Documenten / OCR

Formaat: Afbeeldingen

Count: 2,023

annotatie: Nee

X

Beschrijving: Loonstrookjes - Unieke sjabloon - 130: Synthetische bankcheque

Gegevensset loonstrookjes (document AI)

Gegevensset loonstrookjes (document AI)

Use case: OCR

Formaat: .jpg

Count: 2010

annotatie: Nee

X

Beschrijving: De Pay Slips Dataset (Document AI): Synthetic Pay Slips bestaat uit afbeeldingen van kunstmatig gegenereerde loonstroken zonder enige annotaties. Het bevat verschillende loonstrookformaten en details zoals namen van werknemers, salarissen en data, gebruikt voor het trainen en testen van Document AI-systemen in taken zoals OCR en documentverwerking.

Opnamevoorwaarde: - Gescand - Webscrapper