Wat is intelligente documentverwerking (IDP)?
De term IDP wordt door softwareleveranciers steeds vaker gebruikt om de stappen te beschrijven die nodig zijn om met behulp van Artificiële Intelligence (AI) gegevens uit documenten te halen. Het is het proces waarbij de inhoud van een document (fysiek of elektronisch) wordt vertaald in iets dat voor een machine (computer) zinvol is om te verwerken. Het proces zet de binnenkomende gegevens om in iets “gestructureerds”, zodat geautomatiseerde software zoals RPA (robotic process automation) het kan overnemen en verder kan gaan met geautomatiseerde invoer in diverse systemen.
Hoe intelligente documentverwerking werkt?
In tegenstelling tot het klassieke OCR verhaal kan IDP meer dan alleen karakters herkennen. Het kan deze karakters ook interpreteren en gebruikt daarvoor verschillende aspecten van A.I. zoals natuurlijke taalverwerking (NLP) en machinaal leren (ML) om te helpen bij het classificeren van gegevens en het groeperen van dezelfde categorieën van gegevenspunten.
De betere oplossingen staan ook al ver van het soms gemaakte verwijt, dat het op basis van templates werkt en dus vrij arbeidsintensief zou zijn. Dat is nu niet meer het geval, de documenten worden doorgelicht tegenover modellen die gecreëerd zijn volgens typedocument.
Een belangrijke onderscheidende factor is ook de mogelijkheid om ingenestelde tabellen of regels te herkennen en om te zetten naar gestructureerde data, vraag hiernaar want nog niet alle aanbieders zijn hier even sterk in!
Zal de versnelde digitalisering IDP niet overbodig maken?
De papierendocumentenstroom zal niet snel verdwijnen, ongeacht alle initiatieven tot digitalisering. Vooral gedreven door een verschil in snelheid in digitalisering en kostprijs tussen de bedrijven. Niet alle bedrijven zullen met dezelfde snelheid digitaliseren waardoor er geen uniform proces mogelijk is. Een ander belangrijk aspect is ook dat het voorbij gaat aan de mogelijkheid om een mens in het proces in te schakelen. De mens kan pdf’s lezen/interpreteren, maar geen xml of json.
Oplossingen zoals de UBL-standaard hebben zelfs een veld voorzien om de PDF om te zetten in BIN64 formaat, waardoor de PDF terug zichtbaar gemaakt kan worden binnen de user interface van een applicatie. Geloven in een volledige digitalisering doe ik dus voorlopig nog niet.
Welke bedrijven hebben baat bij een IDP oplossing?
Alle bedrijven met nog een aanzienlijke papieren documentstroom hebben nood aan een IDP-oplossing.
Kies zelf maar uit onderstaande lijst welke documenten bij u nog circuleren:
- handelsgerelateerde documenten
- cognossementen
- luchtvrachtbrieven
- kredietbrieven
- Documenten voor het aanmaken van nieuwe klanten of leveranciers
- Financiële documenten
- facturen
- offertes
- bankafschriften
- Certificaten
- diploma’s
- certificaten van origine
- inventaris-gerelateerde documenten
- paklijsten
- leveringsbonnen
Dankzij IDP hoeven mensen niet langer grote hoeveelheden papierwerk handmatig te verwerken. Door inkomende gegevens uit PDF’s (zowel gescande als native PDF-documenten) om te zetten in Excel- / CSV, XML, JSON-bestanden worden workflows een stuk eenvoudiger voor latere automatisering bijvoorbeeld door middel van Robotic Process Automation (RPA).