Coveo | Optical Character Recognition

Een uiterst productieve oplossing.

Teksten gevangen in pdf, jpeg en tiff documenten kunnen vaak niet door zoeksoftware gelezen worden. Dit komt omdat ze als plaatjes zijn opgeslagen. (zie verderop)

De Coveo OCR module leest op een uiterst productieve de teksten in deze documenten. Zonder één handeling van de gebruiker of systeembeheerder kan de zoeksoftware deze documenten van boven tot onder de documenten lezen.

Hiermee worden automatisch bestaande digitale archieven gevuld met documenten die als plaatje zijn opgeslagen, doorzoekbaar gemaakt. Hiervoor hoeft niemand een handeling te verrichten. Alles verloopt geheel automatisch. Het originele document blijft intact maar de tekstinhoud staat in de Coveo Enterprise index.

Enorme besparing

Dit levert een besparing aan handenarbeid op en er is minder opslagruimte nodig. Bij OCR wordt immers van het origineel een kopie gemaakt die met de doorzoekbaar is geworden.

Je zoekt dus op de inhoud, dat krijg je ook in de resultaten te zien en als je het opent krijg je het originele document (plaatje) op je scherm.

Hoe werkt het NU bij veel bedrijven?

Bij het scannen door een MultiFunctional worden de documenten als een plaatje digitaal opgeslagen. Vervolgens pakt de OCR tekstherkenning software het plaatje op en maakt er een NIEUW doorzoekbare pdf document van.

Je beschikt dan over het originele document (plaatje) en het nieuwe pdf (doorzoekbare) document. Er is dus een kopie van het origineel gemaakt die extra opslagruimte + backup-ruimte in het bedrijfsarchief kost. Bovendien kost het weer kunnen terug vinden van deze documenten in een document management systeem veel (handenarbeid)tijd en geld.

Werkwijze Coveo OCR tekstherkenning

De aanpak Coveo OCR werkt veel slimmer, sneller en goedkoper. De plaatjes worden door OCR tekstherkenning module gelezen. De inhoud wordt direct in de index van de Coveo enterprise search zoekmachine geplaatst. Er wordt dus geen nieuw document aangemaakt.

Als gebruiker zoek je voortaan door de alle teksten die in de index staan. Met de Quickview kan je kijken of het juiste document gevonden is. Als je nu het document opent, open je het originele plaatje.

Met deze oplossing zijn alle documenten waarvan de tekst in plaatjes zijn opgeslagen geheel automatisch doorzoekbaar geworden.

Bovendien wordt er niet een copy van het originele document gemaakt bij het normale scannen. Ook bespaar je tijd en geld omdat het documentmanagement systeem niet gevuld hoeft te worden.

De werkwijze van scannen door de gebruikers blijft ongewijzigd. Een document gaat door de Multifunctionele scanner. De OCR module pakt het automatisch op, leest de tekstinhoud en plaatst deze in de index.

De gebruiker hoeft er verder helemaal niets aan te doen, alles verloopt geheel automatisch.

Waarom tekstherkenning (OCR) nodig is?

Met het scannen worden de pagina's omgezet in een grafisch bestand (plaatje). Indien het bestand tekst bevat, dan wordt deze niet herkend als tekst door programma's als tekstverwerkers.

De tekst maakt immers deel uit van het complete plaatje. Tekstherkenning (OCR) zet het grafische tekst bestand om naar een formaat zodat computers het herkennen als letters en woorden. Dit betekent dat tekstverwerkers de tekst kunnen herkennen, en we het kunnen bewerken, knippen en plakken, etc.

Door de tekst te herkennen ontsluit je de kennis die erin is opgeslagen. De zoeksoftware zorgt ervoor dat de medewerkers de kennis die in het document is opgeslagen kunnen vinden en hergebruiken.

Waarom papier omzetten naar digitale bestanden?

  • Het beheren van digitale documenten is veel goedkoper dan papier. 
  • Papieropslag kost ruimte en ruimte kost geld. 
  • Gescande informatie kan eenvoudig via het beeldscherm worden teruggevonden, i.p.v. in de archiefkast. 
  • Documenten kunnen direct worden verstuurd via email of fax. 
  • De bewerkbare inhoud kan met knippen en plakken worden hergebruikt. 
  • Meerdere personen kunnen tegelijkertijd een document bekijken. 
  • Gebruikers kunnen verschillende toegangsrechten krijgen voor bepaalde documenten. 
  • De opgeslagen kennis in de documenten wordt zonder omhaal beschikbaar. 
  • Door het op andere locaties bewaren van een (online)backup kan informatieverlies bij calamiteiten worden voorkomen. 
  • Ongelimiteerd zonder kosten kopieën maken en deze delen met klanten, relaties en medewerkers. 
  • De documenten publiceren op het internet en/of intranet. 
  • De documenten omzetten in gewenste formaten.

Techniek

Coveo OCR maakt gebruik van de gerenommeerde OCR engine van Nuance. De Nuance OCR engine is marktleider en wordt in vele leveranciers van OCR software als basis gebruikt.

  • De tekstherkenning heeft een robuuste en bewezen betrouwbaarheid. 
  • Automatische herkenning van PDF bestanden die nog niet door OCR zijn voorzien van doorzoekbare tekst. 
  • Naadloze integratie met het Coveo Enterprise Search indexeer proces.

Met enterprise search beschikken je medewerkers over een complete 360 graden zicht op alle bedrijfskennis.

 

Coveo Enterprise Search

Coveo Enterprise Search Klanten Nederland

Coveo Enterprise Search Klanten Nederland

 


 

Ebook Enterprise Search
e-boek vol toepassingen van enterprise search klik voor de download...


 Coveo Proof of Concept