Βίντεο της διαδικασίας σάρωσης και οπτικής αναγνώρισης χαρακτήρων (OCR) σε πραγματικό χρόνο με φορητό σαρωτή
ΗΟπτική Αναγνώριση Χαρακτήρων (αγγλικά: Optical Character Recognition) ή αλλιώς Αυτόματη Αναγνώριση Χαρακτήρων Κειμένου ονομάζεται η διαδικασία μετατροπής σαρωμένων εικόνων χειρογράφων ή έντυπων κειμένων σε κείμενο αναγνώσιμο από ηλεκτρονικό υπολογιστή. Η Οπτική Αναγνώριση Χαρακτήρων καθιστά εφικτή τηνεκ νέου επεξεργασία του κειμένου, αποφεύγοντας τη δακτυλογράφηση του από την αρχή.
Τα συστήματα Οπτικής Αναγνώρισης Χαρακτήρων απαιτούν βαθμονόμηση γιανα διαβάσουν μια συγκεκριμένη γραμματοσειρά. Οι πρώτες εκδόσεις ήταν προγραμματισμένες με εικόνες για κάθε χαρακτήρα και δούλευαν μια γραμματοσειρά τη φορά. Τα ευφυή συστήματα με υψηλό δείκτη αναγνώρισης είναι πλέον κοινά. Μερικά συστήματα είναι ικανά να αναπαράγουν ακόμη και τις πληροφορίες πουδεν είναι κείμενο σε ένα έγγραφο, όπως εικόνες, στήλες, γραμμές, γωνίες κτλ.
Το 1929, οΓκουστάβ Τάουσεκ απέκτησε ευρεσιτεχνίαγιατο OCR στηΓερμανία, ακολουθούμενος από τονΠολΓ. Χάντελ (Paul W. Handel) που απέκτησε την ευρεσιτεχνία γιατην OCR στις Ηνωμένες Πολιτείεςτο 1933. Το 1935 ο Tauschek πήρε επίσης την ευρεσιτεχνία στη μέθοδο του στις ΗΠΑ. Το μηχάνημα του Tauschek ήταν μια μηχανική συσκευή που χρησιμοποιούσε πρότυπα και αισθητήρα φωτός.
Το 1949, οι μηχανικοί της RCA δημιούργησαν τον πρώτο OCR σύστημα γιανα βοηθήσουν τους τυφλούς γιατο US Veterans Administration, αλλά αντί να μετατρέπουν εκτυπωμένους χαρακτήρες σε χαρακτήρες αναγνώσιμους από υπολογιστή, η συσκευή τους μετέτρεπε και τους διάβασε. Η συσκευή είχε υψηλό κόστος καιδεν δόθηκε για παραγωγή.
Το 1950, οΝτέιβιντ Χ. Σέπαρντ, ένας κρυπταναλητής τωνArmed Forces Security AgencyτωνΗΠΑ δημιούργησε μια συσκευή που μετέτρεπε τα εκτυπωμένα μηνύματα σε κείμενο αναγνώσιμο από ηλεκτρονικό υπολογιστή αφού έκδωσε τη δική του πατέντα. Έπειτα, ο Shepard ίδρυσε τηνIntelligent Machines Research Corporation (IMR), η οποία ήταν η πρώτη που έβαλε σε εμπορική λειτουργία τα συστήματα OCR.
Το 1955, το πρώτο εμπορικό σύστημα εγκαταστάθηκε στοReader's Digest. Το δεύτερο σύστημα πουλήθηκε στηStandard Oilγιανα διαβάζει αριθμούς πιστωτικών καρτών για λογαριασμούς. Άλλα συστήματα που πουλήθηκαν από την IMR γύρω στο 1950s είχαν αναγνωστέα αποκόμματος λογαριασμού στηνOhio Bell Telephone Companyκαι έναν σαρωτή σελίδας στις United States Air Forceγια ανάγνωση και μετάδοση χειρόγραφων μηνυμάτων από τον. ΗIBMκαι άλλες αγόρασαν τις άδειες ευρεσιτεχνίας OCR του Shepard.
Το 1965, το Reader's Digest καιη RCA συνεργάστηκαν γιανα φτιάξουν μια συσκευή OCR γιανα διαβάζει καινα ψηφιοποιεί τους σειριακούς αριθμούς από τα κουπόνια του Reader's Digest από τις διαφημίσεις. Οι γραμματοσειρά που χρησιμοποιήθηκε γιατην εκτύπωση των κουπονιών ήταν ηOCR-A font. Η συσκευή ήταν συνδεδεμένη σε ένα RCA 301 υπολογιστή. Η συσκευή επίσης είχε έναν ειδικό αναγνωστέα TWA. Η συσκευή μπορούσε να επεξεργαστεί 1,500 έγγραφα ανά λεπτό, απορρίπτοντας ότι δεν μπορεί να αναγνωρίσει σωστά.
Το Ταχυδρομείο τωνΗΠΑ χρησιμοποιεί τεχνολογία οπτικής αναγνώρισης από το 1965 βασιζόμενο σε τεχνολογία που ανέπτυξε ο εφευρέτης Jacob Rabinow. Η πρώτη χρήση της Οπτικής Αναγνώρισης στην Ευρώπη έγινε από το Ταχυδρομείο της Αγγλίας. Το 1965 ξεκίνησε την κατασκευή ενός τραπεζικού συστήματος βασιζόμενο στην τεχνολογία OCR, μια διαδικασία που έφερε επανάσταση στα συστήματα πληρωμής λογαριασμών στηΜ. Βρετανία. Το ταχυδρομείο τουΚαναδά υιοθέτησε τα συστήματα OCR από το 1971.
Το 1974, οΡέι Κέρζουελ ίδρυσε την εταιρία Kurzweil Computer Products, Inc. και δημιούργησε το πρώτο σύστημα οπτικής αναγνώρισης χαρακτήρων που αναγνώριζε εκτυπωμένο κείμενο διαφόρων γραμματοσειρών. Η εταιρία εστίασε στη δημιουργία μιας συσκευής πουθα βοηθήσει τους τυφλούς να διαβάζουν κείμενο με βοήθεια υπολογιστή. Η συσκευή απαιτούσε την εφεύρεση δύο τεχνολογιών – μια συσκευή σάρωσης και ένα σύστημα ανάγνωσης κειμένου από τον υπολογιστή.
Το 1978, η εταιρία Kurzweil Computer Products άρχισε να πουλά εταιρικές εκδόσεις του λογισμικού οπτικής αναγνώρισης. ΗLexisNexis ήταν από τους πρώτους πελάτες που αγόρασαν το λογισμικό γιανα μεταφορτώνουν έγγραφα στην online βάση δεδομένων τους. Δύο χρόνια μετά, ο Κέρζουελ πούλησε την εταιρία στηνXerox, που έδειξε ενδιαφέρον γιατην επέκταση της τεχνολογίας οπτικής αναγνώρισης.
Υπάρχουν δύο κύριοι τρόποι εφαρμογής της Οπτικής Αναγνώρισης, η "Αντιστοίχηση με Πρότυπα" καιη "Εξαγωγή Χαρακτηριστικών". Η πρώτη μέθοδος είναι πιο διαδεδομένη και κοινή αλλά περιορίζεται αρκετά σε σχέση μετην 2η τεχνική. Η σημερινή τεχνολογία χρησιμοποιεί τον συνδυασμό καιτων δύο τεχνολογιών γιατην καλύτερη επίτευξη αποτελεσμάτων, κυρίως σε χειρόγραφα έγγραφα.
Η αντιστοίχηση με πρότυπα αφορά την αναγνώριση χαρακτήρων από έτοιμα πρότυπα ή περιγράμματα χαρακτήρων. Ο σαρωτής ψηφιοποιεί την εικόνα ενός εγγράφου στον υπολογιστή καιτο λογισμικό Οπτικής Αναγνώρισης προσπαθεί να ταιριάξει, με ένα βαθμό πιθανότητας, τους χαρακτήρες από το σαρωμένο αρχείο εικόνας μετα πρότυπα που έχει αποθηκευμένα. Ανη εικόνα ενός χαρακτήρα αντιστοιχεί με αναγνωρισμένο χαρακτήρα, τότε αντιστοιχίζεται με χαρακτήρα κειμένου γιατον ηλεκτρονικό υπολογιστή.
Τα περισσότερα εκτυπωμένα έγγραφα κειμένου ήταν με γραμματοσειρές Times, Courier ή Helvetica με μέγεθος 10 ως 14. Ένα πρόγραμμα αναγνώρισης χαρακτήρων έχει εικόνες σε μορφή bitmap για κάθε χαρακτήρα κάθε μεγέθους κάθε γραμματοσειράς. Το λογισμικό διάβαζε την εικόνα που σάρωνε ο σαρωτής γραμμή-γραμμή και προσπαθούσε να αντιστοιχήσει κάθε χαρακτήρα μετην αντίστοιχη εικόνα. Για παράδειγμα αντο πρόγραμμα εντόπιζε ένα χαρακτήρα "Γ" τότε το πρόγραμμα έψαχνε όλα τα πρότυπα από τοΑ μέχρι τοωσε όλα τα αποθηκευμένα μεγέθη καιαν εντόπιζε κάποια εικόνα που έμοιαζε τοΓ, το αντιστοίχιζε.
Η όλη διαδικασία είναι χρονοβόρα γιατί απαιτούνται πολλές επαναλήψεις για κάθε χαρακτήρα.[1]
Η εξαγωγή χαρακτηριστικών είναι επίσης γνωστή ως Ευφυής Αναγνώριση Χαρακτήρων (Αγγλ. Intelligent Character Recognition – ICR), ή τοπολογική ανάλυση χαρακτηριστικών. Πρόκειται για ένα είδος οπτικής αναγνώρισης πουδεν βασίζεται σε ακριβείς αντιστοιχήσεις με πρότυπα. Το λογισμικό λειτουργεί με ένα πιο σοφιστικό τρόπο αναγνώρισης χαρακτήρων, όπως ανίχνευση επιμέρους συστατικών στοιχείων ενός χαρακτήρα, όπως γωνίες, γραμμές, ενώσεις κτλ) Η εφαρμογή των αντιστοιχήσεων γίνεται με μορφή κανόνων.
Ένας κανόνας θα μπορούσε να είναι ως έξης: Αν εντοπιστούν δύο κάθετες που κλίνουν οιμιαστην άλλη "/" και "\" καιη κορυφές τους ενώνονται καιστο κέντρο υπάρχει μια γραμμή "-" τότε είναι το γράμμα "Α". Η εφαρμογή αυτού του κανόνα θα μπορούσε να εντοπίσει όλα τα "Α" ανεξάρτητα από το μέγεθος ή τον τύπο γραμματοσειράς που χρησιμοποιήθηκε στο έγγραφο.[2]
Οι παραπάνω μέθοδοι χρησιμοποιούνται κυρίως για αναγνώριση κειμένου που εκτυπώθηκε από ηλεκτρονικό υπολογιστή ή δακτυλογραφήθηκε. Η αναγνώριση χειρόγραφων χαρακτήρων είναι πιο πολύπλοκη διαδικασία και απαιτεί τον συνδυασμό των παραπάνω τεχνικών, καθώς και στοιχεία όπως γνώσεις γιατον συγγραφέα καιτο περιεχόμενο του κειμένου.
Τα προβλήματα μετην αναγνώριση χειρογράφων οφείλονται στην καλλιγραφία (συνεχόμενη γραφή χαρακτήρων χωρίς κενό) διότι δεν μπορούν να ξεχωρίσουν πότε τελειώνει ένα γράμμα και πότε ξεκινάει ένα άλλο. Επίσης, κάθε άνθρωπος έχει διαφορετικό γραφικό χαρακτήρα, δυσχεραίνοντας τη διαδικασία εφαρμογής προτύπων ή εξαγωγής χαρακτηριστικών γιατον κάθε ένα. Όταν ένα λογισμικό πρέπει να αναγνωρίσει τέτοιες λέξεις, χρησιμοποιεί το νόημα του κειμένου, τη γνώση τουγιατον συγγραφέα και τις λέξεις που ήδη αναγνώρισε.
Το λογισμικό Οπτικής Αναγνώρισης και Ευφυούς Αναγνώρισης χαρακτήρων είναι συστήματα τεχνίτης νοημοσύνης που θεωρούν το κείμενο ως μια ακολουθία χαρακτήρων και όχι μεμονωμένες λέξεις ή φράσεις. Βασιζόμενα στην ανάλυση των γραμμών καιτων καμπυλών κάθε χαρακτήρα, προσπαθούν να μαντέψουν ποιος χαρακτήρας απεικονίζεται χρησιμοποιώντας βάσεις με πρότυπα που ταιριάζει.
Μετην ανάπτυξη της τεχνολογία της πληροφορίας, οι πλατφόρμες χρήσης λογισμικού αναγνώρισης χαρακτήρων άλλαξαν σε πολύ-πλατφόρμες μετη χρήση του ηλεκτρονικού υπολογιστή, του διαδικτύου, του υπολογιστικού νέφους και τις κινητές συσκευές. Μετά από 30 χρόνια, το λογισμικό οπτικής αναγνώρισης υιοθετεί νέες μεθόδους όπως χρήση της αναγνώρισης χαρακτήρων ως υπηρεσία ιστού. Χωρίς τη χρήση εξειδικευμένο λογισμικού ή την υπολογιστική ισχύ ενός υπολογιστή, ο χρήστης μπορεί να χρησιμοποιήσει την αναγνώριση χαρακτήρων με εξαιρετικά αποτελέσματα.
Λόγω του μεγάλου εύρους χρήσης της τεχνολογίας Οπτικής Αναγνώρισης Χαρακτήρων, υπήρξε η ανάγκη ανάπτυξης λογισμικού ειδικής χρήσης. Το λογισμικό ειδικής χρήσης δίνει καλύτερα αποτελέσματα σε συγκεκριμένες περιπτώσεις, παρά σε γενικές. Το λογισμικό χρησιμοποιεί κάποιους κανόνες ή κάποια φίλτρα που αντιστοιχούν μόνο σε ορισμένες εικόνες κειμένων και εξάγει το κείμενο. Για παράδειγμα, κάποιο λογισμικό αναγνώρισης των χαρακτηριστικών μιας ταυτότητας, θα πρέπει να εφαρμόσει ειδικά φίλτρα καινα διαβάσει ορισμένες περιοχές γιανα είναι πιο πετυχημένη η αναγνώριση.