OCR – Optical Character Recognition banyak digunakan selain untuk mengubah tulisan analog menjadi tulisan digital. Salah satu library berbasis opensource serta seringkali dibahas sebagai dasar tutorial penerapan OCR yaitu tesseract
Algoritma tesseract berbasis morfologi konvensional sehingga input / masukan ke tesseract harus menggunakan gambar yang baik dan jelas, Tesseract hanya berfungsi untuk mengubah gambar menjadi tulisan digital tapi tidak dapat mengetahui lokasi objek tersebut. Nah tugas untuk detect text, biasanya kita menggunakan east.
East menggunakan deep learning berbasis resnet50, kinerjanya sangat bagus dan pernah saya buat tulisan disini. Nah ada satu lagi library berbasis deep machine learning yaitu PaddleOCR yang dibuat oleh baidu
Bahkan sudah mendukung 27 bahasa, uniknya lagi bisa deteksi gambar yang terbalik
Bila kalian tertarik, bisa kunjungi disini https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.0/doc/doc_en/models_list_en.md . Fitur-fiturnya yaitu
- Text Detection Model
- Text Recognition Model
- Text Angle Classification Model
https://medium.com/axinc-ai/paddleocr-the-latest-lightweight-ocr-system-a13171d7ea3e