OCR Optical Character Recognition berbasis Machine Learning

2,573 Views

OCR – Optical Character Recognition banyak digunakan selain untuk mengubah tulisan analog menjadi tulisan digital. Salah satu library berbasis opensource serta seringkali dibahas sebagai dasar tutorial penerapan OCR yaitu tesseract

Algoritma tesseract berbasis morfologi konvensional sehingga input / masukan ke tesseract harus menggunakan gambar yang baik dan jelas, Tesseract hanya berfungsi untuk mengubah gambar menjadi tulisan digital tapi tidak dapat mengetahui lokasi objek tersebut. Nah tugas untuk detect text, biasanya kita menggunakan east.

East menggunakan deep learning berbasis resnet50, kinerjanya sangat bagus dan pernah saya buat tulisan disini. Nah ada satu lagi library berbasis deep machine learning yaitu PaddleOCR yang dibuat oleh baidu

Bahkan sudah mendukung 27 bahasa, uniknya lagi bisa deteksi gambar yang terbalik

Bila kalian tertarik, bisa kunjungi disini https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.0/doc/doc_en/models_list_en.md . Fitur-fiturnya yaitu

Text Detection Model
Text Recognition Model
Text Angle Classification Model

https://medium.com/axinc-ai/paddleocr-the-latest-lightweight-ocr-system-a13171d7ea3e

Leave a Comment Cancel reply