OCR Optical Character Recognition berbasis Machine Learning

By | October 23, 2021
1,693 Views

OCR – Optical Character Recognition banyak digunakan selain untuk mengubah tulisan analog menjadi tulisan digital. Salah satu library berbasis opensource serta seringkali dibahas sebagai dasar tutorial penerapan OCR yaitu tesseract

Algoritma tesseract berbasis morfologi konvensional sehingga input / masukan ke tesseract harus menggunakan gambar yang baik dan jelas, Tesseract hanya berfungsi untuk mengubah gambar menjadi tulisan digital tapi tidak dapat mengetahui lokasi objek tersebut. Nah tugas untuk detect text, biasanya kita menggunakan east.

East menggunakan deep learning berbasis resnet50, kinerjanya sangat bagus dan pernah saya buat tulisan disini. Nah ada satu lagi library berbasis deep machine learning yaitu PaddleOCR yang dibuat oleh baidu

Bahkan sudah mendukung 27 bahasa, uniknya lagi bisa deteksi gambar yang terbalik

Bila kalian tertarik, bisa kunjungi disini https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.0/doc/doc_en/models_list_en.md . Fitur-fiturnya yaitu

  1. Text Detection Model
  2. Text Recognition Model
  3. Text Angle Classification Model

 

https://medium.com/axinc-ai/paddleocr-the-latest-lightweight-ocr-system-a13171d7ea3e

 

 

See also  Open Images Dataset untuk para developer AI