Deteksi NIK KTP Indonesia
Tugas dari model RCNN yaitu menemukan lokasi NIK. Sekedar info saja mengenai jenis FONT KTP yang digunakan agak unik yaitu dengan nama OCR A Extended Font, kalian bisa download di https://cooltext.com/download-font-ocr+a+extended#google_vignette. Tujuan dari penggunaan jenis font tersebut sebenarnya untuk mempermudah dalam proses OCR karena sering dalam pada jenis font tertentu antar karakater angka 0 huruf O itu hampir mirip.
Perhatikan tampilan font OCR A Extended berikut terhadap huruf latin
Perhatikan
- huruf 0 kecil dengan
- O besar, dan
- angka 0 mempunyai tampilan yang berbeda-beda
Biasanya jenis font diatas digunakan juga pada ID pasport internasional.
Deteksi NIK KTP Indonesia
Contents
Deteksi NIK yang dimaksud disini yaitu hanya mendeteksi bounding box nya tanpa ada proses OCR. Karena kalau udah ketemu NIK nya maka akan lebih mudah memproses khusus NIK tersebut via OCR dan menarik datanya via API.
Database KTP
Untuk database KTP nya, saya comot dari https://github.com/YukaLangbuana/KTP-OCR
Tool Annotation
Untuk tools annotation nya menggunakan CVAT Tools Canggih Buat Anotasi Objek CVAT Computer Vision Annotation Tool – Deteksi NIK KTP Indonesia seperti berikut tampilan CVAT nya
Format dataset di export dalam format YOLO
Hasil deteksi Bounding Box nya
Berikut hasil proses training nya dengan loss semakin turun.
Dengan hasil prediksi untuk KTP validasi yaitu
pada proses pelatihan juga menggunakan teknik augmentasi sehingga untuk gambar seperti berikut masih bisa dikenali
Selanjutnya OCR NIK Membuat Model OCR untuk membaca No KTP