Sinopsis
Bekerja dengan melibatkan banyak data seperti algoritma computer vision, machine learning yang harus disimpan variabelnya kedalam sebuah disk. Kasus yang melibatkan type data bersifat multidimensi seperti misalkan pada kasus machine learning yang menghasilkan sebuah bobot dalam bentuk matrix, hal ini tentu akan menyulitkan jika disimpan dalam bentuk database relational, tentu kita harus menyiapkan type data berupa struct, array, dan lainnya. Dalam python hal tersebut bisa menggunakan pickle (kalau di Matlab kalian bisa simpan data dalam format *.mat).
Mengenai Pickle
Ada beberapa catatan penting mengenai pickle
- In Python 2, you can speed up your pickle access with cPickle. (In Python3, importing pickle will automatically use the accelerated version if it is available.)
- Kamu bisa menggunakan pickle ataupun cPickle. Tapi ingat, ketika menerima data berformat biner (serialisasi di python) sebuah dari jaringan, kamu harus hati-hati karena bisa juga berisikan kode jahat! Pickle files can be hacked. If you receive a raw pickle file over the network, don’t trust it! It could have malicious code in it, that would run arbitrary python when you try to de-pickle it.
Disini tidak membahas mengenai python akan tetapi menggunakan pickle untuk menyimpan sebuah data. Oiya kalian bisa belajar dari buku pemrograman python dengan package opensource
Contoh Pickle
Untuk menyimpan sebuah array dari numpy, oiya kalau data tersebut bersifat binary maka untuk mode membacanya adalah rb (read binary).
#tutorial untuk serialisasi dan deserialisasi import pickle as pc import numpy as np print '\n' *100 #bersihkan layar a = np.array([[1,2,3],[4,5,6]]); fileName = 'D:/data.objek' fileObj = open(fileName,'wb') pc.dump(a,fileObj) fileObj.close() fileObj2 = open(fileName,'r') #kalian bisa set rb, jika mode nya read binary b = pc.load(fileObj2) print 'data b ', b