Tag Archives: Deep Learning
Cara Menentukan argument Input pada model detection mask RCNN
985 ViewsMerujuk pada model di TORCHVISION.MODELS.DETECTION.MASK_RCNN yaitu banyak sekali pengaturan sebelum tuning – https://pytorch.org/vision/0.8/_modules/torchvision/models/detection/mask_rcnn.html Misalkan dengan cara berikut ref: https://www.kaggle.com/code/abhishek/inference-for-mask-rcnn num_classes = 10 model_ft = torchvision.models.detection.maskrcnn_resnet50_fpn(pretrained=True) in_features = model_ft.roi_heads.box_predictor.cls_score.in_features model_ft.roi_heads.box_predictor = FastRCNNPredictor(in_features, num_classes) in_features_mask = model_ft.roi_heads.mask_predictor.conv5_mask.in_channels hidden_layer = 256 model_ft.roi_heads.mask_predictor = MaskRCNNPredictor(in_features_mask, hidden_layer, num_classes) atau dengan cara seperti berikut ref: https://pytorch.org/tutorials/intermediate/torchvision_tutorial.html Cara pertama import torchvision from torchvision.models.detection.faster_rcnn import FastRCNNPredictor… Read More »
Memahami transform.Normalize( )
842 Viewsnormalisasi yaitu mengubah skala menjadi rentang 0 sampai dengan 1 ataupun -1 sampai +1 dengan rumus sebagai berikut image = (image – mean) / std Misalkan Parameter mean = 0.5 dan std = 0.5 maka akan menormalkan gambar dalam rentang [-1,1] Jika kalian ingin mengembalikan gambar ke rentang [0,1], bisa menggunakan rumus image = ((image… Read More »
Model Detectron2 di Pytorch
1,203 ViewsDetectron2 adalah library open-source yang dikembangkan oleh Facebook AI Research (FAIR) untuk melakukan deteksi objek. Library ini merupakan penerus dari Detectron dan dirancang untuk menjadi lebih modular, fleksibel, dan efisien dalam berbagai aplikasi visi komputer, seperti deteksi objek, segmentasi instance, dan segmentasi semantik. Berikut beberapa fitur dan penjelasan tentang Detectron2: Modular dan Fleksibel: Detectron2… Read More »
Mencoba Menggunakan VPS untuk Deep Learning
1,493 ViewsVPS virtual private server bisa kita gunakan untuk menjalankan sebuah deep learning. Walapun hal ini tidak direkomendasikan mengingat ketersediaan GPU nya tidak ada. Tapi mari kita coba saja, saya telah menggunakan VPS untuk iseng2 melakukan training walaupun banyak sekali kendala karena RAM nya selalu habis. Sehingga dikurangi dataset nya sebagai solusi awal. Untuk VPS… Read More »
Catatan untuk model Seq2Seq dan T5ForConditionalGeneration
1,019 ViewsModel Seq2Seq (Sequence-to-Sequence) Model Seq2Seq (Sequence-to-Sequence) adalah arsitektur jaringan saraf yang dirancang khusus untuk menangani tugas-tugas di mana input dan output adalah urutan data yang berbeda panjangnya, seperti terjemahan mesin, pembingkaian kalimat, atau tugas-tugas lain yang melibatkan pemrosesan urutan data. Komponen Utama dari Model Seq2Seq: Encoder: Bagian pertama dari model Seq2Seq disebut encoder. Encoder… Read More »
Mempersiapkan Format Image di Deep Learning
3,940 ViewsMempersiapkan Format Image di Deep Learning. Secara umum format yang digunakan yaitu urutan NCHW. Format ini adalah akronim yang menjelaskan urutan sumbu pada tensor yang berisi sampel data gambar. Format NCHW digunakan seperti pada pelatihan di Pytorch. NCHW yaitu N : Jumlah sampel data; C: Saluran gambar. Gambar merah-hijau-biru (RGB) akan memiliki 3 saluran;… Read More »
Memahami Cara Kerja Learning Rate Scheduler pada Pytorch
1,026 ViewsMetode lr_scheduler digunakan untuk menyesuaikan kecepatan pembelajaran untuk pengoptimal. sementara model pelatihan bisa kita ubah sesuai dengan kecepatan pembelajaran, misalnya pada tahap awal pelatihan, kita memerlukan kecepatan pembelajaran yang sedikit lebih tinggi daripada kondisi selanjutnya. jika pembelajaran kita terlalu sedikit maka model akan membutuhkan banyak waktu untuk dilatih, dan jika kecepatan pembelajaran tinggi pada… Read More »
Mencoba Kinerja Model VGG16
1,113 ViewsVGG16 adalah salah satu arsitektur jaringan saraf tiruan yang sangat terkenal dalam bidang pengolahan citra. Dikembangkan oleh tim peneliti dari Visual Geometry Group (VGG) di Universitas Oxford pada tahun 2014, VGG16 terkenal karena kegunaannya dalam klasifikasi gambar. Arsitektur VGG16 terdiri dari total 16 lapisan (dari situlah namanya berasal). Ini terdiri dari 13 lapisan konvolusi… Read More »
Operasi Convolution pada Pytorch – Filter – Kernel – Weight
1,352 ViewsMembahas mengenani operasi convolution yang merupakan inti dari feature extraction. Operasi konvolusi (convolution) dalam PyTorch, seperti yang biasanya dilakukan dalam jaringan saraf tiruan (neural networks), umumnya dilakukan menggunakan modul torch.nn.Conv2d untuk data 2D dan torch.nn.Conv3d untuk data 3D. Konvolusi adalah proses matematis yang melibatkan penjumlahan produk titik dari bagian-bagian tumpang tindih dari dua himpunan data.… Read More »