
Analisis RFM Recency Frequency Monetary – RFM adalah sebuah teknik segmentasi yang digunakan untuk melihat perilaku pelanggan, seperti waktu terakhir pelanggan melakukan transaksi (recency), seberapa sering pelanggan melakukan transaksi (frequency) dan seberapa besar nilai uang dari pelanggan atas transaksinya (monetary).
Analisis RFM adalah teknik yang digunakan untuk mengidentifikasi pelanggan yang sudah ada yang kemungkinan besar akan menanggapi tawaran baru. Teknik ini biasa digunakan dalam pemasaran langsung. Analisis RFM didasarkan pada teori sederhana berikut ini:
- Faktor terpenting dalam mengidentifikasi pelanggan yang kemungkinan besar akan merespons tawaran baru adalah keterkinian. Pelanggan yang membeli baru-baru ini lebih mungkin untuk membeli lagi daripada pelanggan yang membeli lebih lanjut di masa lalu.
- Faktor terpenting kedua adalah frekuensi. Pelanggan yang telah melakukan lebih banyak pembelian di masa lalu lebih mungkin untuk merespons daripada mereka yang melakukan lebih sedikit pembelian.
- Faktor terpenting ketiga adalah jumlah total yang dibelanjakan, yang disebut sebagai moneter . Pelanggan yang telah menghabiskan lebih banyak (total untuk semua pembelian) di masa lalu lebih mungkin untuk merespons daripada mereka yang menghabiskan lebih sedikit.
Contoh kasus –#Video Tutorial – Belajar Python Bagian 6 – Analisis Perilaku Pelanggan
Bagaimana Analisis RFM Bekerja?
Contents
- Pelanggan diberi skor kebaruan berdasarkan tanggal pembelian terakhir atau interval waktu sejak pembelian terakhir. Skor ini didasarkan pada peringkat sederhana nilai kebaruan ke dalam sejumlah kecil kategori. Misalnya, jika Anda menggunakan lima kategori, pelanggan dengan tanggal pembelian terbaru menerima peringkat kebaruan 5, dan pelanggan dengan tanggal pembelian terjauh di masa lalu menerima peringkat kebaruan 1.
- Dengan cara yang sama, pelanggan kemudian ditugaskan peringkat frekuensi, dengan nilai yang lebih tinggi mewakili frekuensi pembelian yang lebih tinggi. Misalnya, dalam skema peringkat lima kategori, pelanggan yang paling sering membeli menerima peringkat frekuensi 5.
- Terakhir, pelanggan diberi peringkat berdasarkan nilai uang, dengan nilai uang tertinggi menerima peringkat tertinggi. Melanjutkan contoh lima kategori, pelanggan yang telah menghabiskan paling banyak akan menerima peringkat moneter 5
Hasilnya adalah empat skor untuk setiap pelanggan: keterkinian, frekuensi, moneter, dan skor RFM gabungan, yang merupakan tiga skor individu yang digabungkan menjadi satu nilai. Pelanggan “terbaik” (mereka yang paling mungkin menanggapi tawaran) adalah mereka yang memiliki skor RFM gabungan tertinggi. Misalnya, dalam peringkat lima kategori, ada total 125 kemungkinan skor RFM gabungan, dan skor RFM gabungan tertinggi adalah 555.
Pertimbangan Data
Jenis data yang nanti kita gunakan berupa data record harian. Untuk mempelajari dan memahami, kamu bisa menggunakan data berikut http://www.brucehardie.com/datasets/; Download lah yang http://www.brucehardie.com/datasets/CDNOW_sample.zip. Disitu akan terdapat 6919 record dengan 5 kolom sebagai berikut
- the customer’s ID in the master dataset,
- the customer’s ID in the 1/10th sample dataset (ranging from 1 to 2357),
- the date of the transaction,
- the number of CDs purchased,
- and the dollar value of the transaction.
One or more columns doesn't have a header. Please enter headers for all columns in order to proceed.
Untuk lebih jelasnya, penulis tambahkan header di file *.txt menjadi berikut
Data diatas akan kita persempit dengan kolom yang dibutuhkan Teknik RFM – Menambang Insight dari record transaksi Pelanggan sebagai berikut
- tanggal untuk mengetahui recency / kapan terakhir beli
- jumlah_cd dan rupiah untuk mengetahui monetary
- lalu gimana nentukan frequncy?
Penulis sengaja coloring yang berfokus pada id
Oiya, untuk mempermudah analisis ini, kalian bisa belajar mengenai
- pivot
- aggregasi
Recency
Recency pada RFM mempunyai pengertian yaitu kapan terakhir customer tersebut melakukan pembelian, kalian bisa melihat ilustrasi RFM dibawah ini
Frequency
Frequency pada RFM mempunyai pengertian yaitu berapa kali melakukan pembelian? Dalam hal ini penulis menggunakan acuan data 1997 – 1998
Monetary
Frequency pada RFM mempunyai pengertian yaitu berapa uang yang dihabiskan untuk melakukan pembelian
Tools untuk mengolah
Untuk mengolah data diatas, sebenarnya banyak sekali, kalian bisa menggunakan powerBI, Excel, Python, Matlab/Octave, R/RStudio, Java/C#, Julia, bahkan menggunakan MySql/SQtlite. Saya bisa semuanya, tapi tidak mungkin dibahas semuanya satu-persatu, setelah saya pikir-pikir (sebelumnya pakai kode Python dan Matlab), pakai R/RStudio saja biar beragam saja. Nanti kalau kalian butuh kode di Python, silahkan comment saja ya. Hal ini sebagai informasi bahwa software / bahasa pemrograman itu adalah tools, kalian bebas menggunakan yang mana, asal sudah paham teknik pemrograman.
Hasil Aggregasi/Pivot
- Sesuai dengan penjelan sebelumnya, kita harus membuat tabel RFM terlebih dahulu yang berisikan data transaksi per id. Berikut Menghitung metric RFM untuk setiap Customer
-
- Hasil tabel RFM
id frekuensi nominal terakhir 1 1 4 186.04 1997-12-12 2 2 2 201.79 1997-01-13 3 3 1 6.79 1997-01-01 4 4 1 13.97 1997-01-01 5 5 1 47.88 1997-01-01 6 6 16 2876.74 1998-06-20 7 7 2 23.54 1997-02-05 8 8 3 125.49 1998-03-07 9 9 5 182.04 1998-02-11 10 10 1 60.64 1997-01-01
Teknik RFM yang digunakan untuk menambang Insight dari record transaksi Pelanggan caranya sangat mudah, untuk membacanya yaitu
-
- ID pelanggan 1 membeli sebanyak 2 kali, dengan total pembelian sebanyak 186.04, dan transaksi terakhir dilakukan pada 12 desember 1997
- ID pelanggan 9 membeli sebanyak 5 kali, dengan total pembelian sebanyak 182.04, dan transaksi terakhir dilakukan pada 11 februari 1998
- Setelah didapatkan informasi RFM diatas, kita dapat memperoleh informasi quartile 1, 2 dan 3 untuk mengetahui distribusi metric RFM
Untuk membuat aturan distribusi diatas, kita bisa melakukan sorting dan menghilangkan duplikasi yang ada, misalkan kita punya data yang tidak berurut sebagai berikut
1,3,4,4,2,6,1
nanti akan diurutkan dan dihilangkan duplikasinya
1,2,3,4,6
Sehingga dengan mengurutkan data seperti diatas, akan mudah menghitung quartile nya. Perhatikan hasil perhitungan quartile berikut
> summary(distribusi.frekuensi) frekuensi Min. : 1.00 1st Qu.: 9.50 Median :18.00 Mean :21.06 3rd Qu.:31.50 Max. :56.00 > summary(distribusi.money) nominal Min. : 0.00 1st Qu.: 59.87 Median : 159.64 Mean : 620.95 3rd Qu.: 465.39 Max. :61797.00 > summary(distribusi.recency) terakhir Min. :1997-01-01 1st Qu.:1997-05-03 Median :1997-10-07 Mean :1997-10-02 3rd Qu.:1998-02-27 Max. :1998-06-30
Pada frekuensi dihasilkan informasi quartile berikut
-
- Min. : 1.00
- 1st Qu.: 9.50
- Median :18.00
- Mean :21.06
- 3rd Qu.:31.50
- Max. :56.00
artinya kita bisa membagi menjadi 3 kelompok yaitu
-
- Kelompok C yaitu 0 < x < 9.5
- Kelompok B yaitu 9.5 < x < 18
- Kelompok A yaitu x> 18