Sinopsis
Contents
- 1 Sinopsis
- 2 VECTOR
- 3 Akses Vector
- 4 MATRIX
- 5 Dimensi matrix
- 6 Akses pada kolom dan baris tertentu
- 7 Mengubah isi matrix
- 8 List
- 9 Membuat List
- 10 Akses List menggunakan Key
- 11 Mengubah Isi List menggunakan Key
- 12 Data Frame
- 13 Membuat Data Frame dari vector
- 14 Menampilkan informasi head
- 15 Memilih Variabel / kolom tertentu
- 16 Summary
- 17 Informasi tipe variabel
- 18 Mendapatkan data terakhir
Data terstrukur merupakan suatu set variabel yang dijadikan satu kesatuan. Sama seperti dengan bahasa pemrograman umum lainnya yang dilengkapi dengan data tersetrukur maka di R pun ada juga malah lebih mudah dalam penggunaanya yaitu
- Vector
- Matrix
- List
- Data Frame
Dengan 3 jenis data tersebut sangat mampu melakukan pengolahan bermacam-macam sumber jenis dataset seperti CSV, excel dan lainnya.
VECTOR
Vector adalah array yang terdiri dari 1 baris, Vector digunakan mengumpulkan sebuah nilai menjadi satu kesatuan menggunakan perintah . Untuk mengakses indexnya menggunakan operator [] yang dimulai dengan index no 1. Misalkan seperti berikut ini. Contoh kode penggunan vector pada bahasa R
daftar_nama= c('bejo','bagus','pamungkas') print(daftar_nama)
Hasil
[1] "bejo" "bagus" "pamungkas"
Akses Vector
Untuk akses vector seperti berikut, misalkan untuk akses no 1 dan 3. Contoh kode penggunan akses vector pada bahasa R
print(daftar_nama[1]) print(daftar_nama[3])
Hasil
[1] "bejo" [1] "pamungkas"
Selain mempermudah dalam pengelolaan variabel, bisa kalian gunakan untuk operasi sederhana seperti bila variabel tersebut berisi numeric. Contoh lainnya yaitu Contoh kode penggunan operasi vector pada bahasa R
a = c(1,3,4,90,45) total = sum(a) print(a) print(total)
Hasil
[1] 1 3 4 90 45 [1] 143
Sedangkan untuk array yang terdiri dari baris dan kolom disebut dengan matrix.
MATRIX
Array 2D yaitu terdiri dari baris dan kolom yang disebut dengan Matrix. Matrix ini akan berguna sekali ketika kalian bekerja pada sistem persamaan matematika. Membuat Matrix di R sangat mudah koq bisa dilakukan dengan reshape sebuah vector menjadi matrix seperti berikut
Contoh kode penggunan matrix pada bahasa R
data = matrix(c(1,2,4,9,12,3),nrow=2,ncol=3,byrow=TRUE) print(data)
Hasil
[,1] [,2] [,3] [1,] 1 2 4 [2,] 9 12 3
Selain cara diatas, juga bisa dengan function dan
# membuat vektor numerik col1 <- c(5, 6, 7, 8, 9) col2 <- c(2, 4, 5, 9, 8) col3 <- c(7, 3, 4, 8, 7) # menggabungkan vektor berdasarkan kolom my_data <- cbind(col1, col2, col3) my_data
hasil
## col1 col2 col3 ## [1,] 5 2 7 ## [2,] 6 4 3 ## [3,] 7 5 4 ## [4,] 8 9 8 ## [5,] 9 8 7
selain itu, juga bisa mengubah nama kolom
# Mengubah atau menambahkan nama baris rownames(my_data) <- c("row1", "row2", "row3", "row4", "row5") my_data
hasil
## col1 col2 col3 ## row1 5 2 7 ## row2 6 4 3 ## row3 7 5 4 ## row4 8 9 8 ## row5 9 8 7
Catatan:
- cbind(): menggabungkan objek R berdasarkan kolom
- rbind(): menggabungkan objek R berdasarkan baris
- rownames(): mengambil atau menetapkan nama-nama baris dari objek seperti-matriks
- colnames(): mengambil atau menetapkan nama-nama kolom dari objek seperti-matriks
Dimensi matrix
Untuk mengetahui sebuah dimensi matrix gunakan perintah yaitu terdiri dari baris dan kolom. Contoh kode penggunan dimensi matrix pada bahasa R.
dimensi = dim(data) dimensi[1] #jumlah baris dimensi[2] #jumlah kolom
Hasil
[1] 2 [1] 3
atau menggunakan function dan
Akses pada kolom dan baris tertentu
Akses pada sebuah matrix sama seperti dengan vector, misalkan untuk akses baris 2 kolom 3
data[2,3]
Hasil
[1] 3
sedangkan kalau mau akses seluruh kolom pada baris 2 gunakan tanda . Contoh kode akses index matrix pada bahasa R
data[2,1:3] # atau data[2,]
Hasil
[1] 9 12 100 [1] 9 12 100
Mengubah isi matrix
Kalau untuk mengubah value baris 2 kolom 3, seperti berikut. Contoh kode mengubah isi matrix pada bahasa R
data[2,3]=100 print(data)
Hasil
[,1] [,2] [,3] [1,] 1 2 4 [2,] 9 12 100
List
Jenis data list merupakan jenis vector yang mempunyai sebuah nama/key. Misalkan kalian punya data KTP yang mempunyai informasi mengenai nama, tanggal lahir, pekerjaan yang disebut dengan key. Untuk mempresentasikan tersebut digunakanlah list, oiya untuk membuat key harus mengikuti kaidah berikut
- tidak boleh didahului dengan angka
- tidak boleh mengandung spasi
- tidak boleh mengandung tanda simbol seperti
Membuat List
Contoh berikut untuk membuat list KTP yang terdiri dari nama, tanggal, dan pekerjaan
bintang<-list('nama'='bintang pamungkas','tanggal'='4 juni 1988','pekerjaan'='akuntan') print(bintang)
Hasil
$nama [1] "bintang pamungkas" $tanggal [1] "4 juni 1988" $pekerjaan [1] "akuntan"
Akses List menggunakan Key
Untuk akses key nya harus menggunakan tanda $ atau []. Contoh untuk akses nama
print(bintang$nama) print(bintang['nama'])
Hasil
> print(bintang$nama) [1] "bintang pamungkas" > print(bintang['nama']) $nama [1] "bintang pamungkas"
Mengubah Isi List menggunakan Key
Tapi penulis lebih suka menggunakan tanda $ saja, oiya untuk mengubah isi value nya pun sama, dengan cara menggunakan akses tanda $
bintang$nama='sri bintang pamungkas' print(bintang$nama)
Hasil
[1] "sri bintang pamungkas"
Data Frame
Kalau kalian terbiasa bekerja dengan excel yang tersusun atas baris, kolom, dan header yang mempermudah kalian dalam melakukan seleksi kolom tertentu saja yang bila menggunakan R tools dinamakan Data Frame bila kalian menggunaan Matlab disebut dengan , kalau untuk Python kalian menggunakan Library Pandas
Membuat Data Frame dari vector
Untuk membuat data frame ada 2 yaitu dari menggambungkan vector dan loading file. Perintah membuat . Misalkan kalian ingin membuat data frame berikut
Contoh kode pembuatan data frame dari menggabungkan vector
no = c(1:5) item = c('radio','monitor','antena','keyboard','kabel') terjual = c(100,200,234,300,230) data = data.frame(no,item,terjual) print(data)
Hasil
no item terjual 1 1 radio 100 2 2 monitor 200 3 3 antena 234 4 4 keyboard 300 5 5 kabel 230
Menampilkan informasi head
Bilakala kalian menjumpai data frame yang terdiri dari ribuan dataset, maka untuk menampilkan beberapa baris data frame gunakan perintah , seperti contoh berikut untuk menampilkan 3 baris saja
head(data,3)
Hasil
no item terjual 1 1 radio 100 2 2 monitor 200 3 3 antena 234 4 4 keyboard 300 5 5 kabel 230
Memilih Variabel / kolom tertentu
Adakalanya kalian dalam hanya ingin mendapatkan kolom tertentu saja, misalkan hanya ingin mendapatkan kolom terjual, kalian bisa gunakan perintah
data$terjual
Hasil
[1] 100 200 234 300 230
Summary
Bahkan dengan memanggil perintah kalian mendapatkan informasi statistik deskriptif seperti berikut
summary(data)
Hasil
no item terjual Min. :1 antena :1 Min. :100.0 1st Qu.:2 kabel :1 1st Qu.:200.0 Median :3 keyboard:1 Median :230.0 Mean :3 monitor :1 Mean :212.8 3rd Qu.:4 radio :1 3rd Qu.:234.0 Max. :5 Max. :300.0
Informasi tipe variabel
Untuk mendapatkan tipe variabel tiap masing-masing kolom gunakan perintah
str(data)
Hasil
str(data)'data.frame': 5 obs. of 3 variables: $ no : int 1 2 3 4 5 $ item : Factor w/ 5 levels "antena","kabel",..: 5 4 1 3 2 $ terjual: num 100 200 234 300 230
Mendapatkan data terakhir
Berbeda dengan untuk mendapatkan informasi awal, maka untuk mendapatkan data akhir (dimulai dari belakang), maka gunakan . Misalka untuk mendapatkan 2 informasi dari belakang (yaitu no 4 dan 5)
tail(data,2)