Vector – Matrix – List-Data Frame

By | July 30, 2024
3,568 Views

Sinopsis

Data terstrukur merupakan suatu set variabel yang dijadikan satu kesatuan. Sama seperti dengan bahasa pemrograman umum lainnya yang dilengkapi dengan data tersetrukur maka di R pun ada juga malah lebih mudah dalam penggunaanya yaitu

  1. Vector
  2. Matrix
  3. List
  4. Data Frame

Dengan 3 jenis data tersebut sangat mampu melakukan pengolahan bermacam-macam sumber jenis dataset seperti CSV, excel dan lainnya.

VECTOR

Vector adalah array yang terdiri dari 1 baris, Vector digunakan mengumpulkan sebuah nilai menjadi satu kesatuan menggunakan perintah c(). Untuk mengakses indexnya menggunakan operator [] yang dimulai dengan index no 1. Misalkan seperti berikut ini. Contoh kode penggunan vector pada bahasa R

daftar_nama= c('bejo','bagus','pamungkas')
print(daftar_nama)

Hasil

[1] "bejo"      "bagus"     "pamungkas"

Akses Vector

Untuk akses vector seperti berikut, misalkan untuk akses no 1 dan 3. Contoh kode penggunan akses vector pada bahasa R

print(daftar_nama[1])
print(daftar_nama[3])

Hasil

[1] "bejo"
[1] "pamungkas"

Selain mempermudah dalam pengelolaan variabel, bisa kalian gunakan untuk operasi sederhana seperti bila variabel tersebut berisi numeric. Contoh lainnya yaitu Contoh kode penggunan operasi vector pada bahasa R

a = c(1,3,4,90,45)
total = sum(a)
print(a)
print(total)

Hasil

[1]  1  3  4 90 45
[1] 143

Sedangkan untuk array yang terdiri dari baris dan kolom disebut dengan matrix.

MATRIX

Array 2D yaitu terdiri dari baris dan kolom yang disebut dengan Matrix. Matrix ini akan berguna sekali ketika kalian bekerja pada sistem persamaan matematika. Membuat Matrix di R sangat mudah koq bisa dilakukan dengan reshape sebuah vector menjadi matrix seperti berikut

    \[A= \begin{pmatrix} 1 & 2 & 4 \\ 9 & 12 & 3\\ \end{pmatrix}\]

Contoh kode penggunan matrix pada bahasa R

data = matrix(c(1,2,4,9,12,3),nrow=2,ncol=3,byrow=TRUE)
print(data)

Hasil

     [,1] [,2] [,3]
[1,]    1    2    4
[2,]    9   12    3

Selain cara diatas, juga bisa dengan function cbind() dan rbind()

# membuat vektor numerik
col1 <- c(5, 6, 7, 8, 9)
col2 <- c(2, 4, 5, 9, 8)
col3 <- c(7, 3, 4, 8, 7)

# menggabungkan vektor berdasarkan kolom
my_data <- cbind(col1, col2, col3)
my_data

hasil

##      col1 col2 col3
## [1,]    5    2    7
## [2,]    6    4    3
## [3,]    7    5    4
## [4,]    8    9    8
## [5,]    9    8    7

selain itu, juga bisa mengubah nama kolom

# Mengubah atau menambahkan nama baris
rownames(my_data) <- c("row1", "row2", 
                       "row3", "row4", 
                       "row5")
my_data

hasil

##      col1 col2 col3
## row1    5    2    7
## row2    6    4    3
## row3    7    5    4
## row4    8    9    8
## row5    9    8    7

Catatan:

  • cbind(): menggabungkan objek R berdasarkan kolom
  • rbind(): menggabungkan objek R berdasarkan baris
  • rownames(): mengambil atau menetapkan nama-nama baris dari objek seperti-matriks
  • colnames(): mengambil atau menetapkan nama-nama kolom dari objek seperti-matriks

 

Dimensi matrix

Untuk mengetahui sebuah dimensi matrix gunakan perintah  dim() yaitu terdiri dari baris dan kolom. Contoh kode penggunan dimensi matrix pada bahasa R.

dimensi = dim(data)
dimensi[1] #jumlah baris
dimensi[2] #jumlah kolom

Hasil

[1] 2
[1] 3

atau menggunakan function ncol() dan nrow()

Akses pada kolom dan baris tertentu

Akses pada sebuah matrix sama seperti dengan vector, misalkan untuk akses baris 2 kolom 3

data[2,3]

Hasil

[1] 3

sedangkan kalau mau akses seluruh kolom pada baris 2 gunakan tanda :. Contoh kode akses index matrix pada bahasa R

data[2,1:3] # atau
data[2,]

Hasil

[1]   9  12 100
[1]   9  12 100

Mengubah isi matrix

Kalau untuk mengubah value baris 2 kolom 3, seperti berikut. Contoh kode mengubah isi matrix pada bahasa R

data[2,3]=100
print(data)

Hasil

[,1] [,2] [,3]
[1,] 1 2 4
[2,] 9 12 100

List

Jenis data list merupakan jenis vector yang mempunyai sebuah nama/key. Misalkan kalian punya data KTP yang mempunyai informasi mengenai nama, tanggal lahir, pekerjaan yang disebut dengan key. Untuk mempresentasikan tersebut digunakanlah list, oiya untuk membuat key harus mengikuti kaidah berikut

  1. tidak boleh didahului dengan angka
  2. tidak boleh mengandung spasi
  3. tidak boleh mengandung tanda simbol seperti $

Membuat List

Contoh berikut untuk membuat list KTP yang terdiri dari nama, tanggal, dan pekerjaan

bintang<-list('nama'='bintang pamungkas','tanggal'='4 juni 1988','pekerjaan'='akuntan')
print(bintang)

Hasil

$nama
[1] "bintang pamungkas"

$tanggal
[1] "4 juni 1988"

$pekerjaan
[1] "akuntan"

Akses List menggunakan Key

Untuk akses key nya harus menggunakan tanda $ atau []. Contoh untuk akses nama

print(bintang$nama)
print(bintang['nama'])

Hasil

> print(bintang$nama)
[1] "bintang pamungkas"
> print(bintang['nama'])
$nama
[1] "bintang pamungkas"

Mengubah Isi List menggunakan Key

Tapi penulis lebih suka menggunakan tanda $ saja, oiya untuk mengubah isi value nya pun sama, dengan cara menggunakan akses tanda $

bintang$nama='sri bintang pamungkas'
print(bintang$nama)

Hasil

[1] "sri bintang pamungkas"

Data Frame

Kalau kalian terbiasa bekerja dengan excel yang tersusun atas baris, kolom, dan header yang mempermudah kalian dalam melakukan seleksi kolom tertentu saja yang bila menggunakan R tools dinamakan Data Frame bila kalian menggunaan Matlab disebut dengan table, kalau untuk Python kalian menggunakan Library Pandas

Membuat Data Frame dari vector

Untuk membuat data frame ada 2 yaitu dari menggambungkan vector dan loading file. Perintah membuat data .frame . Misalkan kalian ingin membuat data frame berikut

Contoh kode pembuatan data frame dari menggabungkan vector

no = c(1:5)
item = c('radio','monitor','antena','keyboard','kabel')
terjual = c(100,200,234,300,230)
data = data.frame(no,item,terjual)
print(data)

Hasil

no item terjual
1 1 radio 100
2 2 monitor 200
3 3 antena 234
4 4 keyboard 300
5 5 kabel 230

Menampilkan informasi head

Bilakala kalian menjumpai data frame yang terdiri dari ribuan dataset, maka untuk menampilkan beberapa baris data frame gunakan perintah head(), seperti contoh berikut untuk menampilkan 3 baris saja

head(data,3)

Hasil

  no     item terjual
1  1    radio     100
2  2  monitor     200
3  3   antena     234
4  4 keyboard     300
5  5    kabel     230

Memilih Variabel / kolom tertentu

Adakalanya kalian dalam hanya ingin mendapatkan kolom tertentu saja, misalkan hanya ingin mendapatkan kolom terjual, kalian bisa gunakan perintah data$variabel

data$terjual

Hasil

[1] 100 200 234 300 230

Summary

Bahkan dengan memanggil perintah summary() kalian mendapatkan informasi statistik deskriptif seperti berikut

summary(data)

Hasil

      no          item      terjual     
 Min.   :1   antena  :1   Min.   :100.0  
 1st Qu.:2   kabel   :1   1st Qu.:200.0  
 Median :3   keyboard:1   Median :230.0  
 Mean   :3   monitor :1   Mean   :212.8  
 3rd Qu.:4   radio   :1   3rd Qu.:234.0  
 Max.   :5                Max.   :300.0

Informasi tipe variabel

Untuk mendapatkan tipe variabel tiap masing-masing kolom gunakan perintah str()

str(data)

Hasil

str(data)'data.frame': 5 obs. of 3 variables:
$ no : int 1 2 3 4 5
$ item : Factor w/ 5 levels "antena","kabel",..: 5 4 1 3 2
$ terjual: num 100 200 234 300 230

Mendapatkan data terakhir

Berbeda dengan head() untuk mendapatkan informasi awal, maka untuk mendapatkan data akhir (dimulai dari belakang), maka gunakan tail(). Misalka untuk mendapatkan 2 informasi dari belakang (yaitu no 4 dan 5)

tail(data,2)