Belajar Statistik

By | November 28, 2024
8,265 Views

Statistik akan terasa lebih mudah kalau kalian mengenal software R yang merupakan tools sangat bagus sekali bagi kalian yang suka coding untuk analisis data, hal ini menjadi alasan tersendiri mengapa penggunaan R menjadi semakin banyak digunakan untuk kalangan riset dan industri selain berbasis code (tidak seperti SPPS, Orange, Rapid Minner, Weka) juga kegunaannya menjadi semakin diperluas seperti fungsi dasar statistik, ploting data juga ada banyak sekali package seperti digital image processing, digital signal processing, serta machine learning.

Walaupun R digunakan fokus untuk analisis data bukan untuk membuat aplikasi seperti Matlab, Python tapi R sangat mumpuni dalam bidang core nya yaitu Statistik seperti pemodelan linear dan non linear, time series, klasifikasi, analisis kluster, serta visualiasi grafik. Nah fokus buku yaitu Belajar Dasar-Dasar Bahasa R sehingga setelah kalian pahami Dasar-Dasar R maka kalian bisa pergunakan kemampuan tersebut untuk beragam kasus yang kalian temui dalam bidang analisis data seperti data spasial, big data analyst. Seiring bertambahnya dengan adanya puluhan ribu package yang terus menerus diunggah oleh semua komunitas yang ada di seluruh duniak server CRAN setiap tahunnya.

Secara umum pembahasan Buku Belajar Dasar-Dasar Statistik dengan Bahasa R dibagi menjadi 2 topik utama yaitu Sintaks Dasar R dan Statistik dengan R yang sangat simple. Kalian bisa menggunakan R Console / R Script untuk menulis perintah/membuat function ataupun eksekusi perintah/kode yang kalian buat karena memang berbasis script sehingga memudahkan kalian menuliskan algoritma sesuai dengan kebutuhan, ataupun menggunakan R-Commander yang berbasis GUI semudah menggunakan seperti SPPS.

Mengapa kalian harus belajar bahasa R? setidaknya ada 3 alasan yaitu

  1. free dan opensource serta cross platform sehingga kita bisa bebas dan mengembangkan sesuai dengan kebutuhan. misalkan kalian bisa saja membuat package tersendiri untuk sebuah perusahaan/organisasi tertentu dengan beragam OS seperti linux, windows, serta mac.
  2. Visualisasi plot grafik yang mumpuni seperti di Matlab, Python-Matplotlib  serta dukungan data berformat spasial seperti menggunakan package ggplot2
  3. Berbasis Script artinya adalah kalian bebas menulis algoritma bahkan membuat sendiri function yang kalian butuhkan, bagian inilah yang menarik karena tidak seperti SPSS, Minitab dengan fitur drag and drop yang menurut penulis cukup merepotkan ketika bekerja pada tahap pre processing data/cleaning dataset
See also  Uji Validitas dan Reliabilitas serta Cara Meningkatkan Hasil Validitasnya

Tapi tenang saja, tidak melulu menggunakan R dalam mengolah statistika, kami juga menampilkan perhitungan manual di excel dan SPSS juga

Daftar Isi Buku Belajar Dasar-Dasar Statistik dengan Bahasa R

Berikut daftar isi buku yang akan terus diupdate setiap minggunya

  1. Fundamental R/RStudio
    1. Download, Setup Direktori, R Console dan Script R
    2. Tipe Data pada R (Numeric, Integer, Complex, Logical, Character)
    3. Data
      1. Data Terstruktur Vector – Matrix dan Data Frame
      2. Belajar matrix dengan R
      3. Membaca data logger
    4. Jenis Operator di Bahasa R
    5. Kontrol Syarat Kondisi dan Perulangan di R
    6. Dataset Default di R
    7. Plot Grafik di R
      1. Dasar  Dasar Visualisasi Data menggunakan Grafik di R
      2. Ploting Grafik Piramida di R
      3. Visualisasi 2 Line menggunakan package ggplot
      4. Menggunakan package Visreg untuk visualisasi regresi
    8. Mengenal Function di R
    9. Mengenal Statistik Dasar di R (package psych dan pastecs)
    10. Dataset dan Data Frame
      1. Masking Data Frame
      2. Manipulasi Data Frame dengan Package dplyr
      3. Cara melakukan Split / Membagi Dataset
      4. Mencari data last transaction
      5. Menggunakan Operasi Join
      6. Summary dan Pivot Data
  2. Regresi
    1. Analisis Korelasi Pearson
    2. Analisis Regresi Berganda dan R-Squared (nilai determinasi)
    3. Analisis Regresi Logistik dan Pengolahan data Grouping
  3. Time Series
    1. Analisis Forecasting Time Series – Peramalan Deret Waktu
    2. Analisis Decomposing Time Series 
    3. Dekomposisi Runtun Waktu – Time Series Transaksi Saham
    4. Deteksi Anomali pada Time Series/Deret Waktu
    5. Uji Stasioneritas Data
    6. Differencing Data bila tidak Stasioner
    7. ARIMA
      1. Pengertian dan Cara Perhitungan ARIMA serta Prediksi Model ARIMA
      2. Contoh Studi Kasus Forecasting Time Series ARIMA
    8. Korelasi linear Pearson dan Fungsi Autokorelasi (ACF) PACF
  4.  Analisis
      1. Analisis Clustering dengan R
      2. Analisis Decision Tree dengan R
      3. DBScan dan KMeans Clustering
      4. KNN dan KDist
  5. Statistika
    1. Uji Kesamaan Varians
      1. Uji Kesamaan Varians Populasi dengan Uji Levene
    2. Pengertian dan Jenis Uji-t Student
      1. Data berpasangan
        1. Uji Kesamaan Rata-Rata Dari Dua Populasi dan Saling Berhubungan
      2. Data tidak berpasangan
        1. Uji Kesamaan Rata-Rata Dari Dua Populasi Tidak Berhubungan dengan Asumsi Varians Populasi SamaPaired t Test for Dependent Populations
        2. Uji Kesamaan Rata-Rata Dari Dua Populasi Tidak Berhubungan dengan Asumsi Varians Populasi berbeda – t Test
          for Independent Populations with Assumption Different
    3. Uji Normalitas
      1. Cara Hitung Manual Uji Normalitas Populasi dengan Quantile-Quantile Plot (Q-Q Plot)
      2. Cara Hitung Manual Uji Normalitas Populasi dengan Uji Jarque-Bera
      3. Cara Hitung Manual Uji Normalitas dengan Uji Kolmogorov-Smirnov
      4. Cara Hitung Manual Uji Normalitas Shapiro Wilk
    4. Uji Stasioner
      1. Uji Stasioner Dickey Fuller
      2. Differencing Data bila tidak Stasioner
    5. Uji Validitas dan reliabilitas
      1. Uji Validitas dan Reliabilitas serta Cara Meningkatkan Hasil Validitasnya
  6. Deteksi
    1. Deteksi Data Outlier
    2. Deteksi Autokorelasi
    3. Deteksi Anomali Data
  7. Menghitung Confusion matrix
  8. R-Commander yang berbasis GUI semudah menggunakan seperti SPPS
  9. Bekerja dengan RStudio untuk Mempermudah Analisis Statistik
  10. Menggunakan Jupyter Notebook untuk menulis kode R
  11. Mengapa Hasil Nilai di R dan SPSS terkadang beda?
See also  Model Simulasi Monte Carlo

Buku Belajar Dasar-Dasar Statistik dengan Bahasa R akan terus di update tidak hanya melulu statistik tapi juga akan banyak membahas machine learning, khusus untuk deep learning akan tersendiri dibahas menggunakan tools yang tepat yaitu bahasa Python

Sistem Operasi dan Versi Bahasa R

Pada buku ini menggunakan Sistem Operasi Windows 64 Bit dan Bahasa R-3.6.2 64 bit

Download R Tools

R Tools bisa kalian download di https://www.r-project.org/ atau mirror nya untuk negara Indonesia yaitu https://repo.bppt.go.id/cran/.

Lakukan proses instalasi secara default saja

Bekerja dengan R Console

Jalankan saja R Tools dengan tampilan defaultnya seperti dibawah ini yaitu dengan kotak dialog bernama R Console, inilah yang sangat menarik kalau kalian yang suka coding daripada menggunakan drag and drop berbasis visual

R Tools bisa bekerja dalam 2 cara yaitu

  1. Mengetikan langsung perintah/kode di R Console atau
  2. Membuat script .R yang dijalankan di R Console

Kalau dalam mengolah data yang cukup kompleks kalian bisa menggunakan script saja agar mudah dalam penulisan kode.

Setup Direktori Kerja

Hal yang harus kalian lakukan pertama kali yaitu lakukanlah setup direktory kerja, untuk cek direktory saat ini, bisa gunakan perintah getwd() seperti contoh dibawah ini yang kalian ketikan di R Console untuk mengetahui berada direktori saat ini.

Terlebih coba kalian buat dulu sebuah direktori di D:/latihan R, kita akan arahkan ke direktori tersebut dengan perintah berikut ini

setwd('D:/latihan R')

Selamat kamu sudah berhasil melakukannya dengan baik, tapi ada cara yang lebih cepet sih menggunakan akses File -> Change dir seperti berikut ini.

Langkah diatas kalian perlukan jika sedang mengerjakan project yang cukup besar dan melibatkan dataset sehingga dengan pengaturan diatas mempermudah kalian dalam

  1. Akses dataset secara hierarki
  2. Dapat menyimpan workspace
See also  Text Preprocessing dan text minning

Menyimpan Workspace

Kalian bisa menyimpan workspace dengan extension *.Rdata

Bekerja dengan Script

Untuk membuat Script baru akses saja File -> New Script, coba kalian ketikan kode berikut di Editor R

setwd('D:/latihan R')
getwd()

Simpan dengan nama Kode1.R untuk menjalankan script diatas tekan saja F5 pada keyboard, INGAT KALIAN HARUS SELEKSI KODENYA DIATAS agar bisa dijalankan oleh R Console karena cara kerja nya yaitu HANYA KODE YANG DI SELEKSI SAJA YANG AKAN DI RUN, maka select all saja menggunakan CTRL + A.

Untuk membersihkan layar R Console tekan CTRL + L pada keyboard