Variance (Variansi)

📊 Apa Itu Variance (Variasi)?

Variance (atau Variasi) adalah ukuran statistik yang menggambarkan seberapa jauh nilai-nilai dalam dataset bervariasi dari nilai rata-ratanya (mean). Variance memberikan gambaran tentang sebaran atau keragaman data secara lebih detail dibandingkan dengan range. Semakin besar nilai variance, semakin besar pula variasi data dari rata-rata.

🧮 Rumus Variance:

Untuk data populasi:

Variance(σ2)=1Ni=1N(Xiμ)2\text{Variance} (\sigma^2) = \frac{1}{N} \sum_{i=1}^{N} (X_i - \mu)^2

Dimana:

  • XiX_i = Setiap nilai dalam dataset.

  • μ\mu = Rata-rata dari dataset.

  • NN = Jumlah total data dalam dataset.

Untuk data sampel:

Variance(s2)=1n1i=1n(XiXˉ)2\text{Variance} (s^2) = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2

Dimana:

  • XiX_i = Setiap nilai dalam sampel.

  • Xˉ\bar{X} = Rata-rata sampel.

  • nn = Jumlah data dalam sampel.


🔍 Contoh Perhitungan Variance:

Misalkan kamu memiliki data tentang nilai ujian 5 siswa: 85,90,92,88,9585,90,92,88,95

  1. Hitung rata-rata (mean):

Mean=85+90+92+88+955=90\text{Mean} = \frac{85 + 90 + 92 + 88 + 95}{5} = 90
  1. Hitung selisih antara setiap nilai dan rata-rata, kemudian kuadratkan:

(8590)2=(5)2=25(85 - 90)^2 = (-5)^2 = 25
(9090)2=02=0(90 - 90)^2 = 0^2 = 0
(9290)2=22=4(92 - 90)^2 = 2^2 = 4
(8890)2=(2)2=4(88 - 90)^2 = (-2)^2 = 4
(9590)2=52=25(95 - 90)^2 = 5^2 = 25
  1. Jumlahkan hasil kuadrat:

25+0+4+4+25=5825 + 0 + 4 + 4 + 25 = 58
  1. Bagi dengan jumlah data (untuk populasi) atau jumlah data - 1 (untuk sampel):

    • Jika data ini adalah populasi, variansi adalah:

    Variance=585=11.6\text{Variance} = \frac{58}{5} = 11.6
    • Jika data ini adalah sampel, variansi adalah:

    Variance=584=14.5\text{Variance} = \frac{58}{4} = 14.5

🧠 Apa yang Dapat Diketahui dari Variance?

  • Variance menunjukkan seberapa besar penyebaran atau variasi data dari nilai rata-rata. Semakin besar nilai variance, semakin besar pula penyebaran data.

  • Variance tidak memperhitungkan arah penyebaran (apakah ke atas atau ke bawah), hanya ukuran seberapa jauh data tersebar dari rata-rata.

🧠 Kelemahan dari Variance:

  • Unit varians berbeda dengan unit data asli. Misalnya, jika data asli adalah suhu dalam derajat Celcius, maka variansnya akan berada dalam satuan derajat Celcius kuadrat. Untuk membuat interpretasi lebih mudah, sering kali digunakan standar deviasi, yang merupakan akar kuadrat dari variance.

  • Variance sensitif terhadap outliers, sehingga jika ada data yang sangat ekstrem, variance bisa terdistorsi.


✅ Keunggulan dan Kelemahan Variance:

Keunggulan:

  • Variance memberikan gambaran yang lebih komprehensif tentang sebaran data daripada range.

  • Berguna untuk analisis statistik lanjutan seperti regresi dan analisis varians (ANOVA).

Kelemahan:

  • Unit variance berbeda dengan unit data, sehingga sulit untuk langsung menginterpretasikan hasilnya.

  • Sensitif terhadap outliers, yang dapat menyebabkan nilai variance menjadi sangat besar jika ada data yang ekstrem.


🧑‍💻 Menghitung Variance di Python

Di Python, kita bisa menggunakan Pandas atau Numpy untuk menghitung variance dengan mudah.

Menggunakan Pandas:

import pandas as pd

# Data contoh
data = [85, 90, 92, 88, 95]

# Menghitung variance
variance_value = pd.Series(data).var()
print("Variance:", variance_value)

Menggunakan Numpy:

import numpy as np

# Data contoh
data = [85, 90, 92, 88, 95]

# Menghitung variance
variance_value = np.var(data)
print("Variance (Populasi):", variance_value)

✅ Kesimpulan:

Variance adalah ukuran yang digunakan untuk mengukur seberapa besar penyebaran data dari nilai rata-rata. Variance memberikan gambaran tentang variabilitas data, tetapi karena satuannya berbeda dengan data asli, sering kali digunakan standar deviasi untuk interpretasi yang lebih mudah.

Last updated