Quartile dan Interquartile Range (IQR)

📊 Apa Itu Quartile dan Interquartile Range (IQR)?

Quartile adalah pembagian data menjadi empat bagian yang sama banyak. Setiap quartile membagi data menjadi kelompok yang menunjukkan posisi tertentu dalam distribusi data. Sedangkan Interquartile Range (IQR) adalah rentang antara Quartile 1 (Q1) dan Quartile 3 (Q3), yang mencerminkan sebaran data di tengah (menyaring nilai ekstrem atau outliers).

🔢 Pembagian Quartile:

  1. Quartile 1 (Q1): Median dari setengah data pertama (25% data terkecil).

  2. Quartile 2 (Q2): Median dari seluruh dataset (50% data).

  3. Quartile 3 (Q3): Median dari setengah data kedua (75% data terbesar).

🔎 Interquartile Range (IQR):

IQR adalah selisih antara Q3 dan Q1, yang menunjukkan rentang data tengah tanpa dipengaruhi oleh outliers. Rumusnya adalah:

IQR=Q3Q1\text{IQR} = Q3 - Q1

IQR memberikan gambaran tentang kepadatan data dan digunakan untuk mendeteksi outliers.


🧮 Contoh Perhitungan Quartile dan IQR:

Misalkan kita memiliki dataset berikut:

10,12,14,18,20,22,24,30,32,3610, 12, 14, 18, 20, 22, 24, 30, 32, 36

Langkah 1: Urutkan Data

10,12,14,18,20,22,24,30,32,3610, 12, 14, 18, 20, 22, 24, 30, 32, 36

Langkah 2: Cari Median (Q2)

Median adalah nilai tengah dari dataset. Karena dataset ini memiliki jumlah data genap (10 data), maka median adalah rata-rata dari dua nilai tengah:

Median (Q2)=20+222=21\text{Median (Q2)} = \frac{20 + 22}{2} = 21

Langkah 3: Tentukan Quartile 1 (Q1) dan Quartile 3 (Q3)

  • Q1 adalah median dari setengah pertama data (data sebelum median):

10,12,14,18,2010, 12, 14, 18, 20

Median dari data ini adalah 14, sehingga Q1=14Q1 = 14.

  • Q3 adalah median dari setengah kedua data (data setelah median):

22,24,30,32,3622, 24, 30, 32, 36

Median dari data ini adalah 30, sehingga Q3=30Q3 = 30.

Langkah 4: Hitung IQR

IQR=Q3Q1=3014=16\text{IQR} = Q3 - Q1 = 30 - 14 = 16

🧠 Apa yang Dapat Diketahui dari Quartile dan IQR?

  • Quartile 1 (Q1) dan Quartile 3 (Q3) memberikan gambaran tentang sebaran data di bawah dan atas median.

  • IQR mengukur sebaran data di tengah. IQR sering digunakan untuk mengidentifikasi outliers dalam data:

Nilai yang lebih kecil dari:

Q11.5×IQRQ1 - 1.5 \times \text{IQR}

atau lebih besar dari:

Q3+1.5×IQRQ3 + 1.5 \times \text{IQR}

dianggap sebagai outlier.


✅ Keunggulan dan Kelemahan Quartile dan IQR:

Keunggulan:

  • IQR lebih robust dibandingkan dengan standar deviasi karena tidak terpengaruh oleh outliers.

  • Quartile memberikan gambaran yang lebih rinci tentang distribusi data, terutama pada data yang skewed atau tidak terdistribusi normal.

Kelemahan:

  • Quartile dan IQR tidak memberikan informasi detail tentang data yang berada di luar quartile, yaitu nilai ekstrem atau distribusi data secara keseluruhan.

  • Penghitungan IQR memerlukan pemahaman tentang posisi Q1 dan Q3, yang mungkin tidak mudah bagi sebagian orang tanpa alat bantu.


🧑‍💻 Menghitung Quartile dan IQR di Python

Di Python, kita bisa menggunakan Pandas atau Numpy untuk menghitung quartile dan IQR dengan mudah.

Menggunakan Pandas:

import pandas as pd

# Data contoh
data = [10, 12, 14, 18, 20, 22, 24, 30, 32, 36]

# Menghitung Q1, Q2 (Median), dan Q3
Q1 = pd.Series(data).quantile(0.25)
Q2 = pd.Series(data).quantile(0.5)  # Median
Q3 = pd.Series(data).quantile(0.75)

# Menghitung IQR
IQR = Q3 - Q1

print("Quartile 1 (Q1):", Q1)
print("Median (Q2):", Q2)
print("Quartile 3 (Q3):", Q3)
print("Interquartile Range (IQR):", IQR)

Menggunakan Numpy:

import numpy as np

# Data contoh
data = [10, 12, 14, 18, 20, 22, 24, 30, 32, 36]

# Menghitung Q1, Q2 (Median), dan Q3
Q1 = np.percentile(data, 25)
Q2 = np.percentile(data, 50)  # Median
Q3 = np.percentile(data, 75)

# Menghitung IQR
IQR = Q3 - Q1

print("Quartile 1 (Q1):", Q1)
print("Median (Q2):", Q2)
print("Quartile 3 (Q3):", Q3)
print("Interquartile Range (IQR):", IQR)

✅ Kesimpulan:

Quartile dan IQR adalah alat statistik yang sangat berguna untuk mengukur sebaran data, terutama untuk mendeteksi outliers dan memberikan gambaran yang lebih mendalam tentang distribusi data. IQR secara khusus membantu kita untuk melihat kepadatan data di sekitar median dan untuk mendeteksi data yang mungkin tidak representatif (outliers).

Last updated