Percentile

📊 Apa Itu Percentile?

Percentile adalah nilai yang membagi dataset menjadi 100 bagian yang setara. Setiap percentile menunjukkan posisi relatif dari data dalam distribusi. Misalnya, percentile ke-90 adalah nilai yang membagi data sehingga 90% data terletak di bawahnya dan 10% data di atasnya.

Secara umum, percentile digunakan untuk mengetahui peringkat atau posisi relatif suatu nilai dalam distribusi data yang lebih besar.

🔢 Contoh Percentile:

Misalkan kamu memiliki dataset tentang nilai ujian berikut:

50,60,70,80,90,10050,60,70,80,90,100

Jika kita ingin menghitung percentile ke-25 (Q1), berarti kita ingin tahu nilai yang membagi 25% data terendah. Demikian pula, percentile ke-75 (Q3) membagi 75% data terendah.

🧮 Rumus Percentile:

Percentile PkP_k diartikan sebagai nilai yang membagi dataset sehingga persentase kk% dari data berada di bawah nilai tersebut.

Untuk menghitung k-percentile, kita bisa menggunakan rumus interpolasi jika diperlukan. Namun, sebagian besar perangkat statistik (seperti Python atau Excel) sudah memiliki cara otomatis untuk menghitungnya.


🧮 Contoh Perhitungan Percentile:

Misalkan kita memiliki dataset berikut: 10,12,14,18,20,22,24,30,32,3610,12,14,18,20,22,24,30,32,36

Langkah 1: Urutkan Data

10,12,14,18,20,22,24,30,32,3610,12,14,18,20,22,24,30,32,36

Langkah 2: Tentukan Percentile yang Diinginkan

Misalkan kita ingin menghitung Percentile ke-40 (P40).

  1. Percentile ke-40 berarti kita mencari nilai di mana 40% data lebih rendah darinya.

Untuk menghitung P40, kita bisa menggunakan rumus posisi percentile:

Posisi:

Posisi=k100×(n+1)\text{Posisi} = \frac{k}{100} \times (n + 1)

di mana:

  • kk adalah nilai percentile yang diinginkan (misalnya 40 untuk $P_{40}$),

  • nn adalah jumlah data (dalam hal ini 10).

Jadi, posisi untuk $P_{40}$ adalah:

40100×(10+1)=4.4\frac{40}{100} \times (10 + 1) = 4.4

Posisi 4.4 menunjukkan bahwa P40P_{40} berada antara data ke-4 dan ke-5, yaitu antara 18 dan 20. Kita bisa melakukan interpolasi untuk mendapatkan nilai yang lebih tepat, yaitu:

P40=18+0.4×(2018)=18+0.8=18.8P_{40} = 18 + 0.4 \times (20 - 18) = 18 + 0.8 = 18.8

Jadi, Percentile ke-40 (P40P_{40}) adalah 18.8.


🧠 Apa yang Dapat Diketahui dari Percentile?

  • Percentile membantu kita memahami posisi relatif data dalam distribusi.

  • Sebagai contoh, Percentile ke-50 (Q2) adalah median, yang membagi data menjadi dua bagian yang sama.

  • Percentile ke-25 (Q1) dan Percentile ke-75 (Q3) sering digunakan untuk menghitung Interquartile Range (IQR), yang menggambarkan sebaran data di sekitar median.


✅ Keunggulan dan Kelemahan Percentile:

Keunggulan:

  • Percentile memberikan informasi yang lebih lengkap tentang distribusi data dibandingkan hanya menggunakan mean atau median.

  • Sangat berguna untuk menganalisis data yang tidak terdistribusi normal atau memiliki outliers.

Kelemahan:

  • Percentile bisa terdistorsi jika data memiliki banyak outliers.

  • Penghitungan percentile membutuhkan urutan data yang baik dan sering memerlukan interpolasi jika posisi percentile berada di antara dua nilai data.


🧑‍💻 Menghitung Percentile di Python

Di Python, kita bisa menggunakan Pandas atau Numpy untuk menghitung percentile dengan mudah.

Menggunakan Pandas:

import pandas as pd

# Data contoh
data = [10, 12, 14, 18, 20, 22, 24, 30, 32, 36]

# Menghitung Percentile ke-40
percentile_40 = pd.Series(data).quantile(0.40)

print("Percentile ke-40:", percentile_40)

Menggunakan Numpy:

import numpy as np

# Data contoh
data = [10, 12, 14, 18, 20, 22, 24, 30, 32, 36]

# Menghitung Percentile ke-40
percentile_40 = np.percentile(data, 40)

print("Percentile ke-40:", percentile_40)

✅ Kesimpulan:

Percentile memberikan wawasan yang berguna untuk mengukur posisi relatif data dalam distribusi. Ini sangat membantu untuk analisis yang lebih mendalam, terutama ketika kita ingin mengetahui bagaimana nilai-nilai tertentu dibandingkan dengan keseluruhan dataset, serta untuk mendeteksi apakah data terdistribusi normal atau tidak. Percentile sering digunakan dalam analisis statistik untuk mengetahui ranking atau performa relatif dari data.

Last updated