You are on page 1of 12

BAB 1

Konsep Dasar Statistika

1.1 Latar Belakang


Sebelum kita membahas apa itu statistika, kita terlebih dahulu membahas cara berpikir
deduktif dan induktif serta metode ilmiah1 .
Misalkan terdapat kejadian seperti berikut. Seorang dokter sedang melakukan pengu-
jian (memeriksa pasien) atau melakukan pengujian radiografi. Dokter ini mengumpulkan
data pasien ini untuk selanjutnya digunakan sebagai pedoman dalam melakukan tindakan
pengobatan atau diagnostik selanjutnya. Dalam memberikan keputusan untuk melakukan
tindakan tersebut dapat berdasarkan kepada ilmu pengetahuan selama dia menjalani pen-
didikan sebagai dokter, dapat pula berdasarkan literatur atau sumber-sumber lain. Prinsip-
prinsip umum yang diterapkan pada situasi khusus untuk mendapatkan keputusan terbaik
untuk pasien di atas disebut cara penalaran atau argumentasi deduktif (deductive reason-
ing). Dengan kata lain, cara berargumen dari umum ke khusus (general to specific).
Seringkali pula kita berpikir sebaliknya, yaitu menggunakan informasi dari subjek spe-
sifik ke umum (specific to general). Penalaran seperti ini disebut penalaran induktif (in-
ductive reasoning). Sebagai contoh seorang biologiwan melakukan penelitian terhadap
suatu spesies tumbuhan tanaman obat tertentu dan dari apa yang diamati peneliti berusaha
membuat simpulan rasional tentang apa yang terjadi secara umum.
Dalam metode ilmiah (scientific method) kita mengenal empat tahapan lihat (Elston
and Johnson, 1994).

1. Melakukan observasi (making observation): mengumpulkan data.

2. Membuat hipotesis (generating/formulating a hypothesis): sesuatu yang berhubun-


gan dengan perumusan tujuan penelitian.

3. Pengujian hipotesis (test the hypothesis): melakukan pengujian hipotesis. Langkah


ini berhubungan dengan data apa saja yang diperlukan.

4. Melakukan percobaan (experimenting):

a) Melakukan inferensi untuk menolak atau menerima hipotesis;


1 Drafmateri kuliah untuk tanggal 3 Februari 2016. Kirim email sumarjaya@gmail.com kalau ingin
mengirimkan komentar, saran, dan lain-lain.

1
BAB 1. KONSEP DASAR STATISTIKA 2

b) Jika hipotesis ditolak kita kembali ke langkah 2. Jika hipotesis diterima, tidak-
lah berarti itu benar. Hanya saja berdasarkan pengetahuan yang ada sekarang
itu dianggap benar.
c) Hipotesis secara konstan diperbaiki (refined) dan diuji seiring dengan bertam-
bahnya pengetahuan.

Dalam metode ilmiah kita menggunakan inferensi induktif dan tidak pernah membuk-
tikan sesuatu dengan kepastian absolut (absolute certainty). Metode ilmiah memberikan
cara objektif dalam memformulasikan ide-ide baru dan memeriksakan ide-ide ini dengan
data sesungguhnya dan mengerucutkan kembali penemuan-penemuan ini. Sebagai contoh
misalkan Anda melakukan penelitian terhadap 20 orang pasien penyakit tertentu. Dalam
upaya untuk merampatkan (to generalize) hasil berdasarkan sampel dari 20 pasien ini,
Anda mungkin bertanya sebagai berikut.

1. Jika 20 orang pasien baru diperiksa apakah hasilnya sama dengan studi pada 20
pasien pertama?

2. Jika lab berbeda menganalisis sampel darah apakah hasilnya akan serupa?

3. Jika sampel darah disimpan pada suhu berbeda apakah hasilnya akan sama?

Untuk menjawab pertanyaan-pertanyaan di atas kita memerlukan statistika. Subbab se-


lanjutnya akan membahas pengertian statistika.

1.2 Pengertian Statistika


Statistika adalah ilmu yang berkaitan dengan pengumpulan, pengorganisasian, analisis,
interpretasi, dan presentasi informasi yang dapat dinyatakan secara numerik. Ada dua
kata yang sering disalahartikan:

1. Statistik (tanpa ”a”) adalah pendugaan dari kuantitas numerik yang tidak diketahui,
seperti rata-rata, median, atau modus. Contoh rata-rata tinggi mahasiswa Jurusan
Farmasi adalah 165 cm.

2. Statistika adalah ilmu yang berkaitan dengan pengumpulan, pengorganisasian, anal-


isis, interpretasi, dan presentasi informasi yang dapat dinyatakan secara numerik.

1.2.1 Alasan belajar statistika


Ada beberapa alasan untuk belajar statistika:

1. Membuat keputusan yang benar berdasarkan kepada data yang dimiliki, tahu data
berasal dari mana dan bagaimana data itu diperoleh, juga harus tahu apakah data
yang diperoleh secara statistika syah.

2. Anda harus mampu memahami dan mengevaluasi pustaka-pustaka yang berhubun-


gan dengan analisis data dengan cara yang cerdas. Banyak di antara artikel-artikel
tersebut dibuat dengan argumentasi statistika yang tidak tepat.
BAB 1. KONSEP DASAR STATISTIKA 3

3. Anda tahu kapan dan untuk tujuan apa seorang statistikawan diperlukan konsul-
tasinya.

Terkait dengan alasan-alasan di atas, seorang statistikawan dapat melakukan beberapa


hal berikut:

1. Merekomendasikan rancangan studi yang sesuai dengan tujuan (objectives) peneli-


tian dan meningkatkan jumlah informasi yang bisa diperoleh.

2. Membantu dalam mengembagnkan formulir pengumpulan data yang efisien dan


mudah diproses.

3. Merekomendasikan cara-cara untuk memantau kualitas data begitu data dikumpulkan.

Setelah data dikumpulkan dan disiapkan untuk analisis seorang statistikawan dapat:

1. merekomendasikan metode yang paling cocok untuk analisis data;

2. menginterpretasi temuan-temuan dengan istilah-istilah yang mudah dimengerti;

3. mengulas dan berkontribusi kepada isi dalam laporan atau publikasi.

1.3 Statistika Deskriptif dan Inferensial


Pada saat kita mengumpulkan data kita dapat mengambil ringkasan-ringkasan penting data
baik dalam ringkasan numerik maupun grafikal. Sebagai contoh rata-rata dan median dari
suatu jenis tanaman dan plot histogram dari tanaman tersebut. Statistik yang dirangkum
ini sifatnya deskriptif sehingga disebut statistika deskriptif. Statistika deskriptif ini mem-
berikan gambaran awal tentang data.
Untuk tujuan penelitian yang lebih kompleks, kita akan melakukan pengujian hipotesis
dan mengambil simpulan dari apa yang kita lakukan. Pengambilan simpulan dan pengu-
jian hipotesis ini merupakan bagian dari inferensi statistika (statistika inferensial).

1.4 Pengertian dan Jenis Data


Langkah pertama sebelum melakukan kalkulasi atau memplot data adalah memutuskan je-
nis data yang sedang dihadapi (Swinscow and Campbell, 2002). Swinscow and Campbell
(2002) mengatakan terdapat banyak tipologi, namun perbedaan mendasar adalah variabel
kuantitatif (yang mana kita akan bertanya ”berapa banyak?”) dan variabel kategorik atau
kualitatif (yang mana kita akan bertanya ”apa jenisnya?”. Subbab ini membahas beberapa
tipologi tersebut.

1.4.1 Variabel Kuantitatif


Secara garis besar variabel kuantitatif dapat diukur (measured) atau dihitung (counted).
Variabel kuantitatif dapat diukur menurut suatu jumlah atau kuantitas dan disebut juga
variabel numerik, skala, atau metrik. Variabel yang diukur seperti tinggi badan secara teori
dapat memiliki sebarang nilai dalam suatu rentang tertentu dan diberikan istilah ”kontinu”.
BAB 1. KONSEP DASAR STATISTIKA 4

Apabila nilai-nilai variabel kuantitatif ini hanya bernilai bulat atau nilai dalam jumlah
kecil, kita katakan ”diskret” atau ”diskontinu”. Urutan dan magnitud memegang peranan
penting dalam variabel diskrit, dan nilainya terbatas pada bilangan bulat saja. Dengan
kata lain data diskret ini biasanya dilakukan dengan menghitung. Sebagai contoh data
mahasiswa per jurusan di Universitas Udayana.
Seringkali nilai variabel tidak terbatas pada nilai tertentu. Sebagai contoh kita men-
gukur berat badan seseorang misalnya 60kg. Variabel seperti ini dikatakan kontinu. Me-
ngingat kita melakukan pengukuran terhadap semua nilai pecahan (fractional) di dalam
suatu selang maka nilai ini berada dalam skala interval (interval scale).
Variabel kuantitatif diskret dan kontinu kadang tumpang tindih, namun hal ini tidaklah
signifikan karena data dapat dideskripsikan dengan statistik yang sama seperti median.
Menurut Nick (2007) rasio hanya dapat diambil apabila variabel kuantitatif memiliki titik
nol yang tidak sembarang (nonarbitrary zero point). Sebagai contoh skala temperatur
Celcius adalah skala relatif dan bukan ukuran skala rasio. Misalnya 50◦ C tidaklah dua
kali lipat 25◦ C. Namun, skala Kelvin adalah skala absolut sehingga kita dapat mengatakan
50K adalah dua kali panas 25K.

1.4.2 Variabel Kualitatif


Variabel kualitatif (qualitative variable) merupakan klasifikasi atau kategori. Sehingga
memunculkan istilah variabel kategorik (categorical variable). Sebagai contoh kita mengk-
lasifikasikan tinggi orang sebagai ”rendah”, ”sedang”, atau ”tinggi”. Contoh lain adalah
klasifikasi ras seperti ”Asia”, ”hitam”, ”Kaukasia”. Variabel kategorik ini dibagi menjadi
dua jenis: ordinal dan nominal. Suatu variabel dikatakan variabel ordinal apabila terda-
pat urutan secara alamiah (natural ordering). Sebagai contoh pengklasifikasian penyakit
dalam skala empat: ”tidak sakit”,”agak sakit”,”sakit”, ”parah”. Apabila tidak terdapat
urutan secara alamiah, variabel kualitatif disebut variabel nominal. Sebagai contoh kita
mengklasifikasikan warna rambut: ”hitam”,”merah”,dan ”pirang”. Variabel nominal yang
hanya memiliki dua kategori disebut variabel dikotomus (dichotomous variable) atau vari-
abel biner (binary variabel), misalnya jenis kelamin (laki-laki, perempuan).
Pengklasifikasian variabel nominal dan ordinal kadang bersifat subjektif. Misalkan
kita mengklasifikasikan seorang pasien sebagai ”sangat cemas”,”normal”, dan ”depresi”.
Kita mungkin mengklasifikasikan pasien ini sebagai variabel ordinal. Namun, orang lain
bisa mengkatagorikan variabel ini sebagai nominal. Contoh lain misalkan genotipe dik-
lasifikasikan pada skala nominal dengan tiga kategori genotipe AA, AB, BB. Namun lebih
lazim orang menghitung jumlah allelle A dan dinyatakan sebagai skala ordinal 0, 1, atau
2 allelle A.

1.4.3 Variabel Bebas dan Tidak Bebas


Variabel respons (response variable), disebut juga variabel tak bebas (dependent variable)
atau variabel hasil (outcome variable), adalah suatu ukuran yang dipengaruhi oleh kon-
disi yang berbeda dan merupakan tujuan utama penelitian (primary interest). Variabel
bebas (independent variable), disebut juga variabel factor (factor variable) atau variabel
pemrediksi (predictor variable), merupakan variabel yang secara aktif dikendalikan atau
BAB 1. KONSEP DASAR STATISTIKA 5

dikontrol oleh peneliti untuk memahami varisi yang teramati pada variabel respons. Vari-
abel bebas dan tak bebas dapat berupa kuantitatif atau kualitatif.

1.5 Latihan
1. Jika Anda akan melakukan suatu penelitian apakah suatu tanaman dapat menjadi
obat atau tidak apa langkah-langkah yang akan dilakukan?

2. Klasifikasikan jenis-jenis data berikut. Apakah termasuk kuantitatif (kontinu atau


diskret), kategorik (ordinal atau nominal), atau tipe lainnya.

a) tekanan darah, tinggi badan, berat badan, umur;


b) banyak anak dalam suatu keluarga;
c) tidak setuju, netral, setuju;
d) golongan darah: O, A, B, AB;
e) hidup atau mati;
f) jenis kelamin (laki-laki/perempuan);
g) stadium penyakit kanker.

3. Fahrenheit termasuk ke dalam skala interval. Misalkan dalam suatu percobaan un-
tuk mengetahui kadar suatu zat tertentu A mengukur zat tersebut pada 40◦ F dan
50◦ F, tetapi B mengukur zat tersebut pada 35◦ F dan 45◦ F. Apakah selisih penguku-
ran suhu yang dilakukan A dan B sama?

4. Berikan contoh skala interval, rasio, ordinal, dan nominal.


BAB 2
Ukuran-ukuran Statistik Untuk Data

Bab ini1 membahas beberapa ukuran statistik untuk data yaitu ukuran pemusatan, ukuran
penyebaran, dan ukuran bentuk. Pembahasan diawali dengan pemberian definisi tentang
populasi dan sampel.

2.1 Populasi dan Sampel


Salah satu tujuan statistika adalah membuat kesimpulan tentang populasi berdasarkan
sampel yang diambil. Populasi merupakan kumpulan atau kelompok dari semua unit studi
yang memberikan informasi. Sebagai contoh kumpulan laki-laki dengan tingkat kolesterol
tinggi (populasi). Dalam hal ini unit studi adalah laki-laki dengan tingkat kolesterol tinggi.
Secara umum populasi dibedakan menjadi dua jenis populasi: populasi target dan pop-
ulasi studi. Populasi target (target population) merupakan keseluruhan kelompok unit
studi yang mana kita tertarik dalam mengaplikasikan simpulan kita. Sedangkan populasi
studi (study population) merupakan kelompok unit studi yang mana kita dapat mengap-
likasikan simpulan kita secara syah (legitimately apply our conclusion). Sebagai catatan,
populasi target tidak selalu dapat diakses dan kita hanya dapat mempelajari bagian darinya
yang tersedia. Sebagai contoh, kita akan melakukan wawancara melalui telepon rumah un-
tuk mengetahui semua populasi orang dewasa (dalam hal ini populasi target), namun kita
tidak memiliki akses kepada orang-orang yang tidak memiliki telepon.
Contoh lain untuk memberikan gambaran kedua jenis populasi tersebut di atas adalah
sebagai berikut. Misalkan kita akan melakukan penelitian terhadap suatu komunitas ter-
tentu tentang pengaruh obat A kepada semua laki-laki dengan tingkat kolesterol tinggi di
dalam komunitas tersebut. Namun, setelah mengambil sampel laki-laki dalam komunitas
tersebut hanya laki-laki yang mengunjungi dokter, klinik, atau rumah sakit yang tersedia
untuk diambil sampel darahnya. Dengan demikian kita memiliki populasi studi dari unit-
unit studi yang bisa diakses dan suatu target populasi termasuk populasi studi dan unit-unit
studi yang tidak dapat diakses. Unit-unit studi yang tidak dapat diakses mungkin atau tidak
mungkin memiliki karakteristik yang sama dengan populasi studi. Dengan demikian sim-
pulan yang diambil dari populasi studi tidaklah harus diterapkan kepada populasi target.
1 Drafmateri kuliah untuk tanggal 3 Februari 2016. Kirim email sumarjaya@gmail.com kalau ingin
mengirimkan komentar, saran, dan lain-lain.

6
BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 7

2.2 Parameter dan Statistik


Pada subbab sebelumnya telah diuraikan dua jenis populasi. Pertanyaan sekarang adalah
bagaimana cara mengumpulkan informasi tentang populasi studi? Salah satu cara untuk
mengumpulkan informasi adalah dengan melakukan sensus lengkap dari populasi dengan
mengumpulkan setiap data untuk setiap unit studi di dalam populasi. Namun, mengingat
waktu, uang, dan tenaga yang dibutuhkan untuk melakukan sensus lengkap biasanya hal
ini tidak dimungkinkan.
Pendekatan yang lebih praktis adalah dengan mengambil sampel dari populasi. Jika
sampel yang diambil mewakili populasi maka inferensi/simpulan yang dibuat dari data
sampel tentang populasi akan benar. Istilah statistik (statistic) digunakan untuk meny-
atakan kuantitas yang dihitung dari data sampel. Contoh statistik adalah rata-rata, median,
dan modus. Kuantitas yang merupakan karakteristik dari populasi disebut parameter.
Jika sampel yang diambil mewakili populasi, statistika deskriptif (akan dibahas pada
bab selanjutnya) akan memberikan gambaran akurat tentang parameter yang bersesuaian
dari populasi. Selanjutnya pertanyaan kita adalah bagaimana mengambil sampel yang
mewakili? Ini akan dibahas pada bab-bab selanjutnya.

2.3 Ukuran Pemusatan dan Penyebaran Data


Pada subbagian ini kita akan membicarakan bagaimana meringkas data numerik. Kita
mengenal ukuran kecenderungan pusat (measures of central tendency), ukuran penyebaran
(measures of spread), dan ukuran bentuk (measures of shape).

Ukuran Kecenderungan Pusat


Ukuran kecenderungan pusat memberikan gambaran tentang pusat dari penyebaran data.
Ukuran ini berupa rata-rata, median, dan modus.

Rata-rata. Rata-rata, disebut juga rata-rata aritmetika, didefinisikan sebagai

𝑥 + 𝑥2 + ⋯ + 𝑥𝑛 1 ∑
𝑛
𝑥̄ = 1 = 𝑥, (2.1)
𝑛 𝑛 𝑖=1 𝑖

dengan (dibaca sigma) berarti menjumlahkan, 𝑥 menyatakan amatan individual, dan 𝑛
banyak amatan. Rata-rata digunakan untuk pada saat bilangan dapat dijumlahkan yakni
karakteristik diukur pada skala numerik, bukan pada skala ordinal. Hanya terdapat satu
rata-rata untuk setiap kumpulan data.
Sebagai contoh berikut ini adalah data berat badan 30 orang Eropa. Berdasarkan data
berat badan ini dapat kita hitung rata-rata berat badan sebagai berikut:
20 + 30 + ⋯ + 48 1742
𝑥̄ = = = 58,06667 ≈ 58,07. (2.2)
30 30
Hal yang perlu dicatat adalah bahwa rata-rata bersifat sensitif terhadap nilai ekstrem,
terutama jika ukuran amatan cukup kecil. Misalkan berat badan 5 orang (dalam kg) adalah
sebagai berikut: 50, 65, 60, 70, 40. Nilai rata-rata berat badan kelima orang ini adalah 57.
BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 8

Tabel 2.1: Berat badan 30 orang Eropa dalam kg

20 30 35 40 45 50 65 60 70 80
90 85 75 25 33 36 50 80 65 10
95 75 65 55 75 80 77 78 50 48

Namun, jika salah satu orang nilainya 100, data menjadi 50, 65, 60, 70, 100, rata-rata
berubah menjadi 69. Pada kasus yang lebih ekstrem salah satu berat badan adalah 10,
sehingga data menjadi 10, 65, 60, 70, 40, rata-rata berubah menjadi 49. Contoh-contoh
tersebut menunjukkan bahwa rata-rata bersifat sensitif terhadap nilai ekstrem.
Salah satu cara untuk mengatasi sensitifas rata-rata terhadap nilai ekstrem adalah de-
ngan rata-rata terpangkas (trimmed mean). Rata-rata terpangkas ini dihitung dengan ter-
lebih dahulu mengurutkan data dari nilai terkecil ke terbesar, kemudian menghapus ni-
lai terpilih pada masing-masing ujung data terurut, dan kemudiang merata-ratakan nilai
sisanya. Persentase pemangkasan dihitung sebagai berikut (lihat (Peck et al., 2008)):
banyaknya data yang dihapus pada setiap sisi
persentase pemangkasan = × 100. (2.3)
𝑛
Sebagai contoh untuk terdapat data 0, 50, 65, 60, 70, 100. Apabila dua amatan ekstrem,
0 dan 100, dihilangkan kita akan memperoleh persentase rata-rata terpangkas
2
× 100 = 33,33%.
6
Sehingga kita peroleh rata-rata terpangkas 33,33% sebagai berikut:
50 + 65 + 60 + 70
rata-rata terpangkas 33,33% = = 61,25.
4

Median. Median merupakan amatan di tengah, yakni separuh amatan lebih kecil (di
bawah) dan separuh lagi lebih besar (di atas). Median dihitung sebagai berikut.

1. Urutkan amatan dari kecil ke besar (atau sebaliknya).

2. Hitung nilai tengah amatan. Median merupakan nilai tengah untuk jumlah amatan
ganjil; sebaliknya, jika nilai amatan genap didefinisikan sebagai rata-rata dari dua
nilai tengah untuk amatan genap.

Sebagai contoh, untuk data berat badan 30 orang di atas diperoleh median 62,5 yang diper-
oleh dari rata-rata dua nilai tengah yakni amatan ke-15 dan ke-16, yakni
60 + 65
median = = 62,5. (2.4)
2
Ada beberapa hal yang perlu dicatat untuk median. Pertama, median bersifat kurang
sensitif terhadap nilai ekstrem jika dibandingkan dengan nilai rata-rata. Dengan kata lain,
median dapat digunakan untuk data yang amatannya menyebar pencong atau condong. Li-
hat kembali contoh nilai berat badan di atas. Pada kasus pertama data berat badan adalah
50, 65, 60, 70, 40. Median berat badan pada kasus pertama adalah 60. Kemudian, pada
BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 9

Tabel 2.2: Perbandingan rata-rata dan median berat badan lima orang

Data Rata-rata Median


50, 65, 60, 70, 40 57 60
50, 65, 60, 70, 100 69 65
0, 65, 60, 70, 40 47 60

kasus kedua diperoleh data 50, 65, 60, 70, 100 dengan median 65. Terakhir, pada kasus
ketiga kita peroleh data 0, 65, 60, 70, 40 dengan median 60. Contoh-contoh ini menun-
jukkan bahwa median tidak sensitif terhadap nilai ekstrem. Dengan kata lain, median
tidak terpengaruh oleh nilai yang sangat besar atau sangat kecil. Lihat Tabel 2.3 untuk
melihat perbandingan antara rata-rata dan median untuk contoh berat badan. Sifat penting
kedua adalah, median hanya dapat digunakan untuk data kuantitatif dan hanya terdapat
satu median untuk setiap kumpulan data (lihat Ott and Longnecker (2001)).

Modus. Modus merupakan nilai amatan yang paling sering muncul. Apabila amatan
memiliki dua modus, kumpulan data tersebut disebut bimodal. Lihat kembali contoh berat
badan 30 orang. Berdasarkan data ini diperoleh nilai yang paling sering muncul adalah
50.
Modus dapat digunakan untuk data kuantitatif dan kualitatif. Salah satu kelebihan
modus adalah bahwa modus tidak dipengaruhi oleh data ekstrem. Untuk tabel frekuensi
atau data dengan jumlah amatan kecil, modus dihitung dari kelas modal (modal class),
yaitu selang yang memiliki jumlah amatan terbesar.

Menggunakan Ukuran Kencenderungan Pusat. Suatu amatan yang berada jauh


dari pusat (outlying values) bernilai kecil, sebaran amatan dikatakan pencong ke kiri atau
pencong negatif; jika amatan yang berada jauh dari pustat bernilai besar, sebaran amatan
dikatakan pencong ke kanan atau pencong positif. Jika sebaran data memiliki bentuk yang
sama pada kedua sisi nilai tengah, sebaran dikatakan simetrik.
Untuk menentukan bentuk sebaran data dapat digunakan panduan berikut.
1. Jika rata-rata dan median sama, sebaran amatan adalah simetrik.

Mo
Md
Ra
TM

Gambar 2.1: Sebaran simetrik.

2. Jika rata-rata lebih besar daripada median, sebaran data akan pencong ke kanan.
3. Jika rata-rata lebih kecil daripada median, sebaran data akan pencong ke kiri.
BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 10

Mo Md Ra
TM

Gambar 2.2: Sebaran pencong ke kanan.

Ra Md Mo
TM

Gambar 2.3: Sebaran pencong ke kiri.

Ukuran Penyebaran
Pada subbagian sebelumnya kita telah membahas bagaimana ukuran kencederungan pusat.
Namun, kita juga tertarik bagaimana penyebaran atau variasi dari amatan kita. Bebe-
rapa statistik yang dapat digunakan untuk mengetahui penyebaran atau variasi dari amatan
tersebut antara lain: rentang, simpangan baku, koefisien variasi, peringkat persentil, dan
rentang antarkuartil.

Rentang. Rentang merupakan selisih antara amatan terbesar dan terkecil. Rentang
digunakan apabila penekanannya adalah nilai ekstrem. Untuk data berat badan 30 orang,
diperoleh rentang = 95 − 10 = 85. Sebagai catatan, meskipun rentang memberikan ide
tentang penyebaran data, namun nilainya dipengaruhi oleh pencilan (data dengan nilai
yang sangat besar atau sangat kecil).

Simpangan Baku. Simpangan baku merupakan ukuran penyebaran data di seki-


tar rata-rata. Logika di belakang statistik ini adalah kita memerlukan ukuran ”rata-rata”
penyebaran data di sekitar rata-rata. Dengan kata lain, simpangan baku hanya cocok di-
gunakan apabila data bersifat simetrik (lihat Veaux et al. (2008)). Secara matematis sim-
pangan baku didefinisikan sebagai akar positif dari varians. Varians sendiri didefinisikan
sebagai
1 ∑
𝑛
var(𝑥) = ̄ 2.
(𝑥𝑖 − 𝑥) (2.5)
𝑛 − 1 𝑖=1
BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 11

Mengakarkan (2.5) diperoleh simpangan baku, dinotasikan sd, sebagai




√ 1 ∑ 𝑛
sd(𝑥) = √ ̄ 2.
(𝑥 − 𝑥) (2.6)
𝑛 − 1 𝑖=1 𝑖

Simpangan baku digunakan apabila rata-rata digunakan. Artinya, digunakan dengan data
numerik simetrik. Sebagai contoh, lihat kembali data berat badan 30 orang di atas. Varians
nilai ulangan ini dapat dihitung sebagai berikut
1
var(𝑥) = ((20 − 58,07)2 + (30 − 58,07)2 ) + ⋯ + (48 − 58,07)2 )
29
= 501,7195. (2.7)

Selanjutnya mengakarkan persamaan (2.7) diperoleh simpangan baku



sd(𝑥) = 501,7195 = 22,3991 ≈ 22,4.

Aturan-aturan berikut dapat digunakan untuk membantu kita dalam menggunakan


simpangan baku:
1. Bagaimanapun amatan menyebar setidaknya 75% berada pada 𝑥̄ ± 2 × sd(𝑥).
2. Apabila data berbentuk seperti lonceng (bell-shaped)
a) 67% amatan terletak di antara 𝑥̄ ± sd(𝑥),
b) 95% amatan terletak di antara 𝑥̄ ± 2 × sd(𝑥),
c) 99,7% amatan terletak di antara 𝑥̄ ± 3 × sd(𝑥).
Kalau kita lihat kembali data berat badan 30 orang di atas dihitung bahwa setidaknya 75%
berat orang berada pada 58,07 ± 2 × 22,4 = 58,07 ± 44,8.
Sebagai catatan, apabila semua amatan memiliki nilai yang sama, maka simpangan
baku sampel akan bernilai nol. Hal ini berarti tidak ada variabilitas di dalam data.

Koefisien Variasi. Koefisien variasi CV merupakan ukuran penyebaran relatif dalam


data. Koefisien ini didefinisikan sebagai simpangan baku dibagi rata-rata dikalikan 100%.
Hal ini menghasilkan ukuran variasi relatif, yakni variasi yang relatif terhadap ukuran
rata-rata. Formula koefisien variasi adalah
sd(𝑥)
CV(𝑥) = 100%. (2.8)
𝑥̄
Koefisien variasi dapat digunakan untuk membandingkan sebaran data yang diukur
pada skala yang berbeda. Secara matematis koefisien variasi tidak memiliki unit karena
simpangan baku dan rata-rata memiliki unit yang sama sehingga saling meniadakan. Se-
bagai contoh berikut ini adalah berat badan 30 orang Asia.
Untuk data berat badan 30 orang Asia ini diperoleh rata-rata 51,03333 dan simpangan
baku 21,61494. Dengan demikian, koefisien variasinya adalah
21,61494
CV(berat orang Asia) = × 100% = 42,35456%.
51,03333
BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 12

Tabel 2.3: Berat badan 30 orang Asia

40 50 40 40 45 50 65 60 70 80
20 85 75 25 33 25 50 80 65 30
10 75 25 30 75 55 77 78 30 48

Apabila dibandingkan dengan koefisien variasi berat badan 30 orang yakni


22,3991
CV(berat orang Eropa) = × 100% = 38,57479%.
58,06667
Berdasarkan nilai koefisien variasi di atas dapat dilihat bahwa CV berat Asia lebih
besar dibandingkan CV berat orang Eropa. Dengan demikian, berat orang Aisa memiliki
variabilitas yang lebih banyak dibandingkan berat badan 30 orang Eropa.

Persentil. Persentil merupakan persentasi sebaran data yang sama atau lebih kecil
dari suatu nilai tertentu. Lebih jelasnya, persentil ke-p adalah suatu amatan yang diurut
sedemikian hingga 𝑝% dari amatan di bawah dan paling banyak (100 − 𝑝)% di atasnya.
Sebagai contoh persentil ke-75 berat badan adalah 80. Hal ini berarti bahwa 75% berat
badan adalah 80 atau kurang, dan hanya 25% yang beratnya di atas 80.

Rentang Antarkuartil. Ukuran variasi yang menggunakan persentil adalah rentang


antar kuartil yang didefinisikan sebagai selisih dari persentil ke-75 (disebut juga kuartil
ketiga) dan ke-25 (disebut juga kuartil kepertama). Rentang antarkuartil ini digunakan
untuk mendeskripsikan 50% amatan tengah, terlepas dari apapun bentuk sebaran data.
Secara matematis rentang antar kuartil IQR didefinisikan sebagai

IQR = 𝑄3 − 𝑄1

dengan 𝑄3 adalah kuartil ketiga (atau persentil ke-75) dan 𝑄1 adalah kuartil kepertama
(atau persentil ke-25). Sebagai contoh kuantil ke-75 berat 30 orang di atas adalah 76,50
dan kuantil ke-25 ulangan adalah 41,25. Hal ini berarti 50% berat orang berada antara
41,25 dan 76,50. Dengan kata lain, nilai tengah 50% berat orang menyebar pada rentang
35,25 nilai.
Secara garis besar persentil dan rentang antar kuartil digunakan berdasarkan kondisi
berikut. Pertama, pada saat median digunakan (data numerik pencong atau data ordinal).
Kemudian apabila rata-rata digunakan, tetapi tujuannya adalah membandingkan amatan
individual.
Hal yang perlu diperhatikan adalah apabila data terpusat pada median, rentang an-
tarkuantil dapat memberikan informasi yang keliru. Misalkan berat badan 10 orang adalah
20, 50, 50, 50, 50, 50, 50, 50, 50, dan 80. Kuartil ketiga dan kuartil kepertama berturut-
turut adalah 50. Dengan demikian rentang antarkuartil IQR = 0. Nilai 0 ini seharusnya
menunjukkan bahwa amatan terdiri dari nilai yang identik, yang tentu saja tidak demikian
dengan kesepuluh nilai berat orang tersebut.

You might also like