Professional Documents
Culture Documents
1
BAB 1. KONSEP DASAR STATISTIKA 2
b) Jika hipotesis ditolak kita kembali ke langkah 2. Jika hipotesis diterima, tidak-
lah berarti itu benar. Hanya saja berdasarkan pengetahuan yang ada sekarang
itu dianggap benar.
c) Hipotesis secara konstan diperbaiki (refined) dan diuji seiring dengan bertam-
bahnya pengetahuan.
Dalam metode ilmiah kita menggunakan inferensi induktif dan tidak pernah membuk-
tikan sesuatu dengan kepastian absolut (absolute certainty). Metode ilmiah memberikan
cara objektif dalam memformulasikan ide-ide baru dan memeriksakan ide-ide ini dengan
data sesungguhnya dan mengerucutkan kembali penemuan-penemuan ini. Sebagai contoh
misalkan Anda melakukan penelitian terhadap 20 orang pasien penyakit tertentu. Dalam
upaya untuk merampatkan (to generalize) hasil berdasarkan sampel dari 20 pasien ini,
Anda mungkin bertanya sebagai berikut.
1. Jika 20 orang pasien baru diperiksa apakah hasilnya sama dengan studi pada 20
pasien pertama?
2. Jika lab berbeda menganalisis sampel darah apakah hasilnya akan serupa?
3. Jika sampel darah disimpan pada suhu berbeda apakah hasilnya akan sama?
1. Statistik (tanpa ”a”) adalah pendugaan dari kuantitas numerik yang tidak diketahui,
seperti rata-rata, median, atau modus. Contoh rata-rata tinggi mahasiswa Jurusan
Farmasi adalah 165 cm.
1. Membuat keputusan yang benar berdasarkan kepada data yang dimiliki, tahu data
berasal dari mana dan bagaimana data itu diperoleh, juga harus tahu apakah data
yang diperoleh secara statistika syah.
3. Anda tahu kapan dan untuk tujuan apa seorang statistikawan diperlukan konsul-
tasinya.
Setelah data dikumpulkan dan disiapkan untuk analisis seorang statistikawan dapat:
Apabila nilai-nilai variabel kuantitatif ini hanya bernilai bulat atau nilai dalam jumlah
kecil, kita katakan ”diskret” atau ”diskontinu”. Urutan dan magnitud memegang peranan
penting dalam variabel diskrit, dan nilainya terbatas pada bilangan bulat saja. Dengan
kata lain data diskret ini biasanya dilakukan dengan menghitung. Sebagai contoh data
mahasiswa per jurusan di Universitas Udayana.
Seringkali nilai variabel tidak terbatas pada nilai tertentu. Sebagai contoh kita men-
gukur berat badan seseorang misalnya 60kg. Variabel seperti ini dikatakan kontinu. Me-
ngingat kita melakukan pengukuran terhadap semua nilai pecahan (fractional) di dalam
suatu selang maka nilai ini berada dalam skala interval (interval scale).
Variabel kuantitatif diskret dan kontinu kadang tumpang tindih, namun hal ini tidaklah
signifikan karena data dapat dideskripsikan dengan statistik yang sama seperti median.
Menurut Nick (2007) rasio hanya dapat diambil apabila variabel kuantitatif memiliki titik
nol yang tidak sembarang (nonarbitrary zero point). Sebagai contoh skala temperatur
Celcius adalah skala relatif dan bukan ukuran skala rasio. Misalnya 50◦ C tidaklah dua
kali lipat 25◦ C. Namun, skala Kelvin adalah skala absolut sehingga kita dapat mengatakan
50K adalah dua kali panas 25K.
dikontrol oleh peneliti untuk memahami varisi yang teramati pada variabel respons. Vari-
abel bebas dan tak bebas dapat berupa kuantitatif atau kualitatif.
1.5 Latihan
1. Jika Anda akan melakukan suatu penelitian apakah suatu tanaman dapat menjadi
obat atau tidak apa langkah-langkah yang akan dilakukan?
3. Fahrenheit termasuk ke dalam skala interval. Misalkan dalam suatu percobaan un-
tuk mengetahui kadar suatu zat tertentu A mengukur zat tersebut pada 40◦ F dan
50◦ F, tetapi B mengukur zat tersebut pada 35◦ F dan 45◦ F. Apakah selisih penguku-
ran suhu yang dilakukan A dan B sama?
Bab ini1 membahas beberapa ukuran statistik untuk data yaitu ukuran pemusatan, ukuran
penyebaran, dan ukuran bentuk. Pembahasan diawali dengan pemberian definisi tentang
populasi dan sampel.
6
BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 7
𝑥 + 𝑥2 + ⋯ + 𝑥𝑛 1 ∑
𝑛
𝑥̄ = 1 = 𝑥, (2.1)
𝑛 𝑛 𝑖=1 𝑖
∑
dengan (dibaca sigma) berarti menjumlahkan, 𝑥 menyatakan amatan individual, dan 𝑛
banyak amatan. Rata-rata digunakan untuk pada saat bilangan dapat dijumlahkan yakni
karakteristik diukur pada skala numerik, bukan pada skala ordinal. Hanya terdapat satu
rata-rata untuk setiap kumpulan data.
Sebagai contoh berikut ini adalah data berat badan 30 orang Eropa. Berdasarkan data
berat badan ini dapat kita hitung rata-rata berat badan sebagai berikut:
20 + 30 + ⋯ + 48 1742
𝑥̄ = = = 58,06667 ≈ 58,07. (2.2)
30 30
Hal yang perlu dicatat adalah bahwa rata-rata bersifat sensitif terhadap nilai ekstrem,
terutama jika ukuran amatan cukup kecil. Misalkan berat badan 5 orang (dalam kg) adalah
sebagai berikut: 50, 65, 60, 70, 40. Nilai rata-rata berat badan kelima orang ini adalah 57.
BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 8
20 30 35 40 45 50 65 60 70 80
90 85 75 25 33 36 50 80 65 10
95 75 65 55 75 80 77 78 50 48
Namun, jika salah satu orang nilainya 100, data menjadi 50, 65, 60, 70, 100, rata-rata
berubah menjadi 69. Pada kasus yang lebih ekstrem salah satu berat badan adalah 10,
sehingga data menjadi 10, 65, 60, 70, 40, rata-rata berubah menjadi 49. Contoh-contoh
tersebut menunjukkan bahwa rata-rata bersifat sensitif terhadap nilai ekstrem.
Salah satu cara untuk mengatasi sensitifas rata-rata terhadap nilai ekstrem adalah de-
ngan rata-rata terpangkas (trimmed mean). Rata-rata terpangkas ini dihitung dengan ter-
lebih dahulu mengurutkan data dari nilai terkecil ke terbesar, kemudian menghapus ni-
lai terpilih pada masing-masing ujung data terurut, dan kemudiang merata-ratakan nilai
sisanya. Persentase pemangkasan dihitung sebagai berikut (lihat (Peck et al., 2008)):
banyaknya data yang dihapus pada setiap sisi
persentase pemangkasan = × 100. (2.3)
𝑛
Sebagai contoh untuk terdapat data 0, 50, 65, 60, 70, 100. Apabila dua amatan ekstrem,
0 dan 100, dihilangkan kita akan memperoleh persentase rata-rata terpangkas
2
× 100 = 33,33%.
6
Sehingga kita peroleh rata-rata terpangkas 33,33% sebagai berikut:
50 + 65 + 60 + 70
rata-rata terpangkas 33,33% = = 61,25.
4
Median. Median merupakan amatan di tengah, yakni separuh amatan lebih kecil (di
bawah) dan separuh lagi lebih besar (di atas). Median dihitung sebagai berikut.
2. Hitung nilai tengah amatan. Median merupakan nilai tengah untuk jumlah amatan
ganjil; sebaliknya, jika nilai amatan genap didefinisikan sebagai rata-rata dari dua
nilai tengah untuk amatan genap.
Sebagai contoh, untuk data berat badan 30 orang di atas diperoleh median 62,5 yang diper-
oleh dari rata-rata dua nilai tengah yakni amatan ke-15 dan ke-16, yakni
60 + 65
median = = 62,5. (2.4)
2
Ada beberapa hal yang perlu dicatat untuk median. Pertama, median bersifat kurang
sensitif terhadap nilai ekstrem jika dibandingkan dengan nilai rata-rata. Dengan kata lain,
median dapat digunakan untuk data yang amatannya menyebar pencong atau condong. Li-
hat kembali contoh nilai berat badan di atas. Pada kasus pertama data berat badan adalah
50, 65, 60, 70, 40. Median berat badan pada kasus pertama adalah 60. Kemudian, pada
BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 9
Tabel 2.2: Perbandingan rata-rata dan median berat badan lima orang
kasus kedua diperoleh data 50, 65, 60, 70, 100 dengan median 65. Terakhir, pada kasus
ketiga kita peroleh data 0, 65, 60, 70, 40 dengan median 60. Contoh-contoh ini menun-
jukkan bahwa median tidak sensitif terhadap nilai ekstrem. Dengan kata lain, median
tidak terpengaruh oleh nilai yang sangat besar atau sangat kecil. Lihat Tabel 2.3 untuk
melihat perbandingan antara rata-rata dan median untuk contoh berat badan. Sifat penting
kedua adalah, median hanya dapat digunakan untuk data kuantitatif dan hanya terdapat
satu median untuk setiap kumpulan data (lihat Ott and Longnecker (2001)).
Modus. Modus merupakan nilai amatan yang paling sering muncul. Apabila amatan
memiliki dua modus, kumpulan data tersebut disebut bimodal. Lihat kembali contoh berat
badan 30 orang. Berdasarkan data ini diperoleh nilai yang paling sering muncul adalah
50.
Modus dapat digunakan untuk data kuantitatif dan kualitatif. Salah satu kelebihan
modus adalah bahwa modus tidak dipengaruhi oleh data ekstrem. Untuk tabel frekuensi
atau data dengan jumlah amatan kecil, modus dihitung dari kelas modal (modal class),
yaitu selang yang memiliki jumlah amatan terbesar.
Mo
Md
Ra
TM
2. Jika rata-rata lebih besar daripada median, sebaran data akan pencong ke kanan.
3. Jika rata-rata lebih kecil daripada median, sebaran data akan pencong ke kiri.
BAB 2. UKURAN-UKURAN STATISTIK UNTUK DATA 10
Mo Md Ra
TM
Ra Md Mo
TM
Ukuran Penyebaran
Pada subbagian sebelumnya kita telah membahas bagaimana ukuran kencederungan pusat.
Namun, kita juga tertarik bagaimana penyebaran atau variasi dari amatan kita. Bebe-
rapa statistik yang dapat digunakan untuk mengetahui penyebaran atau variasi dari amatan
tersebut antara lain: rentang, simpangan baku, koefisien variasi, peringkat persentil, dan
rentang antarkuartil.
Rentang. Rentang merupakan selisih antara amatan terbesar dan terkecil. Rentang
digunakan apabila penekanannya adalah nilai ekstrem. Untuk data berat badan 30 orang,
diperoleh rentang = 95 − 10 = 85. Sebagai catatan, meskipun rentang memberikan ide
tentang penyebaran data, namun nilainya dipengaruhi oleh pencilan (data dengan nilai
yang sangat besar atau sangat kecil).
Simpangan baku digunakan apabila rata-rata digunakan. Artinya, digunakan dengan data
numerik simetrik. Sebagai contoh, lihat kembali data berat badan 30 orang di atas. Varians
nilai ulangan ini dapat dihitung sebagai berikut
1
var(𝑥) = ((20 − 58,07)2 + (30 − 58,07)2 ) + ⋯ + (48 − 58,07)2 )
29
= 501,7195. (2.7)
40 50 40 40 45 50 65 60 70 80
20 85 75 25 33 25 50 80 65 30
10 75 25 30 75 55 77 78 30 48
Persentil. Persentil merupakan persentasi sebaran data yang sama atau lebih kecil
dari suatu nilai tertentu. Lebih jelasnya, persentil ke-p adalah suatu amatan yang diurut
sedemikian hingga 𝑝% dari amatan di bawah dan paling banyak (100 − 𝑝)% di atasnya.
Sebagai contoh persentil ke-75 berat badan adalah 80. Hal ini berarti bahwa 75% berat
badan adalah 80 atau kurang, dan hanya 25% yang beratnya di atas 80.
IQR = 𝑄3 − 𝑄1
dengan 𝑄3 adalah kuartil ketiga (atau persentil ke-75) dan 𝑄1 adalah kuartil kepertama
(atau persentil ke-25). Sebagai contoh kuantil ke-75 berat 30 orang di atas adalah 76,50
dan kuantil ke-25 ulangan adalah 41,25. Hal ini berarti 50% berat orang berada antara
41,25 dan 76,50. Dengan kata lain, nilai tengah 50% berat orang menyebar pada rentang
35,25 nilai.
Secara garis besar persentil dan rentang antar kuartil digunakan berdasarkan kondisi
berikut. Pertama, pada saat median digunakan (data numerik pencong atau data ordinal).
Kemudian apabila rata-rata digunakan, tetapi tujuannya adalah membandingkan amatan
individual.
Hal yang perlu diperhatikan adalah apabila data terpusat pada median, rentang an-
tarkuantil dapat memberikan informasi yang keliru. Misalkan berat badan 10 orang adalah
20, 50, 50, 50, 50, 50, 50, 50, 50, dan 80. Kuartil ketiga dan kuartil kepertama berturut-
turut adalah 50. Dengan demikian rentang antarkuartil IQR = 0. Nilai 0 ini seharusnya
menunjukkan bahwa amatan terdiri dari nilai yang identik, yang tentu saja tidak demikian
dengan kesepuluh nilai berat orang tersebut.