Professional Documents
Culture Documents
69
K-KARE VE KOLMOGOROV SMRNOV UYGUNLUK TESTLERNN SMULASYON LE ELDE EDLEN VERLER ZERNDE KARILATIRILMASI
H. BRCAN, Y. KARAGZ ve Y. KASAPOLU Cumhuriyet niversitesi, BF, letme Blm
zet Bu almada uygunluk testi olarak Ki-Kare ve Kolmogorov-Simirnov testleri zerinde durulmutur. Simulasyon ile elde edilen bir ana ktleden alnan 20 rnek zerinde hem Ki-Kare hem de Kolmogrov-Simirnov uygunluk testleri yaplmtr. Her iki testten elde edilen P deerleri arasnda nemli bir fark olmad, t testi ile aratrlmtr. Anahtar Kelimeler: Ki-Kare, Kolmogorov-Smirnov Testi, Simlasyon Abstract The Comparation of Goodness-of-fit Tests of Chi-Square and Kolmogorov Simirnov with Data Obtained by Simulation In this study, tests of Chi-Square and Kolmogorov-Simirnov have been given. Either Chi-Square or Kolmogorov-Simirnov tests is applied on 20 example. This examples are taken from an population which is produced with simulation. To find whether there is important difference between P values from these two tests t test carried out. Keywords: Chi-Sguare, Tests of Kolmogorov-Smirnov, Simulation
GR Modern istatistiin temel konusu olan tahmin teorisi; anaktle parametrelerinin tahmini ve hipotezlerin test edilmesi ile ilgilenmektedir. Hipotez testleri, parametrik ve nonparametrik testler olmak zere, iki grupta toplanabilir. Gerekli varsaymlarn geerli olmad durumlarda, parametrik teknikler byk lde gvenilirliklerini kaybederler. Bu gibi durumlarda, nonprametrik teknikler devreye girer. Bilindii gibi anaktle parametreleri tesadfi seimle alnacak rnek istatistikleri ile tahmin edilir. rnekleme dalm bilindii zaman, herhangi bir tahminin gerek parametreye olan yaknl belirli bir ihtimalle belirtilebilir. Bylece tahmin deeri ile gerek parametre arasndaki farkllk ihtimal ile llm olur. Tahminde ana ama, gerek parametre ile tahmin edilen parametre arasndaki fark asgari seviyede tutabilmek ve bu hatann mutlak baz sebeplerden mi, yoksa tesadfi sebeplerden mi meydana geldiini belirlemektir. Bu sebeplerden dolay karara varabilmemiz iin hipotez testleri kullanlr.
70
Bu almada, temel ama; parametrik ve nonparametrik testlere birer rnek olarak, Ki-Kare ve Kolmogorov-Simirnov teknikleri karlatrlacaktr. Yani tesadfi say anaktlesinden alnan ok saydaki ans rnekleri zerine Ki-Kare uygunluk testi ile Kolmogorov-Simirnov tek rnek testi ayr ayr uygulanarak, rneklerdeki zelliin anaktle zelliini yanstp yanstmadn her iki test ile belirlemektir. Ayrca test istatistiklerine baklarak nem seviyeleri test edilip hangi test iin nem seviyesinin daha byk olduunu aratrmak ve bylece testler hakknda bir karlatrma yapabilmektir. 1. PARAMETRK VE NONPARAMETRK TESTLERN AVANTAJ VE DEZAVANTAJLARI Birbirine alternatif olan hipotez testlerinden hangisinin kullanlmasnn daha uygun olacana eitli kriterlere gre karar verilir. Bu kriterler (Ik 1995,46) testin kuvveti, testin dayand istatistiki modelin aratrma verilerine uygulanabilirlii ve kuvvet yetkinliidir. Bir nonparametrik testin ak bir avantaj, anaktle hakknda hibir ey bilinmedii zaman gvenle kullanlabilir olmasdr. Mesel, rnek hacmi yle kk olur ki, istatistiklerin rnekleme dalm normal dalma yaklamaz. Bu durumda nonparametrik bir teknie ihtiya duyulur. Nonparametrik testin dier nemli bir avantaj ise, nominal ve ordinal verilerle yaplabilir olmasdr. Halbuki parametrik testler daha yksek seviyedeki verilere ihtiya duyar. Ayrca, nonparametrik testler parametrik testlere nisbeten daha kolay ve pratiktir. Nonparametrik testlerin dezavantajlar da vardr. Mesel, ayn artlar altndaki parametrik testlerden daha az gldr. Yani, II. Tip bir hata ihtimali nonparametrik testte daha byktr. Buna ilaveten, ounlukla, gzlenen deerler arasndaki farkn byklndense sadece yn ile ilgilenir. Yani, gzlenen deerin belli bir deerden byk veya kk olup olmadna bakar, ne kadar byk veya kk olduu ile pek ilgilenmez. Bu sebeple nonparametrik testin etkinlii parametrik teste gre daha azdr. Ancak rnek hacmi arttrlmak suretiyle nonparametrik bir testin gc ve etkinlii parametrik test seviyesine karlabilir. (Kartal 1998,143). 2. Ki-Kare VE KOLMOGOROV SMRNOV UYGUNLUK TESTLER 2.1. K-KARE DAILIMI KiKare dalm ilk olarak 1900l yllarda Pearson tarafndan ortaya atlmtr(Ayta 1999: 317). Ki-Kare dalm olduka yaygn olarak ve bir ok maksatla kullanlan bir dalmdr. ou aratrmada eitli kategorilere giren deneklerin, nesnelerin veya cevaplarn says ile ilgilenilir. Mesel, bir grup insan belli bir anketin sorularna verdikleri cevaplara gre snflandrlabilirler. Aratrmac belli bir tip cevabn dierlerine kyasla daha sk ortaya kp kmayacan belirlemek isteyebilir. Bu
71
gibi durumlarda ve zellikle de saymla belirlenen kalitatif zelliklerle ilgili testlerde daha ziyade Ki-Kare testi kullanlr. Ki-Kare dalm; uygunluk, bamszlk, varyans, homojenlik ve baml gruplarn testinde olduka sk kullanlr (Kartal 1998: 103-138). KiKare; aritmetik ortalamas sfr ve varyans bir olan normal blnmeli bir anaktleden herbiri dierinden bamsz olarak seilen n birimli bir rnekleme ait deerlerin karelerinin toplam demektir (Ayta 1998: 317-318). Yani, Z i , i = 1 , ..., n olmak zere, n tane bamsz standart normal dalm iin
2 Z1 , Z 2 , ... , Z 2 toplam ile, n serbestlik dereceli Ki-Kare dalm elde edilir. Yani, 2 n
2 Z i2 n
i =1
olur ( Hasgr 2000: 277; Ross1989:491; Dagpunar1988: 128-129; Bratley-FoxSchrage 1987:174-175; Sobol 1984; 81-82; Leemis 1986 143-144 ). KiKare; iki veya daha fazla veri seti arasnda nemli farkn olup olmadn belirlemede aratrmacnn kullanabilecei bir istatistiki analiz yntemidir (Tokol 1996,72). Bu yntemde gzlenen deerler ile beklenen deerler kyaslanr. 2.2. K-KARE UYGUNLUK TEST Uygunluk testi belli bir hipoteze uygunluk ve ihtimal dalmlarna uygunluk testi olarak iki ksmda incelenmektedir. Bu almada belirli bir hipoteze uygunluk testi zerinde durulacaktr Belirli bir hipoteze uygunluk testinde; gzlenen frekanslarn (oi ) , belli bir hipoteze gre elde edilen beklenen frekanslara (ei ) uygun olup olmad aratrlr. N birimlik veri, r kategoriden olumak zere, bu testin safhalar aadaki gibi olur. 1-Hipotezler:
(Gzlenen
72
(o i e i ) 2 = ei i =1
2 r
Grld gibi o i lerin e i lere yaklamas durumunda 2 istatistii sfra yaklaacaktr. 3-Karar Modeli ve Karar Ki-Kare uygunluk testi sa kuyruk testidir. nk, o i e i farklarnn kareleri alnarak 2 test istatistii hesaplanr. Fark bydke, farklarn kareleri pozitif ynde sonsuza doru byr. Bylece red blgesi daima dalmn sa kuyruunda olur. Buna gre karar modeli aada gsterilmitir.
H0 Kabul (Uygun)
K.D
Kritik deer (K.D), nem seviyesi ve s.d = r - - m serbestlik derecesine gre hazrlanm 2 kritik deerler tablosundan belirlenir. Burada m tahmin edilen parametre saysdr. rnek olarak; normal dalm iin tahmin edilen parametreler ve olduundan m = 2 alnr (AkyolGrbz 2002: 24). Bu sebeple, kritik deer,
2 K.D. = ; r -1- m
deerlerin birbirine ( o i lerin e i lere ) uygun olduuna, grlen farklln nemsiz olduuna nem seviyesinde karar verilir.
73
deerlerin birbirine ( o i lerin e i lere ) uygun olmadna nem seviyesinde karar verilir. Testten daha gvenilir sonu almak iin u iki durum dikkate alnmaldr (Kartal 1998,106). 1) ki kategori varsa her bir beklenen frekans 10 veya daha byk olmaldr. 2) Kategori says ikiden fazla ise (r > 2) herbir beklenen frekans be veya daha byk olmaldr. KiKare testi yaparken, ok sk yaplan yanl kullanma hatalarndan birisi kk beklenen frekanslarla allmasdr. Kk bir beklenen frekansn 2 ye katks byk olacaktr. e i kldke 2 byyecektir. Bu durum H 0 hipotezinin reddedilmesi ihtimalini arttrr. 3. KOLMOGOROV-SMRNOV TEST
74
n=
2 z / 2 2
d2
forml kullanlarak, %95 gven ve %5 lik hata pay iin yaklak 100 birim olarak belirlenmi (Yldz ve dierleri 2002, 140) ve tesadfi seimle anaktleden 20 adet rnek alnmtr. Teste konu olacak zellik olarak ift saylarn dalma oranlar alnmtr. Buna gre sonu 0, 2, 4, 6, 8 ile biten saylar test iin kullanlm ve bylece 1000 birimlik anaktledeki 479 adet ift say testlerde kullanacamz anaktleyi oluturmutur. Ayn ekilde herbir rnekteki ift saylar da gerek rnekleri oluturmutur. Bu nedenle herbir rnein bykl 100 deil de, ihtiva ettii ift saylarn says kadar olmutur. Testlerde kullanlacak olan kategoriler ise 0, 2, 4, 6, 8 ile gsterilecek olan 5 kategoridir.
75
Anaktle de sonu 0, 2, 4, 6, 8 ile biten saylarn oranlar kategoriler itibariyle dalma oranlarn oluturmaktadr. Buna gre anaktle dalm Tablo 1de gsterilmitir.
Tablo 1 Anaktle Dalm
Kategori 0 2 4 6 8 Toplam
f Nisbi frekans Yzde (%) 91 0.19 19 101 0.21 21 91 0.19 19 101 0.21 21 95 0.20 20 479 1.00 100
Nisbi frekans stunundaki deerler dalma oranlarn gstermektedir. rneklerdeki dalma oranlarnn bu oranlara uygunluk gsterip gstermedii hem Ki-Kare hem de Kolmogorov-Simirnov testi ile aratrlacaktr. Verilerin analizi SPSS paket program kullanlarak yaplmtr.
Ki-Kare Uygunluk Testi Uygulamas
20 rnein her biri iin 0,2,4,6,8 kategorilerine ait gzlem deerleri Tablo 2de oluturulmutur.
Tablo 2. 20 rnee Ait Gzlem Deerleri
Kademe 1 0 2 4 6 8 8 13 10 13 13 2 9 11 9 11 12 3 4 5 9 11 13 11 10 54 6 11 9 11 8 10 49 7 8 15 8 14 8 53 8 10 9 12 8 8 47 9 8 10 14 14 11 57 19 7 10 8 15 9 49 11 10 9 15 15 6 55 12 11 13 10 11 12 57 13 12 12 9 8 13 54 14 7 8 9 10 12 46 15 8 9 8 10 14 49 16 17 18 8 9 15 12 7 51 19 20 9 14 14 15 10 7 10 7 7 11 50 54
8 8 15 10 9 6 12 12 9 15
11 9 8 11 9 16 11 9 8 9 47 44
Toplam 57 52 53 51
Ki-Kare dala gre bu gzlenen deerlere karlk gelen beklenen deerler, Tablo 1de verilen ana ktle oranlarna gre Tablo2de verilmitir.
76
10
8.74 9.31 8.93 9.66 10.29 9.87 8.74 9.31 8.93 9.66 10.29 9.87 9.20 9.80 9.40 46 49 47
8.36 9.69 9.5 10.26 9.24 10.71 10.5 11.34 8.36 9.69 9.5 10.26 9.24 10.71 10.5 11.34 8.80 10.20 10.0 10.80 44 51 50 54
(o i e i ) 2 = ei i =1
forml kullanlarak, 2 hesap deerleri elde edilir. Test istatistiinde hesaplanan 2 2 deeri ile kritik ; r -1-m deeri, karar modeline gre mukayese edilerek karar verilir. 1. rnek iin 2 hesap deeri aadaki ekilde bulunur.
2 =
bu deer 4 SDli 2 dalnda P=0.8658 ihtimaline eittir. Bu deer 0.05 ihtimal seviyesinden byk olduundan Ho hipotezi kabul edilir. Yani gzlenen deerler ile beklenen deerler arasnda istatistiki olarak bir fark yoktur. Dier rnekler iinde benzer ilemler yaplarak 2 hesap deerleri ve ihtimal deerleri Tablo 5de verilmitir.
Kolmogorov-Simirnov Tek rnek Testi Uygulamas
1. rnee ait veriler iin Kolmogorov-Simirnov tek rnek testi uygulamas Tablo 4de verilmitir.
77
Kategori oi Nispi oi
0 2 4 6 8 Toplam statistik
F0
ei
10.9 11.9 10.9 11.9 11.4 57
Nispi ei
10.9/57=0.19 11.9/57=0.21 10.9/57=0.19 11.9/57=0.21 11.4/57=0.20 1
Fe
0.19 0.40 0.59 0.80 1.00
|F0-Fe|
0.05 0.03 0.06 0.03 0.00
8 8/57=0.14 0.14 13 13/57=0.23 0.37 10 10/57=0.17 0.57 13 13/57=0.23 0.77 13 13/57=0.23 1.00 57 1 D=Max|F0-Fe|=0.06
P=0.5877
Test istatistii D=0.06 kritik deer P=0.5877 deerinden kk olduundan beklenen deerler ile gzlenen deerler arasnda bir fark yoktur. Dier rneklere ait D test istatistikleri ve ihtimal deerleri Tablo 5de verilmitir.
3.3. UYGULAMA SONULARININ KARILATIRILMASI
20 rnek iin yaplan testlerde hem Ki-Kare hem de Kolmogorov-Simirnov testi iin P>0.05 bulunmutur. Bu sonular toplu olarak Tablo 5de sunulmutur.
Tablo 5 rnek in Ki-Kare ve Kolmogorov-Simirnov Test Sonular
rnek No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Ki-Kare(2) Test istatistii P 1.2738 0.8658 0 .4116 0 .9815 2.1944 0.7001 4.1612 0 .3846 0.9661 0.9149 1.2890 0 .8632 3.5745 0 .4666 1.8231 0.7682 2.3499 0.6717 2.9869 0.5600 5.8667 0.2093 0.2651 0.9920 1.9201 0.7504 1.5035 0.8260 2.3386 0.6738 1.1726 0.8826 1.0612 0.9004 4.6369 0.3266 2.1431 0.7095 5.2451 0.2631 Kolmogorov-Simirnov Test istatistii P 0.06 0.7591 0.04 0.5877 0.04 0.5727 0.12 0.9883 0.03 0.8692 0.04 0.5727 0.05 09883 0.07 0.4005 0.08 0.2092 0.08 0.9619 0.10 0.4005 0.02 0.4005 0.04 0.4005 0.07 0.2740 0.09 0.7982 0.04 0.4005 0.05 0.0546 0.07 0.8956 0.07 0.2470 0.14 0.6529
78
Bu sonulara gre rnekler, anaktledeki dalma oranlarn yanstmaktadr. Ancak Ki-Kare testi ile Kolmogorov-Simirnov testi iin P deerleri arasnda farkllklar grlmektedir. Bu farklarn nemli olup olmadn belirlenmesi gerekir. Eer fark nemli karsa, testlerin gleri arasnda da farkllk oluu sylenebilir. Bunu belirlemek amacyla bu 20 rnee ait P deerlerine elenik ift rnek testi uygulanacaktr. Bu durumda testin safhalar yle olur.
1-Hipotezler
H0: D=0 (Ki-Kare uygunluk testi P deerleri ile Kolmogorov-Simirnov tek rnek testi P deerleri arasnda fark yoktur, fark nemsizdir.) H1: D0 ( P deerleri farkldr, fark nemlidir.)
2-Test statistii,
t=
D SD n
0.11382 0.4367 20
= 1.1656
SD =
=0,05 ve s.d=20-1=19 olup ift ynl test iin kritik deer (K.D)= 2,093 dir.
Karar: kan t deeri H0 n kabul blgesine dtnden H0 kabul edilir. Yani P deerleri arasndaki farkn nemli olmadna karar verilir. Ki-Kare uygunluk testi ve Kolmogorov-Simirnov test P deerleri arasnda bir farkllk olmad %5 nem seviyesinde sylenebilir. Bu durumda testlerin gleri arasnda da nemli bir farkllk olmad anlalmaktadr.
79
SONU
Gzlenen ve beklenen frekanslarn aralarnda nemli bir farkllk olup olmadnn testinde, yani uygunluk testinde ok yaygn olarak kullanlan Ki-Kare testi gzlenen frekanslarn 5 den kk olmas durumunda gvenilir sonu vermemektedir. Ancak Ki-Kare uygunluk testine bir alternatif olan KolmogorovSimirnov tek rnek testi iin byle bir snrlama sz konusu deildir. Fakat snrlamalarn kalkmas durumunda testin gcnn azalmas, baka bir ifade ile gvenilirliinin azalmas sz konusu olur. Bu bakmdan herhangi bir snrlamas olmayan ve daha basit ilemleri gerektiren Kolmogorov-Simirnov testi eer KiKare testinden g bakmndan nemli derecede farkl deilse, uygunluk testlerinde tercih sebebi olabilirler. te bu amala bu almada, her iki test de aklandktan sonra simulasyon ile elde edilen bir anaktleden rastgele alnan 20 rnek iin hem Ki-Kare testi ile hem de Kolmogorov-Simirnov testi ile uygunluk testleri yaplmtr. Bu testler sonucunda P deerleri arasnda nemli bir farkllk olup olmad, elenik ift rnekler durumuna gre t testi ile aratrlmtr. t testi sonucunda =0,05 nem seviyesinde nemli bir farkllk olmad sonucuna varlmtr. Sonu olarak, Ki-Kare uygunluk testi ile Kolmogorov-Simirnov tek rnek testlerinin aralarnda nemli bir farkllk olmad, kk rnekler iin Ki-Kare
80
uygunluk testi yerine kullanm daha kolay ve n arta bal olmayan KolmogorovSimirnov testinin kullanlabilecei sylenebilir.
Kaynaka
Akyol, Mehmet ve Fikret Grbz (2002), Ynl Tablolarda 2 statistiinin Kullanlmas, statistik Aratrma Dergisi DE Yaynlar, Nisan 2002, Cilt:1, No:1, 23-27 Ayta, Mustafa (1998), Matematiksel statistik, Uluda niversitesi Basmevi, Bursa. Bratley, Paul, Bennett L. Fox and Linus E. Schrage (1987), A Guide to Simulasyon, Springer. Dagpunar, John (1988), Principles of Random Variate Generation, Clerendon Press, Oxford. Gamgam, Hamza (1998), Parametrik Olmayan statistiksel Teknikler, Ankara: Gazi niversitesi Yayn. Hasgr, brahim (2000), Matematiksel statistik, Sekin Yaynlar, Ankara. Ik, M. Can (1995), Parametrik ve Parametrik Olmayan Testlerin Karlatrlmas ve Uygulama, YL Tezi, Marmara niversitesi Sosyal Bilimler Enstits. Kartal, Mahmut (1998), Hipotez Testleri, afak Yaynevi, Erzurum. Leemis, Lawrance M. (1986), Reliationships Among Common Univariate Distributions, The American Statistician, Vol. 40, No.2, 143-146 Ross, Sheldon M. (1989), Introduction to Probability Models, Academic Press, Inc., New York. Sobol, I. M. (1975), The Monte Carlo Method (eviren ve Uyarlayan: V.I. Kisin), Mr Publishers, Moskow. Tokol, Tuncer., Pazarlama Aratrmas, Bursa: Uluda niversitesi Yldz, N., Akbulut, ., Bircan, H. (2002), Uygulamal statistik, 3. Bask, afak Yaynlar, Erzurum.