Professional Documents
Culture Documents
0
Statistical Packages for the Social Sciences
YRD.DOÇ.DR.YÜKSEL TERZİ
Yrd.Doç.Dr.Yüksel TERZĐ 2
VARIABLE VIEW (DEĞİŞKEN SAYFASI)
Yrd.Doç.Dr.Yüksel TERZĐ 5
Diğer veri tabanı programlarındaki veri
dosyalarını açar.
Farklı uzantılara sahip dosyalardaki
verileri SPSS’e aktarır (xls, dat, txt gibi).
Yrd.Doç.Dr.Yüksel TERZĐ 7
File>Open>Data
Yrd.Doç.Dr.Yüksel TERZĐ 8
Yrd.Doç.Dr.Yüksel TERZĐ 9
Son yapılan değişiklikleri geri alır. Analiz
ile ilgili işlemleri geri almaz.
Geri alınan işlemleri bir önceki konuma
getirir.
Yrd.Doç.Dr.Yüksel TERZĐ 10
GENERAL
Yrd.Doç.Dr.Yüksel TERZĐ 13
CURRENCY
Yrd.Doç.Dr.Yüksel TERZĐ 17
Yrd.Doç.Dr.Yüksel TERZĐ 18
Yrd.Doç.Dr.Yüksel TERZĐ 19
Yrd.Doç.Dr.Yüksel TERZĐ 20
Yrd.Doç.Dr.Yüksel TERZĐ 21
Yrd.Doç.Dr.Yüksel TERZĐ 22
Yrd.Doç.Dr.Yüksel TERZĐ 23
Yrd.Doç.Dr.Yüksel TERZĐ 24
Yrd.Doç.Dr.Yüksel TERZĐ 25
Yrd.Doç.Dr.Yüksel TERZĐ 26
Yrd.Doç.Dr.Yüksel TERZĐ 27
Agreegate : Bir grubu özet olarak birleştirilmiş veri halinde toplar.
Break variables : Gurup yapılacak değişkenler girilir.
Aggregate variables:Yukarıdaki gruplarda üzerinde işlem yapılacak değişkenler.
Function : Grupların hesaplanacağı fonksiyonlar:
Mean of value : Aritmetik ortalama, First value : ilk değer
Number of cases : olay sayısı Sum os values :Değerler toplamı
Percentage above :Belli değerden büyük değerler yüzdesi.
Percentage below : Belli değerden küçük değerler yüzdesi.
Percentage inside : Đki değer arasındaki değerler yüzdesi.
Percentage outside : Đki değer dışındaki değerler yüzdesi.
Fraction above : Bir değerden büyük değerlerin o grup içindeki yüzdesi
Fraction below : Bir değerden küçük değerlerin o grup içindeki yüzdesi
Fraction inside : Đki değer içindeki değerlerin o grup içindeki yüzdesi
Fraction outside : Đki değer dışındaki değerlerin o grup içindeki yüzdesi
Belli değerler value kutusuna, beli iki değer de Low ve High kutularına yazılır.
Creata new data file:Yapılan hesaplamaların yeni bir dosyaya kayıt edilmesi. File ile kayıt yapılır.
Replace data working data file : Yapılan düzenlemeleri mevcut dosyaya kayıt eder.
Yrd.Doç.Dr.Yüksel TERZĐ 28
Save number of cases in break group as variable: Gruplar içindeki olay sayısının bir değişken gibi kaydı
Ortogonal Design : Bağımsız deneme düzeni türetmeyi(generate) ve bu düzeni görüntüler.
Split file:(Veri dosyası ayırma )
Veri dosyasını istenilen değişkenin
alt seviyelerine göre parçalar.
Böylece veri dosyası, değişken kaç
farklı değer alıyorsa o sayıda alt
dosyalara ayrılır.
Analysis all cases : Gruplamanın
olmadığı durum Yrd.Doç.Dr.Yüksel TERZĐ 29
Select cases :Veri süzme veya seçme-
Farklı değerler alan değişkenlerin istenilen değerlerinin analize katılmasını sağlar.
If condition is satisfied : Değişkenlerle ilgili hesap ve fonksiyon işlemleri yapar.
Random sample of cases : Bazı örnekler üzerinde işlem yapar.
Yrd.Doç.Dr.Yüksel TERZĐ 30
Yrd.Doç.Dr.Yüksel TERZĐ 31
Do not weight cases : Ağırlıklı durum yok
Yrd.Doç.Dr.Yüksel TERZĐ 33
Verileri değiştirme veya yeniden kodlama-Recode komutu:
Yrd.Doç.Dr.Yüksel TERZĐ 35
Automatic Recode
Descriptive Statistics :
Frequencies :Verilerin frekans tablosunu, belirtici istatistikleri, dağılım
ölçülerini hesaplar ve grafiklerini çizer.
Descriptives :Verilerin belirtici istatistiklerini ve asimetrik dağılım ölçüleri
olan çarpıklık (kurtosis), basıklık (skewnes) ölçülerini hesaplar.
Explore :Tüm birimlerin yada her bir gruptaki birimlerin belirtici
istatistiklerini hesaplar ve yayılım grafiklerini çizer. Bir değişkenin diğer
değişkene göre istatistiklerini bulur.
Crosstabs :Đki yada daha fazla değişkenin ikili çapraz tablolarını düzenler.
Hazırlanan tablolara testler yapılır ve özet istatistikler bulunur. Sayısal
değişkenler kodlama ile az sayıdaki gruba bölünerek çapraz tablolar
düzenlenir.
Yrd.Doç.Dr.Yüksel TERZĐ 39
Compare Means:
Gruplara göre verilerin belirtici istatistiklerini hesaplayan,
bağımlı ve bağımsız örneklerde iki yada daha fazla ortalama
arasındaki farkları test eden yöntemleri içerir.
Means :Değişkenlerin tek başına ya da diğer bağımsız
değişkenlere göre alt grupların istatistiklerini hesaplar.
One Sample T test :Tek örnek T testi yapar.
Independent Samples T Test:Bağımsız iki örneklem T testi yapar.
Paired Samples T Test :Bağımlı iki örneklem T Testi yapar.
One Way ANOVA :Bağımsız k-örneklem ortalamalarının
önemliliğini test etmek için tek yönlü varyans analizi uygular.
Regression :
Linear:Verilere basit doğrusal ve çoklu doğrusal regresyon analizi uygular.
Curve Estimation:Verilere uygun eğri uydurulması için model denenmesi
sağlar. Model seçimi için çoklu regresyon katsayısından yararlanılır.
Logistic : Đkili (Binary) ve çoklu (Multinominal) lojistik regresyon
analizi yapılmasını sağlar.
Probit :Probit regresyon analizi
Nonlineer : Doğrusal olmayan regresyon analizi uygulaması yapar.
Loglinear :
Kategorik verilere genel ve aşamalı loglinear ve lojit loglinear
analiz uygular. Yrd.Doç.Dr.Yüksel TERZĐ 41
Classify :Verilere kümeleme analizi (cluster analysis) ve ayırma analizi
(discriminant analysis) uygular.
K-Means Cluster : Kümelenecek birim yada değişkenlerin kaç kümeye
ayrılacağı belirlenerek guruplamalar yapılır.
Hierarchical Cluster : Değişkenlere aşamalı kümeleme analizi uygular.
Discriminant : Grupları önceden belirli birimleri rasyonel biçimde
birbirinden ayırmaya yarayan fonksiyonlar türetmeyi ve verilerin sınıflandırır.
Data Reduction:
Veilere faktör analizi ve uyum (Correspendance) analizi uygular.
Scale :
Đsimsel fakat kodlanmış sıralı yada aralıklı ölçekle elde edilmiş verilere
güvenilirlik ve çok boyutlu ölçekleme analizi uygular.
Nonparametrics Tests :
Tek örneklem, bağımlı/bağımsız iki ve k örneklem verilerine parametrik
olmayan test yöntemlerinin uygulanmasının sağlar.
Times Series :
Zaman serisi analizi ile ilgili üssel düzeltme, otokorelasyonlu regresyon,
ARIMA, mevsimsel çözümleme, spectral analiz gibi yöntemleri yapar.
Survival :
Sağkalım verilerin yaşam tablosu, Kaplan-Meier ve Cox regresyon analizi
modelleri ile analiz işlemlerini yapar.
Multiple Response : Yrd.Doç.Dr.Yüksel TERZĐ 42
Çoklu cevap yada çoklu ikili setlerin belirlenmesi ve analizi işlemlerini yapar.
GRAPHS (GRAFĐKLER) :
Yrd.Doç.Dr.Yüksel TERZĐ 43
UTILITIES :
SPSS ile çalışırken yararlanılan
kolaylıkları sunan seçenekleri içerir.
Variables :Değişkenlerle ilgili
bilgi verir. Değişkenin tipi, özelliği,
ölçü birimi gibi.
File Info:Üzerinde çalışılan
değişkenlerin özellikleri konusunda
toplu bilgi verir.
Run Script : Matrix dille yazılmış bir
macronun çalıştırılmasını sağlayan
bir seçenektir.
Yrd.Doç.Dr.Yüksel TERZĐ 44
HELP :
SPSS ile çalışırken SPSS komutları hakkında ayrıntılı yardım
almayı sağlayan bir seçenektir.
Topics:SPSS konuları hakkında yardım seçenekleri görüntülemeyi
sağlar.
Tutorial :SPSS ile çalışmaya yeni başlayanlara bilgi veren bir
seçenektir.
SPSS Home Page : Đnternete bağlı bir bilgisayar ile SPSS INC
tarafından oluşturulan WEB sayfasına ulaşarak bilgilenmeyi
sağlayan bir seçenektir.
Command Syntax Reference : SPSS’de menüler aracılığı ile yapılan
işlemlerin SPSS komutları cinsinden yazılımlarını irdelemek amacıyla
bilgi alınan bir seçenektir.
Yrd.Doç.Dr.Yüksel TERZĐ 45
1. İSTATİSTİĞE GİRİŞ
Karşımıza çıkan bir istatistik sonucun sorgulanması:
Anakütle (Populasyon=Evren=Toplum) :
Üzerinde inceleme veya araştırma yapılacak
olayın gözlenebileceği tüm birimlerin yer aldığı
topluluktur. Bir fabrikanın ürettiği aynı türden
ilaçlar anakütleyi oluşturur.
Yrd.Doç.Dr.Yüksel TERZĐ 51
Birim(olgu=case=denek): Üzerinde gözlem ve ölçüm yapılan ve
anakütleyi oluşturan en küçük öğe. Birimler canlı yada cansız
varlıklar olabileceği gibi, kurum, kuruluş da olabilir. Her ilaç(veya
her kutu) bir birimi oluşturabilir.
Birimlerin mutlaka sayılabilir veya ölçülebilir özelliklere
sahip olması gerekir. Bu yüzden zevk, koku, rüya gibi ifadeler
birime örnek kabul edilemez.
İstatistikte birimin homojen(eşitlik) olması şartı da aranır.
Aynı tanıma uygun birimlere homojen denir. Birimler belli bir
tanıma uyduklarında “biçimsel homojenlik” olur. Örneğin
Üniversite öğrencileri arasında biçimsel homojenlik vardır. Eğer
öğrenciler arasında boy, yaş gibi eşitlik varsa (ki bu zordur)
“maddi homojenlik” olduğu söylenebilir. İstatistiğin ilgi duyduğu
biçimsel homojenliktir. Maddi homojenliğe zor ender rastlanılır.
Biçimsel homojenliği gerçekleştirebilmek için birimin açık ve
kesin bir tanımı muhakkak verilmelidir. Böyle bir tanımın
verilmemesi durumunda gözlemcilerin topladıkları veriler bir
araya getirildiğinde elde edilen sonuç bir anlam taşımaz. Çünkü
kütle homojen olmayan birimlerden oluşmuş olur. Örneğin genel
nüfus sayımında kimler hakkında bilgi toplayacağız? Sayımın
yapıldığı ülkenin vatandaşlarını mı, yoksa hem bunları hem de
sayım anında ülke sınırları içinde yaşayan veya bulunan
yabancıları mı dikkate alacağız? Bu
Yrd.Doç.Dr.Yüksel gibi durumlarda tanımın52 çok
TERZĐ
açık yapılması gerekmektedir.
Parametre: Anakütleyi tanımlamada kullanılabilen tipik
değerlerdir. Anakütle ortalaması, anakütle varyansı gibi
değerlerdir.
Parametre İstatistik
µ
X
S2
σ2
n
N
Örnekleme Örnek
Anakütle
Yrd.Doç.Dr.Yüksel TERZĐ 53
ÖRNEKLEME NĐÇĐN GEREKLĐDĐR ?
1. Popülasyonun hepsini incelemek çok masraflı
olabilir. Popülasyondan alınacak küçük örnekler
yardımı ile gerçeğe yakın bilgiler elde edilebilir.
2. Popülasyonla yapılacak bir çalışma çok uzun
zamana ihtiyaç gösterebilir. Halbuki örnekle
çalışılırsa kısa zamanda gerçeğe yakın bilgiler kısa
zamanda elde edilebilir.
3. Bir çok durumda gözlemlerin elde edilmesi
deneklerin yok edilmesini gerektirebilir. Örneğin bir
ilaç üzerinde deneme yapılıyorsa fabrikanın ürettiği
tüm ilaçları denemeye almak ve yok etmek mümkün
değildir.
4. Küçük sayıda örneklerle çalışılırken daha hassas
çalışma yapmak ve daha dikkatli ölçüm almak, daha
hassas alet ve yöntemler kullanmak mümkündür.
Yapılan işin denetlenmesi
Yrd.Doç.Dr.Yükselde
TERZĐdaha kolay olur. 54
Örneklem büyüklüğünün hesaplanmasına ilişkin formüller
Değişken
Türü N<10.000 N>10.000
Nσ Zα
2 2 Nσ 2 Zα2
Nicel n= n=
( N − 1)( SH ) 2 + σ 2 Zα2 (SH ) 2
(Ortalama)
NPQZα2 PQZα2
Nitel n= n=
2 2
( N − 1)( SH ) + PQZα ( SH ) 2 + PQZα2
(oran)
10-10 55-48 100-80 190-127 280-162 440-205 800-260 1500-306 2800-338 9000-368
15-14 60-52 110-86 200-132 290-165 460-210 850-265 1600-310 3000-341 10000-370
20-19 65-56 120-92 210-136 300-169 480-241 900-269 1700-313 3500-346 15000-375
25-24 70-59 130-97 220-140 320-175 500-217 950-274 1800-317 4000-351 20000-377
30-28 75-63 140-103 230-144 340-181 550-226 1000-278 1900-320 4500-354 30000-379
35-32 80-66 150-108 240-148 360-186 600-234 1100-285 2000-322 5000-357 40000-380
40-36 85-70 160-113 250-152 380-191 650-242 1200-291 2200-327 6000-361 50000-381
45-40 90-73 170-118 260-155 400-196 700-248 1300-297 2400-331 7000-364 75000-382
50-44 95-76 180-123 270-159 420-201 750-254 1400-302 2600-335 8000-367 100.000-384
Yrd.Doç.Dr.Yüksel TERZĐ 56
ÖLÇME DÜZEYLERİ
1. Adlandırma
2. Sıralama
3. Aralık
4. Oran
1. Adlandırma Ölçeğinde sayılar sadece bir isim gibidir,
büyüklük, küçüklük söz konusu değildir. Bir koşu
pistinde 6 numaralı koşucu ile 10 numaralı
koşucunun iyilik yönünden farklı olmadığı gibidir.
Örneğin, psikiyatride hastalar şizofrenik, paranoid,
manyak depresif, psikonörotik gibi isimlendirilir. Bu
isimler hastalığın tipine ait sembollerdir. Bu
isimlendirme A,B,C,D, veya 1,2,3,4,5 diye de
yapılabilirdi. Bu tip verilerde özellikle parametrik
olmayan istatistikler kullanılır.
Yrd.Doç.Dr.Yüksel TERZĐ 57
2. Sıralama ölçeği: Bu ölçekte bir büyüklük veya
önemlilik söz konusudur. Kişilerin eğitim
durumunu gösterirken, Eğitimsiz=1, İlkokul=2,
Ortaokul=3, Lise=4, Üniversite=5, Yüksek
lisans=6 kodları verildiğinde sayı büyüdükçe
eğitim düzeyinin arttığı anlaşılır. Ancak 1 ile 2
arasındaki mesafe ile 5 ile 6 arsındaki mesafe
aynı değildir. Yani sıralama ölçeğinde kod olarak
kullanılan sayılar arasındaki mesafe önemli
değildir. Sıralamada en iyiye büyük sayı
verilebileceği gibi küçük sayıda verilebilir, bu
kullanılacak analiz yöntemini değiştirmez. Bu
ölçekle elde edilmiş verilerde ortalama yerine
medyan kullanılır, daha çok parametrik olmayan
testler kullanılır.
Yrd.Doç.Dr.Yüksel TERZĐ 58
3. Aralık Ölçeği: Bu ölçekte kod sayıları arasındaki
mesafenin önemi vardır. Ölçü biriminin ve sıfır
noktasının seçimi arzuya bağlıdır. Sayılar arası
mesafelerin anlamı önemlidir. Bu tip sayılar
toplanarak ortalama alınabilir.
Bu ölçekte sıfır değeri hiçlik belirtmez.
Örneğin bir ersin sınavından sıfır puan alan
öğrencilerin ders konuları ile ilgili hiçbir şey
bilmediği düşünülemez. Sıcaklık, zeka, yetenek,
performans puanı gibi nicel değişkenlere ait
ölçümler aralık ölçeğindedir.
Yrd.Doç.Dr.Yüksel TERZĐ 59
4. Oran Ölçeği: Bu ölçekte her zaman bir
mutlak sıfır noktası vardır. Ağırlık oran
ölçeğinde bir değişkendir, çünkü sıfır
ağırlığında olabilir. Sayılarak elde edilen
değişkenlerin çoğu oran ölçeğindedir,
örneğin; geçen 6 aydaki hasta sayısı nedir
dendiğinde, bu sıfır olabilir. 1. Altı aydaki
hasta 2. Altı aydaki hastanın iki katıdır
dendiğinde bunu bir anlamı vardır.
Yrd.Doç.Dr.Yüksel TERZĐ 60
Ölçeklerin Güç Hiyerarşisi
Yrd.Doç.Dr.Yüksel TERZĐ 61
Yrd.Doç.Dr.Yüksel TERZĐ 62
İSTATİSTİĞİN GÖREVİ
1. Verilerin toplanması
2. Toplanan verilerin işlenip düzenlenmesi
3. Düzenlenmiş verilerin tablolar ve/veya
grafikler şeklinde gösterilmesi
4. İstatistiksel analiz, tahmin
5. Karar vermek
Yrd.Doç.Dr.Yüksel TERZĐ 63
UYGUN ĐSTATĐSTĐK TEKNĐĞĐN BELĐRLENMESĐ
Yrd.Doç.Dr.Yüksel TERZĐ 65
Adlandırma Ölçeğinde ölçülen verilerin
Farklılığının Testi
Grup Sayısı
Yrd.Doç.Dr.Yüksel TERZĐ 66
1 veya 2 Grup Olduğunda Sıralama ve Aralık Ölçeğindeki
Verilerin Farklılığının Testi
Grup Sayısı
t Testi Dönüşüm yap İşaret Testi t Testi Dağılış Dağılış t-Eşli Dağılış Dağılış
Uygula ve t Testi uygula uygula Normal Normal Değil karşılaştırma Normal Normal
uygula Değil
t testi serbestlik
uygula derecesi
düzeltilmiş
t testi uygula
Yrd.Doç.Dr.Yüksel TERZĐ 67
Sıralama ve Aralık Ölçeğinde 3 veya Daha Fazla
Grup Olduğunda Farklılığın Testi
3 veya Daha
Fazla Grup
Var
Gruplar Gruplar
Bağımsız Bağımlı
Regresyon Pearson
Analizi Korelasyon
Katsayısı
Yrd.Doç.Dr.Yüksel TERZĐ 69
Bağımsız Değişken Sayısı 2 Veya Daha Fazla Olması Durumu
Bağımsız Değişkenlerin
Ölçeği
Sınıfsal Sıralayıcı
Ölçekli veya Aralık Ölçekli
Kaplan-Meier veyaEtki Karışımlı Etki Karışımlı Cox-Proportinal Varyans Analizi Lojistik Diskriminant Cox- Proportional Confounding Confounding
Actuarial (Confounding) (Confounding) Hazard Modeli Regresyon Analizi Hazard Değişken Değişken
Analiz Değişken Yok Değişken Var Modeli Var Yok
Yrd.Doç.Dr.Yüksel TERZĐ 70
GRAFİKLER
Grafikler gözlem sonuçlarının anlaşılması
kolaylaştırır. Çünkü ilk bakışta görsel kolaylık
sağlarlar. Ancak grafikler rakamlar derecesinde
önemli değildir. Çünkü grafiksiz istatistik olabilir ancak
rakamsız grafik asla olamaz. Ayrıca grafikler büyük
farkları ve değişimleri gösterebilir. Ancak küçük farklar
ve değişimleri gösteremez. Çeşitli grafik türleri vardır.
Bar (Çubuk) Grafiği: Nominal ve ordinal verilerin
grafiklerinin yapılması için uygundur. Bu grafik yatay
eksende kategori etiketleri belirtilirken, her kategori ile
frekans veya yüzdeyi temsil eden dikey çubuklar
çiziminde oluşur. Yrd.Doç.Dr.Yüksel TERZĐ 71
Yrd.Doç.Dr.Yüksel TERZĐ 72
Yrd.Doç.Dr.Yüksel TERZĐ 73
Yrd.Doç.Dr.Yüksel TERZĐ 74
Yrd.Doç.Dr.Yüksel TERZĐ 75
Scatter/Dot Grafiği
Yrd.Doç.Dr.Yüksel TERZĐ 76
Yrd.Doç.Dr.Yüksel TERZĐ 77
Pie (pasta) Grafikleri
Yrd.Doç.Dr.Yüksel TERZĐ 78
Yrd.Doç.Dr.Yüksel TERZĐ 79
Histogram Grafikleri
Yrd.Doç.Dr.Yüksel TERZĐ 80
Yrd.Doç.Dr.Yüksel TERZĐ 81
Boxplot (Kutu) Grafikleri
Yrd.Doç.Dr.Yüksel TERZĐ 82
Yrd.Doç.Dr.Yüksel TERZĐ 83
KUTU GRAFİĞİ (BOX PLOT)
Yüzdeliklere dayanan ve tanımlayıcı istatistikleri kullanan bir grafik türüdür.
50
Uç nokta
330
Uç nokta olmayan
40
en büyük değer
30
75. yüzdelik(3. çeyrek)
50. yüzdelik(medyan)
20
Gelir
Yrd.Doç.Dr.Yüksel TERZĐ 84
STEM&LEAF GRAFĐĞĐ (DAL VE YAPRAK GRAFĐĞĐ)
YAS Stem-
Stem-and-
and-Leaf Plot
Frequency Stem & Leaf
1,00 2 . 9
4,00 3 . 0234
5,00 3 . 56789
5,00 4 . 01234
5,00 4 . 56789
5,00 5 . 01234
4,00 5 . 6789
4,00 6 . 0123
2,00 6 . 69
3,00 7 . 013
3,00 7 . 578
Stem width: 10,00
Each leaf: 1 case(s)
Analyze>Descriptive statistics>Explore yolu ile Plots tuşu seçilerek Stem-and leaf
işaretlenir.
Burada stem (dal) ve leaf (yaprak) anlamındadır.
Yukarıdaki tabloda örneğin “4,00 3.0234” satırı 30 ile 34 değerleri arasında
4 değer olduğunu gösterir. Tablo altındaki Stem width : dal genişliğini,
Yrd.Doç.Dr.Yüksel TERZĐ 85
Each leaf : her yapraktaki deneklerin tek tek gösterildiğini ifade eder.
2. MERKEZĐ EĞĐLĐM ÖLÇÜLERĐ (ORTALAMALAR)
(Measures of Central Tendency)
“Başı fırında ayakları buzdolabında olan bir adam ortalama olarak
rahattır” Malcolm E.Lines
Bir mahalledeki ortalama gelir düzeyi bir araştırmaya göre yılda
15000€, diğerine göre ise 5000€ çıkmıştır. Đki sonuçta aynı kişi ve yerden
bulunmuştur. Burada ki hile “ortalama” kelimesidir. Çünkü hangi ortalama
olduğu belirtilmemiştir. Eğer büyük bir sayıya ulaşmak istiyorsanız aritmetik
ortala, küçük bir sayıya ulaşmak için en çok tekrarlanan değer olan mod
kullanılabilir.
Sayı yığınlarının kolayca anlaşılması için sayı yığınlarının en fazla
yığıldığı bölgeyi tarif eden tipik değerlerin verilmesi gerekir. Bu değerler
dağılışın merkezini gösterdikleri için merkezi eğilim ölçüleri olarak da
bilinir. Đstatistikte bir seriyi temsil etmeye yarayan tek bir rakama ortalama
denir.
Ortalamalar serinin bütün terimlerinin hesaba katıldığı ortalamalar
(duyarlı ortalamalar) ve serinin bütün terimlerinin hesaba katılmadığı
ortalamalar (duyarlı olmayan ortalamalar) diye ikiye ayrılır.
Yrd.Doç.Dr.Yüksel TERZĐ 86
2.1. Duyarlı Ortalamalar
Basit Serilerde ∑ i
X r
Or = r
N
Sınıflanmış Serilerde ∑ f i X ir
Or = r
Duyarlı Ortalamalar ∑ fi
Gruplanmış Serilerde ∑ f i mir
Or = r
∑ fi
Burada r’ye -∞ ile +∞ arasında değerler verilerek sonsuz ortalama
bulunabilir. r=-∞ olması durumunda ortalamanın Xmin olmasına, r=+∞
olması durumunda ise Xmax olacağı ispatlanabilir. Yani r arttıkça ortalama
büyümekte, r azaldıkça ise küçülmektedir.
Yrd.Doç.Dr.Yüksel TERZĐ 87
2.1.1. Aritmetik Ortalama
Aritmetik ortalama deneklerin aldıkları değerlerin toplanıp
denek sayısına bölünmesiyle elde edilen değerdir. Tablo 2.1.’de r=1
alındığında aritmetik ortalama formülleri elde edilir.
Basit
X=
∑ Xi
Serilerde N
Aritmetik Sınıflanmış ∑ fi X i
Ortalama X=
Serilerde ∑ fi
Gruplanmış
X=
∑ f i mi
Serilerde ∑ fi
Yrd.Doç.Dr.Yüksel TERZĐ 88
2.1.2. Geometrik Ortalama
Xi: {X1,X2,…, Xn} pozitif sayılar kümesinin geometrik ortalaması,
sayıların çarpımlarının N nci dereceden köküdür.
Geometrik Ortalama = GO = N X 1 X 2 .... X n
Tablo 2.1.’de r=0 yada r→0 için limit alınarak geometrik ortalama
formülleri bulunabilir.
Basit Serilerde ∑ log X i
log GO =
N
Sınıflanmış Serilerde
log GO =
∑ f i log X i
Geometrik ∑ fi
Ortalama Gruplanmış Serilerde
log GO =
∑ f i log mi
∑ fi
Geometrik ortalama, terimlerinin logaritmalarının aritmetik
ortalamasının antilogaritmasınaYrd.Doç.Dr.Yüksel
eşittir. TERZĐ 89
Geometrik Ortalamanın Özellikleri
I. Geometrik ortalama özellikle aynı oranda artma yada azalma
eğilimi gösteren olaylara ilişkin serilere uygulanır. Örneğin
nüfus çoğalması, bakteri üremesi gibi geometrik dizilerde birim
zamandaki artışı bulmak için GO kullanılır.
II. Simetrik olmayan ancak logaritmaları alındığında simetrik hale
dönüşen serilere geometrik uygulama uygulanabilir.
III. Serideki terimler arasında bazı değerler sıfır veya negatifse GO
hesaplanamaz.
IV. Geometrik uygulama aşırı uç değerlerden aritmetik ortalamaya
göre daha az etkilenir.
V. GO ≤ AO ilişkisi vardır. Bütün Xi ler eşitse GO=AO olur.
VI. Seri terimlerinin k. kuvvetlerinin geometrik ortalaması,
geometrik ortalamanın k. kuvvetine eşittir.
[( X )
1
k
( X 2 ) k K( X N ) k ]
1/ N
[
= ( X1X 2 K X N )k ]
1/ N
[
= ( X 1 X 2 K X N )1 / N ]
k
= GO k
Yrd.Doç.Dr.Yüksel TERZĐ 90
2.1.3. Harmonik Ortalama
Harmonik HO =
∑ fi
Ortalama Sınıflanmış
fi
Serilerde ∑
Xi
HO =
∑ fi
Gruplanmış
fi
Serilerde ∑
Yrd.Doç.Dr.Yüksel TERZĐ mi 91
Harmonik Ortalamanın Özellikleri
I. Serideki terimlerden biri sıfır ise harmonik ortalama sıfır çıkar.
Basit Serilerde ∑ X i2
KO =
N
Sınıflanmış ∑ f i X i2
Serilerde KO =
Kareli Ortalama ∑ fi
Gruplanmış ∑ f i mi2
Serilerde KO =
∑ fi
Yrd.Doç.Dr.Yüksel TERZĐ 93
Kareli Ortalamanın Özellikleri
3. HO ≤ GO ≤ AO ≤ KO ilişkisi vardır.
Yrd.Doç.Dr.Yüksel TERZĐ 94
2.2. Duyarlı Olmayan Ortalamalar
Duyarlı ortalamalarda bütün terimler veya sınıflar dikkate alınır.
Hesaplamalarda bazen serinin bütün terimleri veya sınıfları dikkate
alınmayabilir. Bu durumda duyarlı olmayan ortalamalar ortaya çıkar.
Yrd.Doç.Dr.Yüksel TERZĐ 97
2.2.3. Tepe Değer(Mod)
Yrd.Doç.Dr.Yüksel TERZĐ 98
Modun Özellikleri
I. Ortalamalar arasında mod en temsili olanıdır. Çünkü kütledeki
birimleri önemli bir kısmına uyar.
II. Sınıflanmış serilerde modun tamsayı olması gerçeğin daha iyi
yansıtılmasını sağlar. Örneğin bir bölgedeki ailelerin ortalama
çocuk sayıları hesaplandığında kesirli bir rakam elde
edilebilir. Oysa ortalama olarak mod alınırsa bu değer tam
sayı çıkacaktır.
III. Mod anormal terimlerin etkisi altında kalmaz. Örneğin çok
zengin bir kişinin köye taşındığını varsayalım. Bu kişinin gelir
düzeyi tek ve serinin sonunda olacağından modu etkilemez.
IV. Mod uygulamada farkına varılmadan en çok başvurulan
ortalamalardan biridir. Örneğin kundura ve hazır giyim eşyası
üretiminde en çok satılan numaralar ve bedenler dikkate alınır.
Buda mod demektir.
V. Adlandırma (nominal) Yrd.Doç.Dr.Yüksel
ölçekli değişkenlerde
TERZĐ
mod kullanımı
99
uygundur.
Modun Sakıncaları
DG(X)= 52-49= 3
DG(Y)= 61-35= 26
DG(Z)= 92-15= 77
Z TERZĐ
Yrd.Doç.Dr.Yüksel 105
3.2.Standart Sapma
Kareli ortalama sapma adı verilen bu ölçü, terimlerin aritmetik
ortalamadan cebirsel sapmalarının kareli ortalamasıdır. Standart
sapma gözlemlerin ortalamadan ne kadar uzaklaştığını gösterir. Yani
gözlemler arasında ne kadar yaygınlık olduğunu ifade eder.
Standart sapma varyansın kare köküdür. Varyans birimsiz ifade
edildiği halde standart sapma ölçülen özelliğin birimi ile ifade edilir. Yani
milimetre yerine milimetre kare gibi veri biriminin karesinin
kullanılması uygun olmadığından, standart sapma kullanılır.
Ortalama etrafındaki saçılma fazla ise varyans büyük olacak,
dolayısıyla standart sapma da büyük çıkacaktır. Veri seti içinde aşırı
değer fazla ise bunların varyansı etkilemesi olağan karşılanabilir, ancak
birkaç aşırı değerin varyansı büyütmesi olağan karşılanmaz.
Dağılımdaki maksimum ve minimum değerler arasındaki farkı
dörde bölmek suretiyle, standart sapma kabaca tahmin edilebilir.
Moses’e göre standart sapma değeri, örnekteki gözlem değerleri
arasındaki varyasyonun derecesini tanımlayan bir istatistiktir.
Değişkenin dağılışı normal dağılış gösteriyorsa, standart sapma verilerin
ortalama etrafındaki dağılışınıYrd.Doç.Dr.Yüksel
iyi bir şekilde TERZĐ açıklar. 106
Bazen örnek verisine ilişkin standart sapma
hesaplanırken paydada N yerine N-1 alınır. Çünkü elde
edilen değer örneğin alındığı yığının standart sapmasını
daha iyi verir. N’in büyük değerleri için (N>30) iki tanım
arasında bir fark yoktur.
Gözlem değerlerinin tamamı birbirine eşit
olamayacağından standart sapmanın değerleri pozitiftir.
Kitle :
n ( x − x ) 2 n ( x − x) 2
Örnek: s2 = ∑ i s= ∑ i
i =1 n − 1 i =1 n −1
s2=[(49-50)2+(49-50)2+…+(52-50)2]/(6-1)=(1+1+1+0+1+4)/5= 8/5=1.6
veya
s2=[(492+492+492+502+512+522)-3002/6]/5=(1500815000)/5=8/5=1.6
Yrd.Doç.Dr.Yüksel TERZĐ 110
Serbestlik Derecesi
(Degrees of Freedom)
Serbestlik derecesi gözlemlere konulan kısıtlamalara
bağlıdır. Verilere getirilen bazı kısıtlamalardan sonra, değişmekte
serbest olan değerlerin sayısıdır. Örneğin bir grup verinin
ortalamaya göre olan sapmalarının toplamı sıfırdır. ∑ ( x − x) = 0
Bu sapmaların sadece N-1’i serbestçe seçilebilir. Toplam
sapmaların sıfıra eşit olması koşulu, N’nci sapmanın değerini
sınırlandırır.
Varyans 1.6
S .H . = = = 0.52
Yrd.Doç.Dr.Yüksel TERZĐ 112
N 6
Bir serinin ortalaması verilirken standart
hatası ile birlikte verilir. Popülasyondaki
değişimi göstermek için standart hata kullanılır.
Veri setindeki değişim araştırılıyorsa standart
sapma tercih edilir.
Aritmetik Ortalama ± Standart Hata
X m SX
Normal bir seride α 4 =3, sivri bir seride α 4 >3 ve basık bir
seride α 4 <3’tür. α 4 formülünde kesrin pay ve paydası pozitif
olduğundan basıklık ölçüsü pozitif değere sahiptir.
Yrd.Doç.Dr.Yüksel TERZĐ 119
Not: Bir serinin normal seri olup olmadığını
çarpıklık ve basıklık katsayılarına bakarak
anlayabiliriz.
Normal seride Çarpıklık( α 3 )=0 ve
Basıklık( α 4 )=3’tür. Buna normallik testi
denir.
notlar
N Valid 10
Missing 0
Mean 55,00
Std. Error of Mean 4,534
Median 52,50
Mode 50
Std. Deviation 14,337
Variance 205,556
Skewness ,318
Std. Error of Skewness ,687
Kurtosis ,587
Std. Error of Kurtosis 1,334
Range 50
Minimum 30
Maximum 80
Sum 550
Percentiles 25 48,75
50 52,50
75 63,75
Uç değer
Uç değer
Medyan
Variyansı Farklı
Normal Dağılışlar
Analyze>Descriptive Statistics>Explore>plots>normality
plots with tests – histogram
Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
notlar ,126 10 ,200* ,980 10 ,964
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
Histogram
2,5
2,0
1,5
1,0
Frequency
Q3
Q2
Q1
Descriptive Statistics
N Skewness Kurtosis
Statistic Statistic Std. Error Statistic Std. Error
notlar 10 ,089 ,687 -,520 1,334
Valid N (listwise) 10
dönüşüm yapılmalıdır.
Box M Test:
H0: Varyans-kovaryans matrisleri eşittir.
M-Estimators
Huber's Tukey's Hampel's Andrews'
M-Estimatora b
Biweight M-Estimator c
Waved
YAS 50,3593 50,5376 50,7320 50,5429
a. The weighting constant is 1,339.
b. The weighting constant is 4,685.
c. The weighting constants are 1,700, 3,400, and
8,500
d. The weighting constant is 1,340*pi.
Yrd.Doç.Dr.Yüksel TERZĐ 164
Hipotez Testi
Đstatistiksel hipotezler anakütle parametrelerine ilişkin
olarak ileri sürülen ve geçerliliği olasılık kanunlarına göre
araştırılabilen özel önermelerdir. Đstatistiksel hipotezlerin diğer
hipotezlerden farkı, hipotezin bir frekans bölünmesiyle ilgili
olmasıdır. Örneğin “belirli bir markayı taşıyan akülerin
ortalama ömrünün 2.5 saat olduğu”nu ileri sürdüğümüzde bir
hipotez önermiş oluruz. Bunun anlamı normal olan bir
dağılımın aritmetik ortalaması 2.5 saate eşittir.
Bir hipotez ya doğru ya da yanlıştır. Bunu araştırmak için
anakütleden rasgele seçilmiş belli bir örneklemdeki birimler
incelenir ve bu örneklemden hareketle hipotezin geçerli olup
olmadığı hakkında bir karara varılır. Örneklem
istatistiklerinden yararlanarak bir hipotezin geçerli olup
olmadığını ortaya koyma işlemine istatistiksel hipotez testi veya
hipotez testi denir.
Yrd.Doç.Dr.Yüksel TERZĐ 165
Sıfır Hipotezi ve Karşıt Hipotez
Hipotez testinde bir hipotezle onun karşıtı diğer bir
hipotezden hangisinin örneklemden elde edilen sonuç ile
daha iyi daha iyi bağdaştığı araştırılmaktadır.
Karşılaştırılan iki hipotezden birine sıfır hipotezi
(istatistiksel hipotez), diğerine ise karşıt hipotez (araştırma
hipotezi) adı verilir.
Hipotezler daima örneklem alınmadan oluşturulması
gerekir. Sıfır hipotezi H0 ile, karşıt hipotez ise H1 ile
gösterilir.
Ho Ho
Doğru Yanlış
Ho I. Tip Hata
Test
Red P(I. Tip Hata)= α β
Doğru Karar=1-β
H0 : µ=µ
µ0=250 gr H0 : µ=µ
µ0=1000 kg µ=µ
H0:µ µ0=20 gün
H1 : µ≠µ
µ0=250 gr H1 : µ>µ
µ0=1000 kg µ<µ
H1 :µ µ0=20 gün
Yrd.Doç.Dr.Yüksel TERZĐ 174
Anakütle (Popülâsyon) Varyansı (σ σ2) Biliniyor:
Anakütle normal dağılışlı ve anakütle varyansı biliniyorsa
ve n≥ ≥30 ise, sıfır hipotezinin karşıt hipoteze karşı testi için Z
test istatistiği kullanılır.
X −µ
Z=
σ/ n
Bulunan Z test istatistiği α anlamlılık seviyesine göre Z
α) veya
tablo değerleri ile karşılaştırılır. Karşıt hipotezin tek (α
α/2) taraflı olmasına göre karar verilir.
çift (α
X −µ 245.5 − 250
Z= = = −3 Z<-Zα/2⇒-3<-1.96
σ/ n 15 / 100
H0 reddedilir.
Firmanın tereyağı paketlerinin ağırlığı ortalama 250 gr olması
gerektiği halde, firma buna uymamaktadır.
Yrd.Doç.Dr.Yüksel TERZĐ 177
σ2) Bilinmiyor:
Anakütle (Popülâsyon) Varyansı (σ
Anakütle standart sapması bilinmiyorsa, örneklem
standart sapması kullanılır. n>30 durumunda dağılım
normale uyduğundan test istatistiği olarak yine Z testi
kullanılır.
X −µ
Z=
s/ n
Ancak n≤30 olduğunda ve anakütle varyansı bilinmediğinde t
dağılımı kullanılır.
X −µ
t=
s/ n
t istatistiği (n-1) serbestlik dereceli t dağılımına sahiptir. t
dağılımı simetrik bir dağılımdır. Bu dağılımın şekli serbestlik
derecesine bağlıdır. n>30 olduğunda dağılım normale yaklaşır.
Yrd.Doç.Dr.Yüksel TERZĐ 178
Serbestlik derecesi (degrees of freedom) :
Örnekle ilgili bir istatistiğin
hesaplanmasında veya bir parametrenin
tahmin edilmesinde, bağımsız birimlere ait
sayının bilgisini ifade eden bir terimdir.
Serbestlik derecesi modeldeki parametre
sayısına karşılık gelmektedir. Ayrıca
serbestlik derecesi verilere getirilen bazı
kısıtlamalardan sonra, değişmekte serbest
olan değerlerin sayısıdır.
Yrd.Doç.Dr.Yüksel TERZĐ 179
Tek örnek T Testi
Öğrencilerin aylık masraflarının ortalama
300 TL olduğu iddia ediliyor. Bu iddianın
doğruluğunu %5 anlamlılık seviyesinde
test ediniz?
Std. Error
N Mean Std. Deviation Mean
notlar 10 284,50 60,985 19,285
One-Sample Test
Runs Test
notlar
Test Valuea 300,00
Total Cases 10
Number of Runs 2
Z -2,318
Asymp. Sig. (2-tailed) ,020
a. User-specified.
H0: µ1- µ2 = 0
H 1: µ1- µ2 ≠ 0 H 1: µ1- µ2 > 0 H 1: µ1- µ2 < 0
( X 1 − X 2 ) − ( µ1 − µ 2 )
Z= ,
σ 12 σ 22
+
n1 n2
H0: µ1- µ2 = 0 H0: µ1- µ2 = 0 H0: µ1- µ2 = 0
H 1: µ1- µ2 ≠ 0 H 1: µ1- µ2 > 0 H 1: µ1- µ2 < 0
H0: µ1- µ2 = 0
H 1: µ1- µ2 ≠ 0 H 1: µ1- µ2 > 0 H 1: µ1- µ2 < 0
σ 12 ≠ σ 22
ise bu tür problemlere Behrens-Fisher Problemi denir.
H0: µ1- µ2 = 0
H 1: µ1- µ2 ≠ 0 H 1: µ1- µ2 > 0 H 1: µ1- µ2 < 0
( X 1 − X 2 ) − ( µ1 − µ 2 )
t=
s12 s22
+
n1 n2
Bulunan th hesap değeri ttablo değeri mukayese edilir. tα,v<th ise
H0 reddedilir. Serbestlik derecesi aşağıdaki formülle bulunur.
( s12 / n1 + s 22 / n2 ) 2
sd = v = −2
( s12/ n1 ) 2
( s 22 / n2 ) 2
+
Yrd.Doç.Dr.Yüksel TERZĐ 189
n1 + 1 n2 + 1
Örnek: Bulaşık deterjanını plastik kaplara doldurmak için iki
makine kullanılıyor. Birinci makineden n1=10 plastik kap,
ikinci makineden n2=12 plastik kap seçiliyor. Bu kaplar
incelendiğinde birinci makine ortalama 30.87 birim sıvı, ikinci
makine ortalama 30.68 birim sıvı doldurmuştur. Varyansları
ise sırasıyla 0.0225 ve 0.0324 bulunmuştur.
a) Varyansları homojen ( σ 12 = σ 22 ) kabul ederek, %95 güven
düzeyinde (%5 anlamlılık düzeyinde) birinci makinenin daha
fazla sıvı doldurduğu söylenebilir mi?
b) Varyansları heterojen ( σ 12 ≠ σ 22 ) kabul ederek, %95 güven
düzeyinde birinci makinenin daha fazla sıvı doldurduğu
söylenebilir mi?
Çözüm :
X 1 = 30.87 s12 = 0.0225 n1 = 10 H 0 : µ1 = µ 2
X 2 = 30.68 s 22 = 0.0324 n2 = 12 H1 : µ1 > µ 2
Yrd.Doç.Dr.Yüksel TERZĐ 190
a) σ 12 = σ 22 ise
(n1 − 1) s12 + (n2 − 1) s 22 (10 − 1)0.0225 + (12 − 1)0.0324
s= = = 0.167
n1 + n2 − 2 10 + 12 − 2
( X 1 − X 2 ) − ( µ1 − µ 2 ) (30.87 − 30.68) − 0
t= = = 2.657
1 2 1 2
s + 0.167 +
n1 n2 10 12
( X 1 − X 2 ) − ( µ1 − µ 2 ) (30.87 − 30.68)
t= = = 2.699
s12 s 22 0.0225 0.0324
+
+ 10 12
n1 n2
(N − k)
∑ n (Z . − Z
i i .. )
W= ⋅ i =1
,
(k − 1) k ni
∑∑ (Z
i =1 j =1
ij − Z i. ) 2
8 saat uyuyanlar: 40 45 52 61 65 75
5 saat uyuyanlar:30 35 48 52 54 60
H 0 : µ1 = µ 2 veya H 0 : µ1 − µ 2 = 0
H 1 : µ1 ≠ µ 2 H 1 : µ1 − µ 2 ≠ 0
α = 0, 05 , n1 = 6 , n2 = 6
P1=0,910>0,05 P2=0,378>0,05
Veriler normal dağılışlıdır.
Std. Error
grup N Mean Std. Deviation Mean
puan 1 6 56,33 13,110 5,352
2 5 46,20 12,969 5,800
puan
Mann-Whitney U 10,500
Wilcoxon W 31,500
Z -1,203
Asymp. Sig. (2-tailed) ,229
Exact Sig. [2*(1-tailed a
,240
Sig.)]
a. Not corrected for ties.
b. Grouping Variable: grup
Paired Differences
95% Confidence
Interval of the
Std. Error Difference
Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed)
Pair 1 once - sonra 56,111 34,174 11,391 29,843 82,380 4,926 8 ,001
sonra - once
Z -2,549a
Asymp. Sig. (2-tailed) ,011
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test
( X1 − X ) (X 2 − X ) (X n − X ) n
χ2 = + +K+ = Z12 + Z 22 + K + Z n2 = ∑ Z i2
σ2 σ2 σ2 i =1
Burada Gij gözlenen frekansları (A,B,C,D), Tij (A’,B’, C’, D’) ise
beklenen frekansları göstermektedir. Beklenen frekanslar satır ve
sütun toplamlarının çarpımının genel toplama bölünmesi ile
hesaplanır.
A’=N1*N3/N B’=N1*N4/N C’=N2*N3/N D’=N2*N4/N
(Gij − Tij ) 2 (246 − 175) 2 (122 − 193) 2 (125 − 196) 2 (287 − 216) 2
χ = ∑∑
2
= + + +
Tij 175 193 196 216
= 103.87
Serbestlik derecesi=(R-1)*(C-1)=(2-1)*(2-1)=1
χ 2 = 103.87 > χ 02.01, 1 = 6.64 H0 reddedilir. Cinsiyetle düzenli spor
yapma arasında ilişki vardır.
Yrd.Doç.Dr.Yüksel TERZĐ 216
Yrd.Doç.Dr.Yüksel TERZĐ 217
Yrd.Doç.Dr.Yüksel TERZĐ 218
Yrd.Doç.Dr.Yüksel TERZĐ 219
Chi-Square Tests
Asymp. Sig. Exact Sig. Exact Sig.
Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square 103,877b 1 ,000
Continuitya
Correction 102,418 1 ,000
Likelihood Ratio 106,211 1 ,000
Fisher's Exact Test ,000 ,000
Linear-by-Linear
Association 103,744 1 ,000
N of Valid Cases 780
a. Computed only for a 2x2 table
b. 0 cells (,0%) have expected count less than 5. The minimum expected
count is 175,04.
0 1 2+ ∑
Fırça Fırça Fırça
Đlk okul 5 27 5 37
(1.78) (22.06) (13.16)
Lise+ 5 97 69 171
(8.22) (101.94) (60.84)
∑ 10 124 74 208
i =1 j =1
Tij
Khi-Kare=5,833+1,107+5,063+1,262+0,24+1,095= 14,600
Prob(a, b, c, d) =
(a + b )!+(c + d )!+(a + c)!+(b + d )!
n!a!b!c!d!
ile hesaplanır. Birinci sıra ve birinci sütundaki (a) hücresinin değeri her seferinde
1 küçültülerek yeni tablo ve bunun elde edilme olasılığı hesaplanır. Bu işlem a’
Yrd.Doç.Dr.Yüksel TERZĐ 223
nın değeri sıfır oluncaya kadar devam edilir.
Örnek: Perikardial efüzyon olan ve olmayan hastalarda sigara
içme durumu arasında bir ilişki olup olmadığı araştırılıyor. 60 kişi
ile yapılan bir denemede aşağıdaki tablo elde ediliyor.
Sigara içme
var Yok ∑
Efüzyon var 2 23 25
olması yok 5 30 35
∑ 7 53 60
Prob(a, b, c, d) =
(25)!+(35)!+(7 )!+(53)!
= 0.252
60!2!23!5!30!
Prob(a, b, c, d) =
(25)!+(35)!+(7 )!+(53)!
= 0.105
60!1!24!6!29!
Sigara içme
var yok ∑
Efüzyon yok 0 25 25
olması var 7 28 35
∑ 7 53 60
Bu tablonun elde edilme olasılığı:
Prob(a, b, c, d) =
(25)!+(35)!+(7 )!+(53)!
= 0.017
60!0!25!7!28!
Yrd.Doç.Dr.Yüksel TERZĐ 225
Bu olasılıklar toplanırsa, Fisher’in tek yönlü kesin
olasılığı elde edilmiş olur. Çift yönlü olasılık istenirse
bunun iki katı alınır, yani p=0.688 olur.
α=0.05
P(fisher)=(0.017+0.105+0.252)=0,374>α
Tüketici Görüşleri
Ürünler Toplam
Beğenen Beğenmeyen Đlgisiz
I.Ürün 60 30 10 100
II.Ürün 80 50 20 150
Toplam 140 80 30 250
χ 2
c=
χ +n
2
Count
tüketici
Beğenen Beğmeyen Đlgisiz Total
ürün 1 60 30 10 100
2 80 50 20 150
Total 140 80 30 250
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 1,240a 2 ,538
N of Valid Cases 250
a. 0 cells (,0%) have expected count less than 5. The minimum
expected count is 12,00.
Symmetric Measures
Asymp.
a b
Value Std. Error Approx. T Approx. Sig.
Nominal by Nominal Contingency Coefficient ,070 ,538
Interval by Interval Pearson's R ,070 ,062 1,109 ,269c
Ordinal by Ordinal Spearman Correlation ,070 ,063 1,105 ,270c
N of Valid Cases 250
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
c. Based on normal approximation. Yrd.Doç.Dr.Yüksel TERZĐ 235
ÇAPRAZ TABLOLARDA KORELASYON
χ 2
r=
n(k − 1)
π1<1 , 0<π
0<π π2<1 olmak üzere
H0 : π1=π
π2 H0 : π1=π
π2 H0 : π1=π
π2
H1 : π1≠π
π2 H1 : π1<π
π2 H1 : π1>π
π2
( p1 − p 2 ) − (π 1 − π 2 ) p1 (1 − p1 ) p 2 (1 − p 2 )
Z= , s p1 − p 2 = +
s p1 − p 2 n1 n2
0,18 − 0,147
Z= = 0,64
1 1
0,154.0,846 +
61 238
Z2=0,642=0,42=Ki-kare
Yrd.Doç.Dr.Yüksel TERZĐ 241
Bağımlı Gruplarda Ki-Kare Testi (McNemar Testi)
2x2 tablolarda bir örnek grup üzerinde iki farklı
uygulama yapıldığını (örneğin bağımlı olduğunu) ve iki ölçüm
arasındaki farkın anlamlı olup olmadığını test eder.
χ =
2 ( B − C )2
B+C
Eğer B+C<30 ise test istatistiği aşağıdaki gibi düzeltilir.
χ 2
=
( B − C − 1)
2
B+C
χ 2
1,α ≤ χ
Serbestlik derecesi 1 dir. Yrd.Doç.Dr.Yüksel
2
h ise H0 reddedilir.
TERZĐ 242
Örnek: 30 öğrencinin kurs öncesi vermiş oldukları cevap dağılımı
ile kurs sonrası vermiş oldukları cevapların değişimini incelemek
istiyoruz. Veriler aşağıdaki gibidir. Kurs öncesi sonuçların kurs
sonrası değişmesi önemli midir?
χ2 =
( B − C − 1)2
=
( 8 − 6 − 1)2
= 0.071
B+C 8+6
Count
sonra
+ - Total
once + 13 8 21
- 6 3 9
Total 19 11 30
Chi-Square Tests
Exact Sig.
Value (2-sided)
McNemar Test ,791a
N of Valid Cases 30
a. Binomial distribution used.
Standart Test
+ - Toplam
Alternatif
Test + A B A+B
- C D C+D
Toplam A+C B+D N
Patoloji + - ∑
+ 20 12 32
- 2 16 18
∑ 22 28 50
(A+D)/N=36/50=0.72
E=[(A+B)/N*(A+C)/N]+[(C+D)/N*(B+D)/N]=32/50*22/50+18/50*28/50=0.483
Kappa=0.237/0.517=0.458
Count
BT
+ - Total
patoloji + 20 12 32
- 2 16 18
Total 22 28 50
Symmetric Measures
Asymp.
a b
Value Std. Error Approx. T Approx. Sig.
Measure of Agreement Kappa ,458 ,114 3,514 ,000
N of Valid Cases 50
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
A ortamı
+ - ∑
ortamı
+ 20 12 32
B
- 2 16 18
∑ 22 28 50
(∑ X j ) 2 ( X ) 2
∑X − ∑
k
GnKT = ∑ X 2
− , GAKT = ∑ , HKO = GnKT − GAKT
j =1
n nj n
Yrd.Doç.Dr.Yüksel TERZĐ 266
Çoklu Karşılaştırma Testleri
Varyans analizi ile k tane grup arasında farklılık olup olmadığı
araştırılır. Eğer gruplar arasında farklılık varsa, hangi gruplar arasında
fark olduğu çoklu karşılaştırma testleri (post-hoc test) ile yapılır. Çeşitli
çoklu karşılaştırma testleri bulunmaktadır. Bu testler aynı sonucu
vermeyebilir.
(∑ X j ) 2 ( X ) 2
∑X , − ∑
k
GnKT = ∑ X 2
− GAKT = ∑ , GĐĐK = GnKT − GAKT
j =1
n n n
j
Hipotezler: H0: Gruplar arası fark yoktur. H1: Gruplar arasında fark vardır.
Karşılaştırma: FHesap=25.3 FTablo = 2.35 ; 25.3 > 2.35 olduğundan H0 ret edilir.
H0 : µA=µB=µC
Yrd.Doç.Dr.Yüksel TERZĐ 276
Mean difference kısmında * işaretli grup ortalamaları birbirinden farklıdır.
Yrd.Doç.Dr.Yüksel TERZĐ 277
Buna göre A ile B ve B ile C grup ortalamaları birbirinden farklıdır.
Eğer veriler normal
dağılış göstermiyorsa,
non-parametric
testlerden Kruskal-
Wallis testi kullanılır.
makina
Chi-Square 19,439
df 2
Asymp. Sig. ,000
a. Kruskal Wallis Test
b. Grouping Variable: tur
H 0 : µ1 = µ 2 = µ 3 = µ 4
H1 : µ1 ≠ µ 2 ≠ µ 3 ≠ µ 4 ( En az iki ortalama farklı)
VK KT SD KO F
Gruplar arası 804 k-1=3 804/3=268 268/256.8=1.04
Gruplar içi 5136 n-k=20 5136/20=256.8
Genel 5940 n-1=23
Kimyasal
Tür(Etki)
1 2 3 4 5
Varsayımlar:
- Rasgele örnekleme
- Tekrarlanan ölçümler
- Bağımsız örneklemler
- Normallik şartı
- varyans-kovaryans varsayımı
(grupların korelasyonu aynı olmalı
ve gruplardaki varyansın eşit olması)
- Tüm anakütle varyansları eşit olmalı
H0 : Herhangi bir denek ile ilgili gözlemlerin bütün muhtemel sıralamaları eşittir.
Yada gruplardan hiçbirisi diğerinden daha büyük değer oluşturmaz.
X Y X2 Y2 XY
1 14 1 196 14
2 13 4 169 26
3 12 9 144 36
3 13 9 169 39
2 11 4 121 22
1 12 1 144 12
4 12 16 144 48
5 11 25 121 55
4 14 16 196 56
3 13 9 169 39
6 12 36 144 72
5 12 25 144 60
10 10 100 100 100
9 11 81 121 99
1 14 1 196 14
8 11 64 121 88
9 10 81 100 90
7 9 49 81 63
6 12 36 144 72
7 10 49 100 70
Yrd.Doç.Dr.Yüksel TERZĐ 312
Sx 96 Sy 236 Sx2 616 Sy2 2824 Sxy 1075
Elde edilen sonuca göre kullanılan izin miktarı ile performans
puanları arasında negatif yönlü kuvvetli ilişki vardır. Kullanılan izin
miktarı arttıkça performans puanları düşmektedir. Bulunan korelasyonun
gerçekten önemli olup olmadığı incelenirse
Hipotezler, H0 : j=0 ; H1 : j ≠ 0
aˆ = Y − bˆ X
Yrd.Doç.Dr.Yüksel TERZĐ 318
BASİT DOĞRUSAL REGRESYON DENKLEMİN VARSAYIMLARI
1. Bağımsız değişkenin değerleri sabit ve rassal olabilir.
2. Bağımsız değişkenin ölçüm hataları ihmal edilebilecek kadar
küçüktür.
3. Her X değeri için Y değerlerinden oluşan bir alt küme vardır.
Bu alt kümelerin dağılımı normaldir.
4. Bu alt küme değerlerinin (Y’lerin) varyansları eşittir.
5. Bu alt kümelerin ortalamaları aynı doğru üzerindedir Bu
varsayım doğrusallık varsayım olarak bilinir.
y = β 0 + β1 x1 + β 2 x2 + L + β p x p + ε
Modelde amaç;
• Bağımsız değişkenler yardımı ile bağımlı değişkeni kestirmek,
• Bağımsız değişkenlerden hangisi-hangilerinin bağımlı değişkeni daha
çok etkilediğini bulmak ve aralarındaki karmaşık yapıyı tanımlamaktır.
H 0 : β1 = β 2 = L = β p = 0
H1 : En az bir β j ≠ 0
Yrd.Doç.Dr.Yüksel TERZĐ 320
Çoklu Doğrusal Regresyona
İlişkin Varsayımlar
1. Normal dağılım
2. Doğrusallık
3. Hata terimlerinin ortalaması sıfırdır
4. Sabit varyans
5. Otokorelasyon olmaması
6. Bağımsız değişkenler arasında çoklu bağlantı
olmaması
Kovaryans Analizi, iki veya daha fazla grupta bir sürekli (bağımlı)
değişkenin ortalamalarının karşılaştırılması sırasında, bu değişkene etki
eden başka sürekli değişkenin etkisinin ortadan kaldırılması veya bu
etkinin arıtılması maksadıyla kullanılan bir tekniktir.
Bu analizin avantajı sonuçtaki hata varyansını azaltma ve denekler
arasındaki diğer farklılıkları dikkate alarak, grup farklılıklarını ortaya
koyar. Bağımlı değişkendeki değişmeyi kontrol altına alarak, hata
varyansını azaltır.
Kovaryans Analizinde bir bağımlı değişken olmasına karşılık,
birden fazla bağımsız değişken ve birden fazla covariate (kod değişken)
olabilir.
Üç grup hastanın sağlık durumu karşılaştırıldığında ve yaş da
önemli olarak görülüyorsa, yaş değişkeni kontrol altında tutularak
ANCOVA yapılabilir. Böylece yaştaki değişmelerden kaynaklanan
değişiklik açıklanmış olur.
Bağımsız değişken
(Grup) ve kod değişken
(hastakod) ile bağımlı
değişken (uyumskor)
arasında önemli bir ilişki
vardır.
3
Eigenvalue
0
1 2 3 4 5 6 7 8 9 10
Component Number
Şekilde öz değerlerin nispi değerleri verilmiştir. Burada her faktör ile
ilişkili toplam varyans gösterilmiştir. Grafikte 1 ve 2. faktörden sonra belli
bir düşme olduğu görülmektedir. Dolayısıyla faktör sayısı 2 olarak tespit
edilir. 3 ve diğer faktörlerden sonra önemli bir düşüş eğilimi
görülmemektedir. Yani üçüncüYrd.Doç.Dr.Yüksel
ve sonraki faktörlerin varyansa katkıları
TERZĐ 362
birbirine yakındır.
Component Matrix a Rotated Component Matrix a
Component Component
1 2 1 2
YONTEM7 ,797 8,8E-02 YONTEM2 ,798 ,132
YONTEM4 ,759 -,161 YONTEM1 ,779 7,8E-02
YONTEM3 ,749 -,249 YONTEM3 ,748 ,251
YONTEM6 ,743 -9,E-02 YONTEM4 ,703 ,327
YOMTEM5 ,736 1,6E-02 YONTEM6 ,648 ,375
YONTEM2 ,717 -,374 YONTEM7 ,584 ,549
YONTEM1 ,670 -,406 YOMTEM5 ,578 ,455
YONTEM8 ,668 ,272 YONTEM9 9,1E-02 ,807
YONTEM10 ,629 ,514 YONTEM10 ,194 ,789
YONTEM9 ,557 ,590 YONTEM8 ,370 ,619
Extraction Method: Principal Component Analysis.
Extraction Method: Principal Component
a. 2 components extracted. Analysis.
Rotation Method: Varimax with Kaiser
Normalization.
Component matrix tablosunda birinci a. Rotation converged in 3 iterations.