Professional Documents
Culture Documents
İstatistiğin İşlevleri
1. Tanımlama (betimleme)
1
İstatistiğin İşlevleri
Verilerin tamamı hakkında ilgili bütün bilgilere
sahip olma anlamında “tümdengelim”
İstatistiğin İşlevleri
2. Çözümleme (analiz)
3. Kestirim ve öngörü
2
İstatistiğin İşlevleri
4. Olasılık
5. Örnekleme
6. İlişkilerin çözümlenmesi
Korelasyon analizleri
7. Karar verme
Değişkenler
Değişken nedir?
3
Değişken özellikleri
Değişken özellikleri
2. Nitelik: Birimlere dayalı ölçümlerle değil
sayımlarla değerleri belirtilebilen özelliklerdir.
4
Nitel değişken tipleri
5
Nitel değişken tipleri
3. Đki durumlu (dikotom) değişkenler:
Cinsiyet (kadın-erkek)
Hastalık var-yok
Evet-hayır
Tanımlayıcı
istatistikler
Sıklık ve sıklık dağılımı(frekans tabloları)
6
Sıklık ve sıklık dağılımı
(frekans tabloları)
7
Genel görünüm
1. SPSS temel olarak iki ekrandan oluşur. Veri giriş
(Dataentry) ekranı ve sonuç (Output) ekranı.
2. Veri giriş ekranından değişkenler tanımlanır, veriler
girilir,düzenlenir, kaydedilir.
3. Buradan herhangi bir istatistik komutu verildiğinde
otomatik olarak sonuç ekranı açılır.
4. Sonuç ekranında istatistik analiz sonuçları, tablolar ve
grafikler olarak gösterilir. Gerekirse bunlar üzerinde
düzeltmeler yapılmasına olanak sağlar.
1. Veri giriş ekranı kendi içinde iki alt sayfaya ayrılır. Ekranın sol alt
kısmında görülen sekmelerden verilerin girildiği ve
değişkenlerin tanımlandığı sayfalar arasında geçiş yapılabilir.
8
Sonuç ekranı
SPSS menüler
Veri sayfası menüleri
9
Veri sayfası menüleri
10
Sonuç sayfası menüleri
– Ekle (İnsert): Tablo başlığı, tablo açıklaması gibi ekler buradan yapılır.
Ana menüler
SPSS File Menüsü
1- New sekmesi ile, yeni veri, çıktı, makro ve program dosyası oluşturulabilir.
2- Open sekmesi ile, daha önce kayıt edilmiş veri, çıktı, makro ve program
dosyaları açılabilir
4- Read Text Data sekmesi ile, metin dosyası biçiminde girilen veri dosyaları
aktarılabilir.
11
SPSS File Menüsü
7-Display Data Info.. sekmesi ile veri dosyası hakkında bilgiler elde
edilir.
8- Apply Data Dictionary.. ile herhangi bir veri sözlüğü aktif veri
dosyasına uygulanabilir
9- Cache data ile, veri dosyasının geçici bir kopyası oluşturulur.
10- Print sekmesi yazdırmak amacı ile kullanılır.
11- Print preview ile baskı önizleme yapılabilir
12- Switch server, ağ altında çalışan bilgisayrlarda kullanılılır
13- Recently used data sekmesi, son kullanılan veri dosyalarını
gösterir
14- Recently used files sekmesi, son kullanılan dosyaları gösterir.
Değişken Tanımlama
Her bir değişkenin;
adı (name),
tipi (type),
uzunluğu(witdh),
değişken sayısal ise kesirli kısmı ( decimals),
etiketi ( labels), ve etiket değeri, hatalı verilerin tanımı ( missing values),
kolon genişliği, sağa sola bitişik ( align) özelliği ve
ölçüm düzeyi tanımlanabilir
12
Değişken Tanımlama
Sık kullanılan değişken tipleri "numeric","string" ve "date"tir.
• Ortanca (medyan)
13
Merkezi Eğilim Ölçüleri
• Ortalama (aritmetik ortalama) : Tüm ölçüm değerlerinin toplanıp,
örnekteki ölçüm sayısına bölümü ile elde edilir.
Yayılım Ölçüleri
(Nicel Verilerde)
Veriler arasında değişimden kaynaklanan farklılıkların istatistiksel
ölçüleridir.
Standart sapma,
Varyans,
Standart hata,
Varyasyon katsayısı
Değişim genişliği,
Çeyrek sapma,
Mutlak sapma,
14
Yayılım Ölçüleri
(Nicel Verilerde)
• Standart sapma: Dağılımdaki her bir değerin ortalama’ya göre ne
uzaklıkta olduğunu, dağılımın ne yaygınlıkta olduğunu gösterir.
Büyüdükçe dağılım yaygınlaşır.
• Varyasyon Katsayısı: VK= SS / Ortalama x100
Örnek: Ortalama= 28,8, Standart Sapma= 8,2 olduğunu
VK = 8,2 / 28,8 x 100 = %28,4
Yorumu: Bu dağılımdaki değerler Ortalamaya göre %28.4’lük bir
değişim göstermektedir.
• Varyans: Standart sapmanın karesidir. Büyüdükçe dağılım
yaygınlaşır.
• Standart hata: Standart sapmanın, örnek sayısının
kareköküne bölünmesi ile bulunur.
Normal dağılım
içindedir.
15
Normal dağılım
İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir.
16
Normal dağılım
Dağılımın normal olup olmadığının incelenmesi:
Testler:
Shapiro-Wilks (n<30) ve
Normal dağılım
Örneklem büyüklüğü arttıkça, katılımcıların dağılımı ve
ortalamanın örneklem dağılımı normal dağılıma yaklaşır.
17
Sivrilik ve çarpıklık
Eğrinin tepesinin sivriliği (Kurtosis)
Tepe sivri ise........Leptokurtik,
Tepe basıksa.........Platikurtik
Yatıklık (Skewness)
Değer – ise sola, + ise sağa çarpık bir veri seti ile çalıştığımız anlaşılır.
Basıklık ve Sivrilik dereceleri
histogram’lardan anlaşılabilir.
Normal dağılım için basıklık ve sivrilik
değerleri sıfır(0) ‘dır.
18
SPSS ile normal dağılıma uygunluk analizi
Çıkan kutuda normal
dağılıma uygunluğu test
edilecek değişkenler sol
kutucuktan seçilerek sağ
kutucuğa (dependent list)
aktarılır.
Eğer birden çok grupta
aynı değişkenin normal
dağılıma uygunluğu
incelenecek ise sağ altta
yer alan “factor list”
kutucuğuna aktarılır
19
SPSS ile normal dağılıma
uygunluk analizi
Sonuç sayfasında üstte değişkene ilişkin tanımlayıcı
istatistikler,daha sonra normal dağılıma uygunluk istatistiği,
sonra grafikler yer alır.
Đstatistik kutucuğunda p değeri (Sig.) 0,05 ten küçük ise
örneklemimizin dağılımının normal dağılımdan farklı olduğu
kabul edilir.
20
Parametrik ve parametrik
olmayan testler
Parametrik ve parametrik olmayan testlerin her
ikisinin de birbirine üstün yönleri vardır.
21
Parametrik ve parametrik olmayan testler
Niteliksel veriler için parametrik olmayan testler kullanılır. Bunun
yanında ölçümle belirtildiği halde veri parametrik test varsayımlarını
yerine getiremiyorsa, denek sayısı az ise ya da değerler yerine sıraları
verilmişse yine parametrik olmayan testler kullanılır.
DAĞILIMLARI TANIMLAYICI
ÖLÇÜLER
22
A. YER GÖSTEREN ÖLÇÜLER
1. MERKEZ ÖLÇÜLERİ
ARİTMETİK ORTALAMA (mean)
ORTANCA (median)
TEPE DEĞERİ (mod)
GEOMETRİK ORTALAMA
HARMONİK ORTALAMA
KARESEL ORTALAMA
2. ÇEYREK VE YÜZDELİKLER
B. YAYGINLIK ÖLÇÜLERİ
STANDART SAPMA
VARYANS
VARYASYON KATSAYISI
STANDART HATA
DAĞILIM ARALIĞI (RANGE)
INTERQUARTILE RANGE
23
24
ARİTMETİK ORTALAMANIN SAKINCALARI
Dağılımdaki aşırı değerlerden ileri derecede
etkilenir.
Dağılımdaki aşırı değerler aritmetik ortalamayı
kendilerine doğru kaydırırlar.
Bu etkilenme aşırı değerlerin aşırılık ölçüsü ile
doğru, dağılımdaki veri sayısıyla ters orantılıdır.
Ters yöndeki aşırı değerler birbirlerinin etkisini
azaltır.
25
DAĞILIMDA AŞIRI DEĞERLER
VARSA
1. Aşırı değerler değerlendirmeden
çıkarılabilir.
2. Aşırı değerler yerine uygun bir başka değer
atanabilir
3. Verilere dönüşüm (transformasyon)
uygulanabilir
4. Aritmetik ortalama yerine başka bir merkez
ölçüsü kullanılabilir. Bu durumda sıklıkla
ortanca tercih edilir.
DAĞILIMLARI TANIMLAYICI
ÖLÇÜLER
26
A. YER GÖSTEREN ÖLÇÜLER
1. MERKEZ ÖLÇÜLERİ
ARİTMETİK ORTALAMA (mean)
ORTANCA (median)
TEPE DEĞERİ (mod)
GEOMETRİK ORTALAMA
HARMONİK ORTALAMA
KARESEL ORTALAMA
2. ÇEYREK VE YÜZDELİKLER
B. YAYGINLIK ÖLÇÜLERİ
STANDART SAPMA
VARYANS
VARYASYON KATSAYISI
STANDART HATA
DAĞILIM ARALIĞI (RANGE)
INTERQUARTILE RANGE
27
28
ARİTMETİK ORTALAMANIN SAKINCALARI
Dağılımdaki aşırı değerlerden ileri derecede
etkilenir.
Dağılımdaki aşırı değerler aritmetik ortalamayı
kendilerine doğru kaydırırlar.
Bu etkilenme aşırı değerlerin aşırılık ölçüsü ile
doğru, dağılımdaki veri sayısıyla ters orantılıdır.
Ters yöndeki aşırı değerler birbirlerinin etkisini
azaltır.
29
DAĞILIMDA AŞIRI DEĞERLER
VARSA
1. Aşırı değerler değerlendirmeden
çıkarılabilir.
2. Aşırı değerler yerine uygun bir başka değer
atanabilir
3. Verilere dönüşüm (transformasyon)
uygulanabilir
4. Aritmetik ortalama yerine başka bir merkez
ölçüsü kullanılabilir. Bu durumda sıklıkla
ortanca tercih edilir.
GRAFİKLER
30
Grafik Çiziminde Dikkat Edilmesi
Gereken Kurallar
31
GRAFĐK TÜRLERĐ
Sütun (Column) Grafik Tipi
Verilerin karşılaştırılmasını sağlar.
Belli bir zaman aralığındaki değişiklikleri gösterir.
Sütun grafikler, belli bir seri verinin özellikle zamana bağlı
değişiklileri göstermek için kullanılır.
Kategoriler yatay, değerler ise dikey olarak düzenlenirler.
32
Çizgi (Line) Grafik Tipi
Zaman içindeki değişimi ifade etmede kullanılır.
Verilerin oluşumunu ve hareketini çizgiler halinde gösterir.
Zaman akışı ve değişimin oranı gibi durumları göstermek için
kullanılırlar.
Beli aralıklarda yada belli zamanlardaki değişikliği gösterir.
Örneğin bir hisse senedinin veya döviz kurunun seyrini en
iyi açıklarlar. Çizgi grafikte veri serileri yatay çizgilerle ifade
edilirler.
33
34
35
36
37
38
39
Not: 1.5 yerine 3 yazılırsa aykırı değer yerine uç değer bulunur.
40
41
42
43
44
45
46
47
Ölçek
ve
Ölçek Çeşitleri
48
Ölçek
Yapılacak analiz öncesinde, kullanacak verilerin
türünü belirlenmesi ve analiz yöntemlerini bu
veri türüne uygun olarak seçilmesi büyük önem
taşır.
SPSS programında,
Scale (Ölçek),
Nominal (Sınıflama)
Ordinal (Sıralama)
olmak üzere üç farklı ölçek türü bulunmaktadır.
Literatürde yer alan Interval (Aralık) ve Ratio
(Oran) ölçekleri SPSS programında Scale ölçeği
altında toplanmıştır
49
Oran (Ratio) Ölçeği:
•aylık gelir,
•ağırlık,
• uzunluk,
•hız
gibi değişkenleri ölçmek için kullanılır. Bu
ölçekte başlangıç “0” noktasıdır.
50
Sınıflama Ölçeği (Nominal)
Sınıflama ölçeğinde değişkenlerin aldığı değerler sayısal bir büyüklük
ifade etmezler. Bu değerler değişkenlere ait bazı özellikleri tanımlarlar.
Örneğin Cinsiyet değişkeni için “1” değeri “Kadın”ları, “2” değeri
“Erkek”leri temsil edebilir. Bu çerçevede Medeni Durum, Meslek,
Doğum Yeri gibi değişkenlere ait ölçümler için sınıflama ölçeğinin
kullanımı uygun olacaktır.
51
ÖRNEKLEME TEORİSİ
Evren
Evren (population,anakütle) araştırma sonuçlarının
genellenmek istendiği elemanlar bütünüdür.
Ortak özellikleri olan canlı ya da cansız her türlü
elemandır.
Tekli elemanlar için “örnek olay”,
Küçük çokluklar için “araştırma kümesi”
52
Değişkenlerin Ölçülmesi
Tamsayım
Araştırma evreninin tamamının, yani o
evrendeki bütün birimlerin incelenmesine tam
sayım denir. Tam sayımın tipik örneği bir
nüfusun karakteristiklerini tüm birimleri
tarayarak saptayan nüfus sayımlarıdır. Tam
sayım istisnai bir durumdur.
53
Tam sayımın mümkün olmadığı durumların nedenleri:
54
Örnekleme Nedenleri
6- Etik zorunluluklardır.
55
•Bilimsel araştırmalarda doğru bilgi sahibi olmak ve doğru karar
vermek esastır. Bu yüzden doğru bilgilere ulaşmak ve elde edilen
bilgileri genelleştirmek ihtiyacı vardır.
_Örneklemin yansızlğı,
56
ÖRNEKLEM BÜYÜKLÜĞÜNÜ ETKİLEYEN ETMENLER
1-Evrenin Benzeşikliği:
Örneklemede önemli olan, evreni temsil edebilecek “tipik”
birimleri bulabilmektir. Evrenin benzeşikliği arttıkça, tipik birim
bulma işi kolaylaşır. Alınacak tipik birimlerden çıkacak sonuçları
benzerlerine genellemek kolaydır.
Her gözenek, ayrı özellikteki bir alt grubu temsil ettiğine göre, her
grubun kendi evrenini temsil edebilecek büyüklükte seçilmiş olması
gerekir. Bu nedenle, gözenek sayısı artıkça, örneklemin büyüklüğü de
artar.
57
4-Örnekleme türü:
Örnekleme türü de örneklem büyüklüğünü etkiler. Örneğin
oranlı örneklemelerde gerekli örneklem büyüklüğü daha
küçüktür. Bu teknik içinde en az sayıda birim gerektireni
tabakalı örneklemedir. Basit random örneklemelerde, aynı
güven düzeyine ulaşmak üzere gereken örneklem büyüklüğü
tabakalı örneklemeye oranla daha büyüktür.
58
6-Evren değeri temsilde aranan güven düzeyi ile sapma miktarı:
Çoğunlukla %95 yada %99 olarak alınır. Yanılma olasılıkları sıra ile %5
ile %1’dir. Formüllerde, yanılma olasılıklarının “z” değerleri kullanılır.
.0,5 için 1.96
.0,1 için 2.58
59
7-Olanaklar:
Araştırmacı, herşeyin en iyisini yapmak için işe başlar. Ancak kısa zamanda
görür ki, “ideal” den bazı ödünler vermek zorunda kalınabilmektedir. İdeal
“varolan koşullarda en uygun olan” olarak algılanmalıdır.Bu nedenle, varolan
para, insan gücü ve teknik olanakları dikkate alan araştırmacı, kestirilmek
istenen evren değer türü, güven düzeyi ve sapma sınırları ile olanakların
birleştirilmesi gibi konularda yeni önlemler düşünerek örneklem
büyüklüğünde olabilecek düzeltmeleri yapabilir.
Kestirilmek istenen evren değerin, çok büyük örneklem gerektirmesi
halinde, bunun aranması gereken “en uygun bir değer olup olmadığı” sorusu
cevaplandırılmaya çalışır. Örnekleme türü de örneklem büyüklüğünü etkiler .
Örnekleme Türleri
•Olasılıksız
•Olasılıklı
60
Olasılıklı örnekleme, evreni oluşturan birimlerin hepsine eşit
seçilebilme şansının verildiği örnekleme türüdür.
61
Basit tesadüfi örnekleme. Basit tesadüfi örneklemede
evreni oluşturan her elemanın örneğe girme şansı eşittir. Dolayısıyla
hesaplamalarda da her elemana verilecek ağırlık aynıdır. Bu
yöntemin kullanılabilmesi için ele alınan problemlerle ilgili bilgilerin
evrene göre benzeşik (homojen) olması gerekir. Örneğin, seyahat
harcamalarının aile bütçesindeki ortalama payını bulmak için basit
tesadüfi örnekleme yöntemini kullanmak doğru değildir. Çünkü gelir,
meslek vb. özellikler yönünden farklı olan ailelerin seyahat
harcamalarının bütçeleri içindeki payları farklıdır. Bu farklar
ortalamayı önemli ölçüde etkileyeceğinden, basit tesadüfi
örnekleme yönteminin kullanılması doğru değildir.
Sistematik örnekleme:
Sistematik örneklemeye genellikle basit tesadüfi örneklemeye ihtiyaç duyulduğunda
başvurulur. Bu yöntemde örnekleme alınacak elemanların sayısı önceden belirlenir.
Buna göre, örneklemdeki eleman sayısının evrendeki eleman sayısına oranı (k)
hesaplanır. Daha sonra evrendeki elemanlar sıraya dizilir ve bu orana göre sıra
numarası verilir. Verilen sıra numarasına göre başlangıçtan itibaren her
1/k’ nıncı eleman örnekleme alınır.
Sistematik örnekleme, evrendeki elemanlara sıra numarası verilerek yapılabileceği gibi,
alfabetik sıraya konularak ya da başka bir sistematik yolla da yapılabilir. (Baykul, 1996,
s.259). Sistematik örneklemenin uygulanacağı evreni oluşturan birimlerin tamamen
tesadüfi olarak dağılmış olmaları gerekir.
62
Tabakalı örnekleme:
Tabakalı örnekleme, sınırları belirlenmiş bir evrende alt tabakalar veya
alt birim gruplarının var olduğu durumlarda kullanılır. Burada önemli
olan, evren içindeki alt tabakaların varlığından yola çıkarak evren
üzerinde çalışmaktır.
Küme örnekleme:
Kümelere göre örnekleme yönteminde evren küme adı verilen
gruplara ayrılır, her küme bir örnekleme birimi olarak tanımlanır. Tesadüfi
olarak seçilen kümeler bir araya getirilerek örneklem oluşturulur.
Evreni oluşturan elemanların tam olarak listelenemediği hallerde
küme örneklemesinden yararlanılır. Özellikle ülke çapında yapılan
araştırmalarda örnekleme girmesi gereken elemanlara ulaşmak genellikle
güçtür. Örneğin, liselerde yapılacak bir araştırma örneklemi için, liselerde
okuyan öğrencilerin listesi bulunsa dahi basit tesadüfi örnekleme ile alınacak
örnek, topluluk içine dağınık olarak serpiştirilmiş olacağından örneğe çıkan
birimlere ulaşmak güçtür. Bu durumda yaygın bir örnekle çalışmak yerine,
evreni oluşturan her birime eşit seçilme şansı tanınarak örnekleme yapılır.
Küme örnekleme ile seçilen örnekler bir evrenin tek tek birimleri değil, o
birimlerin oluşturdukları kümelerdir.
63
Gelişigüzel örnekleme:
Araştırmacının saptanan örneklem büyüklüğüne
göre herhangi bir şekilde evrenin bir parçasını
seçmesidir. Herhangi bir fakülteye gidip
saptanacak sayıda rastlanan öğrenciyi örnekleme
alma gelişigüzel örneklemedir.
Kota örnekleme:
Kota örneklemede sınırlı bir evren, araştırmanın amacına
uygun olarak araştırmacının öngördüğü belirli değişkenlere
göre sınıflandırılır. Bu değişkenler yaş, cinsiyet, eğitim durumu,
meslek, hastalık olabileceği gibi, etnik köken, kırsal ve kentsel
değişkenler de olabilir.
64
Amaçlı örnekleme:
Araştırmanın amaçları doğrultusunda bir evrenin temsilci bir
örneği yerine, amaçlı olarak bir ya da birkaç alt kesimini örnek olarak
almaktır. Başka bir deyişle amaçlı örnekleme, evrenin soruna en uygun
bir kesimini gözlem konusu yapmak demektir.
Endüstride meslek hastalıklarıyla ilgili olarak yapılacak bir
araştırmada, araştırmacının, meslek hastalıklarının tüm evren içinde
değil, özellikle belli bir hizmet süresini aşmış ya da belli bir yaş sınırının
üstündeki işçiler arasında daha açık bir biçimde gözlenebileceğini
düşünerek, tüm işçiler evrenini değil, orta yaşlı ve yaşlı işçiler kesimini
temsil eden bir seçim yapması buna örnek verilebilir.
Kartopu örnekleme:
Kartopu örneklemede öncelikle evrene ait
birimlerden birisi ile temas kurulur. Temas kurulan birimin
yardımıyla ikinci birime, ikinci birimin yardımıyla üçüncü
birime gidilir. Bu şekilde, sanki bir kartopunun büyümesi
gibi örneklem büyüklüğü genişler.
Marmara Üniversitesi’nin kuruluş yıllarındaki
felsefesini çalışmak isteyen bir araştırmacı için, Marmara
Üniversitesi’nde emekliliği yaklaşmış veya emekli olmuş
birkaç öğretim üyesi çalışmanın ilk örneklemini oluşturabilir.
Araştırma süreci ilerledikçe, ulaşılan kişilerin yardımıyla
daha fazla kişi listeye dahil edilecek ve liste kartopu gibi
büyüyecektir.
65
Örneklem Büyüklüğünün Hesaplanması
Örneklem alınmasında örneklemin alındığı evreni temsil etmesi
önemlidir. Bu durumda ne kadar, hangi büyüklükteki bir örneklemin evreni
temsil edebileceği sorunu ortaya çıkmaktadır. Alınan örneklemin evreni
temsil yeterliği bulunmadığında örnekleme hatası olur. Yeterli bir
örneklem, güvenilir sonuçlar sağlayacak kadar eleman kapsayan
örneklemdir.
Örneklemin çok küçük olması durumunda araştırma sonuçlarının
evren için genellenebilmesi güçleşir. Betimsel araştırmalarda minimum
%10 örneklem alınır, küçük evrenlerde ise %20’ye ihtiyaç duyulur.
Korelasyon çalışmalarında en az 30, nedensel kıyaslamalarda her gruptan
en 30’ar eleman gereklidir. Deneysel araştırmalarda ise, her grupta 15’er
denek gibi az sayıda denek olması sonuçların geçerli olmasını sağlayabilir.
Bazı çevreler ise deneysel araştırmalarda her grupta en az 30’ar deneğin
bulunmasını önermektedir. Ancak örnek büyüklüğünün fazla olması fazla
olması sonuçların güvenilirliğini arttırır.
66
İstatistikte iki tür tahminden yararlanılmaktadır.
• Nokta tahmini (Tek değer tahmini)
Ana kitle parametreleri bilinmediği hallerde örneklerden elde
edilmiş değerlerden tahmin yapmaktır.
• Aralık tahmini
Örnekten elde edilmiş iki değer arasındaki aralığı ifade
etmekte ve ana kitle parametresinin bu iki değer arasında
bulunması beklenmektedir.
67
68
69
70
Örnek :Tatil amacıyla ülkemize gelen Amerikalı ve Avrupalı
turistlerin bozdurdukları günlük ortalama döviz miktarları
karşılaştırılmak isteniyor. Rasgele seçilen 100 amerikalı turistin
bozdurdukları ortalama döviz miktarı $50, avrupalı 80 turistin
bozdurdukları döviz ise $40’dır. Anakütle standart sapmaları ise
$20 ve $16’dır. Her iki kıtadan gelen turistlerin bozdurdukları
ortalama döviz miktarları arasındaki farkın güven sınırlarını %99
olasılıkla belirleyiniz.
71
(20) 2 16
x1 = 50 ⇒ x2 = 40 ⇒ S x1 −x2 = + = 2,68
100 80
P((50-40)±(2,58)(2,68))=0,99
P(3,09<µ1-µ2<16,91)=0,99
HİPOTEZ TESTLERİ
72
Anlam çıkarıcı istatistiğin amacı, ana kütleden çekilen
örnek kütlelerden yani örneklemden elde edilen bilgilere
dayanarak tahminde bulunmaktır.
Tahminde bulunurken en yaygın olarak kullanılan ana
kütle parametreleri , ortalama,varyans ve orandır.
73
Bir hipotezde bulunması gereken özellikler,
74
2.Aşama:Önem düzeyinin belirlenmesi,
olasılığıdır.
olmaktadır.
75
Hipotez testinde iki tip hata oluşabilir.
reddedilmesidir.
kabul edilmesidir.
76
Örnek büyüklüğüne göre I.tip hata olasılığı
belirlenmiş olur.
ve korelasyon katsayısıdır .
77
Hipotez sınamasında kullanılan teknikler;
78
Hipotez sınamaları
Oranlar
Ortancalar(medyanlar)
Ortalamalar
Oranların karşılaştırılmasında,
veriler bağımlıysa
• iki veri grubu varsa Mc Nemar sınama tekniği
•ikiden fazlaysa Cochran Q sınama tekniği
veriler bağımsızsa
iki veri grubu varsa Ki-kare ve Fischer sınama
tekniği
ikiden fazlaysa Ki-kare sınama tekniği
79
Ortancaların(medyanların)
karşılaştırılmasında
Ortalamaların karşılaştırılmasında,
Dağılımın normal olması durumunda parametrik sınama teknikleri
Aksi durumda parametrik olmayan sınama teknikleri ,
80
İstatistiksel karar verebilmek için, örnek kütleden elde
edilen ortalama, oran gibi istatistiksel değerler, ana kütle
parametreleriyle karşılaştırılacağından bu karşılaştırmanın
yapılabilmesi ve toplanan değerlerin bu karşılaştırma işlemine
uygun hale getrilebilmesi için hesaplamalar yapılmaktadır. Bu
işleme sınama tekniğinin hesaplanması denir.
Sınama istatistiği, araştırma sonucu elde edilen
verilerin sınama istatistik formülündeki yerine konularak işlem
yapılmasıyla elde edilir.
6.aşama:Karar ve yorum
Çizelgeden elde edilen kritik değerin, örnek kütleden
elde edilen sınama istatistiği ile karşılaştırılması
sonucunda ,araştırma probleminin çözümüyle ilgili
olarak bir sonuca varmak ve bu sonucu
değerlendirmektir.
Sınama istatistiğinin, önceden belirlenmiş olan ret
bölgesi içinde kalıp kalmamasına bağlı olarak sıfır
hipozetininin reddedilip reddedilmeyeceği istatsiksel
kararı oluşturmaktır.
81
İstatistiksel kararlarda yüzde yüz doğrular yoktur. Amaç,
istatistiğin işlevi ana kütle değerlerini tahmin etmektir.
Yorum da esas ölçütler, elde edilen veriler ve bu verilerden
çıkarılan sonuçlardır. Yorumda olması gereken değil olan önemlidir.
Yorumdaki ifadeler birbiriyle uyum içinde olmalı, problem yüzeysel
değil derinlemesine irdelenmeli, ana kütleyi temsil edemeyen bir
örnek kütleye dayanarak genelleme yapılmamalıdır. Birlikte değişme
göstermiş değişkenlerin arasında mutlaka bir bağıntı olduğu kabul
edilmeli ve nedenle sonuç asla karıştırılmamalıdır.
Ki kare Homojenlik
Ho:Sıra ve sütun kategorileri birbirine EŞİTTİR.
H1:Sıra ve sütun kategorileri birbirine EŞİT DEĞİLDİR. P>0.05 0.001 0.001>0.05 YANLIŞ Ho red - H1 kabul
Ho:İki örneklem AYNI ana kütleden seçilmiştir.
H1:İki örneklem FARKLI ana kütleden seçilmiştir. P>0.05 0.015 0.015>0.05 YANLIŞ Ho red - H1 kabul
Ho:İki parti taraftarlarının en çok etkilendikleri vaatler BENZERDİR.
H1:İki parti taraftarlarının en çok etkilendikleri vaatler BENZER DEĞİLDİR. P>0.05 0.589 0.589>0.05 DOĞRU Ho KABUL - H1 red
Ho:Bölümler başarı açısından HOMOJENDİR.
H1:Ho:Bölümler başarı açısından HOMOJEN DEĞİLDİR. P>0.05 0.140 0.140>0.05 DOĞRU Ho KABUL - H1 red
Ki kare UYGUNLUK
Ho:Verilerin dağılımı düzgün dağılıma UYGUNDUR.
H1:Verilerin dağılımı düzgün dağılıma UYGUN DEĞİLDİR. P>0.05 0.000 0.000>0.05 YANLIŞ Ho red - H1 kabul
Ho:Örnek kütle frekanslarıyla ana kütle frekansları farklı DEĞİLDİR.
H1:Örnek kütle frekanslarıyla ana kütle frekansları FARKLIDIR. P>0.05 0.129 0.129>0.05 DOĞRU Ho KABUL - H1 red
Ho:Uygunluk VARDIR.
H1:Uygunluk YOKTUR. P>0.01 0.003 0.003>0.01 YANLIŞ Ho red - H1 kabul
Ho:Aylara göre sipariş miktarı arasında fark YOKTUR.
H1:Aylara göre sipariş miktarı arasında fark VARDIR. P>0.05 0.000 0.000>0.05 yanlış Ho red - H1 kabul
82
t testi ( TEK ÖRNEKLEM) ONE SAMPLE T
Ho: Ana kütlenin ortalaması 120 dir.
H1:Ana kütlenin ortalaması 120 DEĞİLDİR. P>0.05 0.005 0.005>0.05 YANLIŞ Ho red - H1 kabul
Ho:90'a EŞİTTİR.
H1: 90' a EŞİT DEĞİLDİR. P>0.05 DOĞRU Ho KABUL - H1 red
t independet (bağımsızlık )
H1:Yeni satış yöntemiyle eski satış yöntemi arasında FARK VARDIR. P>0.01 0.00 0.00>0.01 YANLIŞ Ho red - H1 kabul
Ho:İki grubun arasında bir FARK YOKTUR.
H1:İki grubun arasında bir FARK VARDIR. P>0.05 DOĞRU Ho KABUL - H1 red
Ho:Başarıları arasında bir FARK YOKTUR.
H1:Başarıları arasında bir FARK VARDIR. P>0.05 0.003 0.003>0.05 YANLIŞ Ho red - H1 kabul
t paired (eşlenik)
Ho:Vize ve final notları arasında FARK YOKTUR.
H1:Vize ve final notları arasında FARK VARDIR. P>0.01 0.963 0.963>0.01 DOĞRU Ho KABUL - H1 red
Ho:FARK YOKTUR.
H1:Vize ve final notları arasında FARK VARDIR. P>0.05 0.001 0.001>0.05 YANLIŞ Ho red - H1 kabul
İlişki analizleri
(Korelasyon)
83
İlişki (korelasyon) katsayıları
• Yeterli bir korelasyon sonucu için n gözlem sayısının
yeterli olması (n>10) gerekir.
• Buradaki katsayılarla X ve Y gibi (X1 ve X2 gibi )
aralarında ilişki olduğu düşünülen 2 değişken
arasındaki ilişkinin derecesi (miktarı) ve yönü
belirlenmeye çalışılır.
Pearson Korelasyonu, r
• Değişkenler eşit aralıklı yada oranlama tipi ÖLÇEK ile ölçülmüşlerse,
korelasyon katsayısı (Pearson çarpım moment korelasyon katsayısı) uygun
ilişki katsayısı olarak kullanılabilir. Kitlede Korelasyon (Ro) ile örneklemde
(r) ile bulunur.
84
Pearson Korelasyonu, r
• İki değişken arasında herhangi bir ilginin olup
olmadığını belirler.
Pearson Korelasyonu, r
r = -1 ise, x ve y arasında tam negatif korelasyon vardır.
r = +1 ise, x ve y arasında tam pozitif korelasyon vardır.
r = 0 ise, x ve y arasında herhangi bir korelasyon yoktur.
• TAM Korelasyon çok nadir bir sonuçtur.
• Söz konusu tüm (X,Y) gözlemleri bire bir “bir eşitliğe”
uymaktadır.
85
Pearson Korelasyonu, r
Kuvvetli (-) Orta (-) Zayıf (-)
Pearson Korelasyonu, r
• r istatistiğinin örnekleme dağılımına göre yapılan
t, z ,ve ki-kare testlerinin belirli varsayımları vardır.
• Bunlardan biri X ve Y değişkenlerine göre dağılımın iki
değişkenli normal dağılım olmasıdır .
• Eğer bu varsayım sağlanamıyorsa Pearson
Korelasyon katsayısı ile yapılacak testler
doğru olmayacaktır.
86
Spearman sıra korelasyonu
• Parametrik olmayan bir korelasyon
yöntemidir.
• Eğer “İki değişkenli Normal dağılım
varsayımı sağlanamıyorsa veya
bilinmiyorsa” kullanılır.
• Bu yöntemde korelasyon katsayısı x ve y
değişkenlerinin gerçek değerleriyle değil, bu
değerlerin sıra numaralarıyla hesaplanır.
SPSS’te korelasyon
İki yönlü korelasyonlara
SPSS’te analiz(analyze)
menüsünden,
Correlation>Bivariete
sekmesinden ulaşılabilir.
87
SPSS’te korelasyon
• Burada açılacak kutucukta
arasında korelasyon varlığını
araştıracağımız değişkenleri
“ Variable” kutusuna aktarırız.
•Korelasyon katsayısını hangi
teste göre belirleyeceğimizi
“Correlation Coefficient”
bölmesinde,
•istatistiksel anlamlılığı tek yönlü
mü çift yönlü mü aradığımızı ise
“Test of Significance”
bölmesinde işaretleriz.
SPSS’te korelasyon
• Tamam (OK) düğmesini
tıkladığımızda karşımıza bir
korelasyon matriksi çıkar. Bu
tabloda her kutuda üç değer
yer almaktadır. En üstteki
değer korelasyon katsayısını
(r), ortadaki değer bu
korelasyonun anlamlılığını (p),
en alttaki değer ise örnek
büyüklüğümüzü (n) gösterir.
88
Ki-Kare
Testi
Ki-Kare
Uygunluk Testi
89
90
91
Ki-kare
Bağımsızlık Testi
92
93
94
Ki-Kare
Homojenlik Testi
95
96
Đstatistiklerin SPSS’te Uygulanması
Kesikli verilerin analizi
Çapraz tablolar ve ki kare
Bu tablolar;
2x2
2xn
n x m olabilir.
97
Çapraz Tablolar ve Ki-kare
98
SPSS yardımıyla Ki-Kare uygulaması
Çıkan iletişim kutusunda sol kutudaki grup değişkenimizi
sütun,karşılaştırılan değişkeni satır kutusuna aktarırız. Hangi değişkenin
satırda, hangisinin sütunda olduğu istatistik sonuçlarımızı etkilemez.
99
SPSS yardımıyla ki-kare uygulaması
2 x 2 tablolarda kullanılır.
100
SPSS yardımıyla Ki-Kare uygulaması
Sonuç ekranında üstte
çapraz tablo değerlerini ve satır sütun
yüzdelerini görürüz.
Bu örneğimizde erkeklerin
(1 ile kodlu) 61,9’u sigara içerken,
kadınların (0 olarak kodlu)
%27,2 sinin sigara içtiği görülmüş,
aradaki fark istatistiksel olarak
anlamlı bulunmuştur.
Regresyon Analizi
Regresyon analizi, aralarında sebep-sonuç ilişkisi bulunan iki veya daha fazla
değişken arasındaki ilişkiyi belirlemek ve bu ilişkiyi kullanarak o konu ile ilgili
tahminler (estimation) ya da kestirimler (prediction) yapabilmek amacıyla yapılır.
Gelir Harcama
Yaş Boy
101
Regresyon Analizi
Bu analiz tekniğinde iki (basit regresyon) veya daha fazla değişken (çoklu
Regresyon Analizi
Kullanım alanları
– Pazar araştırmaları
– Sosyal bilimler
– Finans
– Ekonomi....
102
Regresyon Analizi
Basit regresyon modeli ;
Y=α+βX+ε
Y; bağımlı (sonuç) değişken olup belli bir hataya sahip olduğu varsayılır.
β ise regresyon katsayısı olup, X’in kendi birimi cinsinden 1 birim değişmesine karşılık Y’de kendi
birimi cinsinden meydana gelecek değişme miktarını ifade eder.
ε; tesadüfi hata terimi olup ortalaması sıfır varyansı σ2 olan normal dağılım gösterdiği varsayılır.
Bu varsayım parametre tahminleri için değil katsayıların önem kontrolleri için gereklidir.
en-küçük kareler
Eğer hata teriminin normal dağılım göstermesi şeklinde bir varsayım varsa
en büyük olabilirlik,
Hata teriminin dağılımı ile ilgili herhangi bir varsayım söz konusu değilse
103
Saçılma(Scatter) Diyagramı
• Basit regresyon analizi sadece değişkenler arasındaki doğrusal
ilişkiyi açıklamaktadır.
Regresyon
İki değişkenden birindeki bir birim artışa karşılık, diğerinde
sabit bir değişiklik meydana geliyorsa, bu değişkenler arasında
doğrusal (lineer) ilişki vardır.
104
Uyum İyiliği
• “R2” ve “Çoklu Korelasyon Katsayısının Karesi” regresyonda
yaygın olarak kullanılan uyum iyiliği istatistikleridir.
• 0 ise doğrusal ilişki yoktur.
• 1 ise veri noktaları ve regresyon doğrusu mükemmel uyum
göstermektedir.
• Başka bir görevi ise tahmindeki gelişimi ya da değişkenlikde ki
azalmayı göstermesidir.
Çoklu Regresyon
• Kolay elde edilebilir bağımsız değişkenler yardımıyla zor elde
edilen bağımlı değişken değerini kestirmek.
• Bağımsız değişkenlerden hangisi ya da hangilerinin bağımlı
değişkeni daha çok etkilediğini belirlemek.
• Bağımlı değişken ile bağımsız değişkenler arasındaki karmaşık
yapıyı tanımlamak.
• Diğer değişkenlerin varlığında katsayı kestiriminde bulunmak
amacıyla çoklu regresyon uygulanır.
105
Çoklu Doğrusal Regresyon Modeli
Değişkenlerin Tanımı
• Bağımlı değişken sürekli ya da kesikli sayısal veri tipinde
olmalıdır.
• Bağımsız değişkenler sürekli kesikli ya da nitelik veri tipinde
olabilir.
• Nitelik bağımsız değişkenler olduğunda göstermelik (dummy)
değişkenler oluşturulur.
106
DÖRT ÖNEMLİ İSTATİSTİK
1. BETA (Standartlaştırılmış regresyon katsayıları): Modele katkısı daha
fazla olan değişkenin BETA katsayısı daha büyük olur.
Uyarılar
• Bağımsız değişkenler arasındaki korelasyon katsayıları yüksek
olmamalıdır.Yüksek ilişki çoklu bağlantıya neden olur.
107
Çoklu Regresyon Yöntemleri
• Tüm değişkenlerin modelde olduğu yöntem
• Değişkenlerin belli bir sırada modele eklendiği yöntem
(hiyerarşik regresyon)
• Adımsal Regresyon (istatistiksel regresyon) yöntemleri
– İleriye doğru seçim (forward selection)
– geriye doğru çıkartma (backward elemination)
– Adım-adım regresyon (step-wise)
Lojistik Regresyon
Bağımlı değişkenin nitel veri tipinde olduğu
durumlarda, bağımlı değişken ile açıklayıcı (bağımsız)
bir ya da daha fazla değişken arasındaki ilişkiyi
tanımlamak için kullanılır.
108
Lojistik Regresyon Türleri
• İkili (Binary) lojistik regresyon: bağımlı değişkenin iki
düzeyi (hasta-sağlam) olduğunda kullanılır.
• Sıralı (Ordinal) lojistik regresyon: bağımlı değişken
sıralı nitel veri tipinde (hafif-orta-şiddetli vb.)
olduğunda kullanılır.
• Multinomial lojistik regresyon: bağımlı değişken
ikiden çok düzeyli sıralı olmayan nitel veri tipinde
olduğunda kullanılır.
109
Lojistik Regresyon
3.Doğrusal regresyondaki birçok varsayım lojistik
regresyonda yoktur.
Örneğin, çoklu doğrusal regresyonda hataların sıfır
ortalama ve belirli bir varyansla normal dağılması
istenirken, lojistik regresyonda böyle bir koşul
aranmaz.
Uyarılar
• Çoklu doğrusal regresyonda olduğu gibi lojistik regresyonda da
uygun değişkenler modele alınmalı, nedensel olarak uygun
olmayan değişkenler modele alınmamalıdır.
• Genel bir yaklaşım olarak modeldeki her bağımsız değişken
için en az 10 gözlem olmalıdır.
• Çoklu doğrusal regresyonda olduğu gibi lojistik regresyonda da
adımsal yöntemler vardır.
110
Örnek
50 hasta üzerinde yapılan bir çalışmada, hastanın
yaşı, cinsiyeti, yoğun bakımda kalış süresi ve önceden
antibiyotik kullanımı değişkenleri kullanılarak yoğun
bakım ünitesinde edinilmiş enfeksiyon belirlenmek
istenmektedir.
111
Variables in the Equation
112