You are on page 1of 112

İstatistik

İstatistik herhangi bir konuyu incelemek için;

 gerekli verilen toplanmasını,

 toplanan verilen değerlendirilmesini,

 değerlendirme sonucu karar verilmesini,

sağlayan bilim dalıdır.

İstatistiğin İşlevleri
1. Tanımlama (betimleme)

 Gözlenmiş durumların “istatistik ölçülerle” tasvir edilmesidir.

 Elde edilmiş veriler yığınını istatistik yardımıyla oldukça özet


sayılara indirgemektir.

1
İstatistiğin İşlevleri
 Verilerin tamamı hakkında ilgili bütün bilgilere
sahip olma anlamında “tümdengelim”

 Veriler kümesinden alınmış bir tek alt küme


için bilgi edinmek anlamında “tümevarım”

İstatistiğin İşlevleri
2. Çözümleme (analiz)

 Neden-sonuç ilişkilerine dair çözümlemeler yapar.

3. Kestirim ve öngörü

 Kestirim, bilinen değişkenden yola çıkarak bilinmeyenler hakkında


tahminde bulunmayı sağlar (Örneğin; Regresyon).

 Zamanla ilişkili tahminde bulunmayı sağlar(Trend).

2
İstatistiğin İşlevleri
4. Olasılık

 Olguların olma, olmama, bir arada bulunma olasılıkları.

5. Örnekleme

 Evreni en iyi temsil edecek örnek nasıl seçilebilir?

6. İlişkilerin çözümlenmesi

 Korelasyon analizleri

7. Karar verme

Değişkenler

Değişken nedir?

 Rastlantısal etkilere bağlı olarak ölçümsel farklılaşmalar gösteren


birim “değişken” adını alır.

3
Değişken özellikleri

1. Nicelik: Çeşitli ölçü teknik ve birimleri ile


düzeyleri saptanıp, simgelenen(ölçülebilen)
nesnel özelliklerdir.

 Örneğin, ağırlık, vücut ısısı gibi. Ölçümleri bir


birime dayalı olarak yapılır ve genelde sürekli
değerler alırlar.

Değişken özellikleri
2. Nitelik: Birimlere dayalı ölçümlerle değil
sayımlarla değerleri belirtilebilen özelliklerdir.

 Örneğin; cinsiyet, medeni hal, bir hastalığı


bulunmak gibi. Nitel özellikler ancak süreksiz
sayılarla belirtilebilirler.

4
Nitel değişken tipleri

1. Nominal değişkenler: Ölçüm düzeyleri


arasında bir sıralama veya uzaklık – yakınlık
gibi bir mesafe yoktur.
 Meslek
 Kan grubu
 Oturulan semt

Nitel değişken tipleri


2. Ordinal değişken: Ölçüm düzeyleri arasında bir
sıralama vardır, ama düzeyler arasında mesafeler
belirli değildir.
 Mezun olunan okul (Đlkokul, ortaokul, lise,
üniversite)
 APGAR skoru
 Rütbe (Teğmen, üsteğmen vs.)

5
Nitel değişken tipleri
3. Đki durumlu (dikotom) değişkenler:
 Cinsiyet (kadın-erkek)
 Hastalık var-yok
 Evet-hayır

Tanımlayıcı
istatistikler
Sıklık ve sıklık dağılımı(frekans tabloları)

 Verileri özetlemek, özelliklerini ortaya koymak için düzenler.

 Verilerin düzenlendiği çizelgelere sıklık çizelgeleri (frekans


tabloları) denir.

 Oluşturduğu çizgisel-şekilsel-geometrik biçime de “sıklık-çokluk


dağılımı” denir.

6
Sıklık ve sıklık dağılımı
(frekans tabloları)

1. Sürekli nicel verilerde, sınıflama,gruplandırma yaparak,

2. Kesikli nicel verilerde ,

3. Sınıflanabilir nitel verilerde,

4. Sıralanabilir nitel verilerde kullanılabilir.

SPSS Veri Đşlemcisi


Genel özellikler
 SPSS (Statistical Package for Social Sciences) verilerin işlenmesi,
depolanması ve analizinde kullanılan bir veri işlemcidir.

 Kullanım kolaylığı nedeniyle ülkemizde en yaygın kullanılan


istatistik paket programlarındandır.

 Çok miktarda veriyi kısa sürede işlemeye ve menüler aracılığıyla


yapılacak işlemin kolayca seçilmesine olanak tanımaktadır.

7
Genel görünüm
1. SPSS temel olarak iki ekrandan oluşur. Veri giriş
(Dataentry) ekranı ve sonuç (Output) ekranı.
2. Veri giriş ekranından değişkenler tanımlanır, veriler
girilir,düzenlenir, kaydedilir.
3. Buradan herhangi bir istatistik komutu verildiğinde
otomatik olarak sonuç ekranı açılır.
4. Sonuç ekranında istatistik analiz sonuçları, tablolar ve
grafikler olarak gösterilir. Gerekirse bunlar üzerinde
düzeltmeler yapılmasına olanak sağlar.

Veri giriş ekranı

1. Veri giriş ekranı kendi içinde iki alt sayfaya ayrılır. Ekranın sol alt
kısmında görülen sekmelerden verilerin girildiği ve
değişkenlerin tanımlandığı sayfalar arasında geçiş yapılabilir.

8
Sonuç ekranı

 Sonuç ekranı iki çerçeve halindedir. Sağ çerçevede sonuçlar


görülürken sol çerçeveden farklı sonuçlar arasında kolay geçiş
yapılabilir.

SPSS menüler
Veri sayfası menüleri

 Dosya (File): Dosya açma, kaydetme, başka dosyadan


veri alma ve kapatma gibi işlemleri yapar.

 Düzen (Edit): Dosyadan bir kısmı kopyalama, kesme,


yapıştırma gibi işlemleri yapar.

 Görünüm (View): Sayfada açık duracak araç çubuklarını


belirleme, kılavuz çizgileri kaldırma veya gösterme,
etiketleri gösterme işlemleri buradan yapılır.

9
Veri sayfası menüleri

 Veri (Data): Verileri seçme, dosyayı bölerek işlem


yapma ve verileri ağırlıklandırma gibi işlemleri yapar.

 Dönüştür (Transform): Verileri yeniden gruplama ve


hesaplamalar buradan yapılır.

 Analiz (Analyze): SPSS altında yapılan istatistikler


buradaki sekmeler kullanılarak yapılır.

Veri sayfası menüleri

 Grafik (Graph): Grafik çizim işlemlerinde kullanılır.

 Araçlar (Utilities): Veri setleri tanımlamada, programcıklar


hazırlayıp çalıştırmada kullanılabilir.

 Pencere (Window): Veri ve sonuç sayfaları arasında geçiş için


kullanılabilir.

 Yardım (Help): Yardım dosyalarını bulundurur.

10
Sonuç sayfası menüleri

 Veri giriş sayfasındaki veri “data” ve dönüştür “trans form”


seçenekleri sonuç sayfasında yer almaz.

 Veri sayfasında bulunmayan iki menü vardır.

– Ekle (İnsert): Tablo başlığı, tablo açıklaması gibi ekler buradan yapılır.

– Biçim (Format): Tablolardaki sayıların hangi yana yaslı olacağı gibi


düzenlemeler bulunur.

 Ayrıca çıktı sayfasındaki tablo veya grafikler çift tıklandığında bu


öğelere ait düzenleyiciler otomatik olarak açılır.

Ana menüler
SPSS File Menüsü
1- New sekmesi ile, yeni veri, çıktı, makro ve program dosyası oluşturulabilir.

2- Open sekmesi ile, daha önce kayıt edilmiş veri, çıktı, makro ve program
dosyaları açılabilir

3- Open Database ile veritabanı sürücüleri eklenebilir

4- Read Text Data sekmesi ile, metin dosyası biçiminde girilen veri dosyaları
aktarılabilir.

5- Save sekmesi ile kayıt yapılır.

6- Save as sekmesi ile farklı isimde ya da yere dosya kayıt yapılabilir.

11
SPSS File Menüsü
7-Display Data Info.. sekmesi ile veri dosyası hakkında bilgiler elde
edilir.
8- Apply Data Dictionary.. ile herhangi bir veri sözlüğü aktif veri
dosyasına uygulanabilir
9- Cache data ile, veri dosyasının geçici bir kopyası oluşturulur.
10- Print sekmesi yazdırmak amacı ile kullanılır.
11- Print preview ile baskı önizleme yapılabilir
12- Switch server, ağ altında çalışan bilgisayrlarda kullanılılır
13- Recently used data sekmesi, son kullanılan veri dosyalarını
gösterir
14- Recently used files sekmesi, son kullanılan dosyaları gösterir.

Değişken Tanımlama
Her bir değişkenin;
 adı (name),
 tipi (type),
 uzunluğu(witdh),
 değişken sayısal ise kesirli kısmı ( decimals),
 etiketi ( labels), ve etiket değeri, hatalı verilerin tanımı ( missing values),
 kolon genişliği, sağa sola bitişik ( align) özelliği ve
 ölçüm düzeyi tanımlanabilir

12
Değişken Tanımlama
 Sık kullanılan değişken tipleri "numeric","string" ve "date"tir.

 Yalnızca sayısal değerler girilecek bir değişkenlerin tipi


numeric olarak tanımlanmalı, rakam dışında karakterle de
varsa string olarak tanımlanmalıdır.

 Mümkün olduğunca tüm değişkenler kodlar atanarak nümerik


olarak girilmelidir.

Merkezi Eğilim Ölçüleri


(Nicel Verilerde)

• Ortalama (aritmetik ortalama)

• Ortanca (medyan)

• Mod (tepe değeri)

• Alt ve üst değerlerin orta noktası (midrange)

13
Merkezi Eğilim Ölçüleri
• Ortalama (aritmetik ortalama) : Tüm ölçüm değerlerinin toplanıp,
örnekteki ölçüm sayısına bölümü ile elde edilir.

• Ortanca: Ölçüm değerleri küçükten büyüğe sıralanır. Oluşan sırada


ortaya denk gelen ölçüm sonucudur.

• Tepe değeri: tüm ölçümler içinde en fazla tekrarlanandır.

• Alt ve üst değerlerin orta noktası (midrange): En küçük ve en


büyük değerlerin toplanıp ikiye bölünmesi ile bulunur.

Yayılım Ölçüleri
(Nicel Verilerde)
Veriler arasında değişimden kaynaklanan farklılıkların istatistiksel
ölçüleridir.

 Standart sapma,
 Varyans,
 Standart hata,
 Varyasyon katsayısı
 Değişim genişliği,
 Çeyrek sapma,
 Mutlak sapma,

14
Yayılım Ölçüleri
(Nicel Verilerde)
• Standart sapma: Dağılımdaki her bir değerin ortalama’ya göre ne
uzaklıkta olduğunu, dağılımın ne yaygınlıkta olduğunu gösterir.
Büyüdükçe dağılım yaygınlaşır.
• Varyasyon Katsayısı: VK= SS / Ortalama x100
Örnek: Ortalama= 28,8, Standart Sapma= 8,2 olduğunu
VK = 8,2 / 28,8 x 100 = %28,4
Yorumu: Bu dağılımdaki değerler Ortalamaya göre %28.4’lük bir
değişim göstermektedir.
• Varyans: Standart sapmanın karesidir. Büyüdükçe dağılım
yaygınlaşır.
• Standart hata: Standart sapmanın, örnek sayısının
kareköküne bölünmesi ile bulunur.

Normal dağılım

Normal dağılım gösteren değişken değerleri için


 Değerlerin % 68.2’si ortalama ± 1 SH

 Değerlerin % 95.4’i ortalama ± 2 SH

 Değerlerin % 99.7’si ortalama ± 3 SH

içindedir.

15
Normal dağılım
 İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir.

 Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da


normale yakın olması gerekir.

 Normal dağılım, standart sapması 1, frekans eğrisi çan şeklinde olan


simetrik dağılımdır.

 Normal dağılım simetrik olduğu için, normal dağılım gösteren


değişkenlerin ortalama, ortanca ve modları eşittir.

Normal dağılım önemi

 Parametrik testlerin tümünün uygulanabilmesi için gereken


varsayımların başında verilerin dağılımının normal olması
gelir.

 Normal dağılımdan gelmeyen ölçümler kullanıldığında, doğru


bir hipotezi reddetme olasılığı artar.

16
Normal dağılım
Dağılımın normal olup olmadığının incelenmesi:

 Grafikler: Histogram, dal ve yaprak grafiği ve normal olasılık grafiği


kullanılabilir.

 Özellikle 30’dan fazla katılımcı olduğunda, grafik yöntemler,normale yakın


bir dağılımı saptama açısından daha yararlı olabilir.

 Testler:

 Shapiro-Wilks (n<30) ve

 Lilliefors (n>30) testleri

p değeri <0.05 ise dağılımın normal olmadığı kabul edilir.

Normal dağılım
 Örneklem büyüklüğü arttıkça, katılımcıların dağılımı ve
ortalamanın örneklem dağılımı normal dağılıma yaklaşır.

 Genellikle bir örneklemde 30 ya da daha fazla sayıda katılımcı


varsa, evren normal dağılım göstermiyorsa bile, ortalamanın
örneklem dağılımının normal olduğu varsayılabilir.

17
Sivrilik ve çarpıklık
 Eğrinin tepesinin sivriliği (Kurtosis)
Tepe sivri ise........Leptokurtik,
Tepe basıksa.........Platikurtik
Yatıklık (Skewness)
 Değer – ise sola, + ise sağa çarpık bir veri seti ile çalıştığımız anlaşılır.
 Basıklık ve Sivrilik dereceleri
histogram’lardan anlaşılabilir.
 Normal dağılım için basıklık ve sivrilik
değerleri sıfır(0) ‘dır.

SPSS ile normal dağılıma uygunluk


analizi
 Analiz (Analyze) menüsünden – Descriptive>Explore sekmesi seçilir.

18
SPSS ile normal dağılıma uygunluk analizi
 Çıkan kutuda normal
dağılıma uygunluğu test
edilecek değişkenler sol
kutucuktan seçilerek sağ
kutucuğa (dependent list)
aktarılır.
 Eğer birden çok grupta
aynı değişkenin normal
dağılıma uygunluğu
incelenecek ise sağ altta
yer alan “factor list”
kutucuğuna aktarılır

SPSS ile normal dağılıma


uygunluk analizi

 “Plots..” yazan düğme tıklanır.


 Açılan pencerede “Normality plots with tests” kutucuğu işaretlenir.
 Devam (continue)düğmesi tıklanır.

19
SPSS ile normal dağılıma
uygunluk analizi
 Sonuç sayfasında üstte değişkene ilişkin tanımlayıcı
istatistikler,daha sonra normal dağılıma uygunluk istatistiği,
sonra grafikler yer alır.
 Đstatistik kutucuğunda p değeri (Sig.) 0,05 ten küçük ise
örneklemimizin dağılımının normal dağılımdan farklı olduğu
kabul edilir.

Parametrik-parametrik olmayan test seçimi

Parametrik ve parametrik olmayan testler


 Bir testin parametrik ya da parametrik olmaması testte
kullanılan ölçülere göre belirlenir.

 Bir testte; ortalama, varyans, oran gibi ölçüler kullanılıyorsa bu


test parametrik testtir.

 Ölçü yerine sıralama, sayma, işaretleme gibi işlemler


yapılıyorsa bu test parametrik olmayan bir testtir

20
Parametrik ve parametrik
olmayan testler
 Parametrik ve parametrik olmayan testlerin her
ikisinin de birbirine üstün yönleri vardır.

Parametrik ve parametrik olmayan testler


Bu iki grup testin varsayımları ve özelliklerini karşılaştırdığımızda;
 Parametrik olmayan istatistiklerin öğrenimi ve uygulaması kolay ve
hızlıdır.
 Sınıflama sıralama özelliğine göre değerlendirildiğinden veri ölçüm ve
toplamasında kolaylarlar getirebilir.
 Parametrik testlerin gerektirdiği katı uygulanabilirlik koşullarını
gerektirmez.
 Bu olumlu taraflarına karşın parametrik olmayan testlerin duyarlılıkları
daha düşüktür yani gerçek farkların ortaya çıkarılmasında (test tipine
göre) parametrik testlere göre biraz daha zayıftırlar.
 Bundan dolayı uygun her koşulda öncelikle parametrik testlerin
kullanımına öncelik verilmektedir.

21
Parametrik ve parametrik olmayan testler
 Niteliksel veriler için parametrik olmayan testler kullanılır. Bunun
yanında ölçümle belirtildiği halde veri parametrik test varsayımlarını
yerine getiremiyorsa, denek sayısı az ise ya da değerler yerine sıraları
verilmişse yine parametrik olmayan testler kullanılır.

 Veri ölçümle belirtilmişse ve parametrik test varsayımlarını yerine


getirebiliyorsa, denek sayısı az ise ya da değerler yerine sıraları
verilmişse yine parametrik olmayan testler kullanılır.

DAĞILIMLARI TANIMLAYICI
ÖLÇÜLER

22
A. YER GÖSTEREN ÖLÇÜLER
1. MERKEZ ÖLÇÜLERİ
ARİTMETİK ORTALAMA (mean)
ORTANCA (median)
TEPE DEĞERİ (mod)
GEOMETRİK ORTALAMA
HARMONİK ORTALAMA
KARESEL ORTALAMA
2. ÇEYREK VE YÜZDELİKLER

B. YAYGINLIK ÖLÇÜLERİ
STANDART SAPMA
VARYANS
VARYASYON KATSAYISI
STANDART HATA
DAĞILIM ARALIĞI (RANGE)
INTERQUARTILE RANGE

23
24
ARİTMETİK ORTALAMANIN SAKINCALARI
 Dağılımdaki aşırı değerlerden ileri derecede
etkilenir.
 Dağılımdaki aşırı değerler aritmetik ortalamayı
kendilerine doğru kaydırırlar.
 Bu etkilenme aşırı değerlerin aşırılık ölçüsü ile
doğru, dağılımdaki veri sayısıyla ters orantılıdır.
 Ters yöndeki aşırı değerler birbirlerinin etkisini
azaltır.

25
DAĞILIMDA AŞIRI DEĞERLER
VARSA
1. Aşırı değerler değerlendirmeden
çıkarılabilir.
2. Aşırı değerler yerine uygun bir başka değer
atanabilir
3. Verilere dönüşüm (transformasyon)
uygulanabilir
4. Aritmetik ortalama yerine başka bir merkez
ölçüsü kullanılabilir. Bu durumda sıklıkla
ortanca tercih edilir.

DAĞILIMLARI TANIMLAYICI
ÖLÇÜLER

26
A. YER GÖSTEREN ÖLÇÜLER
1. MERKEZ ÖLÇÜLERİ
ARİTMETİK ORTALAMA (mean)
ORTANCA (median)
TEPE DEĞERİ (mod)
GEOMETRİK ORTALAMA
HARMONİK ORTALAMA
KARESEL ORTALAMA
2. ÇEYREK VE YÜZDELİKLER

B. YAYGINLIK ÖLÇÜLERİ
STANDART SAPMA
VARYANS
VARYASYON KATSAYISI
STANDART HATA
DAĞILIM ARALIĞI (RANGE)
INTERQUARTILE RANGE

27
28
ARİTMETİK ORTALAMANIN SAKINCALARI
 Dağılımdaki aşırı değerlerden ileri derecede
etkilenir.
 Dağılımdaki aşırı değerler aritmetik ortalamayı
kendilerine doğru kaydırırlar.
 Bu etkilenme aşırı değerlerin aşırılık ölçüsü ile
doğru, dağılımdaki veri sayısıyla ters orantılıdır.
 Ters yöndeki aşırı değerler birbirlerinin etkisini
azaltır.

29
DAĞILIMDA AŞIRI DEĞERLER
VARSA
1. Aşırı değerler değerlendirmeden
çıkarılabilir.
2. Aşırı değerler yerine uygun bir başka değer
atanabilir
3. Verilere dönüşüm (transformasyon)
uygulanabilir
4. Aritmetik ortalama yerine başka bir merkez
ölçüsü kullanılabilir. Bu durumda sıklıkla
ortanca tercih edilir.

GRAFİKLER

30
Grafik Çiziminde Dikkat Edilmesi
Gereken Kurallar

31
GRAFĐK TÜRLERĐ
Sütun (Column) Grafik Tipi
 Verilerin karşılaştırılmasını sağlar.
 Belli bir zaman aralığındaki değişiklikleri gösterir.
 Sütun grafikler, belli bir seri verinin özellikle zamana bağlı
değişiklileri göstermek için kullanılır.
 Kategoriler yatay, değerler ise dikey olarak düzenlenirler.

32
Çizgi (Line) Grafik Tipi
Zaman içindeki değişimi ifade etmede kullanılır.
Verilerin oluşumunu ve hareketini çizgiler halinde gösterir.
Zaman akışı ve değişimin oranı gibi durumları göstermek için
kullanılırlar.
Beli aralıklarda yada belli zamanlardaki değişikliği gösterir.
Örneğin bir hisse senedinin veya döviz kurunun seyrini en
iyi açıklarlar. Çizgi grafikte veri serileri yatay çizgilerle ifade
edilirler.

33
34
35
36
37
38
39
Not: 1.5 yerine 3 yazılırsa aykırı değer yerine uç değer bulunur.

40
41
42
43
44
45
46
47
Ölçek
ve
Ölçek Çeşitleri

48
Ölçek
Yapılacak analiz öncesinde, kullanacak verilerin
türünü belirlenmesi ve analiz yöntemlerini bu
veri türüne uygun olarak seçilmesi büyük önem
taşır.

SPSS programında,
 Scale (Ölçek),
Nominal (Sınıflama)
Ordinal (Sıralama)
olmak üzere üç farklı ölçek türü bulunmaktadır.
Literatürde yer alan Interval (Aralık) ve Ratio
(Oran) ölçekleri SPSS programında Scale ölçeği
altında toplanmıştır

49
Oran (Ratio) Ölçeği:
•aylık gelir,
•ağırlık,
• uzunluk,
•hız
gibi değişkenleri ölçmek için kullanılır. Bu
ölçekte başlangıç “0” noktasıdır.

Aralık (Interval) Ölçeği:


Sıcaklık,
başarı,
performans gibi

 nicel değişkenleri ölçmek için kullanılır. Aralık ölçeğinin

oran ölçeğinden temel farkı bir başlangıç noktasının


bulunmamasıdır.
 Diğer bir ifade ile “0” değeri aralık ölçeğinde yokluk ifade
etmez. Örneğin termometrede görülen “0 C” belirli bir anlam
taşır. Oysa oran ölçeğinde yer alan “0 Kg” bir yokluk ifadesidir

50
Sınıflama Ölçeği (Nominal)
Sınıflama ölçeğinde değişkenlerin aldığı değerler sayısal bir büyüklük
ifade etmezler. Bu değerler değişkenlere ait bazı özellikleri tanımlarlar.
Örneğin Cinsiyet değişkeni için “1” değeri “Kadın”ları, “2” değeri
“Erkek”leri temsil edebilir. Bu çerçevede Medeni Durum, Meslek,
Doğum Yeri gibi değişkenlere ait ölçümler için sınıflama ölçeğinin
kullanımı uygun olacaktır.

Sıralama Ölçeği (Ordinal)


Sınıflama ölçeğinde değişkenlerin aldığı değerler önem derecesi ya da
üstünlükleri baz alınarak sıralanır.
Katılım Düzeyi (Kesinlikle Katılıyorum, Katılıyorum, Karasızım,
Katılmıyorum, Kesinlikle Katılmıyorum),
Sıklık Düzeyi (Hiç, Nadiren, Genellikle, Her Zaman) Öğrenim Durumu
(İlköğretim, Lise, Lisans, Yüksek Lisans),
Yönetim Kademesi (Alt, Orta, Üst) vb. değişkenler için Sıralama (Ordinal)
Ölçeğinin kullanımı uygun olacaktır.

51
ÖRNEKLEME TEORİSİ

Evren
Evren (population,anakütle) araştırma sonuçlarının
genellenmek istendiği elemanlar bütünüdür.
Ortak özellikleri olan canlı ya da cansız her türlü
elemandır.
Tekli elemanlar için “örnek olay”,
 Küçük çokluklar için “araştırma kümesi”

52
Değişkenlerin Ölçülmesi

Evrenin, bilinmek istenen değerlerine (ortalama,


standart sapma v.b.) “evren değer” ya da “parametre” denir.
Bilimsel araştırmaların çoğu evren parametrelerine
ilişkin soruların cevaplandırılması ile ilgilidir. Bu soruların
cevaplandırılmasında iki genel yaklaşım vardır. Herhangi bir
ölçümün bir çalışma evreni üzerinde uygulanması tam sayım ve
kısmi sayım (örnekleme) şeklinde olabilir.

Tamsayım
Araştırma evreninin tamamının, yani o
evrendeki bütün birimlerin incelenmesine tam
sayım denir. Tam sayımın tipik örneği bir
nüfusun karakteristiklerini tüm birimleri
tarayarak saptayan nüfus sayımlarıdır. Tam
sayım istisnai bir durumdur.

53
Tam sayımın mümkün olmadığı durumların nedenleri:

- Tüm araştırma materyaline ulaşılamayabilir.

- Araştırma materyali sayıca ve alanca büyükse zaman, maliyet engelleri


olabillir.

Tam sayım gerektirmeyen durumlar da aşağıda belirtilmiştir:

i. Araştırma materyali ele alınan özellikler bakımında homojen ise, örneğin, TV


haberlerinde, reklam spotlarında olduğu gibi.

ii. Araştırmanın amacı için tam sayım hayati önem taşımıyorsa.

Ayrıca tam sayıma başvurmak kontrol sorunları da yaratabileceğinden her


zaman gerekli değildir. Bu gibi durumlarda bir örneklemeye gitmek gerekir.

-Kısmi Sayım (Örnekleme)


İncelenecek evreni meydana getiren birimlerin tamamının değil aralarından
bir kısmının seçilerek sadece bunların araştırmaya alınmasına kısmi sayım
(örnekleme) denir.
Örneklem, belli bir evrenden belli kurallara göre seçilmiş ve seçildiği evreni
temsil yeterliği kabul edilen küçük kümedir.
Bir evrenin, içinden seçilmiş örneklemlere dayanılarak araştırılması amacıyla
başvurulan işleme örnekleme denir. Örnekleme, bir bütünün kendi içinden
seçilmiş bir parçasıyla temsil edilmesidir, evrenden onu temsil edici
örneklemin alınması işlemidir.

54
Örnekleme Nedenleri

1- Örneklem, araştırmacıya büyük zaman, enerji ve para tasarrufu sağlar.

- Tam sayımın gerektirdiği parasal harcamaları karşılayacak kaynaklar


bulunmaz veya ayrılmak istenmezse,

- Amaçlanan bilgilerin çabuk elde edilmesi zorunlu olduğunda,

- Tam sayımı yapacak miktarda yüksek derecede kalifiye eleman bulmak


güçlüğü varsa, örnekleme zorunludur.

2- Üzerinde araştırma yapılacak birim büyüdükçe gerekli kontrollerin


sağlanması güçleşmektedir. Araştırmada amaç çok veri değil, geçerli ve
güvenilir veriler toplamak olduğundan denetimi daha kolay olan küçük
kümeler tercih edilir.

3- Her araştırmada evreni tümü ile incelemeye gerek veya imkan


olmayabilir.

4- Belirsiz sayıda birimden oluşan evrenleri tamsayım ile kavramak


mümkün değildir.

5- Örnekleme yapılmadan araştırılmaya kalkındığında çözüme


ulaşmanın uzun zaman alması nedeniyle sorunun güncelliğini
kaybetmesi veya şartlar değişebileceğinden çözümün geçersiz olması
riskini de önlediğinden örnekelme zorunlu bir teknik haline gelmektedir.

6- Etik zorunluluklardır.

55
•Bilimsel araştırmalarda doğru bilgi sahibi olmak ve doğru karar
vermek esastır. Bu yüzden doğru bilgilere ulaşmak ve elde edilen
bilgileri genelleştirmek ihtiyacı vardır.

•Bir araştırmanın sonuçları ne kadar fazla genellenebiliyorsa değeri de


o oranda artar. Bilim, genellenebilirliği olan bilgiler bütünü olduğu için
araştırmalarda geniş bir alanda genellenebilirliği olacak bilgiler elde
etmeye çalışmak önemlidir.

ÖRNEKLEMİN TEMSİL EDİCİLİĞİ

- Örneklem üzerinde varılan sonuçları evrene genellerken en az hata ile


vardamalarda bulunabilmek için örneklemin evreni temsil etmesi, temel
özellikleri ile yansıtması gerekir.

-Bir örneklem, evren içinde aranan karakteristikleri yanlılığa yol açmadan


yansıtması halinde temsil yeteneğine sahiptir.
-Örneklemin, evreni temsil etmesini sağlayan iki etmen;

_Örneklemin yansızlğı,

_Yeterli büyüklükte olmasıdır .

56
ÖRNEKLEM BÜYÜKLÜĞÜNÜ ETKİLEYEN ETMENLER
1-Evrenin Benzeşikliği:
Örneklemede önemli olan, evreni temsil edebilecek “tipik”
birimleri bulabilmektir. Evrenin benzeşikliği arttıkça, tipik birim
bulma işi kolaylaşır. Alınacak tipik birimlerden çıkacak sonuçları
benzerlerine genellemek kolaydır.

2-Değişkenlerin kontrolü – tarama ve deneme:

Bir araştırmada, kontrol edilemeyen önemli değişkenlerin sayısı


arttıkça, evreni temsil edebilecek örneklemin büyüklüğü de artar. Bu
nedenle, tarama modellerindeki bir araştırma için gerekli örneklem
büyüklüğü, deneme modellerindeki bir araştırmaya oranla daha
fazladır.

3-Çözümlemedeki gözenek sayısı:

Her gözenek, ayrı özellikteki bir alt grubu temsil ettiğine göre, her
grubun kendi evrenini temsil edebilecek büyüklükte seçilmiş olması
gerekir. Bu nedenle, gözenek sayısı artıkça, örneklemin büyüklüğü de
artar.

57
4-Örnekleme türü:
Örnekleme türü de örneklem büyüklüğünü etkiler. Örneğin
oranlı örneklemelerde gerekli örneklem büyüklüğü daha
küçüktür. Bu teknik içinde en az sayıda birim gerektireni
tabakalı örneklemedir. Basit random örneklemelerde, aynı
güven düzeyine ulaşmak üzere gereken örneklem büyüklüğü
tabakalı örneklemeye oranla daha büyüktür.

5-Kestirilen evren değer türü:


Kestirilmek istenen evren değerin türü, onun ortalama,
standart sapma, oran, ortanca vb. oluşu, alınması
gereken örneklem büyüklüğünü etkiler. Örneklem
büyüklüğünü saptayabilmek için, hangi evren değer
türünün kestirilmek istendiği ve bunun standart hata
formülünün nasıl olduğu da bilinmek zorundadır.

58
6-Evren değeri temsilde aranan güven düzeyi ile sapma miktarı:

Sapma, evren değer ile örneklem değer arasında izin verilebilecek


farklılaşmadır. Sapma değeri, araştırmacının, evren değeri
kestirmede gösterebileceği toleransın ifadesidir. Araştırmacı,
ölçtüğü alanın duyarlılık derecesine göre sapma miktarını, küçük
ya da büyük tutabilir. Sapma miktarı çoğaldıkça, kestiri daha az
duyarlı olur, gerekli örneklem büyüklüğü de küçülür.

Güven düzeyi, örneklemin çok sayıda yinelenmesi halinde elde


edilecek örneklem değerlerin, belli sapma sınırları içinde, evren
değeri temsil edebilme olasılığıdır. Güven düzeyini de araştırmacı
kendi seçer.

Çoğunlukla %95 yada %99 olarak alınır. Yanılma olasılıkları sıra ile %5
ile %1’dir. Formüllerde, yanılma olasılıklarının “z” değerleri kullanılır.
.0,5 için 1.96
.0,1 için 2.58

Güven düzeyi yükselince, güven aralığı ve sapma da artar.


Sapma ve güven düzeyini, ayrı ayrı, istenen düzeyler de tutabilmenin
yolu, örneklem büyüklüğünün ayarlanmasıdır. Bu amaçla kullanılan
genel formül:
(z)(SH)= e’dir.
(z): Güven düzeyi
(SH): Standart hata
e: sapma değeri

59
7-Olanaklar:
Araştırmacı, herşeyin en iyisini yapmak için işe başlar. Ancak kısa zamanda
görür ki, “ideal” den bazı ödünler vermek zorunda kalınabilmektedir. İdeal
“varolan koşullarda en uygun olan” olarak algılanmalıdır.Bu nedenle, varolan
para, insan gücü ve teknik olanakları dikkate alan araştırmacı, kestirilmek
istenen evren değer türü, güven düzeyi ve sapma sınırları ile olanakların
birleştirilmesi gibi konularda yeni önlemler düşünerek örneklem
büyüklüğünde olabilecek düzeltmeleri yapabilir.
Kestirilmek istenen evren değerin, çok büyük örneklem gerektirmesi
halinde, bunun aranması gereken “en uygun bir değer olup olmadığı” sorusu
cevaplandırılmaya çalışır. Örnekleme türü de örneklem büyüklüğünü etkiler .

Örnekleme Türleri
•Olasılıksız
•Olasılıklı

60
Olasılıklı örnekleme, evreni oluşturan birimlerin hepsine eşit
seçilebilme şansının verildiği örnekleme türüdür.

Evreni temsil etmek amacıyla seçilecek örneğe girecek birimlerin


tesadüfi olarak seçilemeyip araştırmacının kendi inisiyatifi ile seçtiği
birimlerden oluşan örneklemeler ise olasılıklı olmayan
örneklemelerdir.

Olasılıklı örneklemede, olasılıklı olmayan örneklemeden farklı olarak


yapılan tahminlerin doğruluk derecesi ve hata payları istatistik olarak
hesaplanabilir.

Olasılıklı örnekleme türleri;


• basit tesadüfi örnekleme,
• sistematik örnekleme,
• tabakalı örnekleme
• küme örnekleme

Olasılıklı olmayan örnekleme türleri


• gelişigüzel örnekleme,
• kota örneklemesi,
• amaçlı örnekleme ve
• kartopu örneklemesi

61
Basit tesadüfi örnekleme. Basit tesadüfi örneklemede
evreni oluşturan her elemanın örneğe girme şansı eşittir. Dolayısıyla
hesaplamalarda da her elemana verilecek ağırlık aynıdır. Bu
yöntemin kullanılabilmesi için ele alınan problemlerle ilgili bilgilerin
evrene göre benzeşik (homojen) olması gerekir. Örneğin, seyahat
harcamalarının aile bütçesindeki ortalama payını bulmak için basit
tesadüfi örnekleme yöntemini kullanmak doğru değildir. Çünkü gelir,
meslek vb. özellikler yönünden farklı olan ailelerin seyahat
harcamalarının bütçeleri içindeki payları farklıdır. Bu farklar
ortalamayı önemli ölçüde etkileyeceğinden, basit tesadüfi
örnekleme yönteminin kullanılması doğru değildir.

Sistematik örnekleme:
Sistematik örneklemeye genellikle basit tesadüfi örneklemeye ihtiyaç duyulduğunda
başvurulur. Bu yöntemde örnekleme alınacak elemanların sayısı önceden belirlenir.
Buna göre, örneklemdeki eleman sayısının evrendeki eleman sayısına oranı (k)
hesaplanır. Daha sonra evrendeki elemanlar sıraya dizilir ve bu orana göre sıra
numarası verilir. Verilen sıra numarasına göre başlangıçtan itibaren her
1/k’ nıncı eleman örnekleme alınır.
Sistematik örnekleme, evrendeki elemanlara sıra numarası verilerek yapılabileceği gibi,
alfabetik sıraya konularak ya da başka bir sistematik yolla da yapılabilir. (Baykul, 1996,
s.259). Sistematik örneklemenin uygulanacağı evreni oluşturan birimlerin tamamen
tesadüfi olarak dağılmış olmaları gerekir.

62
Tabakalı örnekleme:
Tabakalı örnekleme, sınırları belirlenmiş bir evrende alt tabakalar veya
alt birim gruplarının var olduğu durumlarda kullanılır. Burada önemli
olan, evren içindeki alt tabakaların varlığından yola çıkarak evren
üzerinde çalışmaktır.

Küme örnekleme:
Kümelere göre örnekleme yönteminde evren küme adı verilen
gruplara ayrılır, her küme bir örnekleme birimi olarak tanımlanır. Tesadüfi
olarak seçilen kümeler bir araya getirilerek örneklem oluşturulur.
Evreni oluşturan elemanların tam olarak listelenemediği hallerde
küme örneklemesinden yararlanılır. Özellikle ülke çapında yapılan
araştırmalarda örnekleme girmesi gereken elemanlara ulaşmak genellikle
güçtür. Örneğin, liselerde yapılacak bir araştırma örneklemi için, liselerde
okuyan öğrencilerin listesi bulunsa dahi basit tesadüfi örnekleme ile alınacak
örnek, topluluk içine dağınık olarak serpiştirilmiş olacağından örneğe çıkan
birimlere ulaşmak güçtür. Bu durumda yaygın bir örnekle çalışmak yerine,
evreni oluşturan her birime eşit seçilme şansı tanınarak örnekleme yapılır.
Küme örnekleme ile seçilen örnekler bir evrenin tek tek birimleri değil, o
birimlerin oluşturdukları kümelerdir.

63
Gelişigüzel örnekleme:
Araştırmacının saptanan örneklem büyüklüğüne
göre herhangi bir şekilde evrenin bir parçasını
seçmesidir. Herhangi bir fakülteye gidip
saptanacak sayıda rastlanan öğrenciyi örnekleme
alma gelişigüzel örneklemedir.

Kota örnekleme:
Kota örneklemede sınırlı bir evren, araştırmanın amacına
uygun olarak araştırmacının öngördüğü belirli değişkenlere
göre sınıflandırılır. Bu değişkenler yaş, cinsiyet, eğitim durumu,
meslek, hastalık olabileceği gibi, etnik köken, kırsal ve kentsel
değişkenler de olabilir.

64
Amaçlı örnekleme:
Araştırmanın amaçları doğrultusunda bir evrenin temsilci bir
örneği yerine, amaçlı olarak bir ya da birkaç alt kesimini örnek olarak
almaktır. Başka bir deyişle amaçlı örnekleme, evrenin soruna en uygun
bir kesimini gözlem konusu yapmak demektir.
Endüstride meslek hastalıklarıyla ilgili olarak yapılacak bir
araştırmada, araştırmacının, meslek hastalıklarının tüm evren içinde
değil, özellikle belli bir hizmet süresini aşmış ya da belli bir yaş sınırının
üstündeki işçiler arasında daha açık bir biçimde gözlenebileceğini
düşünerek, tüm işçiler evrenini değil, orta yaşlı ve yaşlı işçiler kesimini
temsil eden bir seçim yapması buna örnek verilebilir.

Kartopu örnekleme:
Kartopu örneklemede öncelikle evrene ait
birimlerden birisi ile temas kurulur. Temas kurulan birimin
yardımıyla ikinci birime, ikinci birimin yardımıyla üçüncü
birime gidilir. Bu şekilde, sanki bir kartopunun büyümesi
gibi örneklem büyüklüğü genişler.
Marmara Üniversitesi’nin kuruluş yıllarındaki
felsefesini çalışmak isteyen bir araştırmacı için, Marmara
Üniversitesi’nde emekliliği yaklaşmış veya emekli olmuş
birkaç öğretim üyesi çalışmanın ilk örneklemini oluşturabilir.
Araştırma süreci ilerledikçe, ulaşılan kişilerin yardımıyla
daha fazla kişi listeye dahil edilecek ve liste kartopu gibi
büyüyecektir.

65
Örneklem Büyüklüğünün Hesaplanması
Örneklem alınmasında örneklemin alındığı evreni temsil etmesi
önemlidir. Bu durumda ne kadar, hangi büyüklükteki bir örneklemin evreni
temsil edebileceği sorunu ortaya çıkmaktadır. Alınan örneklemin evreni
temsil yeterliği bulunmadığında örnekleme hatası olur. Yeterli bir
örneklem, güvenilir sonuçlar sağlayacak kadar eleman kapsayan
örneklemdir.
Örneklemin çok küçük olması durumunda araştırma sonuçlarının
evren için genellenebilmesi güçleşir. Betimsel araştırmalarda minimum
%10 örneklem alınır, küçük evrenlerde ise %20’ye ihtiyaç duyulur.
Korelasyon çalışmalarında en az 30, nedensel kıyaslamalarda her gruptan
en 30’ar eleman gereklidir. Deneysel araştırmalarda ise, her grupta 15’er
denek gibi az sayıda denek olması sonuçların geçerli olmasını sağlayabilir.
Bazı çevreler ise deneysel araştırmalarda her grupta en az 30’ar deneğin
bulunmasını önermektedir. Ancak örnek büyüklüğünün fazla olması fazla
olması sonuçların güvenilirliğini arttırır.

İSTATİSTİK TAHMİN TEORİSİ

66
İstatistikte iki tür tahminden yararlanılmaktadır.
• Nokta tahmini (Tek değer tahmini)
Ana kitle parametreleri bilinmediği hallerde örneklerden elde
edilmiş değerlerden tahmin yapmaktır.
• Aralık tahmini
Örnekten elde edilmiş iki değer arasındaki aralığı ifade
etmekte ve ana kitle parametresinin bu iki değer arasında
bulunması beklenmektedir.

67
68
69
70
Örnek :Tatil amacıyla ülkemize gelen Amerikalı ve Avrupalı
turistlerin bozdurdukları günlük ortalama döviz miktarları
karşılaştırılmak isteniyor. Rasgele seçilen 100 amerikalı turistin
bozdurdukları ortalama döviz miktarı $50, avrupalı 80 turistin
bozdurdukları döviz ise $40’dır. Anakütle standart sapmaları ise
$20 ve $16’dır. Her iki kıtadan gelen turistlerin bozdurdukları
ortalama döviz miktarları arasındaki farkın güven sınırlarını %99
olasılıkla belirleyiniz.

71
(20) 2 16
x1 = 50 ⇒ x2 = 40 ⇒ S x1 −x2 = + = 2,68
100 80

P((50-40)±(2,58)(2,68))=0,99

P(3,09<µ1-µ2<16,91)=0,99

HİPOTEZ TESTLERİ

72
Anlam çıkarıcı istatistiğin amacı, ana kütleden çekilen
örnek kütlelerden yani örneklemden elde edilen bilgilere
dayanarak tahminde bulunmaktır.
Tahminde bulunurken en yaygın olarak kullanılan ana
kütle parametreleri , ortalama,varyans ve orandır.

Hipotez, iki veya daha çok değişken arasındaki


tahmini anlatımdır. Hipotez testlerinde birisi sıfır
hipotezi H0 diğeri karşıt hipotez H1dir.
H0, ana kütlenin gerçek değeriyle tahmini değeri
arasında bir fark olmadığını öne sürer. İstatistik
sınamanın temelidir . Geçmiş bilgi ve deneyimlere
dayanan bir öneridir ve doğruluğunun kanıtlanması
için sınanması gerekmektedir.

73
Bir hipotezde bulunması gereken özellikler,

Mantığa uygun olmalıdır.


Kavramca açık seçik olmalıdır.
Olgulara dayanmalıdır.
Belirgin olmalıdır.
Yakından ilişkili olgular arasında bağıntı
kurmalıdır.
Pratik bir gereksinimden doğmalı ve yararlı
olmalıdır.
Reddedilebilecek biçimde kurulmalıdır.
Eldeki tekniklerle ilişkisi kurulmalıdır.
Bir kuramsal sistemle ilişkili olmalıdır.

Hipotez testinin(sınamalarının) aşamaları ;


1. Hipotezlerin belirlenmesi ,
2. Önem düzeyinin belirlenmesi,
3. Kritik değerin belirlenmesi,
4. Red bölgesinin belirlenmesi,
5. Sınama istatistiğinin belirlenmesi,
6. Karar ve yorumdur.

74
2.Aşama:Önem düzeyinin belirlenmesi,

Doğru olduğu halde H0 hipotezini reddetme

olasılığıdır.

Tüm hipotezlere uygun bir önem düzeyi yoktur.

Araştırma konusunun önemine,

Karar alıcının konuyla ilgili düşüncesine,

Örnek kütlenin hacmine bağlıdır.

Büyük örneklerde n>30 için %1 ve % 5

Küçük örneklerde n<30 için %10 bazen %

20 alınması psikoloji ve tıp alanlarında zorunlu

olmaktadır.

Gerçekten doğru olan hipotezin reddedilme

olasılığı artmakta, istenmeyen durum olan

yanlış hipotezin kabul edilme olasılığı

azalmaktadır. Bir araştırmada göze alınacak

riskin düzeyine göre belirlenmektedir .

75
Hipotez testinde iki tip hata oluşabilir.

•I. Tip hata, H0 doğru hipotezinin

reddedilmesidir.

• II. Tip hata, H0 hipotezinin yanlış olduğu halde

kabul edilmesidir.

• I.ve II. Tip hataların neden olacağı kayıpların dikkate

alınması çok önemlidir.

76
Örnek büyüklüğüne göre I.tip hata olasılığı

belirlendikten sonra , II.tip hata olasılığıda

belirlenmiş olur.

 I. ve II. Tip hata olaslıklarının azaltılması için

örnek kütledeki birim sayısı arttırılmalıdır.

3.Aşama: Sınama istatistik tekniğinin belirlenmesi

Hipotezler, aritmetik ortalamaları içeriyorsa , aritmetik

ortalamalarla ilgili, standart sapmaları içeriyorsa standart

sapmalarla ilgili sınama istatistikleri kullanılmalıdır.

En çok kullanılan parametreler ve istatistikler, aritmetik

ortalama, varyans, standart sapma,oran, birim sayısı

ve korelasyon katsayısıdır .

77
Hipotez sınamasında kullanılan teknikler;

merkezi eğilim ölçüleri,


yüzdeler,
parametrik sınama teknikleri
parametrik sınama teknikleridir.

78
Hipotez sınamaları

üç tip parametreyle ilgilidir.

Oranlar

Ortancalar(medyanlar)

Ortalamalar

Oranların karşılaştırılmasında,

veriler bağımlıysa
• iki veri grubu varsa Mc Nemar sınama tekniği
•ikiden fazlaysa Cochran Q sınama tekniği

veriler bağımsızsa
iki veri grubu varsa Ki-kare ve Fischer sınama
tekniği
ikiden fazlaysa Ki-kare sınama tekniği

79
Ortancaların(medyanların)
karşılaştırılmasında

iki veri grubu


veriler bağımlıysa Wilcoxon sınama
tekniği ve varyans çözümleme tekniği
veriler bağımsızsa Mann-Whitney U
sınama tekniği, Kruskal-Wallis varyans
sınama tekniği

Ortalamaların karşılaştırılmasında,
Dağılımın normal olması durumunda parametrik sınama teknikleri
Aksi durumda parametrik olmayan sınama teknikleri ,

iki veri grubu varsa


bağımlı ise bağımlı gruplar t-sınama tekniği ,
bağımsız ise bağımsız gruplar t-sınama tekniği,

Veri grupları 2 den fazlaysa


Bağımlı ise tekrarlı ölçümler varyans çözümleme tekniği
Bağımsız ise varyans çözümleme teknikleri kullanılır.

80
İstatistiksel karar verebilmek için, örnek kütleden elde
edilen ortalama, oran gibi istatistiksel değerler, ana kütle
parametreleriyle karşılaştırılacağından bu karşılaştırmanın
yapılabilmesi ve toplanan değerlerin bu karşılaştırma işlemine
uygun hale getrilebilmesi için hesaplamalar yapılmaktadır. Bu
işleme sınama tekniğinin hesaplanması denir.
Sınama istatistiği, araştırma sonucu elde edilen
verilerin sınama istatistik formülündeki yerine konularak işlem
yapılmasıyla elde edilir.

6.aşama:Karar ve yorum
Çizelgeden elde edilen kritik değerin, örnek kütleden
elde edilen sınama istatistiği ile karşılaştırılması
sonucunda ,araştırma probleminin çözümüyle ilgili
olarak bir sonuca varmak ve bu sonucu
değerlendirmektir.
Sınama istatistiğinin, önceden belirlenmiş olan ret
bölgesi içinde kalıp kalmamasına bağlı olarak sıfır
hipozetininin reddedilip reddedilmeyeceği istatsiksel
kararı oluşturmaktır.

81
İstatistiksel kararlarda yüzde yüz doğrular yoktur. Amaç,
istatistiğin işlevi ana kütle değerlerini tahmin etmektir.
Yorum da esas ölçütler, elde edilen veriler ve bu verilerden
çıkarılan sonuçlardır. Yorumda olması gereken değil olan önemlidir.
Yorumdaki ifadeler birbiriyle uyum içinde olmalı, problem yüzeysel
değil derinlemesine irdelenmeli, ana kütleyi temsil edemeyen bir
örnek kütleye dayanarak genelleme yapılmamalıdır. Birlikte değişme
göstermiş değişkenlerin arasında mutlaka bir bağıntı olduğu kabul
edilmeli ve nedenle sonuç asla karıştırılmamalıdır.

HİPOTEZLER VE TESTLERİN YORUMLARI


Ki-kare bağımsızlık testi test kararı değer kontrol yorum karar
Ho:Sıra ve sütun kategorileri BAĞIMSIZDIR.
H1:Sıra ve sütun kategorileri BAĞIMSIZ DEĞİLDİR. P>0.05 0.000 0.000>0.05 YANLIŞ Ho red - H1 kabul
Ho:Gelirle satın alınan araba tipleri arasında ilişki YOKTUR
H1:Gelirle satın alınan araba tipleri arasında ilişki VARDIR. P>0.05 0.003 0.003>0.05 YANLIŞ Ho red - H1 kabul
Ho:Cinsiyetle başarı arasında ilişki YOKTUR
H1:Cinsiyetle başarı arasında ilişki VARDIR. P>0.05 0.125 0.125>0.05 DOĞRU Ho KABUL - H1 red
Ho:Bölgeler ve kan grupları birbirinden bağımsızdır.
H1:Bölgeler ve kan grupları birbirinden bağımsız değildir. P>0.05 0.000 0.000>0.05 yanlış Ho red - H1 kabul

Ki kare Homojenlik
Ho:Sıra ve sütun kategorileri birbirine EŞİTTİR.
H1:Sıra ve sütun kategorileri birbirine EŞİT DEĞİLDİR. P>0.05 0.001 0.001>0.05 YANLIŞ Ho red - H1 kabul
Ho:İki örneklem AYNI ana kütleden seçilmiştir.
H1:İki örneklem FARKLI ana kütleden seçilmiştir. P>0.05 0.015 0.015>0.05 YANLIŞ Ho red - H1 kabul
Ho:İki parti taraftarlarının en çok etkilendikleri vaatler BENZERDİR.
H1:İki parti taraftarlarının en çok etkilendikleri vaatler BENZER DEĞİLDİR. P>0.05 0.589 0.589>0.05 DOĞRU Ho KABUL - H1 red
Ho:Bölümler başarı açısından HOMOJENDİR.
H1:Ho:Bölümler başarı açısından HOMOJEN DEĞİLDİR. P>0.05 0.140 0.140>0.05 DOĞRU Ho KABUL - H1 red

Ki kare UYGUNLUK
Ho:Verilerin dağılımı düzgün dağılıma UYGUNDUR.
H1:Verilerin dağılımı düzgün dağılıma UYGUN DEĞİLDİR. P>0.05 0.000 0.000>0.05 YANLIŞ Ho red - H1 kabul
Ho:Örnek kütle frekanslarıyla ana kütle frekansları farklı DEĞİLDİR.
H1:Örnek kütle frekanslarıyla ana kütle frekansları FARKLIDIR. P>0.05 0.129 0.129>0.05 DOĞRU Ho KABUL - H1 red
Ho:Uygunluk VARDIR.
H1:Uygunluk YOKTUR. P>0.01 0.003 0.003>0.01 YANLIŞ Ho red - H1 kabul
Ho:Aylara göre sipariş miktarı arasında fark YOKTUR.
H1:Aylara göre sipariş miktarı arasında fark VARDIR. P>0.05 0.000 0.000>0.05 yanlış Ho red - H1 kabul

82
t testi ( TEK ÖRNEKLEM) ONE SAMPLE T
Ho: Ana kütlenin ortalaması 120 dir.
H1:Ana kütlenin ortalaması 120 DEĞİLDİR. P>0.05 0.005 0.005>0.05 YANLIŞ Ho red - H1 kabul
Ho:90'a EŞİTTİR.
H1: 90' a EŞİT DEĞİLDİR. P>0.05 DOĞRU Ho KABUL - H1 red

t independet (bağımsızlık )

Ho:Yeni satış yöntemiyle eski satış yöntemi arasında FARK YOKTUR.

H1:Yeni satış yöntemiyle eski satış yöntemi arasında FARK VARDIR. P>0.01 0.00 0.00>0.01 YANLIŞ Ho red - H1 kabul
Ho:İki grubun arasında bir FARK YOKTUR.
H1:İki grubun arasında bir FARK VARDIR. P>0.05 DOĞRU Ho KABUL - H1 red
Ho:Başarıları arasında bir FARK YOKTUR.
H1:Başarıları arasında bir FARK VARDIR. P>0.05 0.003 0.003>0.05 YANLIŞ Ho red - H1 kabul

t paired (eşlenik)
Ho:Vize ve final notları arasında FARK YOKTUR.
H1:Vize ve final notları arasında FARK VARDIR. P>0.01 0.963 0.963>0.01 DOĞRU Ho KABUL - H1 red
Ho:FARK YOKTUR.
H1:Vize ve final notları arasında FARK VARDIR. P>0.05 0.001 0.001>0.05 YANLIŞ Ho red - H1 kabul

İlişki analizleri
(Korelasyon)

83
İlişki (korelasyon) katsayıları
• Yeterli bir korelasyon sonucu için n gözlem sayısının
yeterli olması (n>10) gerekir.
• Buradaki katsayılarla X ve Y gibi (X1 ve X2 gibi )
aralarında ilişki olduğu düşünülen 2 değişken
arasındaki ilişkinin derecesi (miktarı) ve yönü
belirlenmeye çalışılır.

Pearson Korelasyonu, r
• Değişkenler eşit aralıklı yada oranlama tipi ÖLÇEK ile ölçülmüşlerse,
korelasyon katsayısı (Pearson çarpım moment korelasyon katsayısı) uygun
ilişki katsayısı olarak kullanılabilir. Kitlede Korelasyon (Ro) ile örneklemde
(r) ile bulunur.

• r katsayısı -1 ile +1 arasında değerler alır.

• Yeterli bir ilişki için r= 0.70 ‘den büyük sonuçlar


istenir.

• Ancak, bulunan korelasyon katsayısı yapılacak anlamlılık testi sonucu ile


değer kazanır.

84
Pearson Korelasyonu, r
• İki değişken arasında herhangi bir ilginin olup
olmadığını belirler.

• Bu ilginin, lineer (doğrusal) olup olmadığı incelenir.

• Bir örneklem için bu katsayı r ile sembolize edilir.

Pearson Korelasyonu, r
r = -1 ise, x ve y arasında tam negatif korelasyon vardır.
r = +1 ise, x ve y arasında tam pozitif korelasyon vardır.
r = 0 ise, x ve y arasında herhangi bir korelasyon yoktur.
• TAM Korelasyon çok nadir bir sonuçtur.
• Söz konusu tüm (X,Y) gözlemleri bire bir “bir eşitliğe”
uymaktadır.

85
Pearson Korelasyonu, r
Kuvvetli (-) Orta (-) Zayıf (-)

-1 ≤ r<-0.9 -0.9≤r<-0.5 -0.5≤ r<0

Kuvvetli(+) Orta (+) Zayıf (+)

0.9<r≤ 1 0.5<r≤ 0.9 0<r≤ 0.5

Pearson Korelasyonu, r
• r istatistiğinin örnekleme dağılımına göre yapılan
t, z ,ve ki-kare testlerinin belirli varsayımları vardır.
• Bunlardan biri X ve Y değişkenlerine göre dağılımın iki
değişkenli normal dağılım olmasıdır .
• Eğer bu varsayım sağlanamıyorsa Pearson
Korelasyon katsayısı ile yapılacak testler
doğru olmayacaktır.

86
Spearman sıra korelasyonu
• Parametrik olmayan bir korelasyon
yöntemidir.
• Eğer “İki değişkenli Normal dağılım
varsayımı sağlanamıyorsa veya
bilinmiyorsa” kullanılır.
• Bu yöntemde korelasyon katsayısı x ve y
değişkenlerinin gerçek değerleriyle değil, bu
değerlerin sıra numaralarıyla hesaplanır.

SPSS’te korelasyon
İki yönlü korelasyonlara
SPSS’te analiz(analyze)
menüsünden,
Correlation>Bivariete
sekmesinden ulaşılabilir.

87
SPSS’te korelasyon
• Burada açılacak kutucukta
arasında korelasyon varlığını
araştıracağımız değişkenleri
“ Variable” kutusuna aktarırız.
•Korelasyon katsayısını hangi
teste göre belirleyeceğimizi
“Correlation Coefficient”
bölmesinde,
•istatistiksel anlamlılığı tek yönlü
mü çift yönlü mü aradığımızı ise
“Test of Significance”
bölmesinde işaretleriz.

SPSS’te korelasyon
• Tamam (OK) düğmesini
tıkladığımızda karşımıza bir
korelasyon matriksi çıkar. Bu
tabloda her kutuda üç değer
yer almaktadır. En üstteki
değer korelasyon katsayısını
(r), ortadaki değer bu
korelasyonun anlamlılığını (p),
en alttaki değer ise örnek
büyüklüğümüzü (n) gösterir.

88
Ki-Kare
Testi

Ki-Kare
Uygunluk Testi

89
90
91
Ki-kare
Bağımsızlık Testi

92
93
94
Ki-Kare
Homojenlik Testi

95
96
Đstatistiklerin SPSS’te Uygulanması
Kesikli verilerin analizi
Çapraz tablolar ve ki kare

Đki veya daha çok grupta kesikli bir değişkenin dağılımı


çapraz tablolar ile gösterilir.

Bu tablolar;

 2x2

 2xn

 n x m olabilir.

97
Çapraz Tablolar ve Ki-kare

 Ki-kare testi gözlenen frekanslarla beklenen frekanslar


arasındaki farkın anlamlı olup olmadığı temeline dayanır.

 Örneğin, bir paranın yazı veya tura gelme olasılığı %50’dir.


100 kez attığımız bir paranın 50 kez yazı, 50 kez tura
gelmesini bekleriz. Yani beklenen frekanslar 50’dir.

SPSS Yardımıyla Ki-Kare Uygulaması


 Analiz (analyze) menüsünden, tanımlayıcı >çapraz tablo
(descriptive)> (crosstabs) sekmesi tıklanır.

98
SPSS yardımıyla Ki-Kare uygulaması
 Çıkan iletişim kutusunda sol kutudaki grup değişkenimizi
sütun,karşılaştırılan değişkeni satır kutusuna aktarırız. Hangi değişkenin
satırda, hangisinin sütunda olduğu istatistik sonuçlarımızı etkilemez.

SPSS yardımıyla ki kare


uygulaması
 Yapacağımız istatistiği belirlemek için “Statistics”düğmesine tıklanır.
SPSS yardımıyla ki kare uygulaması
 Açılan pencerede ki kare (chi-square) seçeneği seçilir. Devam
(continue) düğmesi tıklanır.

99
SPSS yardımıyla ki-kare uygulaması

Bu kutucukta yer alan ve sık kullanılan diğer bazı seçenekler:

– Mc Nemar: Eğer değişkenlerimiz bağımlı ise kullanılır.

Örneğin; bir grubun eğitim öncesi ve sonrası başarı durumları


karşılaştırılıyorsa normal ki-kare testinin seçilmesi hatalı
olacaktır.

– Risk: Vaka kontrol çalışmalarında “Odds Ratio1 hesaplamak için

2 x 2 tablolarda kullanılır.

– Kappa: Gözlemciler arası tutarlılıkları analiz etmede kullanılır.

SPSS Yardımıyla Ki-Kare Uygulaması


 Çapraz tablomuzdaki yüzdelerin hesaplanması için satır ve sütun
değişkenlerini atadığımız kutucuktaki hücreler (cells) düğmesini
tıklarız.
 Burada açılacak kutudan satır, sütun ve toplam yüzdeleri seçilebilir.
 Bu kutucukta devam (continue), satır, sütun değişkenlerini
belirlediğim kutucukta tamam (OK) düğmelerini tıkladığımızda
otomatik olarak sonuç ekranı çıkacaktır.

100
SPSS yardımıyla Ki-Kare uygulaması
 Sonuç ekranında üstte
çapraz tablo değerlerini ve satır sütun
yüzdelerini görürüz.

 Bu tablodaki gruplar arası


dağılım farkının anlamlı olup olmadığı
ise alt tablodaki p (Asymp.Sig.(2-sided))
değerine bakarak değerlendirilir.

 Bu örneğimizde erkeklerin
(1 ile kodlu) 61,9’u sigara içerken,
kadınların (0 olarak kodlu)
%27,2 sinin sigara içtiği görülmüş,
aradaki fark istatistiksel olarak
anlamlı bulunmuştur.

Regresyon Analizi
Regresyon analizi, aralarında sebep-sonuç ilişkisi bulunan iki veya daha fazla
değişken arasındaki ilişkiyi belirlemek ve bu ilişkiyi kullanarak o konu ile ilgili
tahminler (estimation) ya da kestirimler (prediction) yapabilmek amacıyla yapılır.

Örnek: Sebep Sonuç

Gelir Harcama

Yaş Boy

Çalışma süresi Alınan not

101
Regresyon Analizi
Bu analiz tekniğinde iki (basit regresyon) veya daha fazla değişken (çoklu

regresyon) arasındaki ilişki açıklamak için matematiksel bir model kullanılır

ve bu model regresyon modeli olarak adlandırılır.


a) Basit doğrusal regresyon
b) Çoklu doğrusal regresyon
c) Doğrusal olmayan regresyon
d) Lojistik regresyon
e) Cox regresyon

Regresyon Analizi
Kullanım alanları
– Pazar araştırmaları
– Sosyal bilimler
– Finans
– Ekonomi....

102
Regresyon Analizi
Basit regresyon modeli ;

Y=α+βX+ε
Y; bağımlı (sonuç) değişken olup belli bir hataya sahip olduğu varsayılır.

X; bağımsız (sebep) değişkeni olup hatasız ölçüldüğü varsayılır.

α; sabit olup X=0 olduğunda Y’nin aldığı değerdir.

β ise regresyon katsayısı olup, X’in kendi birimi cinsinden 1 birim değişmesine karşılık Y’de kendi
birimi cinsinden meydana gelecek değişme miktarını ifade eder.

ε; tesadüfi hata terimi olup ortalaması sıfır varyansı σ2 olan normal dağılım gösterdiği varsayılır.
Bu varsayım parametre tahminleri için değil katsayıların önem kontrolleri için gereklidir.

Parametrelerin (Katsayıların) Tahmini


Bir regresyon modeli oluşturulurken

 en-küçük kareler

 en büyük olabilirlik (maximum likelihood) teknikleri

olarak bilinen iki yaklaşımdan birisi kullanılır.

 Eğer hata teriminin normal dağılım göstermesi şeklinde bir varsayım varsa

en büyük olabilirlik,

 Hata teriminin dağılımı ile ilgili herhangi bir varsayım söz konusu değilse

en-küçük kareler tekniği

kullanılarak parametreler tahmin edilir.

103
Saçılma(Scatter) Diyagramı
• Basit regresyon analizi sadece değişkenler arasındaki doğrusal
ilişkiyi açıklamaktadır.

• Saçılma diyagramı ile bağımlı ve bağımsız değişkenler


arasındaki ilişki incelenmeden regresyon analizi yapılırsa
doğrusal olmayan çok önemli bir ilişki göz ardı edilebilir.

• Bu nedenle önce ilişkinin biçimi saçılma diyagramı ile


incelenmelidir.

Regresyon
 İki değişkenden birindeki bir birim artışa karşılık, diğerinde
sabit bir değişiklik meydana geliyorsa, bu değişkenler arasında
doğrusal (lineer) ilişki vardır.

 Bu ilişki bir doğru denklemi ile veya bir doğrusal regresyon


grafiği ile gösterilebilir.

104
Uyum İyiliği
• “R2” ve “Çoklu Korelasyon Katsayısının Karesi” regresyonda
yaygın olarak kullanılan uyum iyiliği istatistikleridir.
• 0 ise doğrusal ilişki yoktur.
• 1 ise veri noktaları ve regresyon doğrusu mükemmel uyum
göstermektedir.
• Başka bir görevi ise tahmindeki gelişimi ya da değişkenlikde ki
azalmayı göstermesidir.

Çoklu Regresyon
• Kolay elde edilebilir bağımsız değişkenler yardımıyla zor elde
edilen bağımlı değişken değerini kestirmek.
• Bağımsız değişkenlerden hangisi ya da hangilerinin bağımlı
değişkeni daha çok etkilediğini belirlemek.
• Bağımlı değişken ile bağımsız değişkenler arasındaki karmaşık
yapıyı tanımlamak.
• Diğer değişkenlerin varlığında katsayı kestiriminde bulunmak
amacıyla çoklu regresyon uygulanır.

105
Çoklu Doğrusal Regresyon Modeli

Çoklu Doğrusal Regresyon Modeli

Değişkenlerin Tanımı
• Bağımlı değişken sürekli ya da kesikli sayısal veri tipinde
olmalıdır.
• Bağımsız değişkenler sürekli kesikli ya da nitelik veri tipinde
olabilir.
• Nitelik bağımsız değişkenler olduğunda göstermelik (dummy)
değişkenler oluşturulur.

106
DÖRT ÖNEMLİ İSTATİSTİK
1. BETA (Standartlaştırılmış regresyon katsayıları): Modele katkısı daha
fazla olan değişkenin BETA katsayısı daha büyük olur.

2. VIF : Çoklubağlantı olduğunda 15’in üzerindedir.

3. Çoklu korelasyon katsayısı (R): Bağımlı değişken ile bağımsız değişkenler


arasındaki ilişkinin derecesini verir . 0 ile 1 arasında değişir.

4. Çoklu Açıklayıcılık Katsayısı (R2): Çoklu karelasyon katsayısının karesidir.


Bağımsız değişkenlerin bağımlı değişkeni açıklama miktarını verir.

Uyarılar
• Bağımsız değişkenler arasındaki korelasyon katsayıları yüksek
olmamalıdır.Yüksek ilişki çoklu bağlantıya neden olur.

• Büyük R2 ya da F istatistiğinin anlamlı olması modelin yeterliği


ve geçerliği konusunda ayrıntılı bilgi vermez.

• Artıkların incelenmesi gereklidir. Aykırı, uzak, etkili gözlemler


dikkatle incelenmeli, kestirime yönelik çalışmalarda modelin
geçerliği incelenmelidir.

107
Çoklu Regresyon Yöntemleri
• Tüm değişkenlerin modelde olduğu yöntem
• Değişkenlerin belli bir sırada modele eklendiği yöntem
(hiyerarşik regresyon)
• Adımsal Regresyon (istatistiksel regresyon) yöntemleri
– İleriye doğru seçim (forward selection)
– geriye doğru çıkartma (backward elemination)
– Adım-adım regresyon (step-wise)

Lojistik Regresyon
Bağımlı değişkenin nitel veri tipinde olduğu
durumlarda, bağımlı değişken ile açıklayıcı (bağımsız)
bir ya da daha fazla değişken arasındaki ilişkiyi
tanımlamak için kullanılır.

108
Lojistik Regresyon Türleri
• İkili (Binary) lojistik regresyon: bağımlı değişkenin iki
düzeyi (hasta-sağlam) olduğunda kullanılır.
• Sıralı (Ordinal) lojistik regresyon: bağımlı değişken
sıralı nitel veri tipinde (hafif-orta-şiddetli vb.)
olduğunda kullanılır.
• Multinomial lojistik regresyon: bağımlı değişken
ikiden çok düzeyli sıralı olmayan nitel veri tipinde
olduğunda kullanılır.

Model oluşturma yöntemleri doğrusal regresyondaki


yöntemlere benzerdir. Aradaki fark üç başlıkta özetlenebilir;

1. Lojistik regresyonda bağımlı değişken var/yok, evet/hayır gibi nitelik


veri tipindedir.Bağımsız değişkenler çoklu doğrusal regresyondaki gibi
sayısal sürekli-kesikli ya da nitelik veri tipinde olabilir.

2. Çoklu doğrusal regresyonda her bir gözlem için bağımlı değişkenin


değeri kestirilirken, lojistik regresyonda her bir gözlem için riskin
ortaya çıkma olasılığı elde edilir. Yani sonuç 0-1 arasında bir değerdir .

Diğer bir tanımla, lojistik regresyonda bağımlı değişkenin alabileceği iki


değerden birinin gerçekleşme olasılığı elde edilir.

109
Lojistik Regresyon
3.Doğrusal regresyondaki birçok varsayım lojistik
regresyonda yoktur.
Örneğin, çoklu doğrusal regresyonda hataların sıfır
ortalama ve belirli bir varyansla normal dağılması
istenirken, lojistik regresyonda böyle bir koşul
aranmaz.

Uyarılar
• Çoklu doğrusal regresyonda olduğu gibi lojistik regresyonda da
uygun değişkenler modele alınmalı, nedensel olarak uygun
olmayan değişkenler modele alınmamalıdır.
• Genel bir yaklaşım olarak modeldeki her bağımsız değişken
için en az 10 gözlem olmalıdır.
• Çoklu doğrusal regresyonda olduğu gibi lojistik regresyonda da
adımsal yöntemler vardır.

110
Örnek
50 hasta üzerinde yapılan bir çalışmada, hastanın
yaşı, cinsiyeti, yoğun bakımda kalış süresi ve önceden
antibiyotik kullanımı değişkenleri kullanılarak yoğun
bakım ünitesinde edinilmiş enfeksiyon belirlenmek
istenmektedir.

Enfeksiyon Cinsiyet Yaş Kalış Sür. Önceden


(y) (gün) Antibiyotik
K.
1 1 65 3 0
0 2 58 4 1
0 1 46 7 1
1 1 73 11 0
. . . . .
. . . . .
1:var 1:E 0: +
0:yok (Ref. Kat.) 2:B 1: -

111
Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
YAŞ ,000 ,017 ,000 1 1,000 1,000 ,966 1,035
1 CINS -1,033 ,744 1,929 1 ,165 ,356 ,083 1,529
KALıŞSÜR ,161 ,063 6,636 1 ,010 1,175 1,039 1,328
ÖNANTB ,537 ,766 ,492 1 ,483 1,711 ,381 7,677
Constant -,640 1,629 ,154 1 ,695 ,527
Step
a
KALıŞSÜR ,185 ,067 7,534 1 ,006 1,203 1,054 1,373
4 Constant -1,978 ,680 8,452 1 ,004 ,138
a. Variable(s) entered on step 1: YAŞ, CINS, KALıŞSÜR, ÖNANTB.
47.
Kalış süresi 1 Daha önce antibiyotik
Kalış süresi 1 gün Bayan olmak
Daha önce antibiyotik
günarttığında
arttığında erkeklere göre
kullanmayanlarda
kullanmayanlarda
enfeksiyona
enfeksiyona Bayan olmak
riski enfeksiyon riski
enfeksiyon riski
erkeklere göre
azaltmaktadır
yakalanma riski
yakalanma riski riski kat)
(1/0,356=2,8
kullananlara göre
kullananlara göre 1,711
1,175 katkat
1,175 azaltmaktadır kat artmaktadır.
1,711 Ancak,
kat artmaktadır.
(1/0,356=2,8 kat önemsizdir.
artmaktadır
artmaktadır. Ancak, önemsizdir.

Variables in the Equation

95,0% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
YAŞ ,000 ,017 ,000 1 1,000 1,000 ,966 1,035
147. CINS -1,033 ,744 1,929 1 ,165 ,356 ,083 1,529
KALıŞSÜR ,161 ,063 6,636 1 ,010 1,175 1,039 1,328
ÖNANTB ,537 ,766 ,492 1 ,483 1,711 ,381 7,677
Constant -,640 1,629 ,154 1 ,695 ,527
Step
a
KALıŞSÜR ,185 ,067 7,534 1 ,006 1,203 1,054 1,373
4 Constant -1,978 ,680 8,452 1 ,004 ,138
a. Variable(s) entered on step 1: YAŞ, CINS, KALıŞSÜR, ÖNANTB.

Kalış süresi 1 gün


arttığında
enfeksiyona
yakalanma riski
1,203 kat
artmaktadır.

112

You might also like