You are on page 1of 375

SPSS 15.

0
Statistical Packages for the Social Sciences

YRD.DOÇ.DR.YÜKSEL TERZİ

ONDOKUZ MAYIS ÜNİVERSİTESİ


FEN-ED.FAK.
İSTATİSTİK BÖLÜMÜ
yukselt@omu.edu.tr
Yrd.Doç.Dr.Yüksel TERZĐ 1
SPSS DOSYALARININ UZANTILARI

SAV : Data Editörde oluşturulan verilerin uzantısı,


SPO : Sonuç-Output dosyalarının uzantısı,
SPS : Syntax Editörde oluşturulan dosyanın uzantısı,
SBS : Script Editörde oluşturulan dosyanın uzantısı,
SGT : Grafik dosyalarının uzantısı,

DATA VIEW (VERİ SAYFASI)

Yrd.Doç.Dr.Yüksel TERZĐ 2
VARIABLE VIEW (DEĞİŞKEN SAYFASI)

Variable name : Değişkenin adı


Type : Tipi
Numeric : Sayısal Comma : virgül Dot : Nokta
Scientific notation : özel sembol Data : Tarih
Dollar : Diyez,dolar
Custom currency : özel tanımlanmış veri girişi String : Dizi
Width : genişlik Decimal places : ondalık basamak
Labels : Tanımlama, sınıflandırma
Values : Tanımlanacak değişken
Value : Değeri
Value label : Değerin alacağı isim
Missing values : Eksik verilerin hangi kodla gösterileceğini belirler.
Columns : Sütun genişiliği
Align : Hizalama left : Sol Center : Orta Right : Sağ
Measure : Ölçek
Yrd.Doç.Dr.Yüksel TERZĐ 3
Scale :Cetvel Ordinal : Sıra Nominal : Nitel
Nümeric: Rakamlarla ifade edilen değişkenlerin tanımı yapılır.
Comma (virgül): Büyük verilerin tam kısmını virgül ile üçer
basamak, ondalıklı kısmını ise nokta ile ayırır. (567,346.05)
Dot (nokta) : Büyük verilerin tam kısmını nokta ile üçer basamak,
ondalıklı kısmını ise virgül ile ayırır. (567.346,05)
Scientific Notation : Sayısal verileri üssel olarak ifade eder.
(1000000=1E+6)
String : Alfasayısal verilerin tanımlad
Yrd.Doç.Dr.Yüksel ığı seçenek.
TERZĐ 4
Syntax ve Scrip
Editörleri
işlemlere ilişkin
kod
Sistemlerinin
oluşturulduğu
ve kullanıcının
oluşturacağı
komut
kodlarının yer
aldığı
bölümlerdir.

Yrd.Doç.Dr.Yüksel TERZĐ 5
Diğer veri tabanı programlarındaki veri
dosyalarını açar.
Farklı uzantılara sahip dosyalardaki
verileri SPSS’e aktarır (xls, dat, txt gibi).

Veriler dBase, excel, access ortamına


aktarılır.
Bilgisayardaki bir dosya hakkında bilgi verir.
Üzerinde çalışılan dosya hakkında bilgi verir.
Veri dosyasının geçici bir kopyasını verir.
Kullanıcı adı ve şifre girilerek, Network
üzerindeki dosyalarda işlem yapılır.

Son kullanılan sav uzantılı dosyaları belirtir.


Sav uzantılı olmayan dosyaları gösterir.
Yrd.Doç.Dr.Yüksel TERZĐ 6
Excel’den SPSS’e Veri Aktarma

Excel de örnek veri_notlar isminde belgeler


içinde yer alan bir dosyaya veriler girilir. Daha
sonra bu dosya kapatılır.

Yrd.Doç.Dr.Yüksel TERZĐ 7
File>Open>Data

Dosya türünde Excel (*.xls)


uzantısı seçilir.

Yrd.Doç.Dr.Yüksel TERZĐ 8
Yrd.Doç.Dr.Yüksel TERZĐ 9
Son yapılan değişiklikleri geri alır. Analiz
ile ilgili işlemleri geri almaz.
Geri alınan işlemleri bir önceki konuma
getirir.

Variable View sayfasında kopyalanan bir değişkeni


farklı bir isimle başka bir yere yapıştırır.

Seçilen sütunun sağına yeni bir değişken ekler


Seçilen satırın üstüne yeni bir satır ekler

SPSS ayarlarının yapıldığı yer.

Yrd.Doç.Dr.Yüksel TERZĐ 10
GENERAL

Variable list : Değişkenlerin listelenmesi


Display labels : etiketle göster Display names : değişkenin adını göster
Alphabetical: Alfebetik sıraya göre değişkenleri versin File : Dosyadaki sıraya göre değişkenleri versin.
Append : Komutları peş peşe ekle Owerwrite : Đkinci işlemi
birincinin üstüne ekle
Recently used file list : Gelen dosya isimlerinin sayısını gösterir.
Open syntax window at start-up : syntax penceresini başlangıçta aç.
Measurement system : Ölçü sistemi (grafik gibi).
Point : nokta Inches : inç Centimeters : cm.
Output notfication Yrd.Doç.Dr.Yüksel
: Sonuçların gösterilmesi TERZĐ 11
Raise viewer window : Gösterici penceresinde göster Scroll to new output : özel ses koyar.
VIEWER

Log : sonuçları nasıl göstersin.


Shown : göster , Hidden : gizli
Display command in the log : Hangi komutların kullanıldığı sonuçlarda gösterir.
Text output page size : Çıktılar için kağıt genişliğini belirler.
Length : Uzunluk , Width : genişlik
Infinite : sürekli kağıt takılı olup, Yrd.Doç.Dr.Yüksel TERZĐ
çıktıda kullanılır. 12
Monospaced fonts : Tüm harfler ve karakterler aynı standartta yazılır.
PIVOT TABLE

Yrd.Doç.Dr.Yüksel TERZĐ 13
CURRENCY

Veri tipinde özel karakterlerin nereye yazılacağını belirler ($, TL gibi).


Prefix : Önce , Suffix : Sonra
Decimal separator : Veri aktarımı yaparken ondalık kısım için virgül ise comma, nokta ise period
kullanılır.
Yrd.Doç.Dr.Yüksel TERZĐ 14
DATA

Calculate values before used : hesaplamanın kullanılacağı zamanı göster


(zaman serilerinde kullanılır) .
Set century range for 2-digit years : Zaman ayarları yapılır.
Display format for new numeric variables : Đlk dosya
Yrd.Doç.Dr.Yüksel açıldığında sütun ve
TERZĐ 15
ondalık genişliği ayarı yapılır.
Status Bar :SPSS penceresinde menülerin yer almasını
sağlayan/kaldıran bir seçenektir.
Toolbars :Araçların SPSS penceresinde yer alıp almamasını sağlar.
Font :Yazım şekli ve büyüklüğünü düzenler.
Grid Lines :Veri dosyasındaki çizgileri kaldırır.
Value Labels:Çıktı ekranında ve grafiklerde değerlerin isimlerinin yer
alıp almamasını belirler.
Yrd.Doç.Dr.Yüksel TERZĐ 16
Define Dates: Zaman serisi verilerini içeren dosyalara zaman
değişkeni tanımlar.
Insert Variable :Yeni bir değişken ekler.
Insert case :Yeni bir satır ilave eder.
Go to case :Đstenilen veriye gider.
Short cases :Verileri sıralar
Descending : Büyükten küçüğe
Ascending : Küçükten büyüğe
Transpose :Verilerin transpozunu alır. Yani sütun verileri
satır, satır verileri sütun yapar.
Merge Files :Đki ayrı dosyada benzer değişkenli birimleri
alt alta birleştirir yada farklı değ. leri birleştirir.
Add cases :Farklı dosyalardaki verileri alt alta birleştirir.
Değişken isimleri aynı olmalı.
Add variables : Farklı dosyalardaki değişkenleri birbiri
ile birleştirir.

Yrd.Doç.Dr.Yüksel TERZĐ 17
Yrd.Doç.Dr.Yüksel TERZĐ 18
Yrd.Doç.Dr.Yüksel TERZĐ 19
Yrd.Doç.Dr.Yüksel TERZĐ 20
Yrd.Doç.Dr.Yüksel TERZĐ 21
Yrd.Doç.Dr.Yüksel TERZĐ 22
Yrd.Doç.Dr.Yüksel TERZĐ 23
Yrd.Doç.Dr.Yüksel TERZĐ 24
Yrd.Doç.Dr.Yüksel TERZĐ 25
Yrd.Doç.Dr.Yüksel TERZĐ 26
Yrd.Doç.Dr.Yüksel TERZĐ 27
Agreegate : Bir grubu özet olarak birleştirilmiş veri halinde toplar.
Break variables : Gurup yapılacak değişkenler girilir.
Aggregate variables:Yukarıdaki gruplarda üzerinde işlem yapılacak değişkenler.
Function : Grupların hesaplanacağı fonksiyonlar:
Mean of value : Aritmetik ortalama, First value : ilk değer
Number of cases : olay sayısı Sum os values :Değerler toplamı
Percentage above :Belli değerden büyük değerler yüzdesi.
Percentage below : Belli değerden küçük değerler yüzdesi.
Percentage inside : Đki değer arasındaki değerler yüzdesi.
Percentage outside : Đki değer dışındaki değerler yüzdesi.
Fraction above : Bir değerden büyük değerlerin o grup içindeki yüzdesi
Fraction below : Bir değerden küçük değerlerin o grup içindeki yüzdesi
Fraction inside : Đki değer içindeki değerlerin o grup içindeki yüzdesi
Fraction outside : Đki değer dışındaki değerlerin o grup içindeki yüzdesi
Belli değerler value kutusuna, beli iki değer de Low ve High kutularına yazılır.
Creata new data file:Yapılan hesaplamaların yeni bir dosyaya kayıt edilmesi. File ile kayıt yapılır.
Replace data working data file : Yapılan düzenlemeleri mevcut dosyaya kayıt eder.
Yrd.Doç.Dr.Yüksel TERZĐ 28
Save number of cases in break group as variable: Gruplar içindeki olay sayısının bir değişken gibi kaydı
Ortogonal Design : Bağımsız deneme düzeni türetmeyi(generate) ve bu düzeni görüntüler.
Split file:(Veri dosyası ayırma )
Veri dosyasını istenilen değişkenin
alt seviyelerine göre parçalar.
Böylece veri dosyası, değişken kaç
farklı değer alıyorsa o sayıda alt
dosyalara ayrılır.
Analysis all cases : Gruplamanın
olmadığı durum Yrd.Doç.Dr.Yüksel TERZĐ 29
Select cases :Veri süzme veya seçme-
Farklı değerler alan değişkenlerin istenilen değerlerinin analize katılmasını sağlar.
If condition is satisfied : Değişkenlerle ilgili hesap ve fonksiyon işlemleri yapar.
Random sample of cases : Bazı örnekler üzerinde işlem yapar.

Yrd.Doç.Dr.Yüksel TERZĐ 30
Yrd.Doç.Dr.Yüksel TERZĐ 31
Do not weight cases : Ağırlıklı durum yok

Weight cases by – Frequency Variable:


Bir sütunda yer alan değerlerin diğer bir değişken için ağırlık
olarak tanımlanmasını sağlar.
Yrd.Doç.Dr.Yüksel TERZĐ 32
Compute :Mevcut değişkenlerle matematiksel
işlem yaparak, yeni değ. elde edilir.
Target variable : Yapılan işlem sonunda bulunacak
yeni değişkenin adı.
Random number seed : Rasgele üretilecek olan sayıların
ilk değerini belirler.
Count :Bir değişkendeki aynı değere sahip
birimleri belirler.
Categorize variables : Verilere sıra numarası verilir.
Rank cases :Değişkenleri sıralama değerine
dönüştürür ve yeni değişken olarak atar.
Değişik sırala türleri vardır.(Blom, Tukey, Rankit gibi)
Autumatic Recode : Değişkenin değerlerini büyüklük
sırasına göre dizerek yeni değişken 1 den başlayarak kod
numarası verir.
Create Time Series : Bir veriyi alarak zaman serisi
değişkeni türetir.
Difference : Farklı Seasonal : Mevsimlik
Smooth : Düzgün
Replace Missing Values : Seride yer alan eksik gözlem
yerine bir değer atar. Bu değer ya serinin ortalaması
yada zaman serisi fonksiyonlarından birisidir.

Yrd.Doç.Dr.Yüksel TERZĐ 33
Verileri değiştirme veya yeniden kodlama-Recode komutu:

Veri sayfasında bir değişkene ait verileri matematiksel işlem yapmadan


isteğe göre değiştirmek veya yeni kodlarla ifade etmede kullanılır.
Genelde sürekli olan bir veri gruplanarak kategorik hale getirilir.
Yukarıdaki tabloda sürekli değişken olan masraf numeric variable
kısmına girilir ve output variable kısmına da yeni oluşturulacak
değişkenin adı girilir ve change yapılır. Daha sonra Old and New Values
kısmından kodlamalar tanımlan ır.
Yrd.Doç.Dr.Yüksel TERZĐ 34
Masraf değişkeni <200 Ytl için 1, 201-300 Ytl arası 2, >301 arasıda 3
olsun. Lowest through kısmına (< 200) 200 yazılır, sonra Value 1 verilir
ve Add yapılır. 201 through 300 yazılır, Value 2 girilir ve Add yapılır.
Through highest kısmına 301 girilir, Value 3 ve Add yapılırsa veri
gruplanmış hale gelir.

Yrd.Doç.Dr.Yüksel TERZĐ 35
Automatic Recode

String olarak girilen nitel değişkenleri, Automatic recode komutu ile


kodlayarak, Numeric değişkene çevrilir.
Yrd.Doç.Dr.Yüksel TERZĐ 36
New name kısmına string değişkenlerin yani ismi yazılır ve Add New
Name butonuna basılır.
Lowest value işaretlenirse string değişkenin aldığı değerlere baştan sona
doğru kod numarası verilir (B=1, E=2 olur). Highest value seçilirse sondan
aşa doğru kod numarası verilir (E=1, B=2).
Yrd.Doç.Dr.Yüksel TERZĐ 37
Yrd.Doç.Dr.Yüksel TERZĐ 38
Reports :
OLAP Cubes : Seçilen değişkenlerin istatistiksel işlemlerini yapar.
Case summaries :Verilerin frekans ve çapraz tablolarının oluşturulması,
belirtici istatistiklerin hesaplanması, grafik çizimi ve raporlanmasını sağlar.
Report Summaries in Row : Sıralara ilişkin özet istatistikler hesaplar.
Report Summaries in Column : Değişkenlerle ilgili özet istatistikler hesaplar.

Descriptive Statistics :
Frequencies :Verilerin frekans tablosunu, belirtici istatistikleri, dağılım
ölçülerini hesaplar ve grafiklerini çizer.
Descriptives :Verilerin belirtici istatistiklerini ve asimetrik dağılım ölçüleri
olan çarpıklık (kurtosis), basıklık (skewnes) ölçülerini hesaplar.
Explore :Tüm birimlerin yada her bir gruptaki birimlerin belirtici
istatistiklerini hesaplar ve yayılım grafiklerini çizer. Bir değişkenin diğer
değişkene göre istatistiklerini bulur.
Crosstabs :Đki yada daha fazla değişkenin ikili çapraz tablolarını düzenler.
Hazırlanan tablolara testler yapılır ve özet istatistikler bulunur. Sayısal
değişkenler kodlama ile az sayıdaki gruba bölünerek çapraz tablolar
düzenlenir.

Yrd.Doç.Dr.Yüksel TERZĐ 39
Compare Means:
Gruplara göre verilerin belirtici istatistiklerini hesaplayan,
bağımlı ve bağımsız örneklerde iki yada daha fazla ortalama
arasındaki farkları test eden yöntemleri içerir.
Means :Değişkenlerin tek başına ya da diğer bağımsız
değişkenlere göre alt grupların istatistiklerini hesaplar.
One Sample T test :Tek örnek T testi yapar.
Independent Samples T Test:Bağımsız iki örneklem T testi yapar.
Paired Samples T Test :Bağımlı iki örneklem T Testi yapar.
One Way ANOVA :Bağımsız k-örneklem ortalamalarının
önemliliğini test etmek için tek yönlü varyans analizi uygular.

General Lineer Model :


Genelleştirilmiş lineer modellerle ilgili işlemleri yapar.
Univariate :Tek değişkenli
Multivariate :Çok değişkenli
Repeated Measures :Tekrarlı ölçümlü denemelerde kullanılır.
Yrd.Doç.Dr.Yüksel TERZĐ 40
Correlate :
Đki yada daha fazla değişkenin arasındaki ikili (Bivariate) ilişkinin;
yönünü, büyüklüğünü ve önemliliğini belirler. Ayrıca kısmi (partial)
korelasyon analizi de yapılır. En az bir değişkene göre birimlerin birbiriyle
olan benzerlik uzaklıkları (similarity) yada farklılıklarını gösteren
uzaklıklar (dissimilarity) hesaplanır. Çeşitli uzaklık ve benzeerlik ölçülerine
(öklid, karesel öklid, minkowski) göre birimlerin yada değişkenlerin
benzerlik/farklılık matrisleri bulunur.

Regression :
Linear:Verilere basit doğrusal ve çoklu doğrusal regresyon analizi uygular.
Curve Estimation:Verilere uygun eğri uydurulması için model denenmesi
sağlar. Model seçimi için çoklu regresyon katsayısından yararlanılır.
Logistic : Đkili (Binary) ve çoklu (Multinominal) lojistik regresyon
analizi yapılmasını sağlar.
Probit :Probit regresyon analizi
Nonlineer : Doğrusal olmayan regresyon analizi uygulaması yapar.
Loglinear :
Kategorik verilere genel ve aşamalı loglinear ve lojit loglinear
analiz uygular. Yrd.Doç.Dr.Yüksel TERZĐ 41
Classify :Verilere kümeleme analizi (cluster analysis) ve ayırma analizi
(discriminant analysis) uygular.
K-Means Cluster : Kümelenecek birim yada değişkenlerin kaç kümeye
ayrılacağı belirlenerek guruplamalar yapılır.
Hierarchical Cluster : Değişkenlere aşamalı kümeleme analizi uygular.
Discriminant : Grupları önceden belirli birimleri rasyonel biçimde
birbirinden ayırmaya yarayan fonksiyonlar türetmeyi ve verilerin sınıflandırır.
Data Reduction:
Veilere faktör analizi ve uyum (Correspendance) analizi uygular.
Scale :
Đsimsel fakat kodlanmış sıralı yada aralıklı ölçekle elde edilmiş verilere
güvenilirlik ve çok boyutlu ölçekleme analizi uygular.
Nonparametrics Tests :
Tek örneklem, bağımlı/bağımsız iki ve k örneklem verilerine parametrik
olmayan test yöntemlerinin uygulanmasının sağlar.
Times Series :
Zaman serisi analizi ile ilgili üssel düzeltme, otokorelasyonlu regresyon,
ARIMA, mevsimsel çözümleme, spectral analiz gibi yöntemleri yapar.
Survival :
Sağkalım verilerin yaşam tablosu, Kaplan-Meier ve Cox regresyon analizi
modelleri ile analiz işlemlerini yapar.
Multiple Response : Yrd.Doç.Dr.Yüksel TERZĐ 42
Çoklu cevap yada çoklu ikili setlerin belirlenmesi ve analizi işlemlerini yapar.
GRAPHS (GRAFĐKLER) :

Interactive :Çizilen grafiklerin çeşitli özelliklerine göre oluşturur.


Bar:Verilerin basit çubuk, kümelenmiş çubuk ve yığılımlı çubuk grafiğini çizer.
3-Bar : Üç boyutlu bar grafiği
Line :Verilerin basit ve çoklu çizgi grafiğini çizer.
Area :Verilerin basit ve yığılımlı alan grafiğini çizer.
Pie :Basit daire veya birleşik çubuk grafiğini çizer.
High Low:Verilerin ikili yada üçlü değerlerden yararlanarak yüksek ve düşük
değerleri içeren grafiklerini çizer.
Boxplot :Verilerin ortanca değerini, dörtte birlikler arası genişlik ve aşırı değer
içeren birimleri gösteren kutu grafiklerini çizer.
Error Bar:Ortalama ve güven aralığını gösteren kutu grafiği çizer.
Scatter :Verilere uyan basit ve üst üste gelen ilişki grafikleri, matrix grafiği yada
üç boyutlu dağılım grafiklerini çizer.
Histogram:Bir değişkenin dağılım hakkında bilgi veren histogram grafiklerini çizer.
P–P :Bir değişkenin yığılımlı ortalamalarını Normal dağılımın yığılımlı
ortalamalarına karşı gösteren grafiklerini çizer.
Q – Q :Bir değişkenin dağılımının dörtte birliklerini Normal dağılımın dörtte
birliklerine karşı gösteren grafiklerini çizer.

Yrd.Doç.Dr.Yüksel TERZĐ 43
UTILITIES :
SPSS ile çalışırken yararlanılan
kolaylıkları sunan seçenekleri içerir.
Variables :Değişkenlerle ilgili
bilgi verir. Değişkenin tipi, özelliği,
ölçü birimi gibi.
File Info:Üzerinde çalışılan
değişkenlerin özellikleri konusunda
toplu bilgi verir.
Run Script : Matrix dille yazılmış bir
macronun çalıştırılmasını sağlayan
bir seçenektir.

Yrd.Doç.Dr.Yüksel TERZĐ 44
HELP :
SPSS ile çalışırken SPSS komutları hakkında ayrıntılı yardım
almayı sağlayan bir seçenektir.
Topics:SPSS konuları hakkında yardım seçenekleri görüntülemeyi
sağlar.
Tutorial :SPSS ile çalışmaya yeni başlayanlara bilgi veren bir
seçenektir.
SPSS Home Page : Đnternete bağlı bir bilgisayar ile SPSS INC
tarafından oluşturulan WEB sayfasına ulaşarak bilgilenmeyi
sağlayan bir seçenektir.
Command Syntax Reference : SPSS’de menüler aracılığı ile yapılan
işlemlerin SPSS komutları cinsinden yazılımlarını irdelemek amacıyla
bilgi alınan bir seçenektir.

Yrd.Doç.Dr.Yüksel TERZĐ 45
1. İSTATİSTİĞE GİRİŞ
Karşımıza çıkan bir istatistik sonucun sorgulanması:

 Önce bilinçli sapma olup olmadığına bakılır. İşe


yarayan veriler seçilmiş, işe yaramayan veriler örtbas
edilmiş olabilir.

 Uygun olmayan ölçü kullanılmış olabilir. Medyan


yerine aritmetik ortalama gibi.

 Örneklem güvenilir bir sonuç verecek kadar büyük


mü? Korelasyon bir anlam verecek kadar büyük mü?

 Güvenilirlik ölçüsü (olası hata, standart hata)


verilmeden önünüze konan bir korelasyon ciddiye
alınmaz.
Yrd.Doç.Dr.Yüksel TERZĐ 46
 Bazen oranlar verilir, ancak sayılar ortada görünmez. Bu
yanıltıcı olabilir. Mesela sınıftaki %33 (1/3) bankacılar ile
evlenmiştir. Ancak burada kızların sayısı belirtilmemiştir.
Bu sınıfta 3 kız vardır ve biri bankacı ile evlenmiştir.

 Bazen olgulardaki değişikliğe neden olan faktör görünmez.


Mesela Ekim ayı perakende satışları geçen yılın Ekim ayına
göre artış göstermiştir. Ancak burada özel olan durum, bu
seneki ekim ayının ramazan ayına denk gelmesidir. Bu
ayrıntı açıklamada yer almamıştır.

 İstatistiği değerlendirirken elde edilmiş sayılardan sonuca


giderken bir saptırma yapılıp yapılmadığına bakılır. Mesela
Çin’de bir bölgenin nüfusu 28 milyon bulunmuştur. Aynı
bölgenin 5 yıl sonraki nüfus sayımı ise 105 milyon çıkmıştır.
Ancak burada hangi sayımın yapıldığı belirtilmemiştir.
Birinci sayım vergi ve askerlik için, ikinci sayım ise gıda
Yrd.Doç.Dr.Yüksel TERZĐ
yardımı üzerine yapılmıştır. 47
ĐSTATĐSTĐKTE YAPILAN HATALAR
 Sürekli verilerin kategorik verilere dönüştürülerek analiz edilmesi
 Eşli gözlemlerin ortalamalarının eşler arası farklılığın belirtilmeden
verilmesi
 Tanımlayıcı istatistiklerin yanlış kullanılması (örn: ortalamanın
kullanılmaması gereken yerde ortalamanın kullanılması vb)
 Metin içindeki, tablodaki ve grafiklerdeki verilen istatistiklerin
uyumlu olmaması
 Değişim ölçüsü olarak ortamla yanında SEM (ortalamanın standart
hatası)in kullanılması (Bu ölçüt daha küçük olduğu için örneklemin
daha hassas olduğunu işaret için kullanılmaktadır. Ortalamanın
değişimi ile ilgili bir istatistik verilmek istenirse %95 lik güven sınırını
vermek daha uygundur)
 Test İstatistikler verilmeden, sadece p değerinin verilmesi
 İstatistik testler için gerekli olan varsayımlar karşılanmadan bu
testlerin analiz için kullanılması
 İlişkinin doğrusal olup olmadığı kontrol edilmeden doğrusal
regresyon analizinin kullanılması
 Tüm deneklerin veya verinin analizde kullanılmaması, aşırı
değerlerin beklenen sonucu desteklemesi durumunda analizde
bırakılması, aksi halde atılması
Yrd.Doç.Dr.Yüksel TERZĐ 48
ĐSTATĐSTĐKTE YAPILAN HATALAR
• Çoklu karşılaştırma testlerinde düzeltme gereksiniminin kontrol
edilmemesi veya ne şekilde bir düzeltme yapıldığının
açıklanmaması
• Şekil ve tabloların okuyucuya yardımcı olmasını sağlamak yerine
sadece verileri depolamak amaçlı kullanılması
• Grafik ve çartların verdiği görsel mesajların verinin sağladığı
mesajlarla uyumsuz görünmesi
• Tanı testleri rapor edilirken “normal” ve “anormal” kelimelerinin
kullanılması (çünkü normalin tanımı farklı yerlerde farklı
anlamlarda kullanılabilmektedir)
• Tanı testlerinin sonuçları ( Duyarlılık ve özgüllük vb) verilirken
hesaplamada kullanılan testlerin özellikleri açıklanmaması
• Sonuçların yorumlanması ve rapor edilmesi esnasında
gözlemlerin birimlerinin karıştırılması veya göz ardı edilmesi
• Test sonucunda bulunan istatistiki olarak önemsiz
karşılaştırmaların hiçbir anlamı olmadığı düşüncesi ile
verilmemesi Yrd.Doç.Dr.Yüksel TERZĐ 49
İstatistik üç farklı anlamda kullanılır.
 Yığın olayları incelemek, olaylarla ilgili toplanan verileri analiz
etmek, olayların sebep ve sonuçlarını açıklamak, aralarındaki
ilişkileri ortaya koymak için kendine özgü yöntemleri olan bir
bilim dalıdır.

 Olayların nicel ve nitel yönlerinin tablolar, grafikler veya


sayısal değerler şeklindeki özet ifadelerdir. Ölüm istatistikleri,
doğum istatistikleri, göç istatistikleri, kaza istatistikleri gibi özet
bilgiler istatistikler olarak adlandırılır.

 Örneği oluşturan birimlerden hesaplanmış, ana kütleyi


tanımlayan değerlere karşılık gelen değerlerdir. Örnek
ortalaması, örnek varyansı gibi.
İstatistik, geçmişi ve şimdiki durumu çeşitli sayısal
tekniklerle analiz ederek gelecek hakkında karar vermeyi
sağlayan bir bilim dalıdır.Yrd.Doç.Dr.Yüksel TERZĐ 50
BAZI ÖNEMLĐ TERĐMLER

 Anakütle (Populasyon=Evren=Toplum) :
Üzerinde inceleme veya araştırma yapılacak
olayın gözlenebileceği tüm birimlerin yer aldığı
topluluktur. Bir fabrikanın ürettiği aynı türden
ilaçlar anakütleyi oluşturur.

 Örnek(sample=örneklem): Anakütleyi temsil


edebilecek özelliklere sahip daha az sayıda
birimden oluşan topluluktur. Fabrikada üretilen
ilaçlardan rasgele alınan 20 kutu ilaç örnektir.

Yrd.Doç.Dr.Yüksel TERZĐ 51
Birim(olgu=case=denek): Üzerinde gözlem ve ölçüm yapılan ve
anakütleyi oluşturan en küçük öğe. Birimler canlı yada cansız
varlıklar olabileceği gibi, kurum, kuruluş da olabilir. Her ilaç(veya
her kutu) bir birimi oluşturabilir.
Birimlerin mutlaka sayılabilir veya ölçülebilir özelliklere
sahip olması gerekir. Bu yüzden zevk, koku, rüya gibi ifadeler
birime örnek kabul edilemez.
İstatistikte birimin homojen(eşitlik) olması şartı da aranır.
Aynı tanıma uygun birimlere homojen denir. Birimler belli bir
tanıma uyduklarında “biçimsel homojenlik” olur. Örneğin
Üniversite öğrencileri arasında biçimsel homojenlik vardır. Eğer
öğrenciler arasında boy, yaş gibi eşitlik varsa (ki bu zordur)
“maddi homojenlik” olduğu söylenebilir. İstatistiğin ilgi duyduğu
biçimsel homojenliktir. Maddi homojenliğe zor ender rastlanılır.
Biçimsel homojenliği gerçekleştirebilmek için birimin açık ve
kesin bir tanımı muhakkak verilmelidir. Böyle bir tanımın
verilmemesi durumunda gözlemcilerin topladıkları veriler bir
araya getirildiğinde elde edilen sonuç bir anlam taşımaz. Çünkü
kütle homojen olmayan birimlerden oluşmuş olur. Örneğin genel
nüfus sayımında kimler hakkında bilgi toplayacağız? Sayımın
yapıldığı ülkenin vatandaşlarını mı, yoksa hem bunları hem de
sayım anında ülke sınırları içinde yaşayan veya bulunan
yabancıları mı dikkate alacağız? Bu
Yrd.Doç.Dr.Yüksel gibi durumlarda tanımın52 çok
TERZĐ
açık yapılması gerekmektedir.
Parametre: Anakütleyi tanımlamada kullanılabilen tipik
değerlerdir. Anakütle ortalaması, anakütle varyansı gibi
değerlerdir.

İstatistik: Örneği oluşturan birimlerden hesaplanmış,


anakütleyi tanımlayan değerlere karşılık gelen değerlerdir.
Örnek ortalaması, örnek varyansı gibi.

Parametre İstatistik
µ
X
S2
σ2
n
N
Örnekleme Örnek
Anakütle
Yrd.Doç.Dr.Yüksel TERZĐ 53
ÖRNEKLEME NĐÇĐN GEREKLĐDĐR ?
1. Popülasyonun hepsini incelemek çok masraflı
olabilir. Popülasyondan alınacak küçük örnekler
yardımı ile gerçeğe yakın bilgiler elde edilebilir.
2. Popülasyonla yapılacak bir çalışma çok uzun
zamana ihtiyaç gösterebilir. Halbuki örnekle
çalışılırsa kısa zamanda gerçeğe yakın bilgiler kısa
zamanda elde edilebilir.
3. Bir çok durumda gözlemlerin elde edilmesi
deneklerin yok edilmesini gerektirebilir. Örneğin bir
ilaç üzerinde deneme yapılıyorsa fabrikanın ürettiği
tüm ilaçları denemeye almak ve yok etmek mümkün
değildir.
4. Küçük sayıda örneklerle çalışılırken daha hassas
çalışma yapmak ve daha dikkatli ölçüm almak, daha
hassas alet ve yöntemler kullanmak mümkündür.
Yapılan işin denetlenmesi
Yrd.Doç.Dr.Yükselde
TERZĐdaha kolay olur. 54
Örneklem büyüklüğünün hesaplanmasına ilişkin formüller

Değişken
Türü N<10.000 N>10.000

Nσ Zα
2 2 Nσ 2 Zα2
Nicel n= n=
( N − 1)( SH ) 2 + σ 2 Zα2 (SH ) 2
(Ortalama)

NPQZα2 PQZα2
Nitel n= n=
2 2
( N − 1)( SH ) + PQZα ( SH ) 2 + PQZα2
(oran)

P: evrende bir olayın gözlenme oranı


Q=1-P
Yrd.Doç.Dr.Yüksel TERZĐ 55
Evren büyüklüklerine karşılık örneklem büyüklüğü
N–n N–n N–n N–n N–n N–n N–n N–n N–n N–n

10-10 55-48 100-80 190-127 280-162 440-205 800-260 1500-306 2800-338 9000-368

15-14 60-52 110-86 200-132 290-165 460-210 850-265 1600-310 3000-341 10000-370

20-19 65-56 120-92 210-136 300-169 480-241 900-269 1700-313 3500-346 15000-375

25-24 70-59 130-97 220-140 320-175 500-217 950-274 1800-317 4000-351 20000-377

30-28 75-63 140-103 230-144 340-181 550-226 1000-278 1900-320 4500-354 30000-379

35-32 80-66 150-108 240-148 360-186 600-234 1100-285 2000-322 5000-357 40000-380

40-36 85-70 160-113 250-152 380-191 650-242 1200-291 2200-327 6000-361 50000-381

45-40 90-73 170-118 260-155 400-196 700-248 1300-297 2400-331 7000-364 75000-382

50-44 95-76 180-123 270-159 420-201 750-254 1400-302 2600-335 8000-367 100.000-384

Yrd.Doç.Dr.Yüksel TERZĐ 56
ÖLÇME DÜZEYLERİ
1. Adlandırma
2. Sıralama
3. Aralık
4. Oran
1. Adlandırma Ölçeğinde sayılar sadece bir isim gibidir,
büyüklük, küçüklük söz konusu değildir. Bir koşu
pistinde 6 numaralı koşucu ile 10 numaralı
koşucunun iyilik yönünden farklı olmadığı gibidir.
Örneğin, psikiyatride hastalar şizofrenik, paranoid,
manyak depresif, psikonörotik gibi isimlendirilir. Bu
isimler hastalığın tipine ait sembollerdir. Bu
isimlendirme A,B,C,D, veya 1,2,3,4,5 diye de
yapılabilirdi. Bu tip verilerde özellikle parametrik
olmayan istatistikler kullanılır.
Yrd.Doç.Dr.Yüksel TERZĐ 57
2. Sıralama ölçeği: Bu ölçekte bir büyüklük veya
önemlilik söz konusudur. Kişilerin eğitim
durumunu gösterirken, Eğitimsiz=1, İlkokul=2,
Ortaokul=3, Lise=4, Üniversite=5, Yüksek
lisans=6 kodları verildiğinde sayı büyüdükçe
eğitim düzeyinin arttığı anlaşılır. Ancak 1 ile 2
arasındaki mesafe ile 5 ile 6 arsındaki mesafe
aynı değildir. Yani sıralama ölçeğinde kod olarak
kullanılan sayılar arasındaki mesafe önemli
değildir. Sıralamada en iyiye büyük sayı
verilebileceği gibi küçük sayıda verilebilir, bu
kullanılacak analiz yöntemini değiştirmez. Bu
ölçekle elde edilmiş verilerde ortalama yerine
medyan kullanılır, daha çok parametrik olmayan
testler kullanılır.
Yrd.Doç.Dr.Yüksel TERZĐ 58
3. Aralık Ölçeği: Bu ölçekte kod sayıları arasındaki
mesafenin önemi vardır. Ölçü biriminin ve sıfır
noktasının seçimi arzuya bağlıdır. Sayılar arası
mesafelerin anlamı önemlidir. Bu tip sayılar
toplanarak ortalama alınabilir.
Bu ölçekte sıfır değeri hiçlik belirtmez.
Örneğin bir ersin sınavından sıfır puan alan
öğrencilerin ders konuları ile ilgili hiçbir şey
bilmediği düşünülemez. Sıcaklık, zeka, yetenek,
performans puanı gibi nicel değişkenlere ait
ölçümler aralık ölçeğindedir.

Yrd.Doç.Dr.Yüksel TERZĐ 59
4. Oran Ölçeği: Bu ölçekte her zaman bir
mutlak sıfır noktası vardır. Ağırlık oran
ölçeğinde bir değişkendir, çünkü sıfır
ağırlığında olabilir. Sayılarak elde edilen
değişkenlerin çoğu oran ölçeğindedir,
örneğin; geçen 6 aydaki hasta sayısı nedir
dendiğinde, bu sıfır olabilir. 1. Altı aydaki
hasta 2. Altı aydaki hastanın iki katıdır
dendiğinde bunu bir anlamı vardır.

Yrd.Doç.Dr.Yüksel TERZĐ 60
Ölçeklerin Güç Hiyerarşisi

Oran Mutlak sıfır noktası var


(en güçlü ölçek)

Aralık Değerler arası mesafe önemli

Sıralama Sonuçlar sıralanabilir

Adlandırma Sonuçlar sadece isim


(en zayıf ölçek)

Yrd.Doç.Dr.Yüksel TERZĐ 61
Yrd.Doç.Dr.Yüksel TERZĐ 62
İSTATİSTİĞİN GÖREVİ

İstatistikte genellikle şu sıraya uyulur:

1. Verilerin toplanması
2. Toplanan verilerin işlenip düzenlenmesi
3. Düzenlenmiş verilerin tablolar ve/veya
grafikler şeklinde gösterilmesi
4. İstatistiksel analiz, tahmin
5. Karar vermek

Yrd.Doç.Dr.Yüksel TERZĐ 63
UYGUN ĐSTATĐSTĐK TEKNĐĞĐN BELĐRLENMESĐ

 Araştırmanın Amacı : Uygulanacak test araştırmanın amacına uymalıdır.


 Örneklem Yöntemi : Örneklemin yansız olarak seçilmesi gerekir.
 Değişkenlerin Türü : Değişkenlerin hangisinin bağımlı-bağımsız ve
hangisinin nitel-nicel olduğu belirlenmelidir.
 Bağımlı Değişkenlerin Ölçüm Düzeyi : Sınıflama-sıralama-aralık-oran
 Karşılaştırmanın bağımsız gruplar arasında mı yoksa ilişkili ölçümler
arasında mı olduğu belirtilmelidir.
 Parametrik Test Koşulları:
Veriler nicel olmalı
 Veriler Normal Dağılıma sahip olmalı
 Varyanslar homojen olmalı yani dağılımların yaygınlıkları benzer
olmalı
 Örneklemi oluşturan birimler popülasyondan (evrenden) yansız
olarak seçilmeli
 Örneklemi oluşturan birimler birbirinden bağımsız olmalı (bir
birimin seçimi diğer birimin seçimini etkilememeli)
 Örneklem büyüklüğü 10’dan az olmamalıdır.
Yrd.Doç.Dr.Yüksel TERZĐ 64
Karşılaştırma Parametrik Testler Parametrik
Olmayan Testler
I.Grup-örneklem Tek grup için İşaret Testi
Z ve T testi
Bağımsız II Grup Bağımsız örnekler Mann-Whitney
için T testi U Testi
İlişkili-Bağımlı İlişkili Ölçümler Wilcoxon
II.Grup için T Testi Eşleştirilmiş Testi
Bağımsız III veya Varyans Analizi Kruskal-Wallis H
daha fazla grup Testi
İlişkili III veya daha Tekrarlı ölçümler Friedman Testi
fazla grup için ANOVA

Yrd.Doç.Dr.Yüksel TERZĐ 65
Adlandırma Ölçeğinde ölçülen verilerin
Farklılığının Testi
Grup Sayısı

1 Grup Var 2 Grup Var 3 veya Daha


Fazla Grup Var

n.p >=5 n.p<5 Gruplar Gruplar Gruplar Gruplar


n.q>=5 n.q<5 Bağımsız Bağımsız Bağımsız Bağımlı
Değil

Z yaklaşımı Binom testi Mc Nemar Beklenen Beklenen Beklenen Beklenen Cochran-Q


ile test Testi Değer Değer Değer Değer testi
Küçük Büyük Küçük Büyük

Fisher Khi Kare testi Khi Kare Analizi Khi Kare


Exact testi veya için Sınıf Analizi
Z yaklaşımı Birleştir

Yrd.Doç.Dr.Yüksel TERZĐ 66
1 veya 2 Grup Olduğunda Sıralama ve Aralık Ölçeğindeki
Verilerin Farklılığının Testi
Grup Sayısı

1 Grup Var 2 Grup Var

n>=30 n<30 Gruplar Gruplar


Bağımsız Bağımlı

t Testi Dağılış Dağılış n>=30 n<30 n>=30 n<30


Uygula Normal Normal
Değil

t Testi Dönüşüm yap İşaret Testi t Testi Dağılış Dağılış t-Eşli Dağılış Dağılış
Uygula ve t Testi uygula uygula Normal Normal Değil karşılaştırma Normal Normal
uygula Değil

Varyanslar Varyanslar Wilcoxon Dönüşüm ve t-Eşli Dönüşüm ve Wilcoxon


Eşit Eşit Rank sum t testi Karşılaştırma t testi signed rank
Değil testi testi

t Testi n ler Eşit n ler


Uygula eşit değil

t testi serbestlik
uygula derecesi
düzeltilmiş
t testi uygula

Yrd.Doç.Dr.Yüksel TERZĐ 67
Sıralama ve Aralık Ölçeğinde 3 veya Daha Fazla
Grup Olduğunda Farklılığın Testi
3 veya Daha
Fazla Grup
Var

Gruplar Gruplar
Bağımsız Bağımlı

Dağılış Dağılış Dağılış Dağılış


Normal Normal Normal Normal
Değil Değil

k-Faktör için 2 veya Daha 1 Faktör Tekrarlanan Friedman


Kruskal-Wallis Fazla faktör var Var Ölçümlü Testi
Testi Varyans
Analizi

2 Yönlü veya Tek Yönlü


Diğer Varyans Varyans
Analizleri Analizi
Yrd.Doç.Dr.Yüksel TERZĐ 68
1 Bağımlı 1 Bağımsız Değişken Durumunda
İlişki Bulunması
Heriki Değişkenin
Ölçeği

Sınıflayıcı Sıralayıcı Aralık


Ölçekte Ölçekte Ölçeğinde

Göreli(Relative) Spearman Bir Değişken Bir Değişken


Risk Analizi Sıra Korelasyon Diğerinden Diğerinden Tahmin
Katsayısı Tahmin Edilmeyecek
Edilecek

Regresyon Pearson
Analizi Korelasyon
Katsayısı

Yrd.Doç.Dr.Yüksel TERZĐ 69
Bağımsız Değişken Sayısı 2 Veya Daha Fazla Olması Durumu
Bağımsız Değişkenlerin
Ölçeği

Sınıfsal Sıralayıcı
Ölçekli veya Aralık Ölçekli

Bağımlı Bağımlı Değişken Bağımlı Değişken Bağımlı Değişken


Değişken Aralık Sınıfsal Aralık
Sınıfsal Ölçekli Ölçekli Ölçekli
Ölçekli

Sansürlenmiş Sansürlenmiş Sansürlenmiş Sansürlenmiş Bağımsız Bağımsız Sansürlenmiş Sansürlenmiş


(censored) Gözlem Yok Gözlem Var Gözlem Yok Değişken Şık Değişken Şık Gözlem Gözlem
Gözlem Var Sayısı 2 Sayısı 3 Var Yok
(Binary) veya Daha fazla

Kaplan-Meier veyaEtki Karışımlı Etki Karışımlı Cox-Proportinal Varyans Analizi Lojistik Diskriminant Cox- Proportional Confounding Confounding
Actuarial (Confounding) (Confounding) Hazard Modeli Regresyon Analizi Hazard Değişken Değişken
Analiz Değişken Yok Değişken Var Modeli Var Yok

Log-Linear Mantel-Haensel Kovaryans Çoklu


Analiz Analizi Analizi Regresyon
Analizi

Yrd.Doç.Dr.Yüksel TERZĐ 70
GRAFİKLER
Grafikler gözlem sonuçlarının anlaşılması
kolaylaştırır. Çünkü ilk bakışta görsel kolaylık
sağlarlar. Ancak grafikler rakamlar derecesinde
önemli değildir. Çünkü grafiksiz istatistik olabilir ancak
rakamsız grafik asla olamaz. Ayrıca grafikler büyük
farkları ve değişimleri gösterebilir. Ancak küçük farklar
ve değişimleri gösteremez. Çeşitli grafik türleri vardır.
Bar (Çubuk) Grafiği: Nominal ve ordinal verilerin
grafiklerinin yapılması için uygundur. Bu grafik yatay
eksende kategori etiketleri belirtilirken, her kategori ile
frekans veya yüzdeyi temsil eden dikey çubuklar
çiziminde oluşur. Yrd.Doç.Dr.Yüksel TERZĐ 71
Yrd.Doç.Dr.Yüksel TERZĐ 72
Yrd.Doç.Dr.Yüksel TERZĐ 73
Yrd.Doç.Dr.Yüksel TERZĐ 74
Yrd.Doç.Dr.Yüksel TERZĐ 75
Scatter/Dot Grafiği

Yrd.Doç.Dr.Yüksel TERZĐ 76
Yrd.Doç.Dr.Yüksel TERZĐ 77
Pie (pasta) Grafikleri

Yrd.Doç.Dr.Yüksel TERZĐ 78
Yrd.Doç.Dr.Yüksel TERZĐ 79
Histogram Grafikleri

Yrd.Doç.Dr.Yüksel TERZĐ 80
Yrd.Doç.Dr.Yüksel TERZĐ 81
Boxplot (Kutu) Grafikleri

Yrd.Doç.Dr.Yüksel TERZĐ 82
Yrd.Doç.Dr.Yüksel TERZĐ 83
KUTU GRAFİĞİ (BOX PLOT)
Yüzdeliklere dayanan ve tanımlayıcı istatistikleri kullanan bir grafik türüdür.
50
Uç nokta
330

Uç nokta olmayan
40
en büyük değer

30
75. yüzdelik(3. çeyrek)

50. yüzdelik(medyan)
20

25. yüzdelik(1. çeyrek)


10
Uç nokta olmayan
en küçük değer
0
N= 398

Gelir

Yrd.Doç.Dr.Yüksel TERZĐ 84
STEM&LEAF GRAFĐĞĐ (DAL VE YAPRAK GRAFĐĞĐ)
YAS Stem-
Stem-and-
and-Leaf Plot
Frequency Stem & Leaf
1,00 2 . 9
4,00 3 . 0234
5,00 3 . 56789
5,00 4 . 01234
5,00 4 . 56789
5,00 5 . 01234
4,00 5 . 6789
4,00 6 . 0123
2,00 6 . 69
3,00 7 . 013
3,00 7 . 578
Stem width: 10,00
Each leaf: 1 case(s)
Analyze>Descriptive statistics>Explore yolu ile Plots tuşu seçilerek Stem-and leaf
işaretlenir.
Burada stem (dal) ve leaf (yaprak) anlamındadır.
Yukarıdaki tabloda örneğin “4,00 3.0234” satırı 30 ile 34 değerleri arasında
4 değer olduğunu gösterir. Tablo altındaki Stem width : dal genişliğini,
Yrd.Doç.Dr.Yüksel TERZĐ 85
Each leaf : her yapraktaki deneklerin tek tek gösterildiğini ifade eder.
2. MERKEZĐ EĞĐLĐM ÖLÇÜLERĐ (ORTALAMALAR)
(Measures of Central Tendency)
“Başı fırında ayakları buzdolabında olan bir adam ortalama olarak
rahattır” Malcolm E.Lines
Bir mahalledeki ortalama gelir düzeyi bir araştırmaya göre yılda
15000€, diğerine göre ise 5000€ çıkmıştır. Đki sonuçta aynı kişi ve yerden
bulunmuştur. Burada ki hile “ortalama” kelimesidir. Çünkü hangi ortalama
olduğu belirtilmemiştir. Eğer büyük bir sayıya ulaşmak istiyorsanız aritmetik
ortala, küçük bir sayıya ulaşmak için en çok tekrarlanan değer olan mod
kullanılabilir.
Sayı yığınlarının kolayca anlaşılması için sayı yığınlarının en fazla
yığıldığı bölgeyi tarif eden tipik değerlerin verilmesi gerekir. Bu değerler
dağılışın merkezini gösterdikleri için merkezi eğilim ölçüleri olarak da
bilinir. Đstatistikte bir seriyi temsil etmeye yarayan tek bir rakama ortalama
denir.
Ortalamalar serinin bütün terimlerinin hesaba katıldığı ortalamalar
(duyarlı ortalamalar) ve serinin bütün terimlerinin hesaba katılmadığı
ortalamalar (duyarlı olmayan ortalamalar) diye ikiye ayrılır.
Yrd.Doç.Dr.Yüksel TERZĐ 86
2.1. Duyarlı Ortalamalar

Tablo 2.1. Duyarlı ortalamalara ilişkin genel formüller aşağıdaki


gibidir:

Basit Serilerde ∑ i
X r
Or = r
N
Sınıflanmış Serilerde ∑ f i X ir
Or = r
Duyarlı Ortalamalar ∑ fi
Gruplanmış Serilerde ∑ f i mir
Or = r
∑ fi
Burada r’ye -∞ ile +∞ arasında değerler verilerek sonsuz ortalama
bulunabilir. r=-∞ olması durumunda ortalamanın Xmin olmasına, r=+∞
olması durumunda ise Xmax olacağı ispatlanabilir. Yani r arttıkça ortalama
büyümekte, r azaldıkça ise küçülmektedir.
Yrd.Doç.Dr.Yüksel TERZĐ 87
2.1.1. Aritmetik Ortalama
Aritmetik ortalama deneklerin aldıkları değerlerin toplanıp
denek sayısına bölünmesiyle elde edilen değerdir. Tablo 2.1.’de r=1
alındığında aritmetik ortalama formülleri elde edilir.

Basit
X=
∑ Xi
Serilerde N
Aritmetik Sınıflanmış ∑ fi X i
Ortalama X=
Serilerde ∑ fi
Gruplanmış
X=
∑ f i mi
Serilerde ∑ fi

Yrd.Doç.Dr.Yüksel TERZĐ 88
2.1.2. Geometrik Ortalama
Xi: {X1,X2,…, Xn} pozitif sayılar kümesinin geometrik ortalaması,
sayıların çarpımlarının N nci dereceden köküdür.
Geometrik Ortalama = GO = N X 1 X 2 .... X n

Tablo 2.1.’de r=0 yada r→0 için limit alınarak geometrik ortalama
formülleri bulunabilir.
Basit Serilerde ∑ log X i
log GO =
N
Sınıflanmış Serilerde
log GO =
∑ f i log X i
Geometrik ∑ fi
Ortalama Gruplanmış Serilerde
log GO =
∑ f i log mi
∑ fi
Geometrik ortalama, terimlerinin logaritmalarının aritmetik
ortalamasının antilogaritmasınaYrd.Doç.Dr.Yüksel
eşittir. TERZĐ 89
Geometrik Ortalamanın Özellikleri
I. Geometrik ortalama özellikle aynı oranda artma yada azalma
eğilimi gösteren olaylara ilişkin serilere uygulanır. Örneğin
nüfus çoğalması, bakteri üremesi gibi geometrik dizilerde birim
zamandaki artışı bulmak için GO kullanılır.
II. Simetrik olmayan ancak logaritmaları alındığında simetrik hale
dönüşen serilere geometrik uygulama uygulanabilir.
III. Serideki terimler arasında bazı değerler sıfır veya negatifse GO
hesaplanamaz.
IV. Geometrik uygulama aşırı uç değerlerden aritmetik ortalamaya
göre daha az etkilenir.
V. GO ≤ AO ilişkisi vardır. Bütün Xi ler eşitse GO=AO olur.
VI. Seri terimlerinin k. kuvvetlerinin geometrik ortalaması,
geometrik ortalamanın k. kuvvetine eşittir.

[( X )
1
k
( X 2 ) k K( X N ) k ]
1/ N
[
= ( X1X 2 K X N )k ]
1/ N
[
= ( X 1 X 2 K X N )1 / N ]
k
= GO k
Yrd.Doç.Dr.Yüksel TERZĐ 90
2.1.3. Harmonik Ortalama

Xi:{ X1,X2,…, Xn } değerlerinin harmonik ortalaması:


1
Harmonik Ortalama =
1 N 1

N i =1 X i
Harmonik ortalama terimlerin terslerinin aritmetik ortalamasının
tersidir. Tablo 2.1.’de r=-1 alınırsa harmonik ortalama formülleri elde
edilir.
N
HO =
Basit Serilerde 1
∑ Xi

Harmonik HO =
∑ fi
Ortalama Sınıflanmış
fi
Serilerde ∑
Xi

HO =
∑ fi
Gruplanmış
fi
Serilerde ∑
Yrd.Doç.Dr.Yüksel TERZĐ mi 91
Harmonik Ortalamanın Özellikleri
I. Serideki terimlerden biri sıfır ise harmonik ortalama sıfır çıkar.

II. Seri terimleri farklı işaretli olursa harmonik ortalamanın sonucu


anlam taşımaz.
Mesela verilerimiz -4, -2, 1,2,5 olsun. Buna göre HO=5.05 çıkar.
Bu sonuç, bir ortalama maksimum değerden daha büyük bir
değere sahip olamayacağı için, ortalama olarak kabul edilmez.
5
HO = = 5.05
1 1 1 1 1
+ + + +
−4 −2 1 2 5

III. HO ≤ GO ≤ AO ilişkisi vardır.

IV. HO sınırlı hallerde kullanılır. Tersine çevrildiğinde taşıyacağı


anlama önem verilen oran türündeki niceliklerin ortalamasını
bulmak için kullanılır. Bu niceliklere örnek olarak
fiyat=para/mal, prodüktivite=iş/emek, verim=ürün/ekim alanı,
Yrd.Doç.Dr.Yüksel TERZĐ 92
hız=uzaklık/zaman verilebilir.
2.1.4. Kareli Ortalama

Kareli ortalama fiziksel uygulamalarda çok sık kullanılır. Tablo


2.1.’de r=2 alınırsa terimlerin karelerinin aritmetik ortalamasının
kareköküne eşit olan kareli ortalama formülleri bulunur.

Basit Serilerde ∑ X i2
KO =
N
Sınıflanmış ∑ f i X i2
Serilerde KO =
Kareli Ortalama ∑ fi
Gruplanmış ∑ f i mi2
Serilerde KO =
∑ fi

Yrd.Doç.Dr.Yüksel TERZĐ 93
Kareli Ortalamanın Özellikleri

1. Kareli ortalama negatif işaretleri de dikkate


alabileceğinden HO ve GO’ya göre daha üstündür.

2. KO bazı istatistiksel işlemlerin kolaylıkla uygulanmasını


mümkün kılar. Örneğin bir değişkenlik ölçüsü olan
standart sapmanın hesabında kareli ortalamadan
yararlanılır.

3. HO ≤ GO ≤ AO ≤ KO ilişkisi vardır.

Yrd.Doç.Dr.Yüksel TERZĐ 94
2.2. Duyarlı Olmayan Ortalamalar
Duyarlı ortalamalarda bütün terimler veya sınıflar dikkate alınır.
Hesaplamalarda bazen serinin bütün terimleri veya sınıfları dikkate
alınmayabilir. Bu durumda duyarlı olmayan ortalamalar ortaya çıkar.

2.2.1. Ortanca (Medyan)


Sayılar kümesini iki eşit yarıya bölen değer ortanca değerdir
[(N+1)/2]. Gözlem değerleri büyüklük sırasına dizildiğinde tam ortada
kalan değer yada iki orta değerin aritmetik ortalamasıdır.

Örnek 2.22. Xi : { 3,1,13,27,6,8,6 } gözlem değerlerinin ortancası


nedir?
Sayılar büyüklük sırasına dizilirse, { 1, 3, 6, 6, 8, 13, 27 } olur.
Ortada kalan sayı 6 olduğundan
Ortanca=6 olur.
Yrd.Doç.Dr.Yüksel TERZĐ 95
Medyanın Özellikleri
I. Basit bir sıralama ile bulunması mümkün olduğundan, medyan bir
çok durumda pratiktir. Örneğin bir grup öğrencinin boy
uzunluğunu teker teker ölçmeye gerek yoktur. Öğrenciler küçükten
büyüğe doğru sıralanıp ortadaki öğrenci (ler) ölçülerek ortanca boy
uzunluğu bulunabilir.
II. Seride açık (alt sınırı veya üst sınırı belli olmayan) sınıfların varlığı
halinde medyan hesabı önem kazanır.Medyan sınıfı serinin ilk sınıfı
olduğunda, sınıfın alt sınırı tahminsel olarak ele alınır.
III. Diğer ortalamaların aksine, gruplanmış serinin medyan hesabında
sınıf genişliklerinin tamamının eşit olması gerekmez.
IV. Medyan serideki anormal terimlerden etkilenmez.
Ortanca Kullanmanın sakıncaları nedir?
I. Ortancanın standart hatası aritmetik ortalamadan daha büyüktür.
II. Ortanca üzerinde cebirsel işlemler yapılamaz.
III. Farklı alt grupların ortancaları biliniyorsa bu gruplar
birleştiğinde ortanca nedir sorusu hesaplama ile bulunamaz.
Yrd.Doç.Dr.Yüksel TERZĐ 96
2.2.2. Kartiller

Küçükten büyüğe doğru sıralanmış bir seriyi 4, 10, 100 eşit


kısma bölen terimler vardır. Genel olarak kantil adı verilen bu
değerlerden dörde bölenler kartil (çeyreklikler), ona bölenler desil
(ondabirlikler) ve yüze bölenler santil (yüzdebirlikler) olarak
adlandırılır. Kartillerin sayısı 3, desillerin 9 ve santillerin sayısı 99
dur. Medyan 2. kartile, 5. desile ve 50. santile eşittir.
Kümeyi dört eşit parçaya bölen değerleri Q1, Q2, Q3 ile
gösterelim. Bunlar birinci, ikinci ve üçüncü yüzdelik olarak
adlandırılır. Burada Q2 medyandır.
Basit seride 1. kartil yani 1. yüzdelik (N+1)/4’üncü terimdir. 3.
kartil ise 3(N+1)/4’üncü terimdir.

Yrd.Doç.Dr.Yüksel TERZĐ 97
2.2.3. Tepe Değer(Mod)

Bir sayı kümesi içinde en fazla tekrarlanan değer varsa


o seriye tek modlu seri denir. Eğer bir seride birden fazla
aynı sayıda tekrarlanan değer varsa, bu tür serilere çok
modlu seri denir.

Yrd.Doç.Dr.Yüksel TERZĐ 98
Modun Özellikleri
I. Ortalamalar arasında mod en temsili olanıdır. Çünkü kütledeki
birimleri önemli bir kısmına uyar.
II. Sınıflanmış serilerde modun tamsayı olması gerçeğin daha iyi
yansıtılmasını sağlar. Örneğin bir bölgedeki ailelerin ortalama
çocuk sayıları hesaplandığında kesirli bir rakam elde
edilebilir. Oysa ortalama olarak mod alınırsa bu değer tam
sayı çıkacaktır.
III. Mod anormal terimlerin etkisi altında kalmaz. Örneğin çok
zengin bir kişinin köye taşındığını varsayalım. Bu kişinin gelir
düzeyi tek ve serinin sonunda olacağından modu etkilemez.
IV. Mod uygulamada farkına varılmadan en çok başvurulan
ortalamalardan biridir. Örneğin kundura ve hazır giyim eşyası
üretiminde en çok satılan numaralar ve bedenler dikkate alınır.
Buda mod demektir.
V. Adlandırma (nominal) Yrd.Doç.Dr.Yüksel
ölçekli değişkenlerde
TERZĐ
mod kullanımı
99
uygundur.
Modun Sakıncaları

 Modun güvenirliliği azdır. Yani örnekten elde edilen


mod popülasyon modundan çok farklı olabilir.

 Ortancada olduğu gibi mod üzerinde de cebirsel işlemler


yapılamaz.

 Bazen verilerin ortalaması, ortancası olduğu halde modu


olmayabilir. Bütün değerler farklı ise mod yoktur.

Yrd.Doç.Dr.Yüksel TERZĐ 100


ORTALAMA TĐPĐNĐN SEÇĐMĐ
 Ortalama kıyaslama amacıyla hesaplandığında Aritmetik Ortalama tercih
edilir. Çünkü Aritmetik Ortalama bütün terimler yada sınıflar üzerinden
hesaplanan en duyarlı ortalamadır.
 Araştırmanın amacı seriyi kıyaslamayıp, seriyi temsil etmek ise yerine göre
Mod yada Medyan tercih edilir.
 Terimlerin kendileri yerine oranları bizi ilgilendiriyorsa Geometrik Ortalama
tercih edilir.
 Terimlerin tersleri ile ilgileniliyorsa Harmonik ortalama kullanılır.
 Sıfır veya negatif işaretli değerlere sahip serilerde Harmonik ve Geometrik
Ortalama hesaplanamaz.
 Sınıf genişlikleri eşit olamayan gruplanmış serilerde Medyanın hesaplanması
uygundur.
 Seri terimleri arasında önem farkı bulunduğunda Tartılı Ortalama uygulanır.
 Ortalama, ortanca ve mod arasında aşağıdaki genel ilişki vardır.
Ortalama – Mod= 3* ( Ortalama – Ortanca)
 Sıralamalı ölçümlü özelliklerde veya bütün değerlerin elde edilmesinin uzun
zaman aldığı bazı durumlarda Medyanın kullanılması uygundur. Örneğin
öğrenme davranışının incelendiği bir araştırmada bazı bireyler çok geç
öğrenebilir, ortalama için bunu beklemek gerekir, Medyan için bunu
beklemeye gerek kalmaz.
Yrd.Doç.Dr.Yüksel TERZĐ 101
3. DEĞĐŞĐM ÖLÇÜLERĐ
(Measures of Variation)
Bir anakütleyi (popülasyonu) tanıtmak için, başka ana
kütlelerle karşılaştırabilmek için merkezi ölçüleri yanında
dağılışın genişliğini, değişkenliğin büyüklüğünü gösteren bir
başka tipik değerin verilmesi gerekmektedir. Bu tipik değer
değişim ölçüsüdür.

Ortalamaları eşit olan seriler, değişkenlikleri veya


bölüne şekilleri farklı olduğunda birbirine benzemez. Bu
nedenle serileri tam olarak tanımlayabilmek için
ortalamayı, değişimlerini ve bölünme şekillerini incelemek
gerekir. Yrd.Doç.Dr.Yüksel TERZĐ 102
Örnek.
Xi: { 49,49,49,50,51,52 } ; X =AO(X)= 50
Yi : { 35,41,50,55,58,61 } ; Y =AO(Y)= 50
Zi: { 15,21,33,49,90,92 } ; Z =AO(Z)= 50

Bu üç değişkenin ortalaması aynı olduğu halde X, Y ve


Z değişkenlerinin aldığı değerlerin en küçük ve en büyük
değerlerine bakıldığında birbirlerinden çok farklıdır. X
değerleri 50’nin etrafında çok yakın kümelendiği halde Z
değerleri 50 den çok uzakta yer almakta, yani daha büyük
değişim göstermektedir.
Bir popülasyonun bireylerinin değerleri arasındaki bu
değişimin bir ölçü ile ifade edilmesi gerekir. Bu ölçülere
yayılım veya değişim ölçüleri denir.
Yrd.Doç.Dr.Yüksel TERZĐ 103
3.1. Değişim Genişliği (Range)

En basit değişim ölçüsü Değişim Genişliğidir.

Değişim Genişliği = (En Büyük Gözlem – En Küçük Gözlem)

DG(X)= 52-49= 3
DG(Y)= 61-35= 26
DG(Z)= 92-15= 77

olur. Bu dağılışların grafiklerine bakıldığında aşağıdaki


şekilde bir görünüş söz konusudur.

Yrd.Doç.Dr.Yüksel TERZĐ 104


X Y

Z TERZĐ
Yrd.Doç.Dr.Yüksel 105
3.2.Standart Sapma
Kareli ortalama sapma adı verilen bu ölçü, terimlerin aritmetik
ortalamadan cebirsel sapmalarının kareli ortalamasıdır. Standart
sapma gözlemlerin ortalamadan ne kadar uzaklaştığını gösterir. Yani
gözlemler arasında ne kadar yaygınlık olduğunu ifade eder.
Standart sapma varyansın kare köküdür. Varyans birimsiz ifade
edildiği halde standart sapma ölçülen özelliğin birimi ile ifade edilir. Yani
milimetre yerine milimetre kare gibi veri biriminin karesinin
kullanılması uygun olmadığından, standart sapma kullanılır.
Ortalama etrafındaki saçılma fazla ise varyans büyük olacak,
dolayısıyla standart sapma da büyük çıkacaktır. Veri seti içinde aşırı
değer fazla ise bunların varyansı etkilemesi olağan karşılanabilir, ancak
birkaç aşırı değerin varyansı büyütmesi olağan karşılanmaz.
Dağılımdaki maksimum ve minimum değerler arasındaki farkı
dörde bölmek suretiyle, standart sapma kabaca tahmin edilebilir.
Moses’e göre standart sapma değeri, örnekteki gözlem değerleri
arasındaki varyasyonun derecesini tanımlayan bir istatistiktir.
Değişkenin dağılışı normal dağılış gösteriyorsa, standart sapma verilerin
ortalama etrafındaki dağılışınıYrd.Doç.Dr.Yüksel
iyi bir şekilde TERZĐ açıklar. 106
Bazen örnek verisine ilişkin standart sapma
hesaplanırken paydada N yerine N-1 alınır. Çünkü elde
edilen değer örneğin alındığı yığının standart sapmasını
daha iyi verir. N’in büyük değerleri için (N>30) iki tanım
arasında bir fark yoktur.
Gözlem değerlerinin tamamı birbirine eşit
olamayacağından standart sapmanın değerleri pozitiftir.

Yrd.Doç.Dr.Yüksel TERZĐ 107


Basit Serilerde ∑(Xi − X )2
s=
N
Sınıflanmış Serilerde ∑ fi ( X i − X )2
Standart Sapma s=
∑ fi
Gruplanmış Serilerde ∑ f i ( mi − X ) 2
s=
∑ fi

Varyans Standart Sapma

Kitle :

n ( x − x ) 2 n ( x − x) 2
Örnek: s2 = ∑ i s= ∑ i
i =1 n − 1 i =1 n −1

Yrd.Doç.Dr.Yüksel TERZĐ 108


Standart ayrılış ölçüsü ve standart hata Normal dağılış gösteren
özellikler için oldukça kullanışlıdır. Normal dağılışta bireylerin
%68.27 si ortalamanın bir standart sapma solunda ve bir standart
sapma sağındaki noktalar arasında bulunur. Bireylerin %95.45 i
ortalamanın iki standart sapma sağında ve solunda bulunur.

Yrd.Doç.Dr.Yüksel TERZĐ 109


VARYANS (Variance)
Dağılış ölçüsü olarak kullanılan en uygun ölçü standart ayrılış
ölçüsüdür. Standart ayrılış ölçüsü varyansın kareköküdür. Varyans
gözlemlerin ortalamadan olan sapmalarının kareleri toplamının
anakütle için N’e, örneklem için ise serbestlik derecesi n-1’e
bölünmesidir.
Xi: { X1,X2,…, Xn} değerler kümesinin varyansı:
1 N
1  N ( ∑ X ) 2

∑ ∑ i
i
Varyans = s 2 = ( X i − X ) 2
= X 2
− 
( N − 1) i =1 ( N − 1)  i =1 N 

Örnek 3.8. Xi:{49,49,49,50,51,52} değişkeninin varyansı nedir?


X = 300/6=50

s2=[(49-50)2+(49-50)2+…+(52-50)2]/(6-1)=(1+1+1+0+1+4)/5= 8/5=1.6
veya

s2=[(492+492+492+502+512+522)-3002/6]/5=(1500815000)/5=8/5=1.6
Yrd.Doç.Dr.Yüksel TERZĐ 110
Serbestlik Derecesi
(Degrees of Freedom)
Serbestlik derecesi gözlemlere konulan kısıtlamalara
bağlıdır. Verilere getirilen bazı kısıtlamalardan sonra, değişmekte
serbest olan değerlerin sayısıdır. Örneğin bir grup verinin
ortalamaya göre olan sapmalarının toplamı sıfırdır. ∑ ( x − x) = 0
Bu sapmaların sadece N-1’i serbestçe seçilebilir. Toplam
sapmaların sıfıra eşit olması koşulu, N’nci sapmanın değerini
sınırlandırır.

Serbestlik derecesi örnekle ilgili bir istatistiğin


hesaplanmasında veya bir parametrenin tahmin edilmesinde,
bağımsız birimlere ait sayının bilgisinin ifade eden bir terimdir.
Genelde bu terim modeldeki parametre sayısına karşılık
gelmektedir.
Yrd.Doç.Dr.Yüksel TERZĐ 111
3.3. Standart Hata (Standard Error of Estimate)
Standart hata bir istatistiğin örnekleme dağılımının
standart sapmasıdır. Seçilecek örneklerde ortalamalar
arasındaki yaygınlığı gösterir. Standart hata örnek
büyüklüğünün fonksiyonudur. Böylece n attıkça hata
küçülür.
Standart hata ortalamalarla ilgilidir, deneklerle ilgili
değildir. Standart hata ortalamanın ne kadar değiştiğini
gösterir.
Varyans s
S .H . = s X = =
N N

Örnek 2.42’de verilen değerlerden hareketle standart


hata aşağıdaki gibi bulunur.

Varyans 1.6
S .H . = = = 0.52
Yrd.Doç.Dr.Yüksel TERZĐ 112
N 6
Bir serinin ortalaması verilirken standart
hatası ile birlikte verilir. Popülasyondaki
değişimi göstermek için standart hata kullanılır.
Veri setindeki değişim araştırılıyorsa standart
sapma tercih edilir.
Aritmetik Ortalama ± Standart Hata

X m SX

Böylece ortalamaya ait değişkenlik yanında


ifade edilmiş olur.
Yrd.Doç.Dr.Yüksel TERZĐ 113
3.4.Değişim (varyasyon) Katsayısı
(Coefficient of Variation)

Bir serinin standart sapmasının aritmetik ortalamasına


bölünüp 100 ile çarpılması sonucu elde edilen değere değişim
katsayısı adı verilir. Değişim katsayısının ölçü birimi yoktur.
D.K= Standart Sapma*100/ Ortalama
σ
D.K . = *100
X
Değişim katsayısı farklı serilerin değişkenliklerini
kıyaslamada iyi bir ölçü olabilir.
Değişim katsayısı küçük olan serilerin diğerlerine göre aha
az değişken olduğu söylenir. Bunun anlamı ise seri terimlerinin
aritmetik ortalama etrafında daha homojen olarak dağıldığıdır.
Yrd.Doç.Dr.Yüksel TERZĐ 114
3.5.ÇARPIKLIK (Skewness)

Çarpıklık bir dağılımın simetrik olmayış veya


simetriklikten ayrılma derecesidir.

Simetrik yada çan


Yrd.Doç.Dr.Yüksel TERZĐşeklinde eğri 115
Simetrik yada çan şeklindeki frekans eğrileri, merkezdeki
maksimumdan eşit uzaklıkta yer alan gözlemlerin aynı
frekansa sahip olduğunu gösterir. Yani frekansların serinin
maksimum noktası etrafında simetrik olarak dağılması seriye
simetrik seri adını kazandırır. Normal eğri buna örnektir.
Normal eğride serinin tam ortasında maksimuma ulaşan
frekanslar, sonra hızla düşmeye başlar.

Simetrik seri sivri, basık ve normal seri gibi olabilir.


Normal eğrinin özelliği grafikte maksimum noktanın belirli bir
yüksekliğe sahip olmasıdır. Bu yüksekliğin normalin üstüne
çıkması durumunda sivri seri, normalin altına düşmesi
durumunda ise basık seriden söz edilir.

Simetrik seri belli bir yüksekliğe sahip olmadığında


normal olmaktan çıkar. Ayrıca simetrik seri sağa veya sola
doğru eğilim gösterdiğinde de simetriklik özelliğini kaybeder.
Frekanslar serinin tam ortasında değil de, ortadan önceki bir
noktada yığıldığında “sağa çarpık seri”, ortadan sonraki bir
noktada yığıldığında ise “sola çarpıkTERZĐ
Yrd.Doç.Dr.Yüksel seri” den söz edilir. 116
Pozitif (sağa) çarpık eğri

Negatif (sola) çarpık eğri


Yrd.Doç.Dr.Yüksel TERZĐ 117
µ3 µ3
Çarpıklık= α 3 = =
µ 23 σ3

Seri simetrik ise α 3 =0 dır. Ancak α 3 =0 ise serinin mutlaka


simetrik olması gerekmez. α 3 >0 ise seri sağa (pozitif) çarpık, α 3 <0 ise
sola (negatif) çarpıktır. α 3 > 0.5 ise genelde çarpıklık kuvvetli kabul
edilir.

Yrd.Doç.Dr.Yüksel TERZĐ 118


3.6. BASIKLIK (Kurtosis)

Basıklık bir dağılımın sivrilik derecesidir ve çoğunlukla


normal dağılıma göre ele alınır. Normal seri simetrik serinin
özel bir şeklidir. Bir serinin normal olabilmesi için hem
simetrik olması ( α 3 =0) hem de normal bir yüksekliğe sahip
olması gerekir.
α 4 simgesiyle gösterilen ve momentlere dayanan basıklık
ölçüsü aşağıdaki gibi bulunur:
Basıklık= α 4 = µ 42 = µ 44
µ2 σ

Normal bir seride α 4 =3, sivri bir seride α 4 >3 ve basık bir
seride α 4 <3’tür. α 4 formülünde kesrin pay ve paydası pozitif
olduğundan basıklık ölçüsü pozitif değere sahiptir.
Yrd.Doç.Dr.Yüksel TERZĐ 119
Not: Bir serinin normal seri olup olmadığını
çarpıklık ve basıklık katsayılarına bakarak
anlayabiliriz.
Normal seride Çarpıklık( α 3 )=0 ve
Basıklık( α 4 )=3’tür. Buna normallik testi
denir.

Yrd.Doç.Dr.Yüksel TERZĐ 120


Frekans, Ortalamalar, Standart Sapma ve Varyansın Bulunuşu

Yrd.Doç.Dr.Yüksel TERZĐ 121


Quartiles: Kartiller
Mean:Aritmetik ortalama
Median:Medyan
Mode:Mod
Sum:Toplam
Skewness:Çarpıklık
Kurtosis:Basıklık
Std.deviation:Standart
sapma
Variance:Varyans
Range:Değişim aralığı(max-
min)
S.E.mean (Standard error
mean): ortalamanın standart
hatası

Yrd.Doç.Dr.Yüksel TERZĐ 122


Statistics

notlar
N Valid 10
Missing 0
Mean 55,00
Std. Error of Mean 4,534
Median 52,50
Mode 50
Std. Deviation 14,337
Variance 205,556
Skewness ,318
Std. Error of Skewness ,687
Kurtosis ,587
Std. Error of Kurtosis 1,334
Range 50
Minimum 30
Maximum 80
Sum 550
Percentiles 25 48,75
50 52,50
75 63,75

Yrd.Doç.Dr.Yüksel TERZĐ 123


ANALİZ ÖNCESİ VERİ TARAMA

1. Verilerin doğruluğu (accuracy)


2. Kayıp değerler
3. Uç değerler
4. Normallik vasayımı
5. Doğrusallık
6. Eşvaryanslılık (Homojenlik)

Yrd.Doç.Dr.Yüksel TERZĐ 124


ANALİZ ÖNCESİ VERİ TARAMA

1. Verilerin doğruluğu (accuracy) incelenmesi


gerekir. Analiz sonuçlarının kalitesi, veri kalitesine
bağlıdır. Hatalı (uygun olmayan) verilerle yapılan
analizlerden elde edilecek sonuçlar ve bu
sonuçlara dayalı oluşturulan yorumlar geçerli
olmayacaktır.
Nicel veriler için frekanslara bakılarak alt ve
üst değerler belirlenebilir. Ortalama ve s.sapma
değerlerine bakılır.
Nitel veriler de ise kodlamalara dikkat edilir,
yanlış kodlama yapılıp yapılmadığı tespit edilir.
Yrd.Doç.Dr.Yüksel TERZĐ 125
2. Kayıp (eksik) verilerin değerlendirilmesi gerekir. Kayıp veri ölçme
aracının başarısızlığından, deneklerin tüm sorulara cevap
vermemesinden ya da veri girişi sırasında yapılan hatalardan
kaynaklanabilir.
Eğer kayıp veri az ise o silme yapılabilir. Ancak kayıp veri çok
ise o deneklerin veya değişkenin silinmesi ciddi veri kaybına sebep
olabilir. Örneklem büyüklüğü düşer ve eğer araştırma için gruplar arası
karşılaştırmalar isteniyorsa, bazı gruplar analiz için uygun olmayan
örneklem büyüklüğüne inerek karşılaştırmaları tehlikeye sokabilir.
Kayıp veriler için kestirim yapılabilir. Ancak kestirim ya da
yaklaşık değer atama işlemi sadece nicel değişkenler için
yapılabilmektedir.
Kayıp değer kestirimi için bir yaklaşım eldeki verilerden ortalama
bulup, kayıp değerlere bu değeri atamaktır. Bu durumda genel ortalama
değişmezken, varyans bir miktar düşecektir.
Kayıp veri kestirimi için diğer bir yaklaşım regresyon
yaklaşımıdır. Kayıp değerler içeren değişken bağımlı değişken alınır.
Ortalama yönteme göre göre daha objektif bir kestirim yapılır.
Araştırmacı hem kayıp gözlemli durum için hem de kestirim
yapıldıktan sonraki durum Yrd.Doç.Dr.Yüksel
için analizleri
TERZĐ
yapmalı ve sonu 126
çları
karşılaştırmalıdır (Mertler ve Vannatta, 2005).
SPSS de kayıp verileri tahmin etmek için 5 yöntem vardır (Çokluk ve ark,
2010):
1. Seriler Ortalaması (Series Mean):
Tüm verilerin belirli bir değişkene göre aritmetik ortalamasıdır.
2. Yakın Noktaların Ortalaması (Mean of Nearby Points):
Eksik gözlemin yakınındaki verilerin ortalamasıdır. Çevreleyen değerlerin
sayısı, yakın noktaların uzaklığı ( span of nearby points) seçeneği
Kullanılarak belirlenir. Eğer 2 alınırsa eksik verinin öncesi ve sonrası
alınarak ortalama bulunur.
3. Yakın Noktaların Medyanı (Median of Nearby Points):
Eksik verinin yakınındaki verilerin medyanıdır (ortancasıdır). Çevreleyen
değerlerin sayı araştırmacı tarafından belirlenir.
4. Doğrusal Değer Kestirimi (Linear Interpolation):
Bu değer, eksik veriden önceki son tam gözlem değeri ve eksik veriden
sonraki ilk tam gözlem değerinin eksik verilerin yerine atanmasıdır. Eğer
serideki ilk gözlem ve son gözlem eksik ise, kayıp değerin yerine
herhangi bir değer atanmaz.
5. Noktanın Doğrusal Eğimi (Linear Trend of Point):
Verilerin eğilimi (trend) ile uyumlu olarak belirlenir. Örneğin değerler ilk
veriden son veriye doğru yükselme eğiliminde
Yrd.Doç.Dr.Yüksel TERZĐ olabilir. 127
Yrd.Doç.Dr.Yüksel TERZĐ 128
Yrd.Doç.Dr.Yüksel TERZĐ 129
3. Uç değerlerin etkilerinin değerlendirilmesi gerekir. Alışılageldik
değerlerin dışındaki değerlere ya da aşırı değerlere sahip olan denekler
uç değerler olarak adlandırılır. Uç değerlerin üç temel nedeni vardır:

i) Araştırmacılarca veri girişinde yapılan hatalar


ii) Deneğin örneklemin alındığı evrenin bir üyesi olmaması
iii) Deneğin örneklemin geri kalan kısmından farklı olması
Uç değerler istatistik testlerin sonuçlarını bozabilir. Pek çok
istatistiksel işlem ortalamadan olan sapmaların karesine dayanır. Eğer
bir gözlem ortalamadan çok uzakta ise sapma değeri büyüyecektir. Tek
bir uç değer bir istatistik test sonucunu etkileyebilir.
tek değişkenli veri setlerinde uç değerleri belirlemek için frekans
dağılımına veya histogramlarına bakılarak görülebilir.

Örnek : 10 deneği bir kaygı ölçeğinden elde ettikleri puanlar aşağıdaki


gibidir.
Denek:1 2 3 4 5 6 7 8 9 10
Puan:55 48 95 48 51 55 45 53 55 45

3 nolu denek diğerlerinden oldukça farklı bir puan sahip olduğundan uç


Yrd.Doç.Dr.Yüksel TERZĐ 130
değerdir.
Uç değer

Yrd.Doç.Dr.Yüksel TERZĐ 131


Tek değişkenli uç değerler dağılımdaki puanların standart
puanlara dönüştürülmesiyle de belirlenebilir. Bunun için ham puanlar
standart Z puanlarına dönüştürülür. Bu durumda verilerin %99’u
ortalamadan ±3 s.sapma uzaklıkta olacaktır. Böylece +3 den büyük ya da
-3’den küçük Z değerine sahip olan gözlemler uç değer olarak
düşünülür. Küçük örneklemlerde (n<10) bu kural ±2,5 s.sapma olarak
kabul edilir.

Uç değer

Yrd.Doç.Dr.Yüksel TERZĐ 132


Tek değişkenli uç değerler kutu grafiği (Box Plots) ilede bulunabilir.
Kutu grafiğinde kutu içinde yer almayan denek uç değer olarak
belirtilir.

Uç değer

Medyan

Yrd.Doç.Dr.Yüksel TERZĐ 133


Uç değere sebep olan yanlış tespit edilemezse, uç
değerlerin yer durumdaki analiz ile uç değerlerin çıkarıldığı
durumdaki analizler yapılır ve sonuçlar karşılaştırılır (Mertler ve
Vannatta, 2005).
Çok değişkenli analizlerde uç değerler Mahalanobis
uzaklığı kullanılarak belirlenir.

Yrd.Doç.Dr.Yüksel TERZĐ 134


Yrd.Doç.Dr.Yüksel TERZĐ 135
Yrd.Doç.Dr.Yüksel TERZĐ 136
Yrd.Doç.Dr.Yüksel TERZĐ 137
Extreme Values

Case Number Value


Mahalanobis Distance Highest 1 10 7,98991
2 13 5,55067
3 2 5,27463
4 7 3,31692
5 8 3,27989
Lowest 1 9 ,59264
2 3 ,75239
3 15 ,82909
4 5 ,87433
Yrd.Doç.Dr.Yüksel
5 TERZĐ 1 ,94168 138
10. Gözlem uç değer

Yrd.Doç.Dr.Yüksel TERZĐ 139


4. Normallik varsayımı:
İstatistikte uygulanan birçok analiz ve tahmin
yöntemleri X değişkeninin Normal dağılış
göstermesi halinde geçerlidir. Bu nedenle
dağılışın Normal olamadığı hallerde yapılan
analiz geçerliliğini kaybeder. Dolayısıyla bu
dağılış istatistikte önemli bir yere sahiptir.
Eldeki değişken sürekli ve tek modlu ise
Normal dağılış göstermese de bazı dönüşümlerle
dağılışı Normal dağılışa yaklaştırmak mümkün
olabilir. Bunun için √X, log(X), 1/X gibi
dönüşümler kullanılabilir.
1809 tarihinde Alman matematikçi Gauss
tarafından bulunmuştur.
Yrd.Doç.Dr.Yüksel TERZĐ 140
Simetrikliğin Bozulması

 Normal dağılım simetrik bir dağılımdır. Bu


simetriklik sağa veya sola çarpık olacak
şekilde bozulabilir. Sağda uzun kuyruk varsa
pozitif çarpık, solda uzun kuyruk varsa
negatif çarpık olur.
Yrd.Doç.Dr.Yüksel TERZĐ 141
Ortalaması Farklı
Normal Dağılışlar

Variyansı Farklı
Normal Dağılışlar

Yrd.Doç.Dr.Yüksel TERZĐ 142


 Normal dağılış eğrisi simetrik bir eğridir.

X ~N(µ, σ2) ise Olasılık Fonksiyonu


2
1  X i − µ 


1 2  σ 

f(X) = e , − ∞ < X i < +∞
σ 2π
Bu fonksiyonda e=2,71828…, π=3,14159…. olmaktadır.
Yrd.Doç.Dr.Yüksel TERZĐ 143
NORMALLĐK TESTĐ
Verilere parametrik testlerin uygulanabilmesi için
verilerin dağılımının normal olması gerekmektedir.
Tek değişkenli normallik, örneklemde bir
değişkene ilişkin gözlemlerin normal dağılım
gösterdiği anlamına gelir.
Normallik varsayımı için önce veriler SPSS paket
programına girilir ve aşağıdaki işlemler yapılır.

Analyze>Descriptive Statistics>Explore>plots>normality
plots with tests – histogram

Eğer Sig=P>0.05 ise veriler normal dağılıma sahiptir


denilir. Yrd.Doç.Dr.Yüksel TERZĐ 144
Yrd.Doç.Dr.Yüksel TERZĐ 145
H0: Veriler normal dağılıma eşittir (Mertler ve Vannatta, 2005).

Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
notlar ,126 10 ,200* ,980 10 ,964
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

P=0,964>0,05 olup H0 hipotezi kabul edilir. Yani veriler normal dağılış


gösterir.

Yrd.Doç.Dr.Yüksel TERZĐ 146


Kolomogorov-Smirnov testi: Veriler kategorize edilir ve her bir
gözlemin olasılıklarını bulur. Veriler kategorize edildiğinden, bu testin
gücü düşük olur. Ayrıca gözlem sayısı az olduğunda bu test zayıftır.

Shapiro-Wilk testi : Momentlerden hareketle hesaplanan bir testtir


ve Kolmogorov-Smirnov testinden daha güçlüdür.

Histogram
2,5

2,0

1,5

1,0
Frequency

,5 Std. Dev = 4,41


Mean = 36,4
0,0 N = 14,00
30,0 34,0 38,0 42,0
32,0 36,0 40,0 44,0

Yrd.Doç.Dr.Yüksel TERZĐ 147


YAS
Q-Q grafiklerinde gözlemler büyüklüklerine göre artan sırada sıralanır ve
beklenen normal dağılım değerlerine karşılık gelecek şekilde grafik çizilir.
Grafik köşegenler odağında bir doğru çizgisi etrafında toplanıyorsa
normal dağılış varsayımı sağlanıyor demektir.
Yrd.Doç.Dr.Yüksel TERZĐ 148
1,5(Q 3 -Q 1 )

Q3

Q2

Q1

Box Plot grafiklerinde Q2 kutunun ortasında ise normallik varsayımı


sağlanıyor demektir.

Yrd.Doç.Dr.Yüksel TERZĐ 149


Yrd.Doç.Dr.Yüksel TERZĐ 150
Normallik varsayımı çarpıklık ve basıklık katsayılarına
bakılarak ta incelenebilir. Standart normal dağılımda
çarpıklık ve basıklık katsayıları sıfırdır. Bu değerlerin ±1
arasında kalması dağılımın normalden aşırı sapma
göstermediğini gösterir.

Descriptive Statistics

N Skewness Kurtosis
Statistic Statistic Std. Error Statistic Std. Error
notlar 10 ,089 ,687 -,520 1,334
Valid N (listwise) 10

Skewness : Çarpıklık Kurtosis: Basıklık


Yrd.Doç.Dr.Yüksel TERZĐ 151
Çok değişkenli (Multivariate) normallik, örneklemde
yer alan gözlemlerin tüm kombinasyonları açısından normal
dağılım göstermesi gerekmektedir. Bunun için aşağıdaki
şartların sağlanması gerekir (Mertler ve Vannatta, 2005) :

i) Her bir değişken tek başına normal dağılıma sahip


olmalıdır.
ii) Değişkenlerin doğrusal kombinasyonları normal
dağılmalıdır.
iii) Değişken setlerinin tüm alt setleri (her türlü ikili
kombinasyon) çok değişkenli normalliğe sahip olmalıdır (iki
değişkenli normallik-bivariate normality).

iki değişkenli normallik için, her bir değişken çiftinin


saçılma diyagramlarının elips şeklinde olması gerekir.

Yrd.Doç.Dr.Yüksel TERZĐ 152


Yrd.Doç.Dr.Yüksel TERZĐ 153
Yrd.Doç.Dr.Yüksel TERZĐ 154
İkili grafiklerde eğer grafikler
elips şeklinde ise iki değişkenli
normallik varsayım sağlanıyor
demektir.

Yrd.Doç.Dr.Yüksel TERZĐ 155


NORMALLİK VARSAYIMI SAĞLANMADIĞINDA VERİ DÖNÜŞTÜRME
(TRANSFORMASYON)
Eğer veriler normal dağılım göstermiyorsa verilere dönüşüm
uygulanarak veriler normal dağılıma yaklaştırılır. Veri dönüştürme işlemi
verileri farklı birimlerle yeniden ifade etmektir(Mertler ve Vannatta, 2005).

Yaygın Olarak Kullanılan Veri Dönüştürme İşlemleri


Dağılım Şekli Dönüştürme Türü SPSS Compute
Komutu
Orta düzeyde pozitif çarpık Karekök SQRT(X)

Yüksek düzeyde pozitif çarpık Logaritma LG10(X)


Değer<0 Logaritma Lg10(X+a)a
Aşırı pozitif çarpık Ters (Inverse) 1/X

Orta düzeyde negatif çarpık Yansıtma & karekök SQRT(b-X)b

Yüksek düzeyde negatif çarpık Yansıtma & LG10(b-X)b


Logaritma
Aşırı negatif çarpık Yansıtma & Ters 1/(b-X)b
Yrd.Doç.Dr.Yüksel TERZĐ 156
çevirme
DÖNÜŞTÜRMENİN YAPILMAMASININ TAVSİYE EDİLDİĞİ DURUMLAR
 Eğer normallikten ve doğrusallıktan çok sapma yoksa,
 Veriler kg, mm veya IQ gibi anlamlı bir ölçüm biriminin olduğu
durumlarda,
 Örneklem 30’dan büyük olduğunda,
 Dağılım ve örneklem büyüklükleri benzer olan örneklemler mevcut
ise dönüşüm yapılmaz.

DÖNÜŞTÜRMENİN YAPILMASININ TAVSİYE EDİLDİĞİ DURUMLAR


 Veriler çok çarpık ise,
 Ölçüm birimi yaygın olarak bilinmiyorsa,
 Örneklem 30’dan küçük ise,
 Normallik ve doğrusallık varsayımı ihlal edildiğinde,
 Gruplar arasında örneklem büyüklüğü ve dağılımları bakımından
büyük farklılık var ise

dönüşüm yapılmalıdır.

Yrd.Doç.Dr.Yüksel TERZĐ 157


5. Doğrusallık

Doğrusallık, iki değişken arasında bir doğru ile


özetlenebilen bir ilişki olduğu anlamına gelir. Doğrusallık
çok değişkenli analizler açısından önemlidir.
Doğrusallık varsayımı Regresyon analizi yöntemi ile
incelenebilir. Regresyon analizindeki artık grafiği
(residuals plot) doğrusal olmayan ilişkileri de gözlemeye
yarar. Artıklar çok değişkenli analizlerce açıklanamayan
puan oranlarıdır. Artıklar bir değişkene ilişkin elde edilen
değerler ile tahmin değerleri arasındaki farktır. Standardize
edilmiş artık grafikleri çizilir. Grafikte artıklar bazı tahmin
değerleri için çizginin altında bazıları için de çizginin
üstünde yer alıyorsa, doğrusallık varsayımı sağlanmıyor
demektir (Tabachnick ve Fidell, 1996). Eğer noktalar sıfır
çizgisi etrafında kümeleniyorsa, doğrusallık varsayımı
sağlanır. Yrd.Doç.Dr.Yüksel TERZĐ 158
Yrd.Doç.Dr.Yüksel TERZĐ 159
Doğrusallık varsayımı sağlanmaz. Çünkü noktalar sıfır ekseni etrafında
kümelenmemiş. Yrd.Doç.Dr.Yüksel TERZĐ 160
6. Eşvaryanslılık (Homojenlik)

Eşvaryanslılık (homojenlik) bir sürekli değişkendeki


puanlarda gözlenen değişimin, diğer değişkene ilişkin
puanlarda da benzer şekilde gözlenmesidir.
Tek değişkenli durumlarda homojenlik testi Levene
testi ile test edilir. Bu istatistik örneklemin aynı varyansa
sahip bir evrenden geldiğini ifade eder.

H0: Varyanslar eşittir (homojendir)

Levene testi sonucunda p>0,05 ise homojenlik


varsayımı sağlanmış olur.

Yrd.Doç.Dr.Yüksel TERZĐ 161


P=0,7>0,05 olup varyanslar homojendir.

Yrd.Doç.Dr.Yüksel TERZĐ 162


Bağımsız değişkenin bazı düzeylerinde diğerinden
yüksek ölçe hatası olması eşvaryanslılığı (homojenlik)
bozabilir.
Çok değişkenli istatistiklerde homojenlik varsayımı
Varyans-kovaryans matrislerinin eşitliği için Box M testi ile
incelenir.

Box M Test:
H0: Varyans-kovaryans matrisleri eşittir.

Eğer test sonucunda p>0,05 ise H0 hipotezi kabul edilir.


Çok değişkenli istatistiklerde önce normallik
varsayımına bakılır. Daha sonra tek değişkenli analizler için
homojenlik varsayımına, daha sonrada çok değişkenli
analizler için eşvaryanslılık varsayımına bakılır (Tabachnick ve
Fidell, 1996).
Yrd.Doç.Dr.Yüksel TERZĐ 163
M-ESTIMATORS (M TAHMĐNCĐLER)
Düzeltilmiş aritmetik ortalamada alt ve üst uç değerlerin bir kısmı
değerlendirme dışı tutulur. Bu sakıncayı ortadan kaldırmak ve uç
değerlerin etkisini azaltmak için, uç değerlere daha az ağırlık verilerek
yapılan hesaplamalara M-tahminciler denir. SPSS’de kullanılan M-
tahminciler Huber, Hampel, Tukey ve Andrew’dir. Bu tahminciler
aritmetik ortalama ve ortancaya alternatiftirler. Bunlardan Huber M-
tehmincisi dağılım normale yakın olduğunda tercih edilir. Ancak uç
noktaların olduğu durumlarda tercih edilmez.
Analyze>Descriptive statistics>Explore>statistics kutusundan M-
estimators işaretlenerek elde edilir.

M-Estimators
Huber's Tukey's Hampel's Andrews'
M-Estimatora b
Biweight M-Estimator c
Waved
YAS 50,3593 50,5376 50,7320 50,5429
a. The weighting constant is 1,339.
b. The weighting constant is 4,685.
c. The weighting constants are 1,700, 3,400, and
8,500
d. The weighting constant is 1,340*pi.
Yrd.Doç.Dr.Yüksel TERZĐ 164
Hipotez Testi
Đstatistiksel hipotezler anakütle parametrelerine ilişkin
olarak ileri sürülen ve geçerliliği olasılık kanunlarına göre
araştırılabilen özel önermelerdir. Đstatistiksel hipotezlerin diğer
hipotezlerden farkı, hipotezin bir frekans bölünmesiyle ilgili
olmasıdır. Örneğin “belirli bir markayı taşıyan akülerin
ortalama ömrünün 2.5 saat olduğu”nu ileri sürdüğümüzde bir
hipotez önermiş oluruz. Bunun anlamı normal olan bir
dağılımın aritmetik ortalaması 2.5 saate eşittir.
Bir hipotez ya doğru ya da yanlıştır. Bunu araştırmak için
anakütleden rasgele seçilmiş belli bir örneklemdeki birimler
incelenir ve bu örneklemden hareketle hipotezin geçerli olup
olmadığı hakkında bir karara varılır. Örneklem
istatistiklerinden yararlanarak bir hipotezin geçerli olup
olmadığını ortaya koyma işlemine istatistiksel hipotez testi veya
hipotez testi denir.
Yrd.Doç.Dr.Yüksel TERZĐ 165
Sıfır Hipotezi ve Karşıt Hipotez
Hipotez testinde bir hipotezle onun karşıtı diğer bir
hipotezden hangisinin örneklemden elde edilen sonuç ile
daha iyi daha iyi bağdaştığı araştırılmaktadır.
Karşılaştırılan iki hipotezden birine sıfır hipotezi
(istatistiksel hipotez), diğerine ise karşıt hipotez (araştırma
hipotezi) adı verilir.
Hipotezler daima örneklem alınmadan oluşturulması
gerekir. Sıfır hipotezi H0 ile, karşıt hipotez ise H1 ile
gösterilir.

H0: Örneklemden elde edilen değer ile anakütlenin bilinen


değeri arasında bir fark yoktur.
H1: Örneklemden elde edilen değer ile anakütlenin bilinen
değeri arasında bir önemli (anlamlı) bir fark vardır.
Yrd.Doç.Dr.Yüksel TERZĐ 166
Genellikle araştırmacılar sıfır hipotezinin reddedilmesini
ve karşıt hipotezin kabul edilmesini isterler. Eskiden beri
geçerli sayılmış önerme sıfır hipotezi, yeni görüş ise karşıt
hipotezi olur.

Bu ifadeler araştırırcının konu ile ilgili ön yargısına


bağlı olarak değişir. Eğer araştırıcı 1. Uygulamanın 2.
Uygulamadan iyi olacağına dair ön yargısı varsa H1: µ1> µ2
şeklinde kurulur. Hiçbir ön yargısı yoksa, H1: µ1≠ µ2
Yrd.Doç.Dr.Yüksel TERZĐ 167
şeklinde kurulur.
H1 Hipotezinin Tek Yönlü Red Bölgesi H1 Hipotezinin Tek Yönlü Red Bölgesi
( µ1 < µ2 ) ( µ1 > µ2 )

H1 Hipotezinin Çift Yönlü Red Bölgesi


µ1 ≠ µ2)

Yrd.Doç.Dr.Yüksel TERZĐ 168


Birinci ve Đkinci Tip Hatalar
Bir hipotez testi sonucunda örneklem
istatistiklerine göre şu dört durumdan birisi
gerçekleşmiş olur.

I. H0 gerçekte doğrudur ve reddedilmemiştir


(kabul edilmiştir).
II. H0 gerçekte doğrudur, fakat reddedilmiştir
(kabul edilmemiştir).
III. H0 gerçekte yanlıştır, fakat reddedilmemiştir
(kabul edilmiştir).
IV. H0 gerçekte yanlıştır ve reddedilmiştir (kabul
edilmemiştir).
Yrd.Doç.Dr.Yüksel TERZĐ 169
Gerçek Durum

Ho Ho
Doğru Yanlış

Ho I. Tip Hata
Test
Red P(I. Tip Hata)= α β
Doğru Karar=1-β

Sonucu Ho II. Tip Hata


Doğru Karar=1-α α
Kabul P(II. Tip Hata)= β
α : Gerçekte doğru olan sıfır hipotezinin reddedilmesi olasılığını
(anlamlılık düzeyini),
α : Gerçekte doğru olan sıfır hipotezinin reddedilmeme (kabul
1-α
edilmesi) olasılığını yani testin güvenilirlik düzeyini,
β : Gerçekte yanlış olan sıfır hipotezinin reddedilmeme (kabul
edilmesi) olasılığını,
1-β : Gerçekte yanlış olan sıfır hipotezinin reddedilmesi olasılığını
Yrd.Doç.Dr.Yüksel TERZĐ 170
yani testin gücünü gösterir.
Ho gerçekten doğru ise araştırıcı bu doğru iddiayı
testin sonucundaki hesapladığı değere göre red
ederse, hata yapmış olacaktır, istatistikte buna “I.
Tip Hata” denir. Bu hatanın yapılması olasılığı da
α) ile gösterilir. Bu olasılık “testin önem düzeyi”

veya “anlamlılık düzeyi” olarak da adlandırılır. Yani
α=0.05 önem düzeyinde test yapıldı dendiğinde,
bunun anlamı; araştırıcı doğru bir Ho hipotezini red
etmek için 0.05 lik bir hata yapma riskini
kabulleniyor demektir. Bu genelde hipotez
kurulurken peşinen kabul edilen risktir.
Araştırıcı istatistik testi yapabilmesi için belirli
bir düzeyde hata yapma riskini de üzerine alması
gerekir, aksi halde testYrd.Doç.Dr.Yüksel
yapamaz. TERZĐ 171
Araştırıcı istatistik test yaparken bir başka şekilde
de hata yapabilir. Bu da, Ho ile ileri sürülen iddia
gerçekten doğru değilse ve araştırıcı test
istatistiğinde elde ettiği değere bakarak bu yanlış
iddiayı kabul ederse yine hata yapmış olacaktır. Bu
tip hata ya da istatistik de “II. Tip Hata” denir. II
Tip Hata yapma olasılığı β ile gösterilir.
Hipotez testinde amaç sıfır hipotezini ret veya
kabul etmek olduğundan, I. Ve II. Tip hataları aynı
anda işlemek mümkün değildir. Đstatistik testler
yapılırken bu hata olasılıkları mutlaka vardır ve her
ikisini aynı anda küçültmek mümkün değildir. α
küçülürken β büyür, β küçülürken α büyür.
Yrd.Doç.Dr.Yüksel TERZĐ 172
Tek Anakütlenin Parametreleriyle Đlgili Hipotez Testleri
Bu tür hipotezlerin testinin amacı, karşıt hipotezde
ileri sürülen iddianın kabul edilip edilmeyeceğinin
ortaya çıkartılmasıdır. Ancak karşıt hipotezi direk test
etmek mümkün olmadığından, sıfır hipotezi test edilir ve
elde edilen sonuç karşıt hipotez için genellenir.
Tek anakütlenin parametreleriyle ilgili hipotez
testlerin varsayımları şunlardır:

i. Örneklemin alındığı anakütle normal dağılıma


sahiptir.
ii. Örneklemdeki birimler eşit olasılıkla ve iadeli
olarak seçilmiş veya anakütle sonsuz büyüklüktedir.

Yrd.Doç.Dr.Yüksel TERZĐ 173


Anakütle Ortalamasına Đlişkin Testler
Bu testlerde ileri sürülebilecek karşıt hipotezlere şu şekilde
örnek verebiliriz.
 Bir firmanın tereyağı paketlerinin ağırlığının 250 gr
olması gerektiği halde, firma buna uymamaktadır.
 Günlük ortalama üretimi 1000 kg olan bir ilaç
fabrikasında uygulanan yeni teknik üretimi artırmıştır.
 Turistik amaçla yurtdışına giden vatandaşlarımızın
ortama konaklama süresi 20 günden azdır.

Bu örneklere göre sıfır ve karşıt hipotezlerimiz sırasıyla


aşağıdaki gibi olacaktır.

H0 : µ=µ
µ0=250 gr H0 : µ=µ
µ0=1000 kg µ=µ
H0:µ µ0=20 gün
H1 : µ≠µ
µ0=250 gr H1 : µ>µ
µ0=1000 kg µ<µ
H1 :µ µ0=20 gün
Yrd.Doç.Dr.Yüksel TERZĐ 174
Anakütle (Popülâsyon) Varyansı (σ σ2) Biliniyor:
Anakütle normal dağılışlı ve anakütle varyansı biliniyorsa
ve n≥ ≥30 ise, sıfır hipotezinin karşıt hipoteze karşı testi için Z
test istatistiği kullanılır.

X −µ
Z=
σ/ n
Bulunan Z test istatistiği α anlamlılık seviyesine göre Z
α) veya
tablo değerleri ile karşılaştırılır. Karşıt hipotezin tek (α
α/2) taraflı olmasına göre karar verilir.
çift (α

Tek taraflı : Z<-Zα Z>Zα


Çift taraflı : Z<-Zα/2 Z>Zα/2
Yrd.Doç.Dr.Yüksel TERZĐ 175
Đse H0 (sıfır) hipotezi reddedilir.
P değeri : Đstatistik paket programlarında genellikle p
olasılığı kullanılır. Bu olasılık H0 doğru olduğunda, test
istatistiğinin hesaplanan değerine eşit yada daha uç
değerler alması olasılığıdır. Hesaplanan p değeri yanılma
α) küçük ise H0 reddedilir.
olasılığından (α

p≤ α ise H0 hipotezi reddedilir,


p> α ise H0 hipotezi kabul edilir.

p olasılığı Z test istatistiği için aşağıdaki biçimde


hesaplanır. Ancak paket programlar bu olasılığı
vermektedir.
1[1 − Φ ( Z )] ; H1 : µ ≠ µ 0

p = 1 − Φ ( Z ) ; H1 : µ > µ 0
 Φ( Z ) H1 : µ < µTERZĐ
;Yrd.Doç.Dr.Yüksel
 0 176
Örnek: Bir firmanın tereyağı paketlerinin ağırlığının ortalama
250 gr olması gerektiği halde, firmanın buna uymadığı iddia
edilmektedir. Paketleme sırasında rasgele seçilen 100 paketin
ortalama ağırlığı 245.5 gr olduğu tespit ediliyor. Anakütlenin
standart sapması 15 gr olduğu biliniyor. %5 anlamlılık
düzeyinde iddianın doğru olup olmadığını araştırınız?
Çözüm :
H0 : µ=µ
µ0=250 gr Anlamlılık düzeyi=αα=0.05
H1 : µ≠µ
µ0=250 gr Zα/2=1.96

X −µ 245.5 − 250
Z= = = −3 Z<-Zα/2⇒-3<-1.96
σ/ n 15 / 100
H0 reddedilir.
Firmanın tereyağı paketlerinin ağırlığı ortalama 250 gr olması
gerektiği halde, firma buna uymamaktadır.
Yrd.Doç.Dr.Yüksel TERZĐ 177
σ2) Bilinmiyor:
Anakütle (Popülâsyon) Varyansı (σ
Anakütle standart sapması bilinmiyorsa, örneklem
standart sapması kullanılır. n>30 durumunda dağılım
normale uyduğundan test istatistiği olarak yine Z testi
kullanılır.
X −µ
Z=
s/ n
Ancak n≤30 olduğunda ve anakütle varyansı bilinmediğinde t
dağılımı kullanılır.
X −µ
t=
s/ n
t istatistiği (n-1) serbestlik dereceli t dağılımına sahiptir. t
dağılımı simetrik bir dağılımdır. Bu dağılımın şekli serbestlik
derecesine bağlıdır. n>30 olduğunda dağılım normale yaklaşır.
Yrd.Doç.Dr.Yüksel TERZĐ 178
Serbestlik derecesi (degrees of freedom) :
Örnekle ilgili bir istatistiğin
hesaplanmasında veya bir parametrenin
tahmin edilmesinde, bağımsız birimlere ait
sayının bilgisini ifade eden bir terimdir.
Serbestlik derecesi modeldeki parametre
sayısına karşılık gelmektedir. Ayrıca
serbestlik derecesi verilere getirilen bazı
kısıtlamalardan sonra, değişmekte serbest
olan değerlerin sayısıdır.
Yrd.Doç.Dr.Yüksel TERZĐ 179
Tek örnek T Testi
Öğrencilerin aylık masraflarının ortalama
300 TL olduğu iddia ediliyor. Bu iddianın
doğruluğunu %5 anlamlılık seviyesinde
test ediniz?

Yrd.Doç.Dr.Yüksel TERZĐ 180


Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
P=0,913>0,05
Statistic df Sig. Statistic df Sig.
notlar ,129 10 ,200* ,973 10 ,913 veriler normal
*. This is a lower bound of the true significance. dağılışlıdır.
a. Lilliefors Significance Correction

H0: µ=300 One-Sample Statistics

Std. Error
N Mean Std. Deviation Mean
notlar 10 284,50 60,985 19,285

One-Sample Test

Test Value = 300


95% Confidence
Interval of the
Mean Difference
t df Sig. (2-tailed) Difference Lower Upper
notlar -,804 9 ,442 -15,500 -59,13 28,13

p=0,442>0,05 olup H0 hipotezi kabul edilir.


Yrd.Doç.Dr.Yüksel TERZĐ 181
• Tek grup test istatistiğinde eğer veriler normal dağılış
göstermiyorsa Non-parametric test kullanılır.

Yrd.Doç.Dr.Yüksel TERZĐ 182


Descriptive Statistics

N Mean Std. Deviation Minimum Maximum


notlar 10 284,50 60,985 200 400

Runs Test

notlar
Test Valuea 300,00
Total Cases 10
Number of Runs 2
Z -2,318
Asymp. Sig. (2-tailed) ,020
a. User-specified.

p=0,02<0,05 olup H0 hipotezi kabul edilemez.

Yrd.Doç.Dr.Yüksel TERZĐ 183


Đki Anakütlenin Parametreleriyle Đlgili Hipotez Testleri
Bu testlerin amacı karşıt hipotezde ileri sürülen
iddianın kabul edilip edilmeyeceğinin ortaya
çıkartılmasıdır. Ancak karşıt hipotezi test etmek mümkün
olmadığından, önce sıfır hipotezi test edilir ve bu sonuç
karşıt hipotez için genellenir.
Đki anakütlenin parametreleriyle ilgili hipotez testinin
varsayımları:
 Örneklemlerin alındığı anakütle normal dağılışlıdır.
 Örneklemlerdeki birimler iadeli olarak ve eşit
olasılıkla seçilmiş veya anakütleler sonsuz büyüktür.
 Đki anakütledeki örneklem seçimi birbirinden
bağımsızdır.

Yrd.Doç.Dr.Yüksel TERZĐ 184


Đki Anakütle Ortalaması Arasındaki Farka Đlişkin Hipotez Testi
Đki ortalama arasındaki farkın testi yapılırken, kullanılacak
test istatistikleri anakütle varyansının bilinmesi ve örnek
büyüklüğü dikkate alınarak aşağıdaki şekilde bir sınıflama
yapılabilir. Gözlemler Normal dağılış gösteriyorsa ve
1) Popülasyon (anakütle) varyansları ( σ12 , σ 22 ) biliniyor veya
popülasyon varyansları bilinmiyor ancak örnekler büyükse (n ≥ 30)
2) Popülâsyon varyansları bilinmiyor fakat eşit kabul
edilebiliyorsa ( σ12 = σ 22 ),
3) Popülâsyon varyansları bilinmiyor fakat eşit kabul
edilemiyorsa ( σ12 ≠ σ 22 ),
4) Gruplar bağımlı ise yani eşli gözlemler varsa,

farklı her durum için uygun test istatistikleri kullanılarak ilgili


testler yapılabilir.

Yrd.Doç.Dr.Yüksel TERZĐ 185


Bu varsayımları kontrol için yapılacak kontroller:
• Normallik ve simetriyi kontrol et
– Ortalama ve medyanı incele
– Çarpıklık ve basıklık katsayılarını incele
– Her grubun histogram ve kutu grafiklerini çiz ve
incele
• Varyans homojenliğini kontrol için
– Kutu grafiklerini incele
– Serpilme grafiklerini incele
• Aşırı gözlemleri belirlemek için
– Kutu grafikleri incele
– Serpilme grafiklerini incele
– Histogramları incele
X 1 ~ N ( µ1 , σ 12 )
X 2 ~ N ( µ 2 Yrd.Doç.Dr.Yüksel
, σ 22 ) TERZĐ 186
Popülasyon varyansları ( σ12 ve σ 22 ) biliniyor ve
n1>30 , n2>30 ( Z-testi)

H0: µ1- µ2 = 0
H 1: µ1- µ2 ≠ 0 H 1: µ1- µ2 > 0 H 1: µ1- µ2 < 0

( X 1 − X 2 ) − ( µ1 − µ 2 )
Z= ,
σ 12 σ 22
+
n1 n2
H0: µ1- µ2 = 0 H0: µ1- µ2 = 0 H0: µ1- µ2 = 0
H 1: µ1- µ2 ≠ 0 H 1: µ1- µ2 > 0 H 1: µ1- µ2 < 0

Zh>Zt veya Zh<-Zt Zh>Zt Zh<-Zt


ise Ho reddedilir. Yrd.Doç.Dr.Yüksel TERZĐ 187
Popülasyon varyansları bilinmiyor ancak
σ 12 = σ 22 ve n1≤30 , n2≤30 ( t-testi)

H0: µ1- µ2 = 0
H 1: µ1- µ2 ≠ 0 H 1: µ1- µ2 > 0 H 1: µ1- µ2 < 0

( X 1 − X 2 ) − ( µ1 − µ 2 ) (n1 − 1) s12 + (n2 − 1) s 22


t= , s=
1 2 n1 + n2 − 2
s +
n1 n2

Bulunan th hesap değeri ttablo değeri mukayese edilir.


tα,(n1+n2-2)<th ise H0 reddedilir.
Yrd.Doç.Dr.Yüksel TERZĐ 188
Popülasyon varyansları bilinmiyor ancak
σ 12 ≠ σ 22 ve n1≤30 , n2≤30 ( t-testi)

σ 12 ≠ σ 22
ise bu tür problemlere Behrens-Fisher Problemi denir.
H0: µ1- µ2 = 0
H 1: µ1- µ2 ≠ 0 H 1: µ1- µ2 > 0 H 1: µ1- µ2 < 0

( X 1 − X 2 ) − ( µ1 − µ 2 )
t=
s12 s22
+
n1 n2
Bulunan th hesap değeri ttablo değeri mukayese edilir. tα,v<th ise
H0 reddedilir. Serbestlik derecesi aşağıdaki formülle bulunur.
( s12 / n1 + s 22 / n2 ) 2
sd = v = −2
( s12/ n1 ) 2
( s 22 / n2 ) 2
+
Yrd.Doç.Dr.Yüksel TERZĐ 189
n1 + 1 n2 + 1
Örnek: Bulaşık deterjanını plastik kaplara doldurmak için iki
makine kullanılıyor. Birinci makineden n1=10 plastik kap,
ikinci makineden n2=12 plastik kap seçiliyor. Bu kaplar
incelendiğinde birinci makine ortalama 30.87 birim sıvı, ikinci
makine ortalama 30.68 birim sıvı doldurmuştur. Varyansları
ise sırasıyla 0.0225 ve 0.0324 bulunmuştur.
a) Varyansları homojen ( σ 12 = σ 22 ) kabul ederek, %95 güven
düzeyinde (%5 anlamlılık düzeyinde) birinci makinenin daha
fazla sıvı doldurduğu söylenebilir mi?
b) Varyansları heterojen ( σ 12 ≠ σ 22 ) kabul ederek, %95 güven
düzeyinde birinci makinenin daha fazla sıvı doldurduğu
söylenebilir mi?
Çözüm :
X 1 = 30.87 s12 = 0.0225 n1 = 10 H 0 : µ1 = µ 2
X 2 = 30.68 s 22 = 0.0324 n2 = 12 H1 : µ1 > µ 2
Yrd.Doç.Dr.Yüksel TERZĐ 190
a) σ 12 = σ 22 ise
(n1 − 1) s12 + (n2 − 1) s 22 (10 − 1)0.0225 + (12 − 1)0.0324
s= = = 0.167
n1 + n2 − 2 10 + 12 − 2

( X 1 − X 2 ) − ( µ1 − µ 2 ) (30.87 − 30.68) − 0
t= = = 2.657
1 2 1 2
s + 0.167 +
n1 n2 10 12

tα,(n1+n2-2)=t005,(10+12-2)=t0.05,20=1.725 <th=2.657 olduğundan H0


reddedilir.

Karar: Đki makineden birinci makinenin daha fazla sıvı


doldurduğu %95 güvenilirlikle söylenebilir.
Yrd.Doç.Dr.Yüksel TERZĐ 191
b) σ 12 ≠ σ 22 ise
( s12 / n1 + s 22 / n2 ) 2 (0.025 / 10 + 0.0324 / 12) 2
sd = v = −2= − 2 = 22.02
( s12 / n1 ) 2 ( s 22 / n2 ) 2 (0.025 / 10) 2
(0.0324 / 12) 2
+ +
n1 + 1 n2 + 1 10 + 1 12 + 1

( X 1 − X 2 ) − ( µ1 − µ 2 ) (30.87 − 30.68)
t= = = 2.699
s12 s 22 0.0225 0.0324
+
+ 10 12
n1 n2

tα,v=t0.05, 22.02=1.717 <th =2.699 olduğundan H0 reddedilir.

Karar : σ 12 ≠ σ 22 olduğunda birinci makinenin daha etkin


olduğu söylenebilir. Yrd.Doç.Dr.Yüksel TERZĐ 192
Varyansların Homojenlik Testi :
i.) Bartlett Homojenlik Testi
σˆ i2 , i = 1,2,..., t t adet varyansın homojenlik kontrolü için, sıfır
hipotezi:
1
( ) ( )
2 
t
H 0 : σ 12 = σ 22 = K = σ t2 U = ν log e σˆ − ∑ ν i log e σˆ 
2
C  i =1 

Eğer hesaplanan U değeri U > χ α2 ( t −1) ise Ho reddedilir. Burada


t
ν σ
ˆ 2
ν = ∑ νi , σˆ 2 = ∑ i i
i =1 ν
ν i = df i
t grubun her grubunun serbestlik derecelerini
göstermektedir.
1  t 1 1
C =1+ ∑ − 
3( t − 1)  i =Yrd.Doç.Dr.Yüksel
1 νi ν  TERZĐ 193
ii. Levens’ in Varyans Heterojenlik Testi

Denemede (k) tane grup varsa bu grupların varyanslarının


heterojenliğini test için kullanılan basit bir testtir. Bartlett testine
benzemektedir, ancak hesabı biraz daha kolaydır.
k 2

(N − k)
∑ n (Z . − Z
i i .. )
W= ⋅ i =1
,
(k − 1) k ni

∑∑ (Z
i =1 j =1
ij − Z i. ) 2

Burada k: muamele grup sayısı, ni: i nci gruptaki gözlem


sayısıdır, ve Zij hesaplanırken ortalamaya göre, medyana göre
veya budanmış ortalamaya göre hesaplanabilir. Şöyle ki;
Zij = Yij − Yi. , Yi. : i nci grubun aritmetik ortalaması
~ ~
Zij = Yij − Yi. , Yi. : i nci grubun medyandır.
Zij = Yij − Yi′. , Yi′. : i nci grubun budanmış ortalamasıdır.
Yrd.Doç.Dr.Yüksel TERZĐ 194
Z i. : i nci grubun ortalamasıdır, Z.. ise genel ortalamadır.
İki Bağımsız Örnek için T testi

Yrd.Doç.Dr.Yüksel TERZĐ 195


Örnek: Psikolog uykunun hatırlama üzerine etkisini araştırıyor.
Günde 12 saat uyuyan 12 öğrenci ile günde 5 saat uyuyan diğer 12
öğrenciye hatırlama testi uyguluyor. Aldığı puanlar aşağıdaki
şekilde belirleniyor.

8 saat uyuyanlar: 40 45 52 61 65 75
5 saat uyuyanlar:30 35 48 52 54 60

H 0 : µ1 = µ 2 veya H 0 : µ1 − µ 2 = 0
H 1 : µ1 ≠ µ 2 H 1 : µ1 − µ 2 ≠ 0
α = 0, 05 , n1 = 6 , n2 = 6

Yrd.Doç.Dr.Yüksel TERZĐ 196


Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
grup Statistic df Sig. Statistic df Sig.
puan 1 ,140 6 ,200* ,973 6 ,910
2 ,273 5 ,200* ,894 5 ,378
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

P1=0,910>0,05 P2=0,378>0,05
Veriler normal dağılışlıdır.

Yrd.Doç.Dr.Yüksel TERZĐ 197


Group Statistics

Std. Error
grup N Mean Std. Deviation Mean
puan 1 6 56,33 13,110 5,352
2 5 46,20 12,969 5,800

Independent Samples Test

Levene's Test for


Equality of Variances t-test for Equality of Means
95% Confidence
Interval of the
Mean Std. Error Difference
F Sig. t df Sig. (2-tailed) Difference Difference Lower Upper
puan Equal variances
,008 ,929 1,283 9 ,232 10,133 7,901 -7,739 28,006
assumed
Equal variances
1,284 8,678 ,232 10,133 7,892 -7,821 28,088
not assumed

Homojenlik Testi : p=0,929>0,05 varyanslar homojendir.

Independent t-test: p=0,232>0,05 H0 kabul. Ortalamalar arasında fark yoktur.


Yani 8 saat uyuyan öğrenciler ile 5 saat uyuyan öğrencilerin not ortalamaları
arasında %5 önem seviyesinde istatistiksel olarak önemli bir farklılık yoktur.
Yrd.Doç.Dr.Yüksel TERZĐ 198
Eğer veriler normal dağılış göstermiyorsa, Non Parametirc testlerden
Mann-Whitney U testi kullanılır.

Yrd.Doç.Dr.Yüksel TERZĐ 199


Test Statisticsb

puan
Mann-Whitney U 10,500
Wilcoxon W 31,500
Z -1,203
Asymp. Sig. (2-tailed) ,229
Exact Sig. [2*(1-tailed a
,240
Sig.)]
a. Not corrected for ties.
b. Grouping Variable: grup

P=0,229>0,05 olduğundan H0 hipotezi red edilir, yani iki


grubun notları arasında fark yoktur denilebilir.

Yrd.Doç.Dr.Yüksel TERZĐ 200


Đki Bağımlı (Eşli) Anakütle Ortalaması Arasındaki
Farkın Hipotez Testi

Aynı fert üzerinde farklı zamanlarda ölçümler


alındığında ve bunların karşılaştırılması söz konusu
olduğu durumlarda bağımlı (eşli) grup ortaya çıkar.
Eşleştirilmiş fertlerle yapılan testlerde kullanılan
test istatistiği daha önceki grup karşılaştırmalarında
kullanılanlardan daha farklıdır. Çünkü grup
karşılaştırmalarında X1 ile X2 değişkenlerinin
birbirinden bağımsız olduğu varsayılmaktaydı.
Eşleştirilmiş gözlemlerde ise X1 ve X2 ölçümleri aynı
birey üzerinde veya çok benzer bireyler üzerinden
yapıldığı için bağımlı olacaktır. Yani n1 = n2 = n (gözlem
çifti sayısı ) olacaktır. Yrd.Doç.Dr.Yüksel TERZĐ 201
İki Bağımlı Örnek için T testi

Yrd.Doç.Dr.Yüksel TERZĐ 202


P<0.01 olduğundan yokluk hipotezi reddedilir. Yani ilk ağırlık değerleri ile son
ağırlık değerlerinin ortalamaları birbirinden önemli ölçüde farklıdır.

Yrd.Doç.Dr.Yüksel TERZĐ 203


Örnek:Yürüyüşten önceki ve sonraki PEFR değerleri arasındaki
fark:

Hasta Önce Sonra


(PEFR) (PEFR)
1 312 300
2 242 201
3 340 232
4 388 312
5 296 220
6 254 256
7 391 328
8 402 330
9 290 231

Yrd.Doç.Dr.Yüksel TERZĐ 204


Paired Samples Statistics
P=0,001<0,05 olup
Std. Error Ho red edilir. Yani
Mean N Std. Deviation Mean
Pair once 323,89 9 59,826 19,942 ağırlıkta sonradan
1 sonra 267,78 9 50,007 16,669 bir düşme
olmuştur.
Paired Samples Test

Paired Differences
95% Confidence
Interval of the
Std. Error Difference
Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed)
Pair 1 once - sonra 56,111 34,174 11,391 29,843 82,380 4,926 8 ,001

Yrd.Doç.Dr.Yüksel TERZĐ 205


Eğer verile normal dağılış göstermeseydi, Non-Parametric testlerden
Wilcoxon testi kulllanılır.

Yrd.Doç.Dr.Yüksel TERZĐ 206


Test Statisticsb

sonra - once
Z -2,549a
Asymp. Sig. (2-tailed) ,011
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test

P=0,011<0,05 H0 red edilir.

Yrd.Doç.Dr.Yüksel TERZĐ 207


KĐ-KARE TESTĐ

Günümüzde yapılan birçok araştırmada nicel (sayısal)


değişkenlerden ziyade nitel (sayısal olmayan) değişkenlerin
dikkate alındığı gözlemlenmektedir. Ayrıca bazen nicel
değişkenler uygun biçimde gruplandırma ile nitel değişken
durumuna getirilebilir. Đşte sayısal olmayan (nitel)
χ2) testi uygulanır.
değişkenlere ki-kare (χ
Normal dağılan bir anakütleden rasgele çekilen n
hacimli örneklem için ki-kare istatistiği hesaplanır.

( X1 − X ) (X 2 − X ) (X n − X ) n
χ2 = + +K+ = Z12 + Z 22 + K + Z n2 = ∑ Z i2
σ2 σ2 σ2 i =1

Yrd.Doç.Dr.Yüksel TERZĐ 208


1. Bir frekans dağılımının herhangi bir teorik dağılıma
uyup uymadığının kontrolü için yapılan testler
2. Đki veya daha fazla gruptaki oranların eşitliğinin testi
için yapılan testler
3. Đki özelliğin birbirinden bağımsız olup olmadığının
testi
4. Örnek frekanslarının homojenlik kontrolü

Yukarıdaki durumlarda χ2 dağılışı kullanılarak hipotez


testleri yapılabilir. χ2 dağılışı sürekli ve sağa çarpık bir
dağılıştır, üst kuyruğu daha uzundur. Genelde H1 hipotezi
tek yönlü olarak kurulur. Eğer çift yönlü kurulma
mecburiyeti doğarsa o zaman alt ve üst bölgedeki kritik
red bölgesi ayıran tablo değerleri ayrı ayrı okunur.
Süreksiz bir dağılışa yaklaşımda
Yrd.Doç.Dr.Yüksel TERZĐ
kullanıldığında 209
Yates
düzeltmesi zorunludur.
Ki-kare dağılımı pozitif çarpık dağılıştır.

Yrd.Doç.Dr.Yüksel TERZĐ 210


KĐ-KARE (χ χ2 )- UYGUNLUK TESTĐ
n hacimli bir örneklemin anakütleyi iyi temsil edip
etmediğinin veya hangi dağılıma sahip bir anakütleden geldiği
ki-kare uygunluk testi ile belirlenebilir.

H0: Örneklem anakütleyi temsil edebilir (örneklem dağılımı


anakütle dağılımına uygundur).
H1: Örneklem anakütleyi temsil edemez (örneklem dağılımı
anakütle dağılımına uygun değildir).
2 2
(Gi − Ti )
r Gi r
χ =∑
2
=∑ −n
i =1
Ti T
i =1 i

Gi: Gözlenen frekanslar Ti: Teorik frekanslar


Serbestlik derecesi: v=r–1
χ 2 ≤ χ tablo
2
ise H 0 reddedilemez.
Yrd.Doç.Dr.Yüksel TERZĐ 211
KĐ-KARE BAĞIMSIZLIK TESTĐ
Değişkenlerin 2x2 yada RxC biçiminde ki çapraz
tablolarda sınıflandırılması halinde, değişkenlerin arasında
bağımlılık yada bir değişim olup olamadığını ortaya koyan
testtir. Çift yönlü tablolarda (kontenjans tablosu) yer alan
değişkenlerden her ikisi nitel (sayısal olmayan) veya biri nitel
değişken diğeri nicel (sayısal) değişken arasındaki ilişkiler ki-
kare bağımsızlık testi ile test edilebilir.
2x2 tablolarına Pearson Kikare testi, Yates Kikare
(düzeltilmiş) ve Fisher Kikare (kesin) testleri uygulanır. RxC
tipindeki tablolara ise Pearson Kikare testi yapılır. Serbestlik
derecesi R satır sayısı ve C sütun sayısı olmak üzere (R-1)x(C-
1) biçimindedir.
H0: Değişkenler birbirinden bağımsızdır (Değişkenler
arasında ilişki yoktur).
H1: Değişkenler Yrd.Doç.Dr.Yüksel
birbirinden TERZĐ
bağımsız değildir
212
(Değişkenler arasında ilişki vardır).
Sütun
Satır Toplam
C1 C2
S1 A B N1=A+B
A’ B’
S2 C D N2=C+D
C’ D’
Toplam N3=A+C N4=B+D N
χ 2 = ∑∑ (Gij − Tij ) 2 / Tij

Burada Gij gözlenen frekansları (A,B,C,D), Tij (A’,B’, C’, D’) ise
beklenen frekansları göstermektedir. Beklenen frekanslar satır ve
sütun toplamlarının çarpımının genel toplama bölünmesi ile
hesaplanır.
A’=N1*N3/N B’=N1*N4/N C’=N2*N3/N D’=N2*N4/N

Eğer χ 2 ≤ χ α2 ,sd veya P>0.05 ise H0 kabul edilir. Aksi durumda


Hipotez reddedilir. Yrd.Doç.Dr.Yüksel TERZĐ 213
Pearson Ki-kare Analizi : 2x2 tablosunda beklenen değerlerin
tümü 25’te büyük ise uygulanır. (Tij>25 ise)
χ 2 = ∑ ∑ (Gij − Tij ) 2 / Tij

Yates Ki-kare Testi : Gözlerdeki beklenen frekanslardan biri


5 ile 25 arasında ise uygulanır. (5< Tij<<25) n<50 olduğunda
da Yates süreklilik düzeltmesine başvurulur.
χ 2 = ∑∑ ( Gij − Tij − 0.5) 2 / Tij

Fisher Ki-kare Testi : Gözlerdeki beklenen frekanslardan biri


5 ten küçük ise uygulanır. (Tij<5)
P = ∑ ( R1!C1! R 2!C 2! ) /( N ! a!b! c! d! )

Yrd.Doç.Dr.Yüksel TERZĐ 214


Örnek: Bir okulda cinsiyet ile düzenli spor yapma arasında
ilişki olduğu iddia edilmektedir. Bu amaçla rasgele seçilen
780 öğrenciden elde edilen bilgiler aşağıdaki tabloda
verilmiştir. Cinsiyetin düzenli spor yapma üzerinde etkili
olup olmadığına %1 anlamlılık düzeyinde karar veriniz?

Düzenli Spor Yapma


Cinsiyet Toplam
Yapan Yapmayan
Bayan 246 122 368
Erkek 125 287 412
Toplam 371 409 780
H0: Cinsiyet ile düzenli spor yapma arasında ilişki yoktur
(değişkenler birbirinden bağımsızdır).
H1: Cinsiyet ile düzenli spor yapma arasında ilişki vardır
(değişkenler arasında bir bağıntı vardır).
Yrd.Doç.Dr.Yüksel TERZĐ 215
Düzenli Spor Yapma
Cinsiyet Toplam
Yapan Yapmayan
Bayan 246 122 368
175 193
Erkek 125 287 412
196 216
Toplam 371 409 780

(Gij − Tij ) 2 (246 − 175) 2 (122 − 193) 2 (125 − 196) 2 (287 − 216) 2
χ = ∑∑
2
= + + +
Tij 175 193 196 216
= 103.87

Serbestlik derecesi=(R-1)*(C-1)=(2-1)*(2-1)=1
χ 2 = 103.87 > χ 02.01, 1 = 6.64 H0 reddedilir. Cinsiyetle düzenli spor
yapma arasında ilişki vardır.
Yrd.Doç.Dr.Yüksel TERZĐ 216
Yrd.Doç.Dr.Yüksel TERZĐ 217
Yrd.Doç.Dr.Yüksel TERZĐ 218
Yrd.Doç.Dr.Yüksel TERZĐ 219
Chi-Square Tests
Asymp. Sig. Exact Sig. Exact Sig.
Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square 103,877b 1 ,000
Continuitya
Correction 102,418 1 ,000
Likelihood Ratio 106,211 1 ,000
Fisher's Exact Test ,000 ,000
Linear-by-Linear
Association 103,744 1 ,000
N of Valid Cases 780
a. Computed only for a 2x2 table
b. 0 cells (,0%) have expected count less than 5. The minimum expected
count is 175,04.

Đşlem sonucunda 4 hesap değeri bulunur. Bunlar Pearson, Continuity


Correction (süreklilik düzeltmesi-Yates), Likelihood Ratio (Benzerlik oranı)
ve Fisher’in exact testidir. The minimum expected count (en küçük beklenen
değer) 5’ten küçük ise Fisher, 5-25 arasında ise Yates, 5’ten büyük ise
Pearson Kikare değerine bakılır ve yorum yapılır. Buradaki minimum
beklenen değer 175,03 olduğundan Pearson değerine bakılır. O halde ki-kare
hesap değerimiz 103,8 olur. Sd:1 P=0 < 0.05 olduğundan H0 reddedilir. Yani
spor yapma cinsiyete göre değişmektedir.
Yrd.Doç.Dr.Yüksel TERZĐ 220
Örnek: Dişlerin fırçalanması ile kişilerin eğitim durumlarının
arasında bir ilişki olup olmadığı araştırılıyor. Günde diş
Fırçalama sayısı (0,1,2 veya daha fazla), eğitim durumu (ilk
öğretim, lise veya daha yüksek) şeklinde sınıflanıyor. Her iki
değişkende sıralama ölçeğinde değişkenler olduğu için χ2
bağımsızlık testi ile bu kontrol edilebilir.

0 1 2+ ∑
Fırça Fırça Fırça
Đlk okul 5 27 5 37
(1.78) (22.06) (13.16)
Lise+ 5 97 69 171
(8.22) (101.94) (60.84)
∑ 10 124 74 208

Yrd.Doç.Dr.Yüksel TERZĐ 221


Ho: diş fırçalama ile eğitim durumu arasında
bağımlılık yoktur.
H1: En az bir kategoride bağımlılık söz konusudur.
r c (G − T ) 2
χ2 = ∑ ∑
ij ij

i =1 j =1
Tij
Khi-Kare=5,833+1,107+5,063+1,262+0,24+1,095= 14,600

Serbestlik derecesi= (2-1)*(3-1)=2


Ho red edilir Çünkü χ2 (2,0.01)=9.21 ve
χ2 (k-1,αα) = χ2 (2, 0.01)=9.21

14.60>9.21 dir. Diş fırçalaması eğitimle yakından


ilişkilidir. Yrd.Doç.Dr.Yüksel TERZĐ 222
FISHER’in Kesin Olasılık Testi
Örnek hacmi küçük olduğunda hücrelerin beklenen değerlerinin 5 ten
büyük bulunması çok zordur, dolayısıyla χ2 dağılışına yaklaşım uygun olmaz. Bu
nedenle 2x2 lik tablolarda hücrelerden herhangi birisinin beklenen değeri 5 den
küçük ise Fisher’in kesin olasılık testi uygulanması gerekir.
Fisher’ in testi, gözlenen 2x2 lik bir tablonun kesin önem seviyesinin
hesaplanmasına dayanır. Bu teste göre sıra ve sütun marjinal (kenar) toplamları
ve (n) değişmemek koşulu ile tablo içi hücre değerlerinin değişik kombinasyonları
için söz konusu olasılıkları hesaplayarak toplanır. Bu son elde edilen değer
gözlenen ve daha ekstrem tabloların elde edilme olasılığıdır. Toplamı (n) olan
hücreleri a,b,c,d olan bir tablonun elde edilme olasılığı:
I. Özellik
Var Yok ∑
Var a B a+b
II.
Yok c D c+d
Özellik
∑ a+c b+d n

Prob(a, b, c, d) =
(a + b )!+(c + d )!+(a + c)!+(b + d )!
n!a!b!c!d!
ile hesaplanır. Birinci sıra ve birinci sütundaki (a) hücresinin değeri her seferinde
1 küçültülerek yeni tablo ve bunun elde edilme olasılığı hesaplanır. Bu işlem a’
Yrd.Doç.Dr.Yüksel TERZĐ 223
nın değeri sıfır oluncaya kadar devam edilir.
Örnek: Perikardial efüzyon olan ve olmayan hastalarda sigara
içme durumu arasında bir ilişki olup olmadığı araştırılıyor. 60 kişi
ile yapılan bir denemede aşağıdaki tablo elde ediliyor.

Sigara içme
var Yok ∑
Efüzyon var 2 23 25
olması yok 5 30 35
∑ 7 53 60

Bu tablonun elde edilme olasılığı:

Prob(a, b, c, d) =
(25)!+(35)!+(7 )!+(53)!
= 0.252
60!2!23!5!30!

Yrd.Doç.Dr.Yüksel TERZĐ 224


Bu tablodan 2 farklı tablo daha elde edilebilir.
Sigara içme
var Yok ∑
Efüzyon var 1 24 25
olması yok 6 29 35
∑ 7 53 60
Bu tablonun elde edilme olasılığı:

Prob(a, b, c, d) =
(25)!+(35)!+(7 )!+(53)!
= 0.105
60!1!24!6!29!

Sigara içme
var yok ∑
Efüzyon yok 0 25 25
olması var 7 28 35
∑ 7 53 60
Bu tablonun elde edilme olasılığı:
Prob(a, b, c, d) =
(25)!+(35)!+(7 )!+(53)!
= 0.017
60!0!25!7!28!
Yrd.Doç.Dr.Yüksel TERZĐ 225
Bu olasılıklar toplanırsa, Fisher’in tek yönlü kesin
olasılığı elde edilmiş olur. Çift yönlü olasılık istenirse
bunun iki katı alınır, yani p=0.688 olur.

Her ne kadar sigara içenlerde efüzyon oranı


5/7=0.71, içmeyenlerde 30/53=0.566 olsa da
istatistiksel olarak

α=0.05
P(fisher)=(0.017+0.105+0.252)=0,374>α

olduğundan Sigara ile efüzyonun var olması


arasında bir ilişki olmadığı söylenebilir.

Yrd.Doç.Dr.Yüksel TERZĐ 226


Beklenen hücre
Sayısı 5’den küçük
olanların oranı %25
olduğundan uygun
biçimde satır yada
sütun
birleştirilmesine
gidilir. Bunun için
en uygun olan
Trabzon ile
Samsun’un
birleştirilmesidir.

Yrd.Doç.Dr.Yüksel TERZĐ 227


Yrd.Doç.Dr.Yüksel TERZĐ 228
KĐ-KARE HOMOJENLĐK TESTĐ

Đki yada daha fazla bağımsız örneklemin aynı ana kütleden


seçilip seçilmediğini test eder.

H0: Đki örneklem aynı anakütleden seçilmiştir.


H1: Đki örneklem farklı anakütleden seçilmiştir.

χ = ∑∑ (Gij − Tij ) / Tij


2 2

Yrd.Doç.Dr.Yüksel TERZĐ 229


Örnek: Bölgesel satış yapan bir üretim işletmesi 2 yeni
ürün geliştirerek piyasaya sürmüştür. Tüketicilerin
görüşlerini belirlemek amacıyla bir rassal örneklem
oluşturulmuştur. Sonuçlar aşağıdaki gibi bulunmuştur.
Seçilen örneklemlerin, aynı anakütleye ait olup olmadığını
%5 anlamlılık düzeyinde test edinizi?

Tüketici Görüşleri
Ürünler Toplam
Beğenen Beğenmeyen Đlgisiz
I.Ürün 60 30 10 100
II.Ürün 80 50 20 150
Toplam 140 80 30 250

H0: Đki örneklem aynı anakütleden seçilmiştir.


H1: Đki örneklem farklı anakütleden seçilmiştir.
Yrd.Doç.Dr.Yüksel TERZĐ 230
Tüketici Görüşleri
Ürünler Toplam
Beğenen Beğenmeyen Đlgisiz
I.Ürün 60 (56) 30 (32) 10 (21) 100
II.Ürün 80 (84) 50 (32) 20 (21) 150
Toplam 140 80 30 250

(Gij − Tij ) 2 (60 − 56) 2 (30 − 32) 2 (20 − 21) 2


χ = ∑∑
2
= + + ... +
Tij 56 32 21
= 1,24
Serbestlik derecesi=(R-1)*(C-1)=(2-1)*(3-1)=2
χ 2 = 1,24 < χ 02.05, 2 = 5,99 H0 kabul edilir. Đki örneklem aynı
anakütleden seçilmiştir.

Yrd.Doç.Dr.Yüksel TERZĐ 231


KONTENJANS KATSAYISI

Nitel iki değişken arasındaki ilişkini derecesini belirleyen


bir katsayıdır. rxc tablolarında r>2 ve c>2 ise ki-kare
değerinin gösterdiği ilişki düzeyini belirlemede kullanılır.
Đki değişken arasında bir ilişki bulunmuyorsa c=0 olur.
Đlişki yüksekse c 1’e yakın bir değer verir.

χ 2
c=
χ +n
2

Yrd.Doç.Dr.Yüksel TERZĐ 232


Yrd.Doç.Dr.Yüksel TERZĐ 233
Yrd.Doç.Dr.Yüksel TERZĐ 234
ürün * tüketici Crosstabulation

Count
tüketici
Beğenen Beğmeyen Đlgisiz Total
ürün 1 60 30 10 100
2 80 50 20 150
Total 140 80 30 250

Chi-Square Tests

Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 1,240a 2 ,538
N of Valid Cases 250
a. 0 cells (,0%) have expected count less than 5. The minimum
expected count is 12,00.
Symmetric Measures

Asymp.
a b
Value Std. Error Approx. T Approx. Sig.
Nominal by Nominal Contingency Coefficient ,070 ,538
Interval by Interval Pearson's R ,070 ,062 1,109 ,269c
Ordinal by Ordinal Spearman Correlation ,070 ,063 1,105 ,270c
N of Valid Cases 250
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
c. Based on normal approximation. Yrd.Doç.Dr.Yüksel TERZĐ 235
ÇAPRAZ TABLOLARDA KORELASYON

kxk çapraz tablolarında değişkenler arasındaki korelasyon


katsayısı aşağıdaki gibi hesaplanır. Korelasyon 0-1 arasında
değerler alır.

χ 2
r=
n(k − 1)

Yrd.Doç.Dr.Yüksel TERZĐ 236


Đki Anakütle Oranları Arasındaki Farkın Hipotez Testi
Bu testlerde karşıt hipoteze örnek olarak şunlar verilebilir:
 A ve B bölümü öğrencilerinin başarı oranları farklıdır.
 Lise mezunlarının üniversiteye girme oranı Anadolu
liselerinkinden düşüktür.
 Futbol seyretme oranı erkeklerde daha yüksektir.

π1<1 , 0<π
0<π π2<1 olmak üzere

H0 : π1=π
π2 H0 : π1=π
π2 H0 : π1=π
π2
H1 : π1≠π
π2 H1 : π1<π
π2 H1 : π1>π
π2

( p1 − p 2 ) − (π 1 − π 2 ) p1 (1 − p1 ) p 2 (1 − p 2 )
Z= , s p1 − p 2 = +
s p1 − p 2 n1 n2

Yrd.Doç.Dr.Yüksel TERZĐ 237


Örnek:Yapılan bir çalışmada 61 bayandan 11 tanesi, 238
erkekten ise 35 tanesinin bir sınavdan başarılı olduğu tespit
edilmiştir. Bayanlarla erkeklerin başarı oranları arasında %5
önem seviyesinde bir farklılık var mıdır?
Bayan Erkek Toplam
Başarılı 11 35
Başarısız 50 203
Toplam 61 238

Yrd.Doç.Dr.Yüksel TERZĐ 238


Yrd.Doç.Dr.Yüksel TERZĐ 239
Yrd.Doç.Dr.Yüksel TERZĐ 240
H0 : π1=π
π2

Ki-Kare=0,413 , p=0,521>0,05 H0 kabul edilir.

P1=11/61=0,18 p2=35/238=0,147 Sp=(11+35)/(61+238)=0,154

0,18 − 0,147
Z= = 0,64
1 1 
0,154.0,846 + 
 61 238 

Z2=0,642=0,42=Ki-kare
Yrd.Doç.Dr.Yüksel TERZĐ 241
Bağımlı Gruplarda Ki-Kare Testi (McNemar Testi)
2x2 tablolarda bir örnek grup üzerinde iki farklı
uygulama yapıldığını (örneğin bağımlı olduğunu) ve iki ölçüm
arasındaki farkın anlamlı olup olmadığını test eder.

χ =
2 ( B − C )2

B+C
Eğer B+C<30 ise test istatistiği aşağıdaki gibi düzeltilir.

χ 2
=
( B − C − 1)
2

B+C

χ 2
1,α ≤ χ
Serbestlik derecesi 1 dir. Yrd.Doç.Dr.Yüksel
2
h ise H0 reddedilir.
TERZĐ 242
Örnek: 30 öğrencinin kurs öncesi vermiş oldukları cevap dağılımı
ile kurs sonrası vermiş oldukları cevapların değişimini incelemek
istiyoruz. Veriler aşağıdaki gibidir. Kurs öncesi sonuçların kurs
sonrası değişmesi önemli midir?

Kurs Kurs Sonrası Toplam


Öncesi Olumlu Olumsuz
Olumlu 13 8 21
Olumsuz 6 3 9
Toplam 19 11 30

χ2 =
( B − C − 1)2
=
( 8 − 6 − 1)2
= 0.071
B+C 8+6

χ12,0.05 = 3.84 >0.071 olduğundan sıfır hipotezi kabul edilir. Yani


Kurs öncesi ve kurs sonrası sonuçlar arasında uyumluluk vardır.
Öğrencilerin kurs öncesi ve kurs sonrası görüşlerinde değişme
Yrd.Doç.Dr.Yüksel TERZĐ 243
olmamıştır.
Yrd.Doç.Dr.Yüksel TERZĐ 244
Yrd.Doç.Dr.Yüksel TERZĐ 245
once * sonra Crosstabulation

Count
sonra
+ - Total
once + 13 8 21
- 6 3 9
Total 19 11 30

Chi-Square Tests

Exact Sig.
Value (2-sided)
McNemar Test ,791a
N of Valid Cases 30
a. Binomial distribution used.

P=0,791>0,05 H0 kabul. Görüşlerde bir değişiklik olmamıştır.

Yrd.Doç.Dr.Yüksel TERZĐ 246


TESTLERĐN UYUMU- KAPPA DEĞERĐ
Eğer Kappa sıfır ise şansın dışında bir uyum söz konusu değildir. Kappa bir ise
iki test arasındaki uyumun tam olduğunu ifade eder. Kappa hangi yöntemin daha iyi
olduğunu göstermez yöntemler arasındaki uyumu gösterir.2x2 lik bir tabloda Kappa
hesabı yapılması:

Standart Test
+ - Toplam
Alternatif
Test + A B A+B
- C D C+D
Toplam A+C B+D N

(A+D) : Đ ki testte de aynı sonucu elde etme sayısı


O=(A+D)/N : Her iki test de aynı sonucu elde etme oranı
(B+C) : Her iki testte farklı sonuç elde etme sayısı
E=[(A+B)/N*(A+C)/N]+[(C+D)/N*(B+D)/N] : Aynı sonucu elde etmenin beklenen
şansı
1-E : Beklenen gerçek uyum miktarı
[(A+D)/N]-E : Gözlenen gerçek uyum. Buradan Kappa hesaplanabilir
Kappa= {[(A+D)/N]-E}/(1-E)
Yrd.Doç.Dr.Yüksel TERZĐ 247
Kappa=0.5 olması makul uyumu gösterir. Genelde Kappa’nın 0.6-0.8 olması iyi uyumun
göstergesidir.
Patalojik analiz sonucu ile BT(Bilgisayarlı Tomografi) sonucu belirlenen + ve -
sonuçlardaki uyum araştırılıyor. 50 hastada yapılan tetkiklerde aşağıdaki tablo elde
ediliyor.
BT Sonucu

Patoloji + - ∑
+ 20 12 32

- 2 16 18

∑ 22 28 50

(A+D)/N=36/50=0.72

E=[(A+B)/N*(A+C)/N]+[(C+D)/N*(B+D)/N]=32/50*22/50+18/50*28/50=0.483

Gözlenen Gerçek uyum=(Gözlenen Toplam uyum – Şans uyumu)=0.72-0.483=0.237


Beklenen gerçek uyum=1-E=1-0.483=0.517

Kappa=0.237/0.517=0.458

Her iki test arasındaki uyumun fazla olduğu söylenemez.


Yrd.Doç.Dr.Yüksel TERZĐ 248
Uyumun Mükemmelliği

Kappa Uyumun Gücü


0.01 den küçük Çok zayıf
0.01-0.20 Zayıf
0.21-0.40 Orta
0.41-0.60 Makul
0.61-0.80 Đyi
0.81-1.00 Çok iyi

Yrd.Doç.Dr.Yüksel TERZĐ 249


Yrd.Doç.Dr.Yüksel TERZĐ 250
patoloji * BT Crosstabulation

Count
BT
+ - Total
patoloji + 20 12 32
- 2 16 18
Total 22 28 50

Symmetric Measures

Asymp.
a b
Value Std. Error Approx. T Approx. Sig.
Measure of Agreement Kappa ,458 ,114 3,514 ,000
N of Valid Cases 50
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.

İki yöntem arasında iyi uyum olduğu söylenemez.

Yrd.Doç.Dr.Yüksel TERZĐ 251


Örnek: Tüberküloz basilini yetiştirecek iki farklı ortama 50 şer
adet ekim yapılıyor. Bunlardan her iki ortamda yetişme
durumuna göre sonuçlar aşağıdaki tabloda veriliyor.
Ortamların eşit derecede etkili olup olmadığını bulunuz
(0.05).

A ortamı
+ - ∑
ortamı

+ 20 12 32
B

- 2 16 18
∑ 22 28 50

Yrd.Doç.Dr.Yüksel TERZĐ 252


Yrd.Doç.Dr.Yüksel TERZĐ 253
PARAMETRĐK OLMAYAN ĐSTATĐSTĐK TESTLER
Verilerin Dağılışının Normal Dağılış Olmaması Durumunda Ne
Yapılacaktır? Verinin dağılışı ile ilgili varsayımda bulunmayan parametrik
olmayan yöntemler kullanılabilir.
• Varyansın heterojenlik etkisini yok etmeye çalış
• Aşırı gözlem değerlerini incelemeye al
– Đki bağımsız grubun karşılaştırılması için
• Mann-Whitney-U (Wilcoxon Sıra sayıları Toplamı) testini
kullan. Ancak bu test bağımsız grup t testi kadar güçlü
değildir.

Parametrik olmayan ve Dağılışa Bağlı olmayan Testler Ayırımı


• Non-parametrik test: bir istatistik yoğunluk fonksiyonunun
parametresinin değeri ile ilgili bir hipotez kurmayan testlerdir diye
tanımlar.
• Örnek çekilen popülâsyonun tam şekli ile ilgili varsayımda
bulunmayan testlerdir diye tanımlar.
Yrd.Doç.Dr.Yüksel TERZĐ 254
Parametrik Olmayan Testlerin Sakıncaları
Parametrik olmayan testlerde bilgi kaybı vardır. Örneğin
işaret testinde esas gözlemler değil, onların sadece işaretleri
kullanılır. Birçok parametrik olmayan testte yine esas gözlemler
yerine bu gözlemlerin sıra puanları analiz edilir. Burada da
esas gözlemin sahip olduğu bilgi kaybolur. Bu nedenle de
parametrik olmayan bir test hiçbir zaman gerçekten uygun
olarak kullanılan parametrik eşdeğeri kadar güçlü olamaz.

Parametrik olmayan testlerin diğer bir dezavantajı


popülâsyonlar arasındaki gerçek farklar hakkında bir şey
söyleyememektir. Örneğin işaret testinde popülasyonlar
farklıdır, dendiğinde bu fark ne kadardır, güven sınırı nedir,
bunlarla ilgili bilgi vermek mümkün olamamaktadır. Medyan
testi yapıp sonrada ortalamaları ve standart hatalarını verip
bunlar farklıdır, demekte doğru bir kullanım şekli değildir.
Yrd.Doç.Dr.Yüksel TERZĐ 255
PARAMETRĐK OLMAYAN (NONPARAMETRĐK) ĐSTATĐSTĐK TESTLER

ĐKĐ ÖRNEK K- ÖRNEK DURUMU ĐLĐŞKĐNĐN


TEK DURUMU DERECESĐ ĐLE
ÖLÇME ÖRNEK ĐLĐŞKĐLĐ BAĞIMSIZ ĐLĐŞKĐLĐ BAĞIMSIZ ĐLGĐLĐ
ÖLÇEĞĐ DURUMU ÖRNEKLER ÖRNEKLER ÖRNEKLER ÖRNEKLER ĐSTATĐSTĐKLER
Binomiyal Mc Nemar χ2 Đki-Bağımsız Cochran Q χ2 K-Bağımsız Olağanlık Katsayısı
ADLANDIRMA Test Testi Örnek Testi Testi Örnek Testi
χ2 Tek Fisher Kesin
Örnek Olasılık Testi
Testi
Kolmogorov- Đşaret Testi Kolmogorov- Friedman Đki- Kruskal-Wallis Spearman Sıra
Smirnov Tek Smirnov Đki- Yönlü Tek-Yönlü Sayıları Korelasyonu
Örnek Testi Örnek Testi Varyans Varyans Analizi
Analizi
Tek Örnek Wilcoxon Eşli Mann_whitney- Genişletilmiş Kendal Sıra Sayıları
Koşu (Run) Gözlemler Sıra U Testi Medyan Testi Korelasyonu
Testi Sayıları Đşaret
SIRALAMA Testi
Medyan Testi Kendal Konkordans
Katsayısı
Wald Wolfowitz Kendal Kısmi Sıra
Koşu (Runs) Sayıları Korelasyonu
Testi
Moses Aşırı
Tepkiler Testi
Eşli Gözlemler Bağımsız
için Gözlemler için
ARALIK Randomizasyon Randomizasyon
Testi Testi
Walsh Testi
Veriler NORMAL dağılış göstermiyorsa ve dönüşüm (tarnsformasyon) ile
Normalleştirilemiyorsa bu durumda da yine
Yrd.Doç.Dr.Yüksel TERZĐ 256
Parametrik olmayan testlerden uygun olanı seçilerek kullanılır.
BİR GRUPTA KOLMOGOROV-SMIRNOV UYUM İYİLİĞİ TESTİ

Bu test rasgele bir örneklemin belirli bir dağılıma (düzgün,


normal, Poisson ve üstel) ne kadar iyi uyduğunu belirlemede kullanılır.

Yrd.Doç.Dr.Yüksel TERZĐ 257


P=0.934>0.05 olduğundan
veriler normal dağılışlıdır.

Yrd.Doç.Dr.Yüksel TERZĐ 258


Wilcoxon Đşaretli Sıra Testi (Wilcoxon signed ranks test)
Veriler normal dağılmadığında bağımlı iki örnek arasındaki
farkın önemliliğini test eder. Eşleştirilmiş t testini parametrik
olmayan alternatifidir. Ortalama olarak medyan kullanılır. n
birimlik örnekten elde edilen iki gözlem seti farkının medyanı sıfır
olan toplumdan çekilmiş rasgele bir örnek olup olmadığını test
eder.

Örnek: Rasgele seçilen 8 bireyin öntest ve sontest puanları


aşağıdaki gibidir.
Öntest Sontest Öntest Sontest
53 48 51 53
47 37 67 74
38 51 74 67
48 48 48 57

Yrd.Doç.Dr.Yüksel TERZĐ 259


Yrd.Doç.Dr.Yüksel TERZĐ 260
MANN-WHITNEY U TESTĐ
Veriler normal dağılmadığında bağımsız iki örneğin aynı
meydanlı popülasyondan alınmış rasgele örnekler olup olmadığını
test eder. Bağımsız iki örneklem t testinin parametrik olmayan
alternatifidir.
H0 :n1 ve n2 hacimli veri setleri aynı meydanlı dağılıma sahiptir.
Örnek: Kaburga kırığı olan hastaların ağrı kesici skorları
Đlaç grubu Tens grubu Đlaç grubu Tens grubu
7 15 10 14
6 14 6 12
4 17 9 14
11 16 3 17
16 16 13 16
4 16 5

Yrd.Doç.Dr.Yüksel TERZĐ 261


Yrd.Doç.Dr.Yüksel TERZĐ 262
P=0,00<0.01 olduğundan ilaç ve tens tedavi biçimleri arasında
istatistiksel olarak anlamlı bir fark bulunmuştur.

Yrd.Doç.Dr.Yüksel TERZĐ 263


VARYANS ANALĐZĐ (ANOVA)
Đkiden çok örnek kütle ortalamalarının karşılaştırılmasında
kullanılır. Bu yöntemle toplam değişmeye katkıda bulunan çeşitli
değişim kaynaklarının değişkenler arası etkileşimi ve deneysel hataları
incelenir. Varyans analizi tek yönlü ve çok yönlü olarak uygulanabilir.
Tek yönlü varyans analizi elle hesaplanabilir, ancak çok yönlü varyans
analizi için bilgisayar kullanılmalıdır. Bu yöntemle ilgili aşağıdaki
hususlara dikkat edilmelidir:

1. Gruplardaki bireyler birbirine benzer ve homojen olmalıdır.


2. Gruplar birbirinden bağımsız olmalıdır. Bağımlı gruba
uygulanmaz.
3. Veriler ölçümle belirlenmiş sürekli karakter olmalıdır.
4. Gruptaki denek sayıları birbirine eşit veya yakın olmalıdır.

Bu şartlar sağlanamadığı zaman nonparametrik karşılığı "Kruskal


Wallis varyans analizi" uygulanmalıdır.

Yrd.Doç.Dr.Yüksel TERZĐ 264


F- Testi
Tüm grupları bir arada ele alarak aralarında anlamlı bir fark
bulunup bulunmadığı F testi ile yapılır. Normal dağılan bir
anakütleden rasgele çekilen birbirinden farklı n hacimli örneklemlerin
istatistiklerinden ki-kare istatistiklerini verir ve bunlarda ki-kare
dağılımını meydana getirmektedir.
( X1 − X ) 2 ( X 2 − X )2 ( X n − X )2 n
χ =
2
+ +L+ = Z12 + Z 22 + L + Z n2 = ∑ Z i2
σ2 σ2 σ2 i =1

Benzer şekilde normal dağılan iki farklı anakütleden n1 ve n2 hacimli


bütün mümkün rasgele örneklemler seçilip aynı işlemler yapılırsa, v1=
n1-1serbestlik dereceli χ12 dağılımı ve v2= n2-1 serbestlik dereceli χ 22
dağılımı olmak üzere iki dağılım ortaya çıkar. χ12 ve χ 22 istatistikleri
kendi serbestlik derecelerine bölünüp birbirine oranlanırsa F istatistiği
elde edilir.
χ12 / v1 H 0 : µ1 = µ 2 = K = µ k
F= ,
χ / v2
2 H1 : µ1 ≠ µ 2Yrd.Doç.Dr.Yüksel
≠ K ≠ µ k (TERZĐEn az iki ortalama farklı) 265
2
ANOVA TABLOSU
Varyasyon Kareler Serbestlik
Kareler Ortalaması F Testi
Kaynağı Toplamı Derecesi
VK KT SD KO F
Gruplar arası GAKT k-1 GAKO=GAKT/(k-1) GAKO/HKO
Gruplar içi GĐKT=HKT n-k HKO=HKT/(n-k)
Genel GnKT n-1 GnKO=GnKT/(n-1)

Burada GAKO gruplar arası varyanstır. Gruplar arası varyans grupların


ortalamaları arasındaki farklardan doğan değişkenliği ölçer. Gruplar arası varyans
ne kadar büyük ise, grup ortalamalarının birbirinden farklı olma olasılığı o kadar
fazladır. HKO ise gruplar içi varyanstır. Gruplar içi varyans her gruptaki değerler
arasındaki varyansı ifade eder ve rasgele nedenlere bağlı olan değişkenliği ölçer.
Gruplar içi varyans ne kadar büyük ise, grup ortalamalarının birbirinden farklı
olma olasılığı o kadar azdır. GnKO ise toplam varyansı gösterir. Toplam varyans
gruplar arası varyans ile gruplar içi varyansın toplamına eşit değildir.

 (∑ X j ) 2   ( X ) 2 
∑X  − ∑
k
GnKT = ∑ X 2
− , GAKT = ∑   , HKO = GnKT − GAKT
j =1    
n nj n
  
Yrd.Doç.Dr.Yüksel TERZĐ 266
Çoklu Karşılaştırma Testleri
Varyans analizi ile k tane grup arasında farklılık olup olmadığı
araştırılır. Eğer gruplar arasında farklılık varsa, hangi gruplar arasında
fark olduğu çoklu karşılaştırma testleri (post-hoc test) ile yapılır. Çeşitli
çoklu karşılaştırma testleri bulunmaktadır. Bu testler aynı sonucu
vermeyebilir.

1. LSD Testi (En Küçük Önemli Fark Testi)


s2 ortak varyans olmak üzere (yani varyanslar homojen) LSD testi
aşağıdaki gibi bulunur. s2=HKO ,t(n-k),αα tablo değeri ve r tekerrür sayısı
olmak üzere:
2s 2
LSD = t
r
Eğer n’ler farklı ise
HKO HKO
LSD = t +
n1 n2
LSD değeri her grubun ortalama farkları ile karşılaştırılır. LSD
değeri küçük ise o ortalamalar birbirinden farklıdır. LSD testi deneme
başına hatayı korumaz.
Yrd.Doç.Dr.Yüksel TERZĐ 267
2. Bonferroni Testi
Varyanslar homojen ise kullanılır. Test başlangıcında α t’ye bölünür
ve tüm çalışma sonunda toplam hata 0.05 olur.
3. Tukey Testi
Varyanslar homojen ise kullanılır. Tukey testi deneme başına hatayı
korur. Muamele sayısı arttıkça deneme başına hata artmaz. Ancak Tukey
testi küçük farklara önem vermez.
s2
W = qα ,t ,v
r
Burada t muamele sayısını, v hata serbestlik derecesini, r tekerrür sayısını
ve s2 de HKO göstermektedir.
4. Dunnett Testi
Varyanslar homojen ise kullanılır. Uygulama gruplarının her biri
kontrol grubu ile karşılaştırılır. Uygulama gruplarını birbirleriyle
karşılaştırmaz.
5. Scheffe Testi
Güven sınırlarına dayalı güçlü bir testtir.
6. Tamhane’s Testi
Varyanslar heterojen ise bu test kullanılabilir.
Yrd.Doç.Dr.Yüksel TERZĐ 268
7. Duncan Testi

Sıraya dizilmiş ortalamalar arasındaki farklılıkları


ortalamanın sıralamadaki konumunu dikkate alarak
değerlendiren bir testtir.
Duncan testi birbiriyle karşılaştırılan ortalamaların
konumlarının birbirine göre önemli olduğu
karşılaştırmalarda çok sık kullanılır.

Yrd.Doç.Dr.Yüksel TERZĐ 269


ÖRNEK: Bir işletmede bulunan üç eşdeğer makine üretimi aşağıdaki
gibidir. Bu üç makine arasında fark var mıdır?
A B C
4 6 3
5 7 4
5 6 5
4 8 5
6 6 4
6 7 4
4 9 3
5 8 3
4 6 4
4 5 3 Toplam
Σx 47 68 38 153 (Σ Σx)
Σx2 227 476 150 853 (Σ Σx2)
nj 10 10Yrd.Doç.Dr.Yüksel
10 30 (Σ
TERZĐ Σn) 270
I. Kareler toplamlarının bulunması:

GnKT:Genel Kareler Toplamı

 (∑ X j ) 2   ( X ) 2 
∑X ,  − ∑
k
GnKT = ∑ X 2
− GAKT = ∑   , GĐĐK = GnKT − GAKT
j =1    
n n n
j   

GAKT: Gruplar arası kareler toplamı

GiKT: Grup içi kareler toplamı

Yrd.Doç.Dr.Yüksel TERZĐ 271


Serbestlik Derecelerinin Bulunması:

Genel serbestlik derecesi: GnSD= n-1 =30-1=29

Gruplar arası serbestlik derecesi: GASD=Grup sayısı-1=3-1=2

Grup içi serbestlik derecesi: GiSD= n-Grup sayısı=30-3=27

Kareler Ortalamasının Bulunması:

Gruplar arası kareler ortalaması:

Grup içi kareler ortalaması:

Yrd.Doç.Dr.Yüksel TERZĐ 272


Varyasyon Kaynağı Kareler Toplamı Serbestlik Derecesi Kareler Ortalaması
VK KT SD KO
GA 47.4 2 23.7
Gi 25.3 27 0.937
Gn 72.7 29 ----

Hipotezler: H0: Gruplar arası fark yoktur. H1: Gruplar arasında fark vardır.

Karşılaştırma: FHesap=25.3 FTablo = 2.35 ; 25.3 > 2.35 olduğundan H0 ret edilir.

Sonuç: Gruplar arasında fark vardır. Üç makinenin üretimi arasında


anlamlı bir fark bulunmuştur. Bundan sonra gruplar ikişer ikişer
karşılaştırılır. Bu karşılaştırmada t testi kullanılır. Bu şekilde
karşılaştırılan ortalamalar sıralanır ve önem denetimi yapılır.

Yrd.Doç.Dr.Yüksel TERZĐ 273


Önce
verilerin
normallik
testi
yapılır.
Ondan
sonra
ANOVA ya
bakılır.

Yrd.Doç.Dr.Yüksel TERZĐ 274


Yrd.Doç.Dr.Yüksel TERZĐ 275
P=0.222>0.05
olduğundan
varyanslar
homojendir.

P=0.000<0.01 olduğundan en az bir grup ortalaması diğerlerinden farklıdır.

H0 : µA=µB=µC
Yrd.Doç.Dr.Yüksel TERZĐ 276
Mean difference kısmında * işaretli grup ortalamaları birbirinden farklıdır.
Yrd.Doç.Dr.Yüksel TERZĐ 277
Buna göre A ile B ve B ile C grup ortalamaları birbirinden farklıdır.
Eğer veriler normal
dağılış göstermiyorsa,
non-parametric
testlerden Kruskal-
Wallis testi kullanılır.

Yrd.Doç.Dr.Yüksel TERZĐ 278


Test Statisticsa,b

makina
Chi-Square 19,439
df 2
Asymp. Sig. ,000
a. Kruskal Wallis Test
b. Grouping Variable: tur

Eğer ortalamalar farklı


çıkarsa, Mann-Whitney U
testi ile ikili karşılaştırmalar
yapılır. Ancak doğru bir
hipotezin red edilmesi
anlamına gelen I.Tip hata
riskinin azaltılması için
önemlilik seviyesi yapılacak
olan karşılaştırma sayısına
bölünür. Mesela önemlilik
P=0,00<0,05 Ho hipotezi kabul edilemez.
seviyesi 0.05 ise ve 3
karşılaştırma yapılacaksa,
anlamlılık seviyesi
Yrd.Doç.Dr.Yüksel TERZĐ 279
0.05/3=0.0167 alınır.
KRUSKAL-WALLIS TESTİ
Üç veya daha fazla bağımsız grup normal dağılım göstermiyorsa,
bunların ortalamaları parametrik olmayan bir test olan Kruskal-
Wallis testi ile test edilir. Eğer ortalamalar farklı çıkarsa, Mann-
Whitney U testi ile ikili karşılaştırmalar yapılır. Ancak doğru bir
hipotezin red edilmesi anlamına gelen I.Tip hata riskinin azaltılması
için önemlilik seviyesi yapılacak olan karşılaştırma sayısına bölünür.
Mesela önemlilik seviyesi 0.05 ise ve 3 karşılaştırma yapılacaksa,
anlamlılık seviyesi 0.05/3=0.0167 alınır.
Örnek : Dört gruptaki hastaların Peak Asit değerleri veriliyor. Bu dört
grup ortalamaları birbirinden farklı mıdır?
A B C D
1 20 41 88
4 3 22 41
8 52 11 131
4 18 110
2 8
4
Yrd.Doç.Dr.Yüksel TERZĐ 280
2
Yrd.Doç.Dr.Yüksel TERZĐ 281
p=0.005<0.05 olduğundan en az bir grup
ortalaması diğerlerinden farklıdır. Bunun için ikili
Karşılaştırmalar için Mann-Whitney U testine
bakılır. Anlamlılık seviyesi ise 0.05/3=0.00167
alınır.

Yrd.Doç.Dr.Yüksel TERZĐ 282


p=0.033>0.0167 olduğundan A ve B
grubu hastaların asit değerleri
Birbirinden farklı değildir. Benzer
Biçimde diğer gruplar ikili olarak
karşılaştırılır.

Yrd.Doç.Dr.Yüksel TERZĐ 283


Soru : Bir fabrikada aynı işi yapmakta olan 4 işçinin rasgele
belirlenen 6 gün içerisinde ürettikleri parça sayıları aşağıdaki
gibidir. Đşçilerin verimliliklerinin dağılımı normal ve anakütle
varyanslarının eşit olduğu kabul ediliyor. Đşçilerin günlük
ortalama verimlilikleri arasında önemli bir farklılık bulunup
bulunmadığını %1 anlamlılık düzeyinde araştırınız?

Đşçi 1 Đşçi 2 Đşçi 3 Đşçi 4


36 55 52 82
43 42 99 83
51 44 31 61
39 49 37 41
48 53 43 48
53 39 50 45

Yrd.Doç.Dr.Yüksel TERZĐ 284


k=4, n=24

H 0 : µ1 = µ 2 = µ 3 = µ 4
H1 : µ1 ≠ µ 2 ≠ µ 3 ≠ µ 4 ( En az iki ortalama farklı)

VK KT SD KO F
Gruplar arası 804 k-1=3 804/3=268 268/256.8=1.04
Gruplar içi 5136 n-k=20 5136/20=256.8
Genel 5940 n-1=23

F3,20;0.05=4.94>Fh=1.04 H0 kabul edilir.

Yrd.Doç.Dr.Yüksel TERZĐ 285


İKİ YÖNLÜ VARYANS ANALİZİ (TWO-WAY ANOVA)
İki yönlü varyans analizi, deney birimlerini iki ölçüte göre
sınıflayabildiğimizde veya etkileri farklı deneysel materyallere
uyguladığımızda aklımıza gelmelidir. Bu tür tasarımda sınıflama
ölçütü etki olurken, farklı deneysel materyaller ise blok adını alır.
Amaç etki ortalamalarının blok etkilerinden bağımsız olmasını
sağlayarak, bloklar nedeniyle ortaya çıkan değişkenlikten hata
değişkenliğini ayırmaktır. Bunun için deney birimlerinin homojen
bloklarda toplanması gerekir. 2 yönlü ANOVA’da etkileşime de
bakılır. Etkileşimle 2 faktörün dışında açıklanamayan ancak bu iki
faktörün kombinasyonları ile açıklanan farklılık öğrenilebilir.
Varsayımlar
i. kn tane anakütlenin dağılımları normal dağılıma sahip olmalıdır.
ii. Etkilerle bloklar arasında etkileşim yoktur.
X ij = µ + β i + τ j + eij
µ : Bilinmeyen bir sabit
β i : Deney birimi i bloğuna düştüğünde blok etkisi
τj:
Deney birimi j’inci etkiyi ald ığında ortaya çıkan etki
Yrd.Doç.Dr.Yüksel TERZĐ 286
eij : Etki ve blok dışındaki tüm değişkenlik kaynaklarını gösteren artık
Değişkenlik Serbestlik Kareler Kareler Ortalaması F
Kaynağı Derecesi Toplamı Oranı

Etkiler (Faktör) k-1 SSTr MSTr=SSTr/(k-1) MSTr/MSE

Bloklar n-1 SSB MSB=SSB/(n-1) MSB/MSE

Hata (n-1)(k-1) SSE MSE=SSE/(n-1)(k-1)

Toplam kn-1 SST

Yrd.Doç.Dr.Yüksel TERZĐ 287


Örnek :
Kumaş Örneği (Blok)

Kimyasal
Tür(Etki)
1 2 3 4 5

1 1,2 1,5 0,4 1,2 1,3

2 2,3 2,2 0,3 4,0 1,1

3 1,7 1,8 0,5 1,5 1,9

4 3,4 4,3 2,0 2,1 3,5

%5 anlamlılık düzeyinde kimyasalların etkileri arasında anlamlı bir farklılık olup


Olmadığını inceleyiniz?
Yrd.Doç.Dr.Yüksel TERZĐ 288
Yrd.Doç.Dr.Yüksel TERZĐ 289
FIXED FACTOS : Etkileri araştırıcı tarafından değil, bilinçli olarak seçildiği
faktörlerden oluşan modeldir.
RANDOM FACTOS : Etkileri mümkün tüm seçenekler içerisinden
tesadüfen seçildiği ve denemeye alınan faktörlerden oluşan modeldir.

Yrd.Doç.Dr.Yüksel TERZĐ 290


Yrd.Doç.Dr.Yüksel TERZĐ 291
Kimyasal etkilere bakıldığında P=0,009<0.05 olduğundan kimyasalların
etkileri arasın anlamlı bir farklılık vardır.

Yrd.Doç.Dr.Yüksel TERZĐ 292


TEKRARLI ÖLÇÜMLERDE TEK FAKTÖR VARYANS ANALİZİ
(REPEATED MEASURES)

ANOVA’nın aksine bu tür çalışmalarda kullanılan değişkenler


bağımlıdırlar. Üç çeşit tekrarlı ölçüm tasarımı yapılabilir:

i. Aynı deneklerin belirli bir değişken açısından zamana bağlı


olarak tekrarlanan ölçüm yapılması, mesela deneklerden
birden fazla kan basıncı için ölçüm alınması buna bir örnektir.
ii. Aynı deneklerin farklı tedavi biçimlerine maruz bırakılması,
mesela ağrıyı azaltmada değişik tedavi biçimlerinin
karşılaştırılması yapılabilir.
Bu iki tasarım biçimine denekler arası tasarım veya tek
faktörlü tasarım denir.
iii. Hem zamana bağlı hem de tedavi biçimini dikkate alan karışık
tasarım veya çok faktörlü tasarım kullanılabilir.örneğin değişik
tedavi biçimlerinin, hipertansiyonun zaman içindeki durumu
üzerindeki etkilerinin incelenmesi böyle bir tasarımdır. 293
Yrd.Doç.Dr.Yüksel TERZĐ
TEKRARLI ÖLÇÜMLERDE VARYANS ANALİZİ VARSAYIMLARI
1. Rasgele Örnekleme
2. Tekrarlanan Ölçümler
3. Her Faktör Seviyesinde Bağımsız Örneklemler
4. Normal anakütlelerden örneklem elde edilmesi yani faktörün her
seviyesindeki değerler normal veya normale yakın olmalıdır.
5. Varyans-Kovaryans Varsayımı (Box M testi: P>0,05 ise kovaryans matrisleri
benzerdir.), yani ölçüm değerlerinden oluşan grupların korelasyonu aynıdır.
Çünkü aynı deneklerden tekrarlanan ölçüm alındığından veriler arasında bir
korelasyon mevcuttur. Ayrıca gruplardaki varyansların eşit olması gerekir.
Bu varsayım önemlidir.
Varyansların eşit olup olmamasına Mauchly testi ile bakılır. Eğer test
sonunda P>0.05 ise varyanslar eşit demektir.
Örnek: 9 Hastanın başlangıç ve tedavi sonrası kalp atımları veriliyor. Gruplar
arasında kalp atımları açısından fark var mıdır?
Hasta ilaç yok Propranolol Plasebo Acebutolol
1 94 67 90 67
2 57 52 69 55
3 81 74 69 73
4 82 59 71 72
5 67 65 74 72
6 78 72 80 72
7 87 75 106 74
8 82 68 76 TERZĐ
Yrd.Doç.Dr.Yüksel 59 294
9 90 74 82 80
Yrd.Doç.Dr.Yüksel TERZĐ 295
Yrd.Doç.Dr.Yüksel TERZĐ 296
Mauchyl Sphericity (küresellik) testinde P=0.592>0.05 olduğundan varyans –
kovaryans varsayımı sağlanır. Eğer sağlanmasaydı Multivariate kısmındaki
testlerden biri kullanılacaktı.
Yrd.Doç.Dr.Yüksel TERZĐ 297
Dört grubun kalp atımları arasında anlamlı farklılık vardır (P<0.10). Hangi
gruplar arasında fark olduğunu bulmak için ikili karşılaştırmalar yapılır. Bunun
için eşleştirilmiş T testine bakılır. Ancak anlamlılık seviyesi karşılaştırma
sayısına bölünür (0.10/4=0.025). Mesela İlaçyok ile propranol
karşılaştırıldığında aralarında anlamlı fark olduğu görülür.

Yrd.Doç.Dr.Yüksel TERZĐ 298


TEKRARLI ÖLÇÜMLERDE İKİ FAKTÖR VARYANS ANALİZİ

Varsayımlar:
- Rasgele örnekleme
- Tekrarlanan ölçümler
- Bağımsız örneklemler
- Normallik şartı
- varyans-kovaryans varsayımı
(grupların korelasyonu aynı olmalı
ve gruplardaki varyansın eşit olması)
- Tüm anakütle varyansları eşit olmalı

Yrd.Doç.Dr.Yüksel TERZĐ 299


-Graphs /Boxplot/clustered/data in chart are/Summarize os separate variable
/Define/Boxes represent:haafta1, ay1, ay3, ay6/category Axis (G)/Ok
Yrd.Doç.Dr.Yüksel TERZĐ 300
Her bir zaman periyodu eşit
varyansa sahiptir. (P>0,05)

Box’s M varyansın homojenliği


İle ilgili çok boyutlu bir testtir.
Eğer P>0,05 ise varyans-
kovaryans matrisi eşittir
demektir. (tedavi grupları için
varyans kovaryans matrisi
aynıdır.)

Yrd.Doç.Dr.Yüksel TERZĐ 301


Eğer Mauchly testinde P>=0,05 ise univariate yaklaşımı, değilse multivariate
yaklaşım kullanılır. Genelde de Pillai’s kullanılır.

Yrd.Doç.Dr.Yüksel TERZĐ 302


4 zaman grubu birbirinden önemli düzeyde farklıdır. Ayrıca tedavi gruplarının
zaman ile etkileşimleri anlamlıdır (p<0,01).

Yrd.Doç.Dr.Yüksel TERZĐ 303


Tedavi grupları arasındaki farkı bulmak için tek yönlü anova yapılır. Burada
önem seviyesi 0,10/4=0,025 alınır.

Yrd.Doç.Dr.Yüksel TERZĐ 304


NORMAL DAĞILMAYAN TEKRARLI ÖLÇÜMLERDE ÜÇ VEYA DAHA FAZLA
GRUP İÇİN UYGULANAN TESTLER: FRIEDMAN TESTİ

Burada gruplar tekrarlı ölçümlü olduğundan bağımlıdırlar. Fridman testi


için aşağıdaki varsayımlar geçerlidir:
1. Rasgele Örnekleme
2. Tekrarlanan Ölçümler
3. Her gruptaki örneklemler kendi içinde bağımsız olmalıdır.

H0 : Herhangi bir denek ile ilgili gözlemlerin bütün muhtemel sıralamaları eşittir.
Yada gruplardan hiçbirisi diğerinden daha büyük değer oluşturmaz.

Örnek: Perikardiyal olan hastaların perikart içi basınç değerleri veriliyor.


Hasta Tamponade Orta Tam
1 17 7 0
2 18 8 0
3 16 5 3
4 10 5 0
5 13 0 0
6 14 8 5
7 10 5 0
8 18 8 0
9 12 6 -1
Yrd.Doç.Dr.Yüksel TERZĐ 305
Yrd.Doç.Dr.Yüksel TERZĐ 306
P<0.10 olduğundan en az bir grup
diğerlerinden farklıdır. Bunun için ikili
karşılaştırmalara bakılır ve anlamlılık
seviyesi yine karşılaştırma sayısına bölünür
(0.10/3=0.033). İkili karşılaştırma için
Wilcoxon testi kullanılır. Çünkü gruplar
bağımlıdır.

Yrd.Doç.Dr.Yüksel TERZĐ 307


KORELASYON
Korelasyon analizinde iki veya daha çok sayıda
değişken arasında bir ilişki bulunup bulunmadığı, eğer
varsa bu ilişkinin derecesi ve fonksiyonel şekli
belirlenmeye çalışılır. Örneğin reklamların satışı
arttırdığı şeklinde bir düşünce yaygındır. Ancak
satışların artışı sadece reklamlar ile açıklanamaz.
Nüfus artışı, moda, fiyat rakiplerle rekabet satışları
etkileyen diğer nedenler olarak düşünülebilir. Öyle ise
reklamlar ile satış arasında ilişkinin olup olmadığı
incelenmelidir.

Yrd.Doç.Dr.Yüksel TERZĐ 308


Doğrusal Korelasyon:

Bir değişkenin değeri artarken diğer değişkenin değeri düzenli


artıyor veya eksiliyorsa iki değişken arasındaki ilişki doğrusaldır.
Đlişki grafik üzerinden de incelenebilir.

Korelasyon=+1 Korelasyon=-1 Korelasyon=0

Yrd.Doç.Dr.Yüksel TERZĐ 309


Doğrusal korelasyonun hesaplanmasında Pearson Momentler
Çarpımı korelasyonu kullanılır. Bu formülün uygulanabilmesi için
veriler en az aralıklı ölçekle toplanmalı ve süreklilik gösteren nicel
bir değişken olmalıdır.

Korelasyon katsayısının değeri -1 ile +1 arasında değişir. Sonucun


+1 çıkması iki değişken arasında kuvvetli olumlu ilişkinin
bulunduğunu, -1 ise kuvvetli olumsuz ilişkinin bulunduğunu
gösterir. Korelasyon katsayısı 0 'a yaklaştıkça ilişkinin kuvveti
zayıflar, sıfır ise iki değişken arasında ilişkinin olmadığını
gösterir. Yrd.Doç.Dr.Yüksel TERZĐ 310
Korelasyon katsayısının önem denetimi:
Hesaplanmış olan korelasyon katsayısının tesadüfi mi
yoksa gerçek bir ilişkiyi mi gösterdiğinin belirlenmesi
için denetlenmesi gerekir.Denetim için kurulan
hipotezler H0 : j=0 ; H1 : j ≠ 0 şeklinde belirlenir. Test
istatistiği şu formüle göre hesaplanır,

r:Korelasyon katsayısını belirtir.

Yrd.Doç.Dr.Yüksel TERZĐ 311


ÖRNEK: Aşağıda bir işletmede gün olarak kullanılan izin (X) ile performans puanları (Y) verilmiştir. Bu iki
değişken arasında ilişki var mıdır?

X Y X2 Y2 XY
1 14 1 196 14
2 13 4 169 26
3 12 9 144 36
3 13 9 169 39
2 11 4 121 22
1 12 1 144 12
4 12 16 144 48
5 11 25 121 55
4 14 16 196 56
3 13 9 169 39
6 12 36 144 72
5 12 25 144 60
10 10 100 100 100
9 11 81 121 99
1 14 1 196 14
8 11 64 121 88
9 10 81 100 90
7 9 49 81 63
6 12 36 144 72
7 10 49 100 70
Yrd.Doç.Dr.Yüksel TERZĐ 312
Sx 96 Sy 236 Sx2 616 Sy2 2824 Sxy 1075
Elde edilen sonuca göre kullanılan izin miktarı ile performans
puanları arasında negatif yönlü kuvvetli ilişki vardır. Kullanılan izin
miktarı arttıkça performans puanları düşmektedir. Bulunan korelasyonun
gerçekten önemli olup olmadığı incelenirse

Hipotezler, H0 : j=0 ; H1 : j ≠ 0

Serbestlik derecesi :(n-2)=20-2=18

ZHesap> ZTablo; 4.8>2.1 olduğundan H0 reddedilir.

Sonuç: Bulunan korelasyon önemlidir veTERZĐ


Yrd.Doç.Dr.Yüksel tesadüfi değildir.(t=4.8, p<.05)
313
Yrd.Doç.Dr.Yüksel TERZĐ 314
Yrd.Doç.Dr.Yüksel TERZĐ 315
REGRESYON ANALĐZĐ
Regresyon analizinin temelinde; gözlenen bir olayın
değerlendirilirken, hangi olayların etkisi içinde olduğunun
araştırılması yatmaktadır. Bu olaylar bir veya birden çok olacağı
gibi dolaylı veya direkt etkileniyor da olabilirler.
Regresyon analizi yapılırken, gözlem değerlerinin ve
etkilenilen olayların bir matematiksel gösterimle yani bir fonksiyon
yardımıyla ifadesi gerekmektedir. Kurulan bu modele regresyon
modeli denilmektedir. Regresyon analizi incelenirken, genellikle
konusunu oluşturan, etkilendiği olaylara değişkenler adı verilir ve
bu değişkenlerin yer alacağı matematiksel model incelenir.
Đstatistikte değişkenler arasındaki ilişkinin derecesini
gösteren katsayıya korelasyon, değişkenler arasındaki ilişkinin
fonksiyonel şeklini belirleyen denkleme ise regresyon denklemi
denir.
Yrd.Doç.Dr.Yüksel TERZĐ 316
Regresyon modelinin kullanılması, ilgilenilen olayla ilgili olarak,
bir sebep-sonuç ilişkisi bulunması gerekmektedir. Örneğin 1990-1997
yılları arasındaki hisse senedi fiyatlarını incelersek, seçilen zaman
aralığında bir matematiksel model kurma gereği vardır ve bu modelde
bir sebep, sonuç ilişkisi aranmaktadır. Sebep, hisse senedinin fiyatını
yükselten veya düşüren unsurlardır. Faiz oranları, ekonomik nedenler,
enflasyon oranları vs. olarak incelenebilir. Sonuç ise hisse senedinin
fiyatının değişmesidir.

Sebep-sonuç ilişkisi, regresyon modeli kurulurken, bağımlı ve


bağımsız değişkenler olarak anlatılmaktadır. Yukarıdaki hisse senedi
fiyatı sonuç olan bağımlı değişken, faiz oranları, ekonomik nedenler,
enflasyon oranları vs. sebep olan bağımsız değişkenlerdir.
Regresyon analizi yapılırken kurulan matematiksel modelde yer alan
değişkenler bir bağımlı değişken ve bir veya birden çok bağımsız
değişkenden oluşmaktadır.

Bağımsız değişkenler kurulacak modelde bir değişkenli olarak ele


alınırsa basit doğrusal regresyon, birden fazla bağımsız değişkenli
Yrd.Doç.Dr.Yüksel TERZĐ 317
olarak alınırsa çoklu regresyon modeli konusunu oluşturmaktadır.
Basit Doğrusal Regresyon Modeli: Y = a + bX + ei
Çoklu Regresyon Modeli: Y = a + bX1 + cX2 + dX3 + ... + ei
Y: Bağımlı değişken
X1 , X2 , X3 , .... : Bağımsız değişkenler
a, b, c, d, … : Katsayılar
ei : Hata terimi
(∑ X )(∑ Y )
∑ XY − SS XY
b=
ˆ n =
2 SS XX
2 ( ∑ X )
∑X −
n

aˆ = Y − bˆ X
Yrd.Doç.Dr.Yüksel TERZĐ 318
BASİT DOĞRUSAL REGRESYON DENKLEMİN VARSAYIMLARI
1. Bağımsız değişkenin değerleri sabit ve rassal olabilir.
2. Bağımsız değişkenin ölçüm hataları ihmal edilebilecek kadar
küçüktür.
3. Her X değeri için Y değerlerinden oluşan bir alt küme vardır.
Bu alt kümelerin dağılımı normaldir.
4. Bu alt küme değerlerinin (Y’lerin) varyansları eşittir.
5. Bu alt kümelerin ortalamaları aynı doğru üzerindedir Bu
varsayım doğrusallık varsayım olarak bilinir.

Hata Terimi (ei) Varsayımları


1. Rassal hataların beklenen değeri sıfırdır. E( ε )=0
2. Rassal hataların dağılımı normaldir.
3. ε ’ların olasılık dağılımının varyansı sabittir.
4. Farklı Y değerlerine ilişkin rassal hatalar birbirinden
bağımsızdır.
Yrd.Doç.Dr.Yüksel TERZĐ 319
ÇOKLU DOĞRUSAL REGRESYON

Çoklu regresyon çözümlemesinde bağımlı değişken ile bağımsız


değişkenler arasındaki ilişkiyi matematiksel modelle açıklayarak,
bağıntılar bulmak ve bağımsız değişkenler yardımı ile bağımlı değişkenin
kestirimi yapılır.

y = β 0 + β1 x1 + β 2 x2 + L + β p x p + ε
Modelde amaç;
• Bağımsız değişkenler yardımı ile bağımlı değişkeni kestirmek,
• Bağımsız değişkenlerden hangisi-hangilerinin bağımlı değişkeni daha
çok etkilediğini bulmak ve aralarındaki karmaşık yapıyı tanımlamaktır.

H 0 : β1 = β 2 = L = β p = 0
H1 : En az bir β j ≠ 0
Yrd.Doç.Dr.Yüksel TERZĐ 320
Çoklu Doğrusal Regresyona
İlişkin Varsayımlar

1. Normal dağılım
2. Doğrusallık
3. Hata terimlerinin ortalaması sıfırdır
4. Sabit varyans
5. Otokorelasyon olmaması
6. Bağımsız değişkenler arasında çoklu bağlantı
olmaması

Yrd.Doç.Dr.Yüksel TERZĐ 321


Yrd.Doç.Dr.Yüksel TERZĐ 322
Yrd.Doç.Dr.Yüksel TERZĐ 323
Collinearity Diagnostics : Bağımsız değişkenler arasında doğrusal bir ilişki olup
olmadığını araştırır.
Model Fit : Modele eklenen ve modelden çıkarılan değişkenler incelenir. R2 ler
ve varyans tablosu analiz edilir.
Durbin Watson : Otokorelasyonu test eder. 0-4 arasında değerler alır. DW
değeri 1.5-2.5 arasında ise otokorelasyon olmadığını gösterir. 0’a yakın ise
pozitif korelasyonu yani b katsayılarının s.hatalarının çok küçük olduğunu, 4’e
yakın değerler ise negatif korelasyonu yani b katsayılarının s.hatalarının çok
büyük olduğu anlamına gelir. Yrd.Doç.Dr.Yüksel TERZĐ 324
ZPRED : Standartlaştırılmış tahmini değerler
ZRESID : Standartlaştırılmış artıklar (residual)
DRESID : Silinen artıklar
ADJPRED : Düzeltilmiş tahmini değerler
SRESID : Student artıklar
SDRESID : Student silinen artıklar

Histogram ve normal probability plot kısmından çoklu normal dağılım ve


doğrusallık varsayımı kontrol edilebilir.
Yrd.Doç.Dr.Yüksel TERZĐ 325
Unstandardized : Bağımlı
değişken için modelin tahmin ettiği
değerler.
Standardized: Tahmin edilen
değerin standardize edilmiş değeri
Adjusted: Düzeltilmiş tahmini
değerler.
S.E. Of mean predicrions: Tahmini
değerlerin standart hataları

Distances : Uç nokta analizleri


Mahalanobis: Bu değerin büyük
çıkması bağımsız değişkenlerin uç
değerlere sahip olduğunu gösterir.
Cook’s : Bir gözlemin regresyon
hesaplanmasından çıkarılması
Prediction Intervals sonucu katsayıların önemli oranda
Mean-Individual: Ortalama tahmini-tek değişeceğini gösterir.
bir gözlem için tahmin aralığının için alt Leverage values: Regresyonun
ve üst sınırları hesaplar. uyumu üzerindeki bir noktan
Yrd.Doç.Dr.Yüksel TERZĐ 326
ın
etkisin ölçer.
Residuals (Artıklar)
Unstandardized: Gözlenen ve tahmini
değerler arasındaki fark
Standardized: Stndardize artıklar
(Pearson residuals ~N(0,1)).
Studentized: Student artıklar
Deleted: Bağımlı değişkenin değeri ile
düzeltilmiş tahmini değer arasındaki
fark.
Studentized deleted: Silinen artığın
kendi standart hatasına bölümü

Influence Statistics (etki ist.)


DfBeta(s): Belli bir değişkenin çıkarılması sonucunda oluşan regresyon
katsayısındaki değişim.
Stan. DfBeta(s): Herhangi bir durumun çıkarılması sonucu regresyon
katsayısındaki değişim. DfFit: Belli bir değişken çıkarıldığında tahmini
değerdeki oluşan değişiklik.
StanDfFit: Herhangi bir durumun çıkarılması sonucu tahmini değerdeki
Yrd.Doç.Dr.Yüksel TERZĐ 327
değişim.
D.W.=2,5 değeri 1.5-2.5 arasında olduğundan modelde
Otokorelasyon yoktur.
Çoklu Korelasyon Katsayısı ( R ) : bağımsız değişkenler ile bağımlı değişken arasındaki
ne derece ilişki olduğunu gösteren ölçüye denir. Gözlenen yi değerleri ile tahmin edilen
yi değerleri arasındaki korelasyon katsayısıdır. R=0,937 oldukça yüksek bir korelasyon
vardır.
Çoklu Belirtme Katsayısı (R2) : Bağımsız değişkenlerin bağımlı değişkeni açıklama
yüzdesidir (R2=0.878). Bütün gözlemler regresyon doğrusu üzerinde yer alırsa R2=1,
eğer bağımlı ve bağımsız değişken arasında hiç doğrusal ilişki yoksa R2=0 olur. R2
modelin uyum iyiliği ölçütü olup, R2=0 olması değişkenler arasında ilişki olmaması
anlamına gelmez. Yani değişkenler arasında doğrusal ilişki olmadığını gösterir.
Düzeltilmiş R2 : Regresyon denklemine ilgisi olmayan bağımsız değişkenler
eklendiğinde, çoklu belirtme katsayısında düzeltme yapılır. Örneklem R2 modelin
anakütleye ne kadar uyduğu ile ilgilidir. Bunun için düzeltilmiş R2 kullanılarak modelin
anakütleye uyum iyiliği daha iyi yansıtılır. Düzeltilmiş R2 açıklayıcı değişken sayısı çok
olduğunda kullanılmalıdır.

 2 p  n − 1  Std.Error of the Estimate : Artıkların standart


R2
= R −   hatas ı (regresyon denkleminin s.h.)
− − −
düz Yrd.Doç.Dr.Yüksel TERZĐ 328
 n 1  n p 1 
ANOVA tablosu modelin bir bütün olarak anlamlı olup olmadığını test
eder. P<0,05 ise kurulan regresyon modeli anlamlıdır.

Yrd.Doç.Dr.Yüksel TERZĐ 329


Regresyon modeli: Y= =-58,15+0,357Yaş+0,687Boy+0,655Ağırlık
Standardized Coefficients-Beta: Beta bağımsız değişkenlerin önem sırasını
gösterir. İşarete bakmadan en yüksek Beta değerine sahip olan değişken en
önemli bağımsız değişkendir.

Zero-order (r) : her bir bağımsız değişkenin bağımlı değişken(Y) ile


korelasyonu

Partial (kısmı) : Diğer tüm bağımsız değişkenlerin Xi ve Y üzerindeki etkisini


arıttıktan sonra bağımsız değişken ile Y arasındaki korelasyon katsayısıdır.

Part (yarı kısmı kor.) : Diğer tüm bağımsız değişkenlerin Xi değişkeni


üzerindeki etkisini arıttıktan sonra Y ile arasındaki korelasyon katsayısıdır.
Yrd.Doç.Dr.Yüksel TERZĐ 330
Bağımsız değişkenlerin bazılarının veya tümünün kendi aralarında
doğrusal ilişki içinde olması durumuna çoklu bağlantı (multicollinarity) denir. Bu
ifade doğrusal regresyon modelinden bir sapmayı ifade eder. Bu durumda
parametreler için bulunan güven aralıklarının (confidence interval) büyük
olmasından dolayı, o parametreler sıfırdan farklı değildir. Yani açıklayıcı
değişken önemsiz demektir.
Varyans enflasyon faktörü (VIF) arttıkça regresyon katsayılarının
varyansı artar. Küçük Tolerance değeri ve büyük VIF değeri varsa (VIF>5),
bağımsız değişkenler arasında çoklu bağlantı olduğunu gösterir. Bu durumda
değişkenlerden sadece birisinin modele dahil edilmesi gerekmektedir. Tabloda
boy ve ağırlığın VIF değerleri yüksek, tolerance değerleri küçük, aynı zamanda
iki değişken arasında yüksek korelasyon vardır. Bu durumda boy yada ağırlık
değişkenlerinden biri modelden çıkarılabilir.
Yrd.Doç.Dr.Yüksel TERZĐ 331
Boy ile ağırlık arasında yüksek
korelasyon vardır.

Çoklu bağlantı özdeğer ve durum indeksi (Condition Index) ve değişim oranları


(Variance Proportions) ile de bulunabilir. Ağırlık değişkeninin %1’lik değişimi 2.
özdeğerle, %21’lik değişimi 3. özdeğerler ve %77’lik değişimi 4. özdeğerle
ilişkilidir. Aynı özdeğerde yüksek oranı olan değişkenlere bakılır. 4.özdeğer
sabitteki varyansın %99’unu, boydaki değişimin %100’ünü, ağırlıktaki değişimin
ise %77’sini açıklar. Bu bize değYrd.Doç.Dr.Yüksel
işkenlerin birbiriTERZĐ
ile bağımlı olduğunu g österir.
332
4.özdeğerin en küçük olması ve durum indexinin ise en yüksek olması önemlidir.
Hata terimleri ve tahmin edilen değerler arasındaki serpme grafiğinde,
noktalar rasgele ve bir yığılma olmadan dağılmalıdır. Eğer noktalar bir
eğri gösteriyorsa doğrusal ilişYrd.Doç.Dr.Yüksel
ki varsayım ı sağlanmaz.
TERZĐ 333
Uç Değerler:

ZRE_1 :Standardize artıklara bakılır. Mutlak değerce 3’den


büyük olan standartlaştırılmış hata terimi değerleri uç
değerler olarak kabul edilir.

Yrd.Doç.Dr.Yüksel TERZĐ 334


Cook Uzaklığı :
Etkili gözlemlerin elde edilmesinde
kullanılır. Cook değeri 1 ve daha
büyük olan gözlemler etkili gözlem
olarak nitelenir.

Yrd.Doç.Dr.Yüksel TERZĐ 335


PROBİT REGRESYON MODELİ

Bağımlı değişkenin iki şıklı (evet-hayır, başarılı-başarısız gibi)


olduğu kategorik modeller, iki uçlu yada gölge bağımlı değişkenli
modeller olarak adlandırılır. Bu modelleri tahmin etmek için doğrusal
olasılı, Logit (lojistik) ve Probit gibi yaklaşımlar kullanılır.
Probit analizi lojistik regresyona benzer. Ancak Lojistik
regresyonda log odd lar kullanılırken, probit analizde kümülatif normal
dağılım kullanılır.

Yrd.Doç.Dr.Yüksel TERZĐ 336


KOVARYANS ANALİZİ (ANCOVA)

Kovaryans Analizi, iki veya daha fazla grupta bir sürekli (bağımlı)
değişkenin ortalamalarının karşılaştırılması sırasında, bu değişkene etki
eden başka sürekli değişkenin etkisinin ortadan kaldırılması veya bu
etkinin arıtılması maksadıyla kullanılan bir tekniktir.
Bu analizin avantajı sonuçtaki hata varyansını azaltma ve denekler
arasındaki diğer farklılıkları dikkate alarak, grup farklılıklarını ortaya
koyar. Bağımlı değişkendeki değişmeyi kontrol altına alarak, hata
varyansını azaltır.
Kovaryans Analizinde bir bağımlı değişken olmasına karşılık,
birden fazla bağımsız değişken ve birden fazla covariate (kod değişken)
olabilir.
Üç grup hastanın sağlık durumu karşılaştırıldığında ve yaş da
önemli olarak görülüyorsa, yaş değişkeni kontrol altında tutularak
ANCOVA yapılabilir. Böylece yaştaki değişmelerden kaynaklanan
değişiklik açıklanmış olur.

Yrd.Doç.Dr.Yüksel TERZĐ 337


KOVARYANS ANALİZİ İÇİN VARSAYIMLAR

 Gruplar bağımsız olmalıdır.

 Grupların varyansı eşit olmalıdır.

 Bağımlı değişkenin verisi oransal veya aralıklı ölçekli olmalıdır.

 Bağımlı değişken normal veya normale yakın dağılım göstermelidir.

 Kod değişken (covariate) aralıklı veya oransal veri şeklinde olmalıdır.


Eğer kod değişken nominal ise ANCOVA yapılamaz.

 Kod değişken ile bağımlı değişken doğrusal bir ilişki göstermelidir. Bu


varsayım olmazsa analizin gücü zayıf olur. Çünkü hata varyansı az
azaltılmış olur.

 Kod değişken ile bağımlı değişken arasındaki ilişkinin gücü ve yönü


her grupta benzer olmalıdır. Yani kod değişken ile bağımlı değişken
arasındaki ilişki üzerinde bağıms ız değişTERZĐ
Yrd.Doç.Dr.Yüksel kenin etkisi olmamalıdır. 338
Yrd.Doç.Dr.Yüksel TERZĐ 339
Yrd.Doç.Dr.Yüksel TERZĐ 340
P=0.204>0.05 olup
varyansların
homojenlik şartı
sağlanmış olur.

H0: iki grup için


eğim aynıdır (iki
gruptaki uyum skoru
ile hastalık skorları
doğrularının eğimi
aynıdır).
P=0.185>0.05 olup
Bağımsız değişken
ile kod değişken
arasındaki etkileşim
Bağımsız değişken (grup) ile bağımlı değişken arasında önemli değildir. Yani
ve kod değişken (hastakod) ile bağımlı değişken iki grup için eğim
arasında önemli bir ilişki vardır (P<0.05). aynıdır.
Yrd.Doç.Dr.Yüksel TERZĐ 341
Eğer kod değişken (ortak değişken) ile bağımlı değişken arasındaki ilişki
doğrusal değilse, kod değişken bağımsız değişken alınarak ANOVA yapılır veya
dönüşüm ile yeniden ANCOVA yapılabilir. Bunun için etkileşime bakılır, burada
önemsiz çıktığından ANCOVA yapılabilir.

Bağımsız değişken
(Grup) ve kod değişken
(hastakod) ile bağımlı
değişken (uyumskor)
arasında önemli bir ilişki
vardır.

Yrd.Doç.Dr.Yüksel TERZĐ 342


Grupları karşılaştırmak için, grupların düzeltilmiş
ortalamalarına akmak gerekir. Orijinal ortalamalar hemen hemen
eşittir (8,5 ve 8,00). Hastalık derecesi skoru dikkate alındığında
ise elde edilen düzeltilmiş ortalamalar çok farklıdır (14,32 ve
2,17). Buda ANCOVA’nın farkını göstermektedir.
Yrd.Doç.Dr.Yüksel TERZĐ 343
GÜVENĐLĐRLĐK ANALĐZĐ (RELIABILITY ANALYSIS)

Güvenilirlik bir ölçme aracında (testte) bütün soruların


birbirleriyle tutarlılığını, ele alınan oluşumu ölçmede türdeşliğini
ortaya koyan bir kavramdır. Ölçme araçlarının güvenilirliğini
değerlendirmek amacıyla geliştirilmiş yöntemlere Güvenilirlik Analizi
ve bu araçta yer alan soruların irdelenmesine ise Soru Analizi
(Reliability and item analysis) denir.
Testlerin güvenilirliğini analiz etmek amacıyla güvenilirlik
katsayıları hesaplanmalıdır. En çok kullanılan güvenilirlik katsayıları
Cronbach alfa katsayısı ve Kuder-Richardson katsayılarıdır.
Güvenilirlik analizi toplam puanlar üzerine kurulu ölçeklere
(Likert Ölçeği) dayalı araçların güvenirliğini ortaya koymaya yarayan
Cronbach Alfa katsayılarını hesaplar.
Temel varsayımlar:
“Her soru toplam skorun bir doğrusal bileşeni olmalıdır” ve “Ölçekte
toplanabilirlik özelliğinin bulunması gerekir”.
Yrd.Doç.Dr.Yüksel TERZĐ 344
Cronbach Alfa Katsayısı :
Alfa katsayısı ölçekte yer alan k sorunun varyansları
toplamının genel varyansa oranlaması ile bulunan bir ağırlık
standart değişim ortalamasıdır. Cronbach Alfa Katsayısı 0-1
arasında değerler alır. Sorular arasında negatif korelasyon
varsa Alfa katsayısı da negatif çıkar. Bu durum güvenilirlik
modelin bozulmasına neden olur.

Đkiye Bölünmüş Yöntem (Split Half) :


Ölçekte yer alan soruların ikiye ayrılması ve bu iki parça
arasında korelasyon hesaplanması yöntemidir.

Guttman Katsayıları : 6 katsayı hesaplanır. Güvenirliği


kovaryans yada varyans yaklaşımı ile hesaplayan bir
yaklaşımdır.
Yrd.Doç.Dr.Yüksel TERZĐ 345
Paralel Yöntem : Soruların varyanslarının eşit olduğu varsayımı
kullanılarak, en büyük benzerlik güvenirlik tahminleri yapılır.
Uygunluk için ki-kare testi kullanılır.

Kesin (Strict) Paralel Yöntem : Soru ortalamaları ve varyanslarının


eşit olduğu varsayımına göre en büyük benzerlik güvenirlik
tahminleri yapılır. Uygunluk için ki-kara testi kullanılır.

Soru ile Bütün Arasındaki Korelasyonlar Yöntemi (Item Total


Correlation)
Bir soru ile diğer soruların toplamından oluşan bütün
(total)arasındaki korelasyon hesaplanmasına dayanmaktadır. Eğer
soru-bütün korelasyon katsayısı düşük ise, o sorunun ölçeğe
katkısının düşük olduğu anlamına gelir. Eğer soru-bütün
korelasyon katsayısı çok düşük ise, o sorunun ölçekten çıkarılması
gerekir.

Yrd.Doç.Dr.Yüksel TERZĐ 346


Soru Silinirse Bütün ortalamalarının Değişimi (Means if item deleted)
Eğer soru ölçekten çıkarılırsa bireylerin soru ortalama ve standart
sapmalarının değişimi incelenir.

Soru Silinirse Güvenilirlik Katsayısı (Reliability coefficient if item


deleted) :
Ele alınan soru ölçekten çıkarıldığında güvenirlik katsayısının
değişimini incelemek amacıyla yararlanılan bir yaklaşımdır. Eğer soru
ölçekte yer almasa idi ölçeğin güvenirliği nasıl değişirdi (azalır mı?,
artar mı?) durumunu görmek amacıyla hesaplanır.

Genel olarak güvenilirlik analizinde aşağıdaki varsayımların


dikkate alınması gerekir:
1. Demografik ve sosyo-ekonomik sorular dışında birbiri ile ilişkili en
az 20 soru içermelidir.
2. Araçlar en az 50 tane rasgele seçilen denek üzerinde
uygulanmalıdır.
Sorulara verilen cevapların toplanabilir özellikte (additivity
assumption) olması gerekir. Yrd.Doç.Dr.Yüksel TERZĐ 347
Yrd.Doç.Dr.Yüksel TERZĐ 348
Item : soru Scale : ölçek

F test, Friedman chi-square, Cochran chi-square


Model uyumu ve soruların uyumluluğu için
ANOVA tablosu seçeneklerinden birisi seçilir.

Tukey’s test of additivity : Ölçekte yer alan


soruların bir toplamsal ölçek oluşturacak biçimde
hazırlanıp hazırlanmadığını, soruların skorlarının
toplanabilir olup olmadığını test eder.

Interclass correlation coefficient: Olgular


arasındaki değerlerin uyumluluğunu test eder ve
hesaplama modeli için iki yönlü rasgele (Two-way
Random) model seçilir. Mutlak uyumluluk için
test parametre değeri (Test value) sıfır olarak
seçilir.

Hotelling’s T-square : Soru ortalamalarının


birbirine eşit olup olmadığını test eder.

Alfa katsayısının değerlendirilmesi : Soru ortalamalarının birbirine eşit olup


0 -0,39 : ölçek güvenilir değil olmaması kavramı; soruların denekler tarafından
0,40-0,59 : ölçek düşük güvenirlikte aynı yaklaşım ile algılanıp algılanmadığını yani
0,60-0,79 : ölçek oldukça güvenilir soruların zorluk derecelerinin birbirine eşit olup
0,80-1,00 : ölçek yüksek derecede güvenilir bir ölçektir. olmadığıdır. Ölçek değerlendirmede soruların
%75’i orta, %12,5’i kolay ve %12,5’i de zor
nitelikte olmalıdır.
Yrd.Doç.Dr.Yüksel TERZĐ 349
Ölçekte yer alan soruların genel ortalaması (item means) 2.8276’dır. Ortalanmaların değişim aralığı
(range) 1.9598 olmaktadır.
Soru-Bütün (item-total) korelasyonlara bakıldığında -0,23 ile 0,609 arasında değişim
gösterdiği görülür. Soru ile bütün arasındaki korelasyonların negatif olmaması gerekir, hatta
0,25’den büyük olması beklenir. Yrd.Doç.Dr.Yüksel TERZĐ 350
Bir sorunun ölçekten çıkarılması için; soru silinirse Alfa katsayısında
(Alpha if Item Deleted) değişimine ve soru silinirse ortalamadaki (Scale
mean if item deleted) değişimine bakmak gerekir. Örnekte α=0,8408
bulundu (güvenilir bir çalışma demektir), eğer bir soru ölçekten
çıkarıldığında alfa katsayısı yükseliyorsa o soru güvenilirliği azaltan bir
Yrd.Doç.Dr.Yüksel TERZĐ 351
sorudur ve ölçekten çıkarılması gerekir.
Soru ortalamalarının testi sonucunda, soru ortalamaların farklı olduğu
görülmektedir (Hotelling's T-Squared = 1606,7 , Prob. = ,0000). Yani
soruların zorluk dereceleri birbirinden farklıdır.

Yapılan varyans analizi sonucuna göre ölçek toplanabilir özellikte değildir


(Nonadditivity F=447,9 P=0,0000). Ölçümler arası değişime bakıldığında
da önemli bir farklılık görülmektedir (Between Measures, F=209,65
Yrd.Doç.Dr.Yüksel TERZĐ 352
P=0,0000).
FAKTÖR ANALĐZĐ (FACTOR ANALYSIS)

Faktör analizi, birbiri ile ilişkili p tane değişkeni bir araya


getirerek az sayıda ilişkisiz ve kavramsal olarak anlamlı yeni
değişkenler (faktörler, boyutlar) bulmayı amaçlayan çok değişkenli bir
istatistiktir.
Faktör analizinin amacı, veri setini küçülterek daha kolay
açıklanabilir hale getirmektir. Faktör analizi bir çok değişkenin birkaç
başlık altında toplanması tekniğidir. Mesela bir ankette 100 madde
olsun. Anket sonucunda deneklerin; sözel, matematiksel ve analitik
kabiliyetleri değerlendirilmek istenmiştir. Faktör analizi ile
kabiliyetlerin her birisi için “faktör skoru” elde edilebilir. Analiz ile
üçten daha az veya daha fazla birbirinden farklı faktörün olup
olmadığı ortaya çıkarılır.
Faktör analizi uygulamadan önce, değişkenlerin korelasyon
matrisi incelenmelidir. Mutlak değerce 0,4’den küçük olan değişkenin
analize dahil edilmesi uygun olmayabilir.
Yrd.Doç.Dr.Yüksel TERZĐ 353
Açıklayıcı (exploratory) ve doğrulayıcı (confirmatory)
olmak üzere iki tür faktör analizi yaklaşımı vardır. Açıklayıcı
faktör analizinde, değişkenler arasındaki ilişkilerden hareketle
faktör bulmaya yönelik bir işlem; doğrulayıcı faktör analizinde
ise değişkenler arasındaki ilişkiye dair daha önce saptanan bir
hipotezin yada kuramın test edilmesi söz konusudur.
SPSS’de faktörlerin ortaya çıkarılması değişik metotlar
kullanılır. Bunlardan en yaygın kullanılanı Temel Bileşenler
(Principal Components) metodudur. Bu metotla bütün
değişkenlerdeki maksimum varyansı açıklayacak varyans
hesaplanır. Kalan maksimum miktardaki varyansı açıklamak
için, ikinci faktör hesaplanır. Bu süreç değişkenlerdeki bütün
varyansın açıklanmasına kadar devam eder. Ancak çok
faktörün olması iyi değildir. Bunun için öz değer (eigenvalue)
kullanılarak, analizde kaç faktörün kullanılacağına karar
verilir.
Yrd.Doç.Dr.Yüksel TERZĐ 354
Faktör Analizinin Adımları :
1. Bütün değişkenler için korelasyon matrisi hesaplanır.Birbiri ile
ilişkisiz olan değişkenler belirlenir. Böylece faktör modelin uygunluğu
değerlendirilir.
2. Faktör sayısı belirlenir. Bu adımda seçilen modelin veriye ne kadar
uyumlu olduğu tespit edilir.
3. Rotasyonla faktörler dönüştürülerek, daha iyi yorumlanması
sağlanır.
4. Her vaka için faktörün skoru hesaplanır.
m kadar önemli faktör “ bağımsızlık, yorumlamada açıklık ve
anlamlılık” için bir eksen döndürmesine (rolation) tabi tutulur. Eksenlerin
döndürülmesi sonrasında maddelerin bir faktördeki yükü artarken, diğer
faktörlerdeki yükleri azalır. Dik (orthogonal) ve eğik (oblique) olmak üzere
iki tür döndürme yaklaşımı vardır. Döndürme sonunda değişkenlerle ilgili
toplam varyans değişmezken, faktörlerin açıkladıkları varyans değişir.
Soysal bilimlerde genellikle dik döndürme tercih edilir. Yani faktörler
eksenin konumu değiştirilmeksizin (90 derece) döndürülür. Dik döndürme
tekniklerinden en sık kullanılan varimax ve quartimax’dır. Bu teknikler
maddelerin yüklerini bir faktörde 1’e, diğerlerinde ise sıfıra yaklaştırmayı
Yrd.Doç.Dr.Yüksel TERZĐ 355
amaçlar.
Yrd.Doç.Dr.Yüksel TERZĐ 356
Correlation Matrix
YONTEM1 YONTEM2 YONTEM3 YONTEM4 YOMTEM5 YONTEM6 YONTEM7 YONTEM8 YONTEM9 YONTEM10
Correlation YONTEM1 1,000 ,559 ,521 ,445 ,426 ,447 ,455 ,345 ,203 ,294
YONTEM2 ,559 1,000 ,568 ,554 ,407 ,449 ,508 ,402 ,246 ,305
YONTEM3 ,521 ,568 1,000 ,560 ,517 ,456 ,511 ,416 ,322 ,340
YONTEM4 ,445 ,554 ,560 1,000 ,518 ,560 ,502 ,396 ,292 ,447
YOMTEM5 ,426 ,407 ,517 ,518 1,000 ,573 ,529 ,367 ,400 ,405
YONTEM6 ,447 ,449 ,456 ,560 ,573 1,000 ,609 ,393 ,351 ,327
YONTEM7 ,455 ,508 ,511 ,502 ,529 ,609 1,000 ,571 ,436 ,436
YONTEM8 ,345 ,402 ,416 ,396 ,367 ,393 ,571 1,000 ,348 ,500
YONTEM9 ,203 ,246 ,322 ,292 ,400 ,351 ,436 ,348 1,000 ,487
YONTEM10 ,294 ,305 ,340 ,447 ,405 ,327 ,436 ,500 ,487 1,000
Sig. (1-tailed) YONTEM1 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
YONTEM2 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
YONTEM3 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
YONTEM4 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
YOMTEM5 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
YONTEM6 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
YONTEM7 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
YONTEM8 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
YONTEM9 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
YONTEM10 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000

Değişkenler arasındaki korelasyonlar genelde


Yrd.Doç.Dr.Yüksel TERZĐ iyi gözükmektedir. 357
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling
Adequacy. ,896

Bartlett's Test of Approx. Chi-Square 1489,003


Sphericity df 45
Sig. ,000

KMO örneklem yeterliliği ölçütü, gözlenen korelasyon


katsayıları büyüklüğü ile kısmi korelasyon katsayılarının
büyüklüğünü karşılaştıran bir indekstir. KMO ölçütü 0,9-1,0
arasında mükemmel, 0,8-0,89 arasında çok iyi, 0,7-0,79
arasında iyi, 0,6-0,69 arasında orta, 0,5-0,59 zayıf, 0,5’de aşağı
ise kabul edilemez. Örnekte 0,89 bulunmuş ve çok iyi olduğu
söylenebilir.
Bartlett testi ile korelasyon matrisinin birim matris olup
olmadığı test edilir.
H0 : Evren korelasyon matrisi birim matristir.
P=0,000<0,01 olduğundan yokluk hipotezi reddedilir. Yani
evren korelasyon matrisi birim matris değildir.
Yrd.Doç.Dr.Yüksel TERZĐ 358
Anti-image Matrices
YONTEM1 YONTEM2 YONTEM3 YONTEM4 YOMTEM5 YONTEM6 YONTEM7 YONTEM8 YONTEM9 YONTEM10
Anti-image YONTEM1 ,588 -,159 -,105 8,9E-04 -5,E-02 -6,E-02 -3,E-02 -7,E-03 5,5E-02 -3,1E-02
Covariance YONTEM2 -,159 ,512 -,109 -,118 1,9E-02 -7,E-03 -6,E-02 -4,E-02 4,3E-03 2,47E-02
YONTEM3 -,105 -,109 ,505 -,104 -9,E-02 1,7E-02 -4,E-02 -5,E-02 -5,E-02 2,60E-02
YONTEM4 8,9E-04 -,118 -,104 ,482 -6,E-02 -,122 -4,E-03 6,3E-03 4,6E-02 -,124
YOMTEM5 -5,E-02 1,9E-02 -9,E-02 -6,E-02 ,531 -,131 -5,E-02 1,9E-02 -8,E-02 -5,5E-02
YONTEM6 -6,E-02 -7,E-03 1,7E-02 -,122 -,131 ,487 -,137 -9,E-03 -4,E-02 4,97E-02
YONTEM7 -3,E-02 -6,E-02 -4,E-02 -4,E-03 -5,E-02 -,137 ,432 -,155 -8,E-02 -1,8E-02
YONTEM8 -7,E-03 -4,E-02 -5,E-02 6,3E-03 1,9E-02 -9,E-03 -,155 ,580 -5,E-03 -,171
YONTEM9 5,5E-02 4,3E-03 -5,E-02 4,6E-02 -8,E-02 -4,E-02 -8,E-02 -5,E-03 ,671 -,204
YONTEM10 -3,E-02 2,5E-02 2,6E-02 -,124 -5,E-02 5,0E-02 -2,E-02 -,171 -,204 ,580
Anti-image YONTEM1 ,912a -,290 -,193 1,7E-03 -8,E-02 -,112 -6,E-02 -1,E-02 8,7E-02 -5,4E-02
Correlation YONTEM2 -,290 ,898a -,215 -,237 3,7E-02 -1,E-02 -,130 -8,E-02 7,3E-03 4,53E-02
YONTEM3 -,193 -,215 ,917a -,210 -,183 3,4E-02 -8,E-02 -9,E-02 -8,E-02 4,81E-02
YONTEM4 1,7E-03 -,237 -,210 ,897a -,121 -,252 -1,E-02 1,2E-02 8,1E-02 -,234
YOMTEM5 -8,E-02 3,7E-02 -,183 -,121 ,924a -,257 -,104 3,4E-02 -,130 -9,8E-02
YONTEM6 -,112 -1,E-02 3,4E-02 -,252 -,257 ,891a -,297 -2,E-02 -8,E-02 9,35E-02
YONTEM7 -6,E-02 -,130 -8,E-02 -1,E-02 -,104 -,297 ,904a -,309 -,157 -3,5E-02
YONTEM8 -1,E-02 -8,E-02 -9,E-02 1,2E-02 3,4E-02 -2,E-02 -,309 ,890a -8,E-03 -,294
YONTEM9 8,7E-02 7,3E-03 -8,E-02 8,1E-02 -,130 -8,E-02 -,157 -8,E-03 ,865a -,327
YONTEM10 -5,E-02 4,5E-02 4,8E-02 -,234 -1,E-01 9,4E-02 -4,E-02 -,294 -,327 ,840a
a. Measures of Sampling Adequacy(MSA)

Anti-image correlation matrices’in köşegen elemanları


örneklem yeterliliğini gösterir. Makul büyüklükteki
değerler (buradaki gibi) iyi faktör analizi için geçerlidir.

Yrd.Doç.Dr.Yüksel TERZĐ 359


Communalities
Initial Extraction
YONTEM1 1,000 ,614
YONTEM2 1,000 ,655
YONTEM3 1,000 ,623
YONTEM4 1,000 ,602
YOMTEM5 1,000 ,541
YONTEM6 1,000 ,561
YONTEM7 1,000 ,643
YONTEM8 1,000 ,520
YONTEM9 1,000 ,659
YONTEM10 1,000 ,660
Extraction Method: Principal Component Analysis.

Bir değişken ile diğer bütün değişkenler arasındaki çoklu


korelasyon katsayısının karesi, değişkenler arasındaki
doğrusal ilişkinin bir diğer göstergesidir. Bu değerlere ortak
varyans (Communality) olarak verilir. Burada maddelerle
ilgili olarak verilen ortak varyansların 0,520 ile 0,660 arasında
değiştiği görülmektedir. Eğer düşük çoklu korelasyon katsayısı
varsa, bu değişken analizden çıkarılmalıdır.
Yrd.Doç.Dr.Yüksel TERZĐ 360
Total Variance Explained
Extraction Sums of Squared Rotation Sums of Squared
Initial Eigenvalues Loadings Loadings
% of Cumulative % of Cumulative % of Cumulative
Component Total Variance % Total Variance % Total Variance %
1 4,980 49,802 49,802 4,980 49,802 49,802 3,577 35,771 35,771
2 1,096 10,956 60,757 1,096 10,956 60,757 2,499 24,986 60,757
3 ,735 7,354 68,111
4 ,626 6,258 74,370
5 ,575 5,746 80,116
6 ,502 5,022 85,138
7 ,477 4,773 89,911
8 ,375 3,750 93,661
9 ,333 3,333 96,994
10 ,301 3,006 100,000
Extraction Method: Principal Component Analysis.

Total variance explained” tablosunda, rotasyona tabi


olmamış faktörlerin genel özellikleri vardır. Analizde 10
değişkenin özdeğeri 1’den büyük olan iki faktör altında
toplanmıştır. Bu iki faktörün ölçeğe ilişkin açıkladıkları
varyans %60,757 dir.

Yrd.Doç.Dr.Yüksel TERZĐ 361


Scree Plot
6

3
Eigenvalue

0
1 2 3 4 5 6 7 8 9 10

Component Number
Şekilde öz değerlerin nispi değerleri verilmiştir. Burada her faktör ile
ilişkili toplam varyans gösterilmiştir. Grafikte 1 ve 2. faktörden sonra belli
bir düşme olduğu görülmektedir. Dolayısıyla faktör sayısı 2 olarak tespit
edilir. 3 ve diğer faktörlerden sonra önemli bir düşüş eğilimi
görülmemektedir. Yani üçüncüYrd.Doç.Dr.Yüksel
ve sonraki faktörlerin varyansa katkıları
TERZĐ 362
birbirine yakındır.
Component Matrix a Rotated Component Matrix a

Component Component
1 2 1 2
YONTEM7 ,797 8,8E-02 YONTEM2 ,798 ,132
YONTEM4 ,759 -,161 YONTEM1 ,779 7,8E-02
YONTEM3 ,749 -,249 YONTEM3 ,748 ,251
YONTEM6 ,743 -9,E-02 YONTEM4 ,703 ,327
YOMTEM5 ,736 1,6E-02 YONTEM6 ,648 ,375
YONTEM2 ,717 -,374 YONTEM7 ,584 ,549
YONTEM1 ,670 -,406 YOMTEM5 ,578 ,455
YONTEM8 ,668 ,272 YONTEM9 9,1E-02 ,807
YONTEM10 ,629 ,514 YONTEM10 ,194 ,789
YONTEM9 ,557 ,590 YONTEM8 ,370 ,619
Extraction Method: Principal Component Analysis.
Extraction Method: Principal Component
a. 2 components extracted. Analysis.
Rotation Method: Varimax with Kaiser
Normalization.
Component matrix tablosunda birinci a. Rotation converged in 3 iterations.

faktör yük değerlerinin tamamı 0,557’nin Faktör döndürme sonuçları (rotated


üzerindedir. Bu bulgu ölçeğin genel bir component matrix) incelendiğinde, 1-
faktöre sahip olduğunu gösterir. 7 maddelerin ilk faktörde, 8-10
maddelerin ise ikinci faktörde daha
yüksek değerler verdiği
görülmektedir.
7. madde iki faktörde de yüksek
çıkmıştır (0,578 - 0,549) . Bu yüzden
ölçekten çıkarılması daha uygun
Yrd.Doç.Dr.Yükselolacaktır.
TERZĐ 7.madde analizden çıkarılıp
363
yeniden analiz yapılır.
LOJİSTİK REGRESYON
Bağımlı değişken mutlaka ikili sonucu olan (dikotom) değişken
olduğunda (sağ-ölü) Lojistik regresyon kullanılır. Ayrıca bağımsız
değişkenlerinde genelde sürekli olması istenir.
Lojistik regresyonda odds oranı kullanılır. Odds oranı, olma
ihtimalinin olmama ihtimaline oranı olarak tanımlanır.
Açıklayıcı değişkenlere göre cevap değişkeninin beklenen
değerleri olasılık olarak elde edilen bir regresyon yöntemidir. Normal
dağılım varsayımı yoktur. Bir olayın ihtimali aşağıdaki gibi bulunur.

Lojistik regresyonda üç temel yöntem vardır.


1. İkili lojistik regresyon (Binary logistic): İkili cevap içeren bağımlı
değişkenlerle yapılan lojistik regresyon analizidir. Ortak değişkeler
sürekli olmalıdır.
2. Sıralı lojistik regresyon (ordinal logistic) : Cevap değişkenin sıralı
ölçekli olduğu durumlarda uygulanan bir yöntem olup, en az üç
kategorisi olması gerekir(hafif-orta-ağır gibi).
3. İsimsel lojistik regresyon (nominal logistic) : Cevap değişkeni isimsel
ölçekli olup, en az üç kategoriden oluşmalıdır (fen-tıp-eğitim-iibf gibi).
Yrd.Doç.Dr.Yüksel TERZĐ 364
1
P (Y ) =
1 + exp[−(b0 + b1 X1 + b2 X 2 + L + bn X n )]
1
= , z = b0 + b1 X1 + b2 X 2 + L + bn X n
−z
1+ e

Örnek : Kayak yapmak isteyenlerle ilgili bir anket yapılıyor.


Kayak değişkeni bağımlı değişken alınmış ve evet diyenler
(1), hayır diyenler (0) alınmıştır. Tahmin edici değişkenler
olarak Atletik, yükselti ve hata alınmıştır. Atletik değişkende 0
hiç kabiliyeti olmayanları, 10 ise çok yüksek kabiliyeti
göstermektedir. Yükseklikte de yine benzer şekilde kodlama
yapılmıştır. Hata değişkeni ise evet (1) ve hayır (0) olarak
kodlanmıştır.

Yrd.Doç.Dr.Yüksel TERZĐ 365


Yrd.Doç.Dr.Yüksel TERZĐ 366
Yrd.Doç.Dr.Yüksel TERZĐ 367
Model uyum iyiliği testi:
Gözlenen değerlerin tahmin edilen
değerlerle karşılaştırması için -2logL
değerlerine bakılır. İyi model gözlenen
sonuçların yüksek ihtimallerini oluşturan
modeldir yani -2LL değerinin (sıfıra
yakınsa model mükemmeldir) küçük
olması gerekir.
Block 0 da sadece sabitin yer
aldığı model için -2LL=55.0.51 bulundu.
Block 1 de ise sabit ve tüm bağımsız
değişkenlerin yer aldığı modelin -2LL
değeri 24.313 bulunmuştur.
Model Chi-Square sadece sabiti
olan modelin -2LL değeri ile bütün
değişkenleri ihtiva eden modelin -2LL
arasındaki farkı verir. Bu istatistik ile
sabit hariç, tü m değişkenlerin
katsayılarının sıfır olduğu yokluk hipotezi
test edilir.

Yrd.Doç.Dr.Yüksel TERZĐ 368


P=0,00<0.05 olduğundan bağımsız
değişkenlerin katsayıları sıfırdan farklıdır.

Veri sayfasında tahmin edilen değerlerin


ihtimalleri pre_1 ve tahmin edilen grup üyeleri pgr_1 ile
verilmiştir.
Classification Table de görüldüğü gibi sadece 7
denek yanlış sınıflanmıştır. Tablodan kayak yapmama
kararı verenlerin %83.3’ü, yapacak olanların ise %81.8’i
doğru tahmin edilmiştir.

Yrd.Doç.Dr.Yüksel TERZĐ 369


Yukarıdaki tabloda B değerleri katsayılar olup, deneğin bir işi yada diğerini yapma
ihtimalini belirlemede kullanılır. Burada kayak yapma yada yapmama ihtimali
araştırılmaktadır. İhtimal 0.5’ten büyük ise deneğin kayak yapmaya karar verdiği tahmin
edilir.
B sütunundaki işaretler ise ilişkinin yönünü gösterir. Yani daha atletik olan ve
hatalarının söylenmesini isteyenlerin kayak yapmaya istekli olduğu, yükseklikten
korkanların ise kayak yapmaya daha az eğilimli olduğu söylenebilir.
Wald ist.=B/S.E. ile bulunur. Burada Atletik katsayı önemli (P=0,006<0.05), diğerleri
ise önemsiz bulunmuştur.
Exp(B) odds oranlarıdır. Yani kayak yapmaya karar verenlerin ihtimalinin, kayak
istemeyenlerin ihtimaline oranıdır. Mesela atletik kabiliyet bir birim artarsa ln odds 2,342 kat
artar.
İhtimal 1’e
1
1.kişi = yakın
1 + exp(−(−3,138 + 0,851X1 − 0,579 X 2 + 0,363 X 3 )) olduğundan,
birinci kişinin
1 kayak
= = 0,9968
1 + exp(+3,138 − 0,851(10) + 0,579(0) − 0,363(1))
Yrd.Doç.Dr.Yüksel TERZĐ yapacağı370
tahmin edilir.
E kayak yapanlar, H yapmayanları gösterir. Eğer E’lerin çoğu 0,5’in
sağında ve H’lerin büyük kısmı 0.5’in solunda ise doğru sınıflandırma
Yrd.Doç.Dr.Yüksel TERZĐ 371
yapılmıştır.
Yrd.Doç.Dr.Yüksel TERZĐ 372
Yrd.Doç.Dr.Yüksel TERZĐ 373
Exp(B)=OR>1 ise ve katsayısı önemli ise o değişkenler önemli bir risk faktörü
taşımaktadır. Burada tüm değişkenlerin doğum ağırlığı üzerinde etkisi yoktur.
Ancak sigara içmenin içmemeye göre düşük doğum ağırlıklı bebek doğumuna 3.9
kat daha fazla olduğu görülmektedir.
1
P(Y ) =
1 + exp(−6,88 + 0,19Yas − 1,36 Sigara + 0,027 Boy + 0,04 Kilo )

30 yaşında, 170 cm boyunda, 70 kg ve sigara içen bir annenin düşük doğum


yapıp yapmayacağını tahmin edelim. P(Y)<0.5 olduğunda düşük doğum,
P(Y)>=0.5 ise normal doğum olması beklenir.
1
P(Y ) = = 0.99
1 + exp(−6,88 + 0,19 * 30 − 1,36 *1 + 0,027 *170 + 0,04 * 70)
Yrd.Doç.Dr.Yüksel TERZĐ 374
KAYNAKLAR :
 Özdamar K. (2002). Đstatistik Paket Programlarıyla Veri Analizi 1,
Kaan Kitabevi, Eskişehir.
 Özdamar K. (1999). Đstatistik Paket Programlarıyla Veri Analizi 2,
Kaan Kitabevi, Eskişehir.
 Serper Ö. (2000), Uygulamalı Đstatistik I,II. Egi Kitabevi, Bursa.
 Ural A., Kılıç Đ. (2005). Bilimsel Araştırma Süreci ve SPSS ile Veri
Analizi, , Detay Yayıncılık, Ankara.
 Akgül A. (2003). Tıbbi Araştırmalarda Đstatistiksel Analiz
Teknikleri-SPSS Uygulamaları, Ankara
 Kalaycı Ş. Ve ark. (2005). SPSS Uygulamalı Çok Değişkenli
Đstatistik Teknikleri, Asil Yayın Dağıtım, Ankara.
 Efe E., Bek Y, Şahin M. (2000). SPSS’te Çözümleri Đle Đstatistik
Yöntemler II, Sütçü Đmam Üniversitesi Rektörlüğü, Yayın NO:10,
Kahramanmaraş.
 Çokluk Ö., Şekercioğlu G., Büyüköztürk Ş. (2010). Sosyal Bilimler
Đçin Çok Değişkenli Đstatistik, Gegem Akademi, Ankara.
 Mertler, C.A. &Vannatta, R.A.(2005). Advanced and multivariate
statistical methods: Pratical application and interpretation (Third
Ed.), Pyrczak Publishing.
 Tabachnick, B.G. & Fidel, L.S (1996).
Yrd.Doç.Dr.Yüksel TERZĐ Using multivariate statistics
375
(Third Ed.), New York.

You might also like