You are on page 1of 43

Temel İstatistik Terimleri

ve Dağılımlar
Temel Tanımlar
 Her bilim kolunda olduğu gibi istatistik de
kendine ait terimler üretmiştir. Bunlardan belli
başlılarını ilerideki konuların anlaşılmasını
sağlamak üzere tanımlayalım.
 Yığın (Population): N gözlemden oluşan geniş
veri seti
Örnek: Yüksek Lisans Öğrencileri
Örneklem: Topluktan alınan n tane gözlemden
oluşmuş grup
Örnek: GYTE’deki Yüksek Lisans Öğrencileri
 Rasgele değişken: deneydeki bir sonraki
gözlemin değeri.
Temel tanımlar
 Yığını tanımlayan bir nicelikle örneklemi
tanımlayan bir nicelik birbirinden farklıdır.
 İstatistik: Yığını temsil ettiği düşünülen verileri
kullanarak hesaplanmış nicelikler
 Parametre: Yığınla özdeşleştirilen idealize edilmiş
nicelik. Parametreler direkt olarak ölçülemezler ve
bu nedenle istatistikle tahmin edilirler.
Parametreler Yunan harfleriyle istatistikler ise
Roma harfleriyle gösterilir.
Yığın ve Örneklem

Yığın Örneklem

N: gözlem sayısı n: gözlem sayısı


Ortalama: µ Ortalama: y
Varyans: σ 2 Varyans: s2
Standard Sapma: σ Standard Sapma: s
Yığın ve Örneklem

Yığın Örneklem
Ortalama

Σyi Σy i
µ= y=
N yi: gözlem n
Varyans: belli bir gözlemin yığın ortalamasından ne kadar
farklı olduğunun ölçüsüdür.

Σ ( yi − µ ) 2 Σ ( y − y ) 2

σ2 = Deneyi yapan, yığın s2 = i

N n −1
parametrelerini
Σ ( yi − µ ) 2 örneklem istatistiği ile Σ ( yi − y ) 2
Standard
σ= elde edebilir. s=
sapma N n −1
Yığın ve Örneklem
varyans Σ ( yi − y ) 2 Bağımsızlık derecesi: ν = n-1
s =
2

n −1 varyansı hesaplarken ortalamanın


kullanılmasıyla bağımsızlık
Σ ( yi − y ) 2
s= derecesi v = n-1 olur.
Standard n −1
Bağımsızlık derecesi: bir
sapma
parametrenin hesaplanmasında
kullanılan her bir bağımsız bilgi
girdisi

Bağımsız bilgi girdisinin azalmasıyla, hesaplanan s toplam gözlem


sayısının bir eksiğine bölündüğü için örneklemdeki sapma daha
büyük olacaktır.
Ortalama ve Standard Sapma
 Verilen değerlerin ortalaması en az bir
daha fazla anlamlı basamakla
gösterilmelidir. Standard sapma ise en az
üç anlamlı basamağa kadar
hesaplanmalıdır.
 Örnek: NO3 ölçümleri = 6.9, 7.8, 7.9,7.1
 Ortalama = 7.42 mg/l
 s = 0.499
Hassasiyet, Yanlılık ve Doğruluk

Verideki Yanlılık ve
Sistematik
saçılmanın hassaslığın bir
Hatalar
derecesi fonksiyonu
Gerçek
Değer
A
Y H D
B
A Büyük İyi Az

C
B Küçük Kötü Az
D
C Büyük Kötü Az
7.5 8.00 8.5 9
D Yok İyi Çok

Yanlış ölçümler kötü hassasiyet ya da yanlılığa, veya bunların her ikisine de


sahip olan ölçümlerdir.
Yanlılık
 Yanlılık = y-µ Yığın ortalamasının (µ ) 8
mg/l olduğunu biliyorsak, yanlılık ölçüm
sonuçlarının ortalaması (y) ile 8 mg/l
arasındaki farktır. Yanlılık sistematik hataya
işaret eder. Eğer kaynağı tespit edilirse
ortadan kaldırılabilir.
Soru: Daha fazla sayıda ölçüm yapmak
yanlılığı ortadan kaldırır mı?
Hassasiyet
 Hassasiyet: Tekrar edilen ölçümler
arasındaki farklara göre belirlenir. Ölçümler
arası farklardan kaynaklanan bu saçılmalar
deneydeki rasgele (deneysel) hatalar ile
ilgilidir. Eğer hassas bir ölçüm söz konusuysa
bu hatalar küçüktür. Hata büyüklüğü daha
fazla sayıda ölçüm yapıp ortalaması alınarak
sağlanabilir.
 Soru: Deneysel hatalar tamamen ortadan
kaldırılabilir mi?
Deneysel Hatalar (gürültü)
 Gerçek değer µ ve ölçülen değer yi ise
 Yi = µ + ei
 ei: hata payı, gözlemlerdeki dalgalanma ya da bir
deneyden diğerine değişen fark. Bir yanlışlık,
yanlılık, bir gaf değil, istatistiksel ölçmenin
kaçınılamaz bir sonucudur.
 Aletin durumu Deneysel
 Kullananın becerisi hatanın
kaynakları
 Numune alma sırasındaki hatalar
 Ortam şartlarındaki farklılıklar
Normallik,Rastsallık ve Bağımsızlık
 Birçok istatistiksel işlemin dayandığı üç önemli
özellik
 Normallik
 Rastsallık
 Bağımsızlık
 Normallik: ölçümdeki hatalar normal olasılık
dağılımından gelir. Bu da hatanın bir çok nedeni
olduğu ama hiçbirinin diğerine baskın olmadığı
varsayımına dayanır. Her zaman olmamakla
birlikte çoğunlukla bu varsayım geçerlidir.
Rastsallık
 Rastsal, bir yığına ait gözlemlerden
rasgele birinin çekilmesi durumunda,
yığındaki her bir elementin eşit çekilme
şansı olması demektir.
 Rastsallık terimi aksi söylenmediği
takdirde, genellikle yanlılık veya bir
korelasyonun olmadığı anlamına gelir.
Ölçüm No NO3 Kons
1 6.9
2 7.8
3
4
8.9
5.2
Örnek
5 7.7
6 9.6
7 8.7 Bir laboratuarın nitrat ölçüm işlemleri 8.0 mg/L lik
8 6.7 olduğu bilinen 27 numuneyi laboratuara gönderip
9 4.8 ölçtürerek değerlendiriliyor. Sürekli ve çok sayıda
10 8 ölçümün yapıldığı laboratuarda teknik elemanlar
11 10.1 bunun bir değerlendirme olduğunu bilmiyorlar. 27
12 8.5
numunede bulunan NO3 değerleri yandaki tabloda
13 6.5
sıralanmıştır.
14 9.2
15 7.4 Yığın: 8.0 mg/L lik konsantrasyona sahip olduğu
16 6.3
bilinen tüm örnekler
17 5.6
18 7.3 Örneklem: Yığından alınan 27 tane numune ölçümü
19 8.3
20 7.2
Örneklem Büyüklüğü: n = 27
21 7.5
Bu laboratuarda nitrat ölçümlerindeki hata rastsal
22 6.1
mıdır?
23 9.4
24 5.4
25 7.6
26 8.1
27 7.9
Ölçüm No NO3 Kons Fark
1 6.9 1.1
2 7.8 0.2
3
4
8.9
5.2
-0.9
2.8 Örnek,Devam
5 7.7 0.3
6 9.6 -1.6 NO3 Kons
7 8.7 -0.7
8 6.7 1.3 4
9 4.8 3.2 3

Fark (mg/l)
10 8 0 2
11 10.1 -2.1 1
12 8.5 -0.5 0
13 6.5 1.5 -1
14 9.2 -1.2 -2
15 7.4 0.6 -3
16 6.3 1.7 0 10 20 30
17 5.6 2.4
18 7.3 0.7
Ölçüm No
19 8.3 -0.3
20 7.2 0.8
21 7.5 0.5
Şekilde görüldüğü gibi nitrat ölçümlerindeki
22 6.1 1.9
hatalar için rastsal diyebiliriz.
23 9.4 -1.4
24 5.4 2.6
25 7.6 0.4
26 8.1 -0.1
27 7.9 0.1
Örnek
 Ancak rastsallığın
kontrolünde deneye etki
eden tüm faktörler göz Teknisyen B
önüne alınmalıdır. 2
Örneğin nitrat
örneklerinde deneyi

kr a F
yapan kişilere göre veri 0
çizildiğinde şekildeki gibi
bir durum çıktığında
verilerin rastsallığından -2
söz edemeyiz. Teknisyen A
Bağımsızlık
 Bir dizi gözlemden bilinmeyen nedenlerden
deneysel hataların bir süre etkin olarak
kaldığını varsayalım. Öyle ki birinci gözlem
y1 yüksekse ikinci gözlem y2 de yüksek
oluyor. Bu durumda y1 ve y2 istatistiksel
olarak bağımsız değildir. Bir veri setinin
bağımsız olmaması hesaplanan varyans
değerini ciddi şekilde bozar ve normal ya da
t dağılımına bağlı olarak yapılan çıkarımlar
hatalı olabilir.
Bağımsızlık, Örnek
 Verilen nitrat verilerinin bağımsız olup olmadığı
hakkında ne diyebilirsiniz?

12
Bu örnekte ölçümler
10 birbirinden bağımsız
nitrat kons(i-1)

8 görünüyor.
6
4
2
0
0 2 4 6 8 10 12
nitrat kons (i)
Bağımsızlık
 Çevresel veriler söz konusu olduğunda, arıtma tesisi giriş
çıkış konsantrasyonları , ırmaktaki su kalitesi değerleri,
bunların bir önceki ölçüm değerinden etkilenmemesi
mümkün değildir. Çıkış kalitesi çok kötü ise bu bir süre
devam edecektir. O nedenle bu tip verileri
değerlendirirken otomatik olarak bağımsızdır varsayımını
yapamayız. Veri setinde bağımsızlıktan söz edilemiyorsa,
bu durumda özel yöntemler kullanılmalıdır.
Normal Dağılım
Deneysel hatalar yüzünden tekrar edilen ölçümler arasındaki
fark genellikle merkezi bir değerin çevresinde çan eğrisi
şeklinde simetrik ve küçük sapmaların büyük sapmalardan
daha çok olduğu bir şekilde dağılır. Bu şekilde sürekli yığın
frekans dağılımına Gaussian ya da normal dağılım denir.

N(ortalama,varyans)
N(µ ,σ 2):
N(52,144)
Standartlaştırılmış Normal Dağılım
Standartlaştırılmış normal
sapmalarla çalışmak daha
kolaylık sağlar. (veri Standard
sapma cinsinde yazılarak
orijinal ölçüm birimlerinden
bağımsız hale gelir.)

z = (y-µ )/σ
Ν ( 0,1)

1 . σ ortalama değerden büküm noktasına olan uzaklık


2. Ortalama değerden bir standartlık sapmayı geçen pozitif bir
sapmanın olasılığı 0.1587 (0.00135+0.0214+0.1359) ya da 1/6, 2
σ ’yı geçme olasılığı 0.0228 (0.0135+0.0214) (1/40), 3 σ ’yı
geçme olasılığı 0.0013 (1/750)
Örnek
Standartlaştırılmış sapmanın
1.57’den büyük olma olasılığı
kaçtır? (z değerleri tablosunu
kullanın)

z = 1.57
α = 0.0582 = % 5.82
(Excel’de, = 1-Normsdağ(z))
Verinin %10’nun üzerinde olacağı z
değeri kaçtır?

Eğrinin altındaki yeşille gösterilmiş


alana karşılık gelen z değerine bakılır.
z = 1.28
(Excel’de, = normsters(1-olasılık)
= normsters(0.90)
t dağılımı (Student’s t)
 Herhangi bir normal
değişkeni standartlaştırmak
için µ ve σ ’yı bilmemiz
gerekir. Ancak yığına ait s genellikle bilinmediğinden σ
 z = (y-µ )/σ yerine s kullanılması artıdan bir hata devreye
sokacak ve dağılım da buna göre farklı olacaktır.
İşte bu farklı dağılım 1906’da William S. Gossett
σ =s tarafından bulundu ve 1908’de yayımlandı. İngiliz
kimyacı Dublin’de bir bira fabrikasında
çalışıyordu. Ticari sırları ortaya çıkarmamak için
 t = (y-n)/s takma isim “Student” ile yayımlandı. O nedenle
Student’s T test olarak biliniyor.
t dağılımı
 Eğer örneklem büyüklüğü sonsuz ise (N
 ∞ ) t dağılımı normal dağılıma eşittir.
 Eğer örneklem büyüklüğü küçük ise
kuyruklar daha yayılmış hale gelir ve t
değerleri kullanılır.
 t tablosunu kullanırken serbestlik
derecesi(sd) gerekir. Sd (Tabloda df,
degree of freedom = N-1)
df\p 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0005
1 0.324920 1.000000 3.077684 6.313752 12.70620 31.82052 63.65674 636.6192
2 0.288675 0.816497 1.885618 2.919986 4.30265 6.96456 9.92484 31.5991
3 0.276671 0.764892 1.637744 2.353363 3.18245 4.54070 5.84091 12.9240
4 0.270722 0.740697 1.533206 2.131847 2.77645 3.74695 4.60409 8.6103
5 0.267181 0.726687 1.475884 2.015048 2.57058 3.36493 4.03214 6.8688
6 0.264835 0.717558 1.439756 1.943180 2.44691 3.14267 3.70743 5.9588
7 0.263167 0.711142 1.414924 1.894579 2.36462 2.99795 3.49948 5.4079
8 0.261921 0.706387 1.396815 1.859548 2.30600 2.89646 3.35539 5.0413
9 0.260955 0.702722 1.383029 1.833113 2.26216 2.82144 3.24984 4.7809
10 0.260185 0.699812 1.372184 1.812461 2.22814 2.76377 3.16927 4.5869
11 0.259556 0.697445 1.363430 1.795885 2.20099 2.71808 3.10581 4.4370
12 0.259033 0.695483 1.356217 1.782288 2.17881 2.68100 3.05454 4.3178
13 0.258591 0.693829 1.350171 1.770933 2.16037 2.65031 3.01228 4.2208
14 0.258213 0.692417 1.345030 1.761310 2.14479 2.62449 2.97684 4.1405
15 0.257885 0.691197 1.340606 1.753050 2.13145 2.60248 2.94671 4.0728
16 0.257599 0.690132 1.336757 1.745884 2.11991 2.58349 2.92078 4.0150
17 0.257347 0.689195 1.333379 1.739607 2.10982 2.56693 2.89823 3.9651
18 0.257123 0.688364 1.330391 1.734064 2.10092 2.55238 2.87844 3.9216
19 0.256923 0.687621 1.327728 1.729133 2.09302 2.53948 2.86093 3.8834
20 0.256743 0.686954 1.325341 1.724718 2.08596 2.52798 2.84534 3.8495
21 0.256580 0.686352 1.323188 1.720743 2.07961 2.51765 2.83136 3.8193
22 0.256432 0.685805 1.321237 1.717144 2.07387 2.50832 2.81876 3.7921
23 0.256297 0.685306 1.319460 1.713872 2.06866 2.49987 2.80734 3.7676
24 0.256173 0.684850 1.317836 1.710882 2.06390 2.49216 2.79694 3.7454
25 0.256060 0.684430 1.316345 1.708141 2.05954 2.48511 2.78744 3.7251
inf 0.253347 0.674490 1.281552 1.644854 1.95996 2.32635 2.57583 3.2905
Örnek
 20 birimli bir örneklem için verinin %5’nin büyük
olacağı t değeri kaçtır? Normal dağılımda
karşılık gelen z değeri kaçtır?
 t = 1.724 (Tablodan).
 Excel’de =tters (2*olasılık;Serbestlik derecesi) =
tters(0.1;19)
 z = tablodan = 1.64
 Excel’de =normsters (1-olasılık) =
normsters(0.95)
Ortalama ve Varyansın Dağılımı
 Tüm istatistikler rastsal değişkenlerdir ve ortalama ve bir
varyansı olan bir olasılık dağılımı ile tanımlanabilirler.
 Ortalamanın örnekleme dağılımını incelemek için n
birimli rastsal örneklemleri aldığımızı varsayalım ve her
birinin ortalamasını hesaplayalım. Bir çok farklı ortalama
y değeri elde ederiz ve olasılık dağılımı şeklinde y
dağılımını çizebiliriz. Bu ortalamanın örneklem dağılımını
verir. Eğer gözlemlerin (y) ortalama civarındaki
sapmaları rastsal ve bağımsızsa o zaman y¯’nin
dağılımını ortalaması µ ve varyans σ 2/n olacaktır.(σ 2/n
ortalamanın varyansı. )
Ortalamanın Varyansı
Yığın N σ y örneklem ortalamasının
(y¯) yığın ortalaması (µ )
civarındaki yayılımını verir. σ
ise örneklemdeki gözlemlerin
(y) µ civarındaki yayılımını
µ ,σ 2
verir.

n n Ortalamanın varyansı: σ 2/n


n
y¯3 n y¯4 Ortalamanın standart hatası: σ /√n ≈ s/√n
y¯1
y¯2

Eğer ana dağılım normalse y¯’nin dağılımı da normal olacak, normal değilse y¯
dağılımı daha normal gibi olacaktır. Ortalamanın hesaplanmasında kullanılan birim
sayısı (n) arttıkça y¯nin dağılımı normal dağılıma daha çok yaklaşır. Ortalaması µ ve
varyansı σ 2/n olan dağılımı referans dağılım gibi alıp y¯ hakkında istatistiksel
çıkarımlar yapmamızı sağlar. Örneğin y¯’nin belli bir sayıdan büyük ya da küçük olma
ya da iki sayı arasında olma olasılığının değerlendirilmesinde.
Örnek
 27 adet nitrat numune ölçümünün
ortalaması 7.51 mg/l. s = 1.383.
 Ortalamanın standart hatası kaçtır?
sy = s/ √n=0.266 mg/l

Örneklemin ortalamasının değişkenliği,


örneklemdeki gözlemlerin değişkenliğinden
daha azdır.
Karşılaştırmalar
 Eğer yığın varyansı bilinmiyorsa, ki çoğunlukla
böyledir, normal dağılımı karşılaştıracağımız
referans dağılım olarak kullanamayız. Bunun
yerine σ y yerine sy’yi yerleştirip t dağılımını
kullanırız.
 Örnek: Nitrat verisi (n=27) için y¯= 7.51 mg/l
µ = 8 mg/l. Eğer gerçek ortalama 8 mg/l ise 7.51
gibi düşük bir ölçüm ortalaması çıkma olasılığı
nedir?
Örnek, devam
7.51 − 8
y−µ t= = −1.842
t= 1.383 / 27
s/ n ν = 27 − 1 = 26
Serbestlik derecesi 26, t değeri -1.842 için α değeri (yüzde) bulunabilir.

α = 0.05 t = -1.706 t dağılımı


α = 0.025 t = -2.056 µ =8
α = 0.01 t = -2.479 α =%4 -1.842
Bu değerlerin ara-değerlemesi
(interpolasyon) ile t = -1.842’e karşılık -3 -2 -1 0 1 2 3
gelen α değeri 0.04 veya %4 bulunur.
(Excel’de = TDAĞ(1.842;26;1) Yani 8
mg/l lik bir çözeltiden yollanan 27
ölçümün ortalamasının şans eseri 7.51
çıkma olasılığı %4 gibi küçük bir
olasılıktır.
Örnek
 t referans dağılımı bir
t dağılımı
µ =8 olayın sırf şans eseri olma
α =%4 -1.842 olasılığını verir. Dağılımın
kuyruk bölgesine düşen
-3 -2 -1 0 1 2 3
bir olay sıradışı olarak
Nitrat ölçümlerin göz önüne alırsak düşünülebilir. Eğer olay
ölçüm işleminin gerçek değeri sıradışı bulunmuyorsa
altında değerler verecek şekilde buna “istatistiksel olarak
sistemli bir hataya, yanlılığa sahip
olduğu söylenebilir. Ya da yanlılık anlamlı” denir.
değil de tamamen şans eseri öyle
olduğunu kabul edebiliriz.
Anlamlılık Testleri ve Güvenlik
Aralığı
 İstatistiksel tümevarım: Bilinmeyen yığın
parametreleri hakkında deneysel veriye
dayanarak değerlendirme yapmak
 Diyelim ki gerçek yığın ortalamasının değerini
bilmiyoruz. Eğer nitrat numunesi ölçümlerinin
ortalamasını 7.51 bulduysak, yığının gerçek
ortalamasının 8.00 mg/l olma olasılığı nedir? Bu
değerlendirme için anlamlılık testleri ve güvenlik
aralığı kullanılan en yaygın iki metottur.
Anlamlılık Testleri
 1. Hipotez testi şeklinde olur:
 Hipotez testi için bir “sıfır hipotezi”, bir “alternatif
hipotez” ve bir de testin sonucunun belirleneceği
anlamlılık düzeyi değeri (α ) ‘ya ihtiyaç vardır.
Test edilecek hipotez: Ho : µ = 8 mg/l
Ho “sıfır hipotezi” veya “geçersizlik” hipotezi diye
adlandırılır.
Ha :m<8 veya m>8 (tek yönlü) veya
Ha: m≠8 (çift yönlü)
H: “alternatif hipotez”
Anlamlılık düzeyi: 0.05 (sıfır hipotezinin yanlışlıkla
reddedilme riski)
1. Hipotez Testleri, Örnek
 Nitrat ölçüm sonuçları için ortalamanın 8.0 mg/l
olduğunu α =0.05 düzeyinde test edin.
 Çözüm:
 Ho=µ =8 mg/l
 Ha=µ < 8 mg/l (tek yönlü test)
 α =0.05
7.51 − 8
t= = −1.842
1.383 / 27
 Hesaplanan t, α =0.05 yani %5 olma olasılığı olan t
istatistiğinden küçükse, Sıfır hipotezi reddedilecektir.
Serbestlik derecesi 26 için bu kritik t değeri tablodan bulunur.
 tk=t(26,0.05)=-1.706
 t<tk.
Hipotez Testleri, Örnek
 t<tk . -1.842<-1.706.
 Bu durumda alternatif hipotez lehine sıfır hipotezi
reddedilir. Yani ortalamasının 7.51 bulunduğu nitrat
ölçümlerinin ait olduğu yığının ortalamasının %5 riskle, 8
olmadığını söyleyebiliriz.

t dağılımı
µ =8
α =%5 tk-1.706

-3 -2 -1 0 1 2 3
Hesaplanan t=-1.842
Çift Yönlü Test
 Ho : µ = 8 mg/l
 Ha : µ ≠ 8 mg/l (çift yönlü test)
 α =0.05.
Bu durumda t referans dağılımının hem negatif hem de
pozitif kuyruk alanları dikkate alınır. Simetriden dolayı bu
kuyruk alanları birbirine eşittir.
0.05/2 = 0.025.
Serbestlik derecesi 26 için kritik t değeri tablodan bulunur.
 tk=t(26,0.025)=±2.056 (excel’de =tters(0.05;26))
 t = ±1.842
 t>tk (-1.842>-2.056).
 Sıfır hipotezini reddetmek için yeterli kanıt yok.
Tek Yönlü Çift Yönlü
t dağılımı t dağılımı
µ =8 µ =8
α =%5 tk-1.706 α =%2.5
tk-2.056
α =%2.5

-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3

Tek ve çift yönlü hipotez testleri sonuçları farklı çıkarımlar doğurdu, aynı ortalama,
aynı veri, aynı anlamlılık düzeyi ve aynı sıfır hipotezi kullanılmasına rağmen. Tek
fark alternatif hipotezdi, Ha. İstatistiksel olarak sıfır hipotezini reddetmek için için y-
ile µ arasındaki sapma çift yönlü testte tek yönlü teste göre daha fazla olmalıdır.

SORU: HANGİ TESTİ KULLANMALIYIZ?


Hangi Test?
 Genel olarak bir yanıtı yok. Problemin içeriği hangi testin
kullanılması gerektiğini belirler. Örneğin eğer pozitif
sapma bir sorun ama negatif sapma sorun değilse tek
yönlü test kullanılır.
 Örneğin yüksek değerler kanuna uygunluğu ihlal etmek
demek olduğu bir durumda uygunluğunu değerlendirmek
ya da verimliliği artırılması bir bir A maddesi
eklediğinizdeki durumu değerlendirmek için tek yönlü
test diğer taraftan örneğin A maddesinin verimliliği
değiştirip değiştirmediğine bakmak isterseniz çift yönlü
testi kullanabilirsiniz.
2. Güvenlik Aralığı
 Genellikle parametre değerinin hangi değerler
arasında kalacağını belirtmek daha
bilgilendiricidir.
y − tα / 2 s y < µ < y + tα / 2 s y

α = 0.05 ise, yukarıdaki ifade bize gerçek


değerin %95 ihtimalle güvenilirlik aralığı
içinde olduğunu gösterir.
Örnek
 Nitrat ölçümleri için %95’lik güvenlik aralığını
hesaplayın.
µ =8 mg/l
α =0.05
n=27
v=26
t(26,0.025)=-2.056
y = 7.51 y − tα / 2 s y < µ < y + tα / 2 s y
s y = 0.266
t dağılımı
6.96 < µ < 8.05
α =
tk-2.056 α =
%2.5 8 mg/l bu aralığın içinde.
%2.5
7.0 7.25 7.5 7.75 8.0
Özet
 Yığın: µ ,σ ,σ 2
 Örneklem, y¯,s
 Yığının parametreleri örneklemden elde edilen
istatistikler yardımıyla hesaplanır. İstatistikler
rastsal değişkenlerdir ve ortalaması ve varyansı
olan bir olasılık dağılımına sahiptirler.
 Tüm deneyler ölçüm hatasına sahiptirler. Doğruluk
hem yanlılığın hem de hassaslığın bir
fonksiyonudur. Bilimsel araştırmalarda istatistiğin
görevi hatayı nicelendirmek ve karar vermek üzere
veri kullanıldığında hatayı göz önüne almaktır.
Özet
 Eğer normal ana dağılımın ortalaması m,
varyansı σ 2 ise örneklem ortalaması y¯,
ortalaması µ ve varyansı σ 2 /n olan normal bir
dağılıma sahiptir. σ 2 bilinmiyorsa s2 ile tahmin
edilir ve t dağılımı kullanılır.
 Hipotez testleri istatistiksel tümevarım için
kullanılan bir yöntem olmakla birlikte basit bir
karşılaştırmayı bile gereksiz yere
karmaşıklaştırırlar. Güvenilirlik aralığı istatistiksel
olarak hipotez testlerinin karşılığı olup daha
basit ve anlaşılırdır. Yığın parametresinin
düşmesi gereken aralığı verir.

You might also like