P. 1
istatistik-ders notları-pau.edu.tr

istatistik-ders notları-pau.edu.tr

3.0

|Views: 30,392|Likes:
Yayınlayan: ebüyükyılmaz

More info:

Published by: ebüyükyılmaz on Oct 21, 2010
Telif Hakkı:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

06/23/2013

pdf

text

original

İSTATİSTİK

DERS NOTLARI
HAZIRLAYANLAR
YDR.DOÇ.DR.ANDIM OBEN BALCE - YRD.DOÇ.DR.SERDAR DEMİR
PAMUKKALE ÜNİVERSİTESİ
İKTİSADİ VE İDARİ BİLİMLER FAKÜLTESİ
EKONOMETRİ BÖLÜMÜ
2007, DENİZLİ
- 2 -
BÖLÜM 1 GİRİŞ
Günümüzde artık neredeyse her gün duyduğumuz “İSTATİSTİK” sözcüğü acaba gerçekte neyi
ifade etmektedir? Özellikle medyada her gün bir kısım istatistiksel bilgiler sunulmakta, doğru ya da
yanlış yorumlar yapılmaktadır. Ekonomik analizlerde, spor programlarında, seçim süreçlerinde,
sağlık konularında ve daha birçok alanda sıkça kullanılan istatistik neden bu kadar önemlidir?
Aklımıza gelen bu sorulara, bu bölümde kısaca cevap verilmeye çalışılacak, istatistiğin temel
kavramları ele alınarak bir giriş yapılacaktır.
İSTATİSTİK (STATISTICS) NEDİR?
Yaşantımızın her anında bir karar verme durumu söz konusudur. Bu kararları verirken sahip
olduğumuz bilgileri düşünce sürecinden geçirerek sonuca varmaya çalışırız. “Peki sahip
olduğumuz bilgiler her zaman yeterli midir?, Bu bilgileri nasıl elde ediniriz?” v.b. sorulara
vereceğimiz cevaplar bizi istatistiğe yönlendirecektir. İhtimallerin bu kadar çok olduğu
yaşamda elbetteki alınacak kararların, içinde bulunulan koşulların en iyi biçimde
değerlendirilerek alınması gerekmektedir. Bu değerlendirme sürecinde en güçlü yardımcı
araçlardan birisi istatistiktir. İstatistik, matematiğe dayalı olan kuramını uygulamaya geçirerek
her türlü alanda büyük katkılar sağlamaktadır. Günümüzde ekonomi, işletme, sağlık, spor,
mühendislik, genetik, astronomi, sanat v.d. hemen hemen tüm alanlarda kullanılan istatistiksel
yöntemler, hızla artan bir öneme sahiptir. Bu nedenle istatistiğin doğru biçimde anlatılması
gerekmektedir. Burada temel düzeyde istatistik konuları ele alınarak, öğrencilere günlük
yaşamlarında ya da iş yaşamlarında yararlı olacak bilgileri vermek amaçlanmaktadır .
Bir tanım olarak istatistik; belirsizlik altında bir konuda karar verebilmek amacıyla, ilgilenilen
konuya ilişkin verilerin toplanması, düzenlenmesi, özetlenmesi, çözümlenmesi ve sonuçlarının
yorumlanmasına yönelik olarak kullanılan yöntemler topluluğu olarak ifade edilebilir. Kısacası
veri bilimidir ya da verilerin dilidir.
- 3 -
ÖNEMLİ KAVRAMLAR, TERİMLER, TANIMLAR
Araştırma (Research)
İlgilenilen konuya ilişkin sorunların saptanması, çözüm yollarının planlanması, uygulamaya
konulması ve sonuçlarının değerlendirilmesine yönelik yapılan çalışmalardır. Araştırmanın
konusu ve amacı belirgin olmalıdır. Zaman, personel ve maliyet dikkate alınarak,
araştırmanın sınırı iyi belirlenmelidir. Araştırmada görev alan araştırıcılar ya da uzmanlar
yeterli bilgi düzeyine sahip olmalıdır. Araştırmanın sonucunda elde edilen bilgiler doğru
biçinde değerlendirilmelidir.
Ölçme ve Ölçü (Ölçek)
Ölçme (Measurement): Araştırma konusu ile ilgili sayısal değerleri elde etme işlemine “
ölçme” denir. Ölçme başlı başına bir çalışma alanıdır. Birçok yöntem ve teknik
kullanılmaktadır.
Ölçek(Scale): Sayısal değerleri elde etmek için kullanılan araç ya da gereçlere “Ölçek” ya
da “Ölçek ya da Ölçü” denir. Ölçek türleri aşağıda verilmektedir:
Sınıflamaya dayalı (Nominal) Ölçek: Cinsiyet (E, K); Sektör (Otomotiv, İmalat, Tarım,
Maden,...; Medeni Durum; v.b; Ülkeler; ...)
Sıralamaya dayalı (Ordinal) Ölçek: Ünvanlar, Rütbeler, Sınıflar,...
Aralıklı (Interval) Ölçek: Başlangıç ve bitiş noktası vardır. Geçme notları, Sıcaklık
ölçüleri, Zeka Ölçekleri,...
Orana dayalı (Ratio) Ölçek: Sabit bir başlangıç noktası vardır. Hacim ve ağırlık ölçüleri,
Uzaklık ölçüleri, sermaye, ...
Kitle (Yığın, Anakütle, Population)
Araştırma kapsamına giren, aynı özellikleri taşıyan birimlerin ya da bireylerin oluşturduğu
topluluğa KİTLE denir. Kitlenin büyüklüğü araştırmanın özelliğine göre değişir. Nüfus sayımı
için kitle Türkiye’dir. Denizli’deki üniversite öğrencilerinin giderleri için kitle Pamukkale
Üniversitesi öğrencileridir. Kitle büyüklüğüne bağlı olarak her zaman tüm birimler (bireyler)
hakkında bilgi sahibi olmak mümkün değildir. Bundan dolayı geniş kitlelerde araştırmalar;
zaman, maliyet, personel, ulaşım, vb. nedenlerden dolayı tüm birimler yerine daha az
sayıdaki birimler seçilerek yürütülür.
- 4 -
Örneklem (Sample) ve Örnekleme (Sampling)
Bir kitleden, belirli yöntemler kullanılarak seçilen aynı özellikleri taşıyan bir kısım bireyin
oluşturduğu topluluğa ÖRNEKLEM denir.
Örneklem seçmek için kullanılan yöntemler topluluğu ise ÖRNEKLEME olarak adlandırılır.
Örnekleme yöntemleri en genel şekliyle, Olasılığa Bağlı ve Olasılığa Bağlı Olmayan olarak
2 grubta toplanabilir.
Olasılığa Bağlı Bazı Örnekleme Yöntemleri: Basit Rasgele Örnekleme, Tabakalı
Örnekleme, Sistematik Örnekleme, Küme Örneklemesi; Sıralı Küme Örneklemesi.
Olasılığa Bağlı Olmayan Bazı Örnekleme Yöntemleri: Kota Örneklemesi, Kartopu
Örneklemesi, Uzman Örneklemesi.
Tam Sayım
Bir araştırma kapsamında, kitledeki tüm birimlerine ulaşılarak istenen bilginin elde edilmesi
işlemidir. Bunun yapılabilmesi için incelenecek kitlenin büyüklüğünün, belirlenen maliyet ve
zaman gibi kısıtlara uygun olması gerekir. Bazı durumlarda (nüfus sayımları gibi) kitle
büyük olsa bile tam sayım yapılması zorunlu olmaktadır. Gelişen teknoloji ile birlikte bu tür
tam sayımlar daha kolay yapılabilir hale gelmiştir.
Gözlem (ya da denek, Observation)
Kitle ya da örneklemde yer alan her birime gözlem ya da denek denir. Gözlem (ya da
denek) sayısı aşağıdaki biçimde simgeleştirilmektedir.
Kitledeki Gözlem Sayısı : N
Örneklemdeki Gözlem Sayısı: n
Parametre (Parameter) ve İstatistik
Kitle özelliklerinin sayısal değerlerine PARAMETRE denir. Araştırma kitle yerine örneklem
üzerinde uygulanıyorsa, parametre değerleri tahmin edilir. Bu durumda, örneklemden elde
edilen sayısal değerlere İSTATİSTİK denir. Örnek olarak, sıkça kullanılan bazı parametreler
ve istatistikler aşağıda verilmektedir:
Parametre İstatistik
Kitle Ortalaması : u Örneklem Ortalaması : x
Kitle Varyansı : o
2
Örneklem Varyansı : S
2
- 5 -
Değişken (Variable)
Nicel (kantitatif) ya da nitel (kalitatif) anlamda bir özellik ya da karakterde belirgin olarak
görülen farklılık, DEĞİŞKEN ile gösterilebilir. Bir değişken, denekten deneğe değişebilir.
Örneğin; GSMH, İhracat-İthalat Değerleri ya da miktarları, Cari Fiyat, Dolar Alış-Satış
Kurları,vb...
Değişkenlere karşılık gelen denek ya da gözlem değerlerine de VERİ denir. Veriler, tek
değişkenli, çift değişkenli ya da çok değişkenli olarak da kullanılabilir.
Değişkenler; Nicel ve Nitel değişkenler olarak sınıflandırılabilir.
Örnek: Nitel Değişkenler Nicel Değişkenler
Cinsiyet İhracat Miktarı
Medeni durum Öğrenci Sayısı
Şirket Türü TÜFE Endeksi
Ülkeler Ücretler
Değişkenler; Sürekli ve Kesikli değişkenler olarak sınıflandırılabilir.
Sürekli Değişken: Değişkenler ölçülerek ya da sıralanarak elde edilir. İki ölçüm arası
sonsuz sayıda noktaya bölünebilir. Aralık biçiminde ifade edilebilirler. Örneğin; boy
uzunluğu, kilo, fiyat, gelir,....
Kesikli Değişken: Ölçümler 0, 1, 2 gibi kesin değerler alır. Ara değerler söz konusu
değildir. Nitel değişkenler, genellikle kesikli değişkenlerdir. Örneğin; cinsiyet, yazı-tura, ülke
kodları, şirket türü, vb...
- 6 -
BÖLÜM 2 VERİLERİN ÖZETLENMESİ
Bu bölümde, veri kavramı ve verilerin özetlenmesinde kullanılan temel yöntemler ele alınacak;
çeşitli uygulamalar ile konuların daha iyi anlaşılması sağlanmaya çalışılacaktır.
Veri (Data, Datum)
Belirli amaçlar için toplanan bilgilere veri denir. Veri toplamak için farklı yöntemler kullanılabilir:
- Mevcut kaynaklardan (eski kayıtlar, arşivler, raporlar, yıllıklar, vb...) yararlanarak,
- Gözlem yaparak,
- Anket yaparak,
- Deney yaparak,
- Simülasyon yoluyla bilgisayarda yapay veri üreterek.
Temel olarak 2 tür veri vardır:
NİCEL (Quantity) VERİ: Sayısal bir ölçekle ölçülerek elde edilmiş verilerdir. Boy uzunluğu,
fiyat,..
NİTEL (Qualify) VERİ: Kategoriler biçiminde sınıflandırılabilen verilerdir. Cinsiyet, göz
rengi,...
Dağılım (Distribution)
Kitlede ya da örneklemde yer alan her değişkene ilişkin veriler, araştırma konusuna ve
araştırılan topluluğa özgü bir dağılım gösterirler. Dağılımda yer alan verilerin ortalaması
hesaplanabilir. Veriler, ortalamanın iki yanında ve farklı uzaklıklarda yer alırlar. Verilerin,
ortalamanın iki yanında ne şekilde yer aldığına ilişkin görünüme verilerin DAĞILIMI denir.
İstatistikte kullanılan dağılım kavramı genel olarak 3 başlık altında ele alınmaktadır:
i) Sıklık Dağılımları
ii) Olasılık Dağılımları
iii) Örneklem Dağılımları
Bunlar ilerleyen kısımlarda ya da bölümlerde ayrıntılı olarak ele alınacaktır.
- 7 -
SIKLIK DAĞILIMLARI
Çeşitli yollarla toplanan veriler, özellikleri hakkında bilgi edinmek amacıyla, düzenlemeler
yapılarak özet halinde sunulurlar. Uygulamalarda veri kümeleri çok sayıda gözlem
içerebilmektedir. Bu nedenle verilerin özetlenmesi, ilgilenilen olay ya da problem açısından ilk
yapılacak iş ve son derece önemli bir işlemdir. Verilerin düzenlendiği çizelgelere sıklık
çizelgeleri, verilerin gösterdiği dağılıma sıklık dağılımı denir. Verilerin yapısına (nitel, nicel,
vb...) göre sıklık çizelgeleri düzenlenir.
NİCEL VERİLERDE SIKLIK ÇİZELGELERİ
Bir araştırma sonunda elde edilen sürekli nicel veriler, düzenlenmemiş ham ya da
sınıflandırılmamış verilerdir. Aşağıda örnek olarak sunulan veriler düzenlenmemiş ham
verilerdir. Konunun daha iyi anlaşılması için bu örnek üzerinden uygulamalar yapılacaktır.
ÖRNEK: Bir finans analisti, bilgisayar donanım ve yazılım şirketlerinin Araştırma-
Geliştirme(AR-GE) faaliyetlerine ayırdıkları kaynak miktarıyla ilgilenmektedir. Bu analist
yüksek teknolojiye sahip 50 firmayı örneklem olarak belirlemiş ve bir önceki yıl gelirlerinden
AR-GE’ye ayırdıkları kaynak miktarlarını (1000 YTL) elde etmiştir. Analistin amacı bu veri
kümesini özetleyerek bir takım bilgilere ulaşmaktır. Veriler Tablo 1’de verilmiştir.
Tablo1. Firmaların AR-GE faaliyetlerine ayırdıkları kaynak miktarları
Firma
No
Miktar
Firma
No
Miktar
Firma
No
Miktar
Firma
No
Miktar
Firma
No
Miktar
1 13.5 11 8.0 21 8.2 31 9.6 41 7.1
2 8.4 12 7.9 22 8.0 32 7.2 42 13.2
3 10.5 13 6.8 23 7.7 33 8.8 43 7.7
4 9.0 14 9.5 24 7.4 34 11.3 44 5.9
5 9.2 15 8.1 25 6.5 35 8.5 45 5.2
6 9.7 16 13.5 26 9.5 36 9.4 46 5.6
7 6.6 17 9.9 27 8.2 37 10.5 47 11.7
8 10.6 18 6.9 28 6.9 38 6.9 48 6.0
9 10.1 19 7.5 29 7.2 39 6.5 49 7.8
10 7.1 20 11.1 30 8.2 40 7.5 50 6.5
Bu verilerin kaynak miktarına göre küçükten büyüğe doğru sıralanmış şekli, Tablo2’de
verilmektedir.
- 8 -
Tablo2. Sıralanmış Kaynak Miktarı Verileri
Firma
No
Miktar
Firma
No
Miktar
Firma
No
Miktar
Firma
No
Miktar
Firma
No
Miktar
45 5.2 28 6.9 43 7.7 35 8.5 9 10.1
46 5.6 38 6.9 49 7.8 33 8.8 3 10.5
44 5.9 10 7.1 12 7.9 4 9.0 37 10.5
48 6.0 41 7.1 11 8.0 5 9.2 8 10.6
25 6.5 29 7.2 22 8.0 36 9.4 20 11.1
39 6.5 32 7.2 15 8.1 14 9.5 34 11.3
50 6.5 24 7.4 21 8.2 26 9.5 47 11.7
7 6.6 19 7.5 27 8.2 31 9.6 42 13.2
13 6.8 40 7.5 30 8.2 6 9.7 1 13.5
18 6.9 23 7.7 2 8.4 17 9.9 16 13.5
Sıklık Çizelgesinin Elde Edilişi
Sıklık çizelgesinin elde edilişinde kullanılan tanımlar adımsal olarak verilerek yukarıdaki
örnekle bu tanımlar pekiştirilmeye çalışılacaktır.
Dağılım Sınırları: Bir dağılımda (veri kümesinde) yer alan en küçük ve en büyük denek
değerleridir.
En büyük değer (Maksimum): 13.5 (dağılımın üst sınırı)
En küçük değer (Minimum) : 5.2 (dağılımın alt sınırı)
Dağılım Genişliği (DG): Dağılım sınırları arasındaki farktır.
DG=En büyük değer - En küçük değer =13.5 - 5.2 = 8.3
Sınıf: Eşit ya da birbirine yakın değerli deneklerin oluşturduğu her bir gruba SINIF denir.
Sınıf sayısı, k ile gösterilir. Sınıf sayısının genellikle 7 ile 20 arasında olması istenir.
Araştırmacı tarafından belirtilen sınıf sayısı, çok sayıda veri olduğunda aşağıda verilen
Sturges’in formülü ile de bulunabilir.
k=1+3.3log(n)
Sınıfın Alt Sınırı: Bir sınıfta yer alan en küçük değerdir.
Sınıfın Üst Sınırı: Bir sınıfta yer alan en büyük değerdir.
Sınıf Aralığı: Ard Arda gelen iki sınıfın alt sınırları ya da üst sınırları arasındaki farktır. Sınıf
aralığı, c ile gösterilir. Örneğimizde sınıf sayısı 8 olarak alınsın. Bu durumda Sınıf Aralığı:
- 9 -
I SINIFSAYIS
a DG
c
+
=
a: veri kümesindeki verilerin ondalık kısmındaki hane sayısı ile ilgilidir. Örneğimizde tam
kısımdan sonra 1 hane olduğu için a=0.1 alınır.
05 . 1
8
4 . 8
8
1 . 0 3 . 8
c = =
+
=
Sınıf sayısı ve aralığı belirlendikten sonra, ilk sınıfın alt sınırı saptanır. Bu değer
genellikle dağılımın en küçük değeridir. Sınıf aralığı (c=1.1) ard arda eklenerek diğer
sınıfların alt sınırları bulunur. İlk sınıfın üst sınırı ise ikinci sınıfın alt sınırının son
hanesinden 1 çıkarılarak bulunur. Diğer sınıfların üst sınırları da ardı ardına sınıf aralığı
eklenerek bulunur.
Sıklık: Bir sınıfta yer alan denek sayısı o sınıfın sıklığıdır. f ile gösterilir. Sıklıklar toplamı
denek sayısına eşittir.
n f
n
1 i
i
=
¯
=
Örneğimizde ise k=8 tane sınıf olduğundan 50 f
8
1 i
i
=
¯
=
’dir.
Sınıflar oluşturulduktan sonra sınıfların sıklıkları bulunur. Bunun için önce her sınıfın sıklığı
işaretleme (çeteleme) ile bulunur. İşaretlerin sayısı sınıf sıklıklarını verir.
Seçilen sınıf sayısının uygun olup olmadığını tespit etmek için son sınıfta en büyük
denek değerinin yer alıp almadığın bakılmalıdır. Eğer son sınıfta en büyük denek değeri yer
almıyorsa sınıf sayısı daha büyük olmalıdır. En büyük denek değeri son sınıftan bir önceki
sınıfta da yer alabilir. Bu durumda seçilen sınıf sayısı veriler için büyüktür. Bu iki durumda
sınıf sayısı artırılır ya da azaltılır.
Sınıf (Orta) Değeri (m): Bir sınıfın alt ve üst sınırlarının ortalaması o sınıfın sınıf değeri ya
da sınıf orta değeridir. Sınıf değeri bir sınıfı tek bir değerle temsil eder ve m ile gösterilir.
k ,..., 2 , 1 i ,
2
ÜS AS
m
i i
i
=
+
=
AS
i
: i.sınıfın alt sınırı
ÜS
i
: i.sınıfın üst sınırı
Göreli Sıklık(Sıklık Yüzdesi): Her sınıfa düşen denek sayısının toplam denek sayısına
göre yüzdesidir. Göreli Sıklıklar p
i
ile gösterilir. Toplamları 1 olmalıdır.
- 10 -
k ,..., 2 , 1 i ,
n
f
p
i
i
= = 1 p
n
1 i
i
=
¯
=
Çizelge1. AR-GE faaliyetleri için ayrılan kaynak miktarı verileri için sıklık çizelgesi
Sınıf
Alt Sınır
(AS)
Üst Sınır
(ÜS)
Sınıf Orta Değeri
(m
i
)
Çeteleme
Sıklık
(f
i
)
Göreli Sıklık
(p
i
=f
i
/n)
1 5.20 6.24 (5.15+6.24)/2=5.72 //// 4
0.08
2 6.25 7.29 6.77 ///// ///// // 12 0.24
3 7.30 8.34 7.82 ///// ///// /// 13 0.26
4 8.35 9.39 8.87 ///// 5 0.10
5 9.40 10.44 9.92 ///// // 7 0.14
6 10.45 11.49 10.97 ///// 5 0.10
7 11.50 12.54 12.02 / 1 0.02
8 12.55 13.59 13.07 //// 3 0.06
Toplam: 50 1.00
Çizelge 1 için örnek yorumlar:
İkinci sınıfta AR-GE’ye 6.25 ile 7.29 bin YTL arasında yatırım yapan firmalar yer alır ve bu
sınıftaki firmalar ortalama 6.77 bin YTL AR-GE’ye yatırım yapar.
AR-GE’ye yatırım yapan 50 firmanın 12 tanesi ya da %24’ü AR-GE’ye ortalama 6.77 bin
YTL yatırım yapmışlardır.
AR-GE’ye yatırım yapan firmaların %24’ü AR-GE’ye tahminen ortalama 6.77 bin YTL
yatırım yapmaktadırlar. (kitle için yorum)
Sınıf Ara Değerleri (SA): Sınıflar arasındaki değerlerdir. Birinci sınıfın üst sınırı ile ikinci
sınıfın alt sınırının ortalaması, birinci sınıf ile ikinci sınıf arasındaki sınıf ara değerini verir.
İlk sınıfın ara değeri birinci sınıftan önce bir sınıf varmış diye kabul edilerek, hesaplanın
birinci ve ikinci sınıflar arasındaki değerinden sınıf aralığı (c) çıkarılarak bulunur. Son sınıf
ara değeri ise, sanki son sınıftan sonra bir sınıf daha varmış gibi kabul edilerek, hesaplanan
son sınıf ara değerine sınıf aralığı (c) eklenerek bulunur. Sınıf ara değerlerinin sayısı
(k+1)’dir.
Birikimli Sıklık: Sınıf sıklıklarının üst üste eklenmesi ile oluşan sıklıklar birikimli sıklıklardır.
Den Daha Az Birikimli Sıklık: Sınıf ara değerinden daha az değeri olan sınıf sıklıklarının
birinci sınıftan başlayarak eklenmesi ile elde edilir.
Den Daha Çok Birikimli Sıklık: Sınıf ara değerinden daha çok değeri olan sınıf
sıklıklarının birinci sınıftan başlayarak eklenmesi ile elde edilir.
Bir sınıf ara değerine karşı gelen den daha az ve den daha çok birikimli sıklıklar toplamı
denek sayısına eşittir. Birikimli sıklıklar denek sayısına oranlanırsa den daha çok birikimli
- 11 -
sıklık yüzdeleri ve den daha çok birikimli sıklık yüzdeleri elde edilir. Birikimli sıklık
yüzdeleri sınıf ara değerinden daha az ya da daha çok büyük değerli denek değerlerinin
yüzdesini verir.
Alt sınır, üst sınır, sınıf değeri, sıklık ve göreli sıklık bilgilerinin oluşturduğu çizelgeye Sıklık
Çizelgesi (Çizelge 1) ve Alt sınır, üst sınır; sınıf ara değeri, birikimli den daha az ve den
daha çok sıklıklar ve birikimli den daha az ve den daha çok sıklık yüzdelerinden oluşan
çizelgeye Birikimli Sıklık Çizelgesi denir(Çizelge 2).
Çizelge2. AR-GE faaliyetleri için ayrılan kaynak mikatarı verileri için Birikimli Sıklık Çizelgesi
Birikimli Sıklıklar Birikimli Sıklık Yüzdeleri
Sınıf AS ÜS
Sınıf Ara
Değeri
fi Den Daha
Az
Den Daha
Çok
Den Daha
Az
Den Daha
Çok
5.145 0 50 0.00 1.00
1 5.20 6.24 4
6.245 4 46 0.08 0.92
2 6.25 7.29 12
7.295 16 34 0.32 0.68
3 7.30 8.34 13
8.345 29 21 0.58 0.42
4 8.35 9.39 5
9.345 34 16 0.68 0.32
5 9.40 10.44 7
10.445 41 9 0.82 0.18
6 10.45 11.49 5
11.495 46 4 0.92 0.08
7 11.50 12.54 1
12.545 47 3 0.94 0.06
8 12.55 13.59 3
13.595 50 0 1.00 0.00
Çizelge 2 için örnek yorumlar:
50 firmadan sadece 4 tanesi ya da %8’i AR-GE’ye 6.245 bin YTL’den daha az yatırım
yapmıştır.
AR-GE’ye yatırım yapan firmalardan tahmini olarak %8’i AR-GE’ye 6.245 bin YTL’den
daha az yatırım yapmaktadır. (kitle için yorum)
50 firmadan sadece 46 tanesi ya da %92’si AR-GE’ye 6.245 bin YTL’den daha çok yatırım
yapmıştır.
AR-GE’ye yatırım yapan firmalardan tahmini olarak %92’i AR-GE’ye 6.245 bin YTL’den
daha çok yatırım yapmaktadır. (kitle için yorum)
Dikkat: Rakamların geldiği yerlere dikkat ederek benzer yorumlar diğer sınıflar içinde
yapılabilir.
Veriler ondalıklı değil ise sınıf ara değerinin anlamı yoktur. Çizelge2’deki sınıf ara değeri
kolonu olmaz ve birikimli sıklık ve birikimli sıklık yüzdeleri alt sınır ve üst sınır değerlerine
göre yorumlanır.
- 12 -
HİSTOGRAM :
0
2
4
6
8
10
12
14
5.72 6.77 7.82 8.87 9.92 10.97 12.02 13.07
K.Miktarı
S
ı
k
l
ı
k
Çizelge1’de verilen göreli sıklık ve sınıf değerleri kullanılarak histogram çizilmiş ve yukarıda
verilmiştir. Tablodaki bilgiler görsel olarak bu histogramdan da yorumlanabilir.
Histogramdan veri dağılımının sağa çarpık olduğu gözlenmektedir. Büyük olasılık ile
verilerin ortalaması ortancadan büyüktür. Eğer ortalama ve ortanca hesaplanırsa bu
kolaylıkla görülebilir.
DAL YAPRAK ÇİZİMİ:
Veri kümesinin görsel olarak bir diğer gösterimi Dal-yaprak çizimidir.
Dal Yaprak
5 2 6 9
6 0 5 5 5 6 8 9 9 9
7 1 1 2 2 4 5 5 7 7 8 9
8 0 0 1 2 2 2 4 5 8
9 0 2 4 5 5 6 7 9
10 1 5 5 6
11 1 3 7
12
13 2 5 5
Dal kısmında ondalıktan önceki verinin tam kısmı, yaprak kısmına ise ondalıktan sonraki
kısım yazılarak dal-yaprak çizimi gerçekleştirilir. Benzer yorumlar bu çizimden de
yapılır.Veri kümesinin sağa çarpıklığı buradan da gözlenebilir. 50 firmanın çoğunluğunun
%9.9’dan daha az AR-GE’ye yatırım yaptığı söylenebilir. Bu durumdaki firma sayısı ise 40
tanedir. Grafikten yorumlar subjektif’tir. Diğer benzer ya da farklı yorumlamak mümkündür.
- 13 -
DAĞILIM POLİGONU:
0
0.05
0.1
0.15
0.2
0.25
0.3
5.70 6.80 7.90 9.00 10.10 11.20 12.30 13.40
Kaynak Miktarı
S
ı
k
l
ı
k

Y
ü
z
d
e
s
i
Enterpolasyon yöntemi ile ara değer bulma
Yukarıdaki örnekte size %9’dan daha çok yatırım firma sayısı ne olduğu sorulduğunda
tablodan direk bu soruya cevap vermeniz mümkün değil ama enterpolasyon yöntemi ile
cevap vermeniz mümkündür.
Sınıf Ara
Değeri
Den Daha çok
Sıklığı
8.345 21
9.00 X
9.395 16
21 16
21 X
) 345 . 8 395 . 9 (
) 345 . 8 9 (
÷
÷
=
÷
÷
¬
5
21 X
05 . 1
655 . 0
÷
÷
= ¬ 18 17.88 X ~ ~
Enterpolasyon yöntemi ile %9’dan daha çok yatırım firma sayısının yaklaşık 18 olduğu
bulunur. Enterpolasyon yöntemi ara değer bulmada kullanılan bir yöntemdir.
NİTEL VERİLERDE SIKLIK ÇİZELGESİ
- 14 -
SINIFLANABİLEN VERİLERDE SIKLIK ÇİZELGESİ
Sınıflanan verilerde, sınıflar bağımsız olarak elde edildiği için her sınıfa düşen denek
sayıları sıklık çizelgesini oluşturur. Sınıflar bağımsız olduğu için sıklık çizelgesinde sadece
sınıf ve sıklık, göreli sıklık kolonları yer alır.
ÖRNEK: 2003 turizm sezonunda ülkemize gelen 800 turistin ülkeye gelişte yararlandıkları
taşıt türlerine göre dağılımının sıklık çizelgesi aşağıdaki çizelgede verilmiştir.
Çizelge 3. 800 turistin yararlandıkları taşıt türlerine göre sıklık çizelgesi
Taşıt Türü Sıklık (f
i
) Göreli Sıklık (p
i
=f
i
/n)
Kara Taşıtı 220 0.275
Hava Taşıtı 380 0.475
Deniz Taşıtı 200 0.250
Toplam 800 1.000
Yorumlar:
2003 turizm sezonunda ülkemize gelen 800 turistin %47.5’i (380 tanesi) uçak ile seyahat
etmişlerdir.
2003 turizm sezonunda ülkemize gelen turistlerin yaklaşık %47.5’inin uçak ile seyahat
ettikleri tahmin edilmektedir.
Daire Dilimleri Grafiği
0.275
0.475
0.25
Kara
Hava
Deniz
SIRALANABİLEN VERİLERDE SIKLIK ÇİZELGESİ
- 15 -
Veriler belli bir sıralama ölçütüne göre sıralanabilen sınıflara ayrılır ve her sınıfa düşen
deneklerin sayısı saptanırsa sıralanabilen verilerde sıklık çizelgesi elde edilir.
ÖRNEK: Ekonomi dersinin genel sınav sonuçlarının sıklık çizelgesi aşağıdaki çizelgede
verilmiştir.
Çizelge 4. 77 öğrencinin Ekonomi sınav sonuçlarının sıklık çizelgesi
Notlar
Sıklık
(f
i
)
Göreli
Sıklık
(p
i
=f
i
/n)
Ve Daha Az
Birikimli
Sıklığı
Ve Daha Çok Birikimli
Sıklığı
F 29 0.377 29 (%37.7) 77 (%100)
C 31 0.402 60 (%77.9) 48 (%62.3)
B
2
7 0.091 67 (%87.0) 17 (%22.0)
B
1
6 0.071 73 (%94.8) 10 (%12.9)
A
2
3 0.039 76 (%98.7) 4 (%5.2)
A
1
1 0.013 77 (%100) 1 (%1.3)
77 1.000
Yukarıdaki sıklık çizelgesinden yararlanarak bazı yorumlar yapılabilir: Ekonomi dersini alan
öğrencilerin %3.9’u dersi A
2
notu ile başarmıştır. Ekonomi dersini alan öğrencilerin %62.3’ü
C ve daha yüksek not almıştır
EŞİT OLMAYAN ARALIKLI VE AÇIK UÇLU SIKLIK ÇİZELGESİ
Eşit olmayan aralıklı sıklık çizelgeleri, uçlara doğru sıklık yoğun olduğunda ya da dağılım
aşırı derecede çarpıklaştığında, uçların birinde ayrıntıların yok olduğu diğerinde gereksiz
olduğu durumlarda düzenlemelidir. Örneğin, gelir dağılımı eşit olmayan aralıklı çizelgesi
oluşturulur. Düşük gelirlerde sıklık yayılması olmasına karşın yüksek gelirlerde sıklıklar
azalır.
Eşit olmayan aralıklı sıklık çizelgelerinde, sınıflandırmada yorum ve grafik çiziminde kolaylık
sağlanması için aralıklar en küçük aralığın katları olarak alınmalı ve değişik aralık sayısı da
az olmalıdır.
Dağılım sınırları belli olmayan verilerin sıklık çizelgeleri açık uçlu düzenlenir. Açık uçlu sıklık
çizelgeleri, sınıf değerlerine bağlı olan hesaplamalarda güçlük yaratabilir. Böyle durumlarda
kesin olmayan sınıf değerleri tahmin edilir. Açık uçlu sınıf sıklıkları küçük olduğu için,
tahmin edilen değerlerden ötürü hatalı sonuç bulma olasılığı küçük olabilir.
ÖRNEK: Bir ildeki 30 ilkokulun derslik sayılarının dağılımı incelensin.
- 16 -
Derslik Sayısı: 5 6 7 8 9 10 11 12 13 14 15
İlkokul Sayısı: 6 8 0 1 0 9 0 3 0 2 1
Verilerin, derslik sayısı 7, 9 11 ve 13 olan ilkokul sayısı sıfır olduğu için eşit olmayan aralıklı
sıklık çizelgesi düzenlenebilir:
Derslik Sayısı İlkokul Sayısı
5 6
6 8
7-9 1
10-12 12
13-15 3
ÖRNEK: 108 kişinin yetenek test puanlarına göre dağılımı, açık uçlu sıklık çizelgesine
örnektir:
Puan Sıklık(f
i
)
100’den az 7
100-119 11
120-139 24
140-159 36
160-179 19
180-199 8
200 ve çok 3
MERKEZİ KONUM (EĞİLİM) ÖLÇÜLERİ
- 17 -
Konum ölçüleri, verilerin dağılımdaki yerlerini, birbirlerine olan uzaklıklarını kısacası
konumlarını belirlemek için kullanılan ölçülerdir. Bu ölçüler Tablo1’de verilen verilen veriler
üzerinde uygulanarak aşağıda tek tek ele alınmaktadır.
Aritmetik Ortalama ( x )
En sık biçimde kullanılan merkezi konum ölçüsüdür.
Sınıflandırılmamış verilerde aritmetik ortalama,
n / x x
n
i
i ¯
=
=
1
formülü ile bulunur. Elimizdeki verilerin aritmetik ortalaması;
49 . 8 50 / 6 . 424 5 . 13 ... 6 . 5 2 . 5 x = = + + + =
olarak bulunur.
Sınıflandırılmış verilerde ise aşağıdaki formüller kullanılmaktadır:
i) Formül1
n
m f
x
k
1 i
i i ¯
=
= = (5.72x4+6.80x12+...+13.07x3)/50 = 425.65/50 = 8.513
ii)Formül2
n
b f
c A x
k
1 i
i i ¯
=
+ =
A=Herhangi bir sınıf değeri (genellikle orta kısımlardaki sınıflardan seçilir)
b
i
=(S
i
-A)/c
Tepe Değeri (Mod) ( xˆ )
Sınıflandırılmamış verilerde tepe değeri en sık tekrar eden değerdir. Ham verilerimizde bu
değer 6.50 ve 8.20 değerleridir.
Sınıflandırılmış verilerde ise tepe değeri aşağıdaki gibi hesaplanır.
2 1
1
ˆ
d d
d
c A x
s
+
+ =
A
s
=En büyük sıklığın bulunduğu sınıfın alt sınırı
- 18 -
d
1
=En büyük sıklık - bir önceki sıklık
d
2
=En büyük sıklık-bir sonraki sıklık
O halde,
A
s
=7.30
d
1
=13-12=1
d
2
=13-5=8
42 . 7
8 1
1
05 . 1 30 . 7 xˆ ~
+
+ =
Ortanca (Medyan)( x' )
Sınıflandırılmamış verilerde ortanca; n çift ise n/2'nci değer, n tek ise (n+1)/2'nci değerdir.
Veri sayısı çift olduğundan (50)/2=25'inci değer olan 8.00 ortanca değerimizdir.
Sınıflandırılmış verilerde ise ortanca aşağıdaki gibi hesaplanır.
i
i
m
m
f
f
) n yada ( n
c L x
¯
÷
=
÷
+
+ = '
1
1
2
1
¦
¦
¹
¦
¦
´
¦
+
=
ise n tek ,
n
ise çift n ,
n
j
2
1
2
L= DDA kolonunda j'nin bulunduğu sınıfın alt SA
i
değeri
n=50 olduğundan j=59/2=25 bulunur.
L=7.295
16 f f
1 4
1 m
m
1 i
1 m
m
= =
¯ ¯
÷
=
÷
=
02 . 8
13
16 2 / 50
05 . 1 295 . 7
f
f 2 / n
c L x
i
1 i
1 m
m
~
÷
+ =
÷
+ = '
¯
÷
=
olarak bulunur.
Ortalama, ortanca ve tepe değeri arasındaki bağıntı:
xˆ x x = ' = ise sıklık dağılımı simetrikdir.
- 19 -
xˆ x x < ' < ise sıklık dağılımı negatif yöne eğilimli ya da sola doğru çarpıktır.
xˆ x x > ' > ise sıklık dağılımı pozitif yöne eğilimli ya da sağa doğru çarpıktır.
Verilerimiz için xˆ < x' < x olduğundan dağılımın sağa çarpık olduğu söylenebilir. Hali hazırda
verilerin histogram grafiğinden de bu görünmekteydi.
YÜZDELİKLER, ÇEYREK DEĞERLER (DÖRDEBÖLENLER)
- 20 -
Yüzdelik (Percentile): Kendinden önce ve sonraki belirli oranlarda değerler olan noktanın
değerini ifade etmektedir. Örneğin; 40. yüzdelik kendisinden önce deneklerin %40'ını
kendisinden sonra deneklerin % 60'ının olduğu değerdir.
Çeyrek Değer (Quartile): 25. ,50. ve 75. yüzdelik değerleri, 1, 2 ve 3. çeyrek dğerlerdir.
Q
1
= 1.çeyrek değer (25. yüzdelik) (Alt dördebölen)
Q
2
= 2. çeyrek değer (50. yüzdelik) aynı zamanda ortancadır.
Q
3
= 3. çeyrek değer (75. yüzdelik) (Üst dördebölen)
Sınıflandırılmamış verilerde aşağıdaki eşitlikler ile 1. ve 3. çeyrek değerler bulunur:
¦
¦
¹
¦
¦
´
¦
=
+
+
=
=
+
ise çift n ,
4
n
j ,
2
X X
ise n tek ,
4
1 n
j , X
Q
1 j j
j
1

¦
¦
¹
¦
¦
´
¦
=
+
+
=
=
+
ise çift n ,
4
3n
j ,
2
X X
ise n tek ,
4
1) 3(n
j , X
Q
1 j j
j
3
n ya da n+1 dördün katı değilse, çeyrek değerler araya katma yolu bulunurlar.
Verilerimiz için n=50 olduğundan dördün katı değildir. j=50/4=12.50=12
1/2
olduğundan 12. ile
13. veri arasında kalmaktadır (% 50 lilik bir fazlayla). Bu durumda;
Q
1
=6.9+0.50x(7.1-6.9)=7.00
3.çeyrek değeri için j=3x50/4=37.5=
2
1
37 olduğundan 37 ile 38. veri arasında kalmaktadır.
Bu durumda;
Q
3
=9.6+0.50x(9.7-9.6)=9.65
Dördebölenler Aralığı: Aşırı uç değerden çok az etkilenen bir konum ölçüsüdür. Ancak
kullanımda tercih edilmeyen bir ölçüdür.
DBA=Q
3
- Q
1
Sınıflandırılmış verilerde ise aşağıdaki formül ile hesaplanmaktadır:
- 21 -
i
i
m
m
a
f
f an %
c L P
¯
÷
=
÷
+ =
1
1
P
a
=a. yüzdelik
L=%an değerini içine alan DDA sıklıklarının minimum olanına karşılık gelen SA değeri
Ef
m
=%an değerini içine alan DDA sıklığı
f
i
=yüzdeliğin bulunduğu sınıfın sıklığı
Verilerimiz için aşağıdaki yüzdelikleri bulalım:
a=10 için
%an=10x50/100=5.00, L=6.245, f
2
=12, Ef
m
=4
34 . 6
12
4 5
1 . 1 245 . 6 P
10
~
÷
+ =
YORUM-1: 50 firmanın %10’u AR-GE için en fazla 6.34 bin YTL yatırım yapmaktadır.
YORUM-2: 50 firmanın %90’ı AR-GE için en az 6.34 bin YTL yatırım yapmaktadır.
YORUM-3: Firmaların %10’u AR-GE için tahminen en fazla 6.34 bin YTL yatırım yapmaktadır.
YORUM-4: Firmaların %90’ı AR-GE için tahminen en az 6.34 bin YTL yatırım yapmaktadır.
a=25 için
%an=25x50/100=12.50 L=6.245 f
2
=12 Ef
m
=4
02 . 7
12
4 5 . 12
1 . 1 245 . 6 P
25
~
÷
+ =
YORUM-1: 50 firmanın %25’i AR-GE için en fazla 7.02 bin YTL yatırım yapmaktadır.
YORUM-2: 50 firmanın %75’i AR-GE için en az 7.02 bin YTL yatırım yapmaktadır.
YORUM-3: Firmaların %25’i AR-GE için tahminen en fazla 7.02 bin YTL yatırım yapmaktadır.
YORUM-4: Firmaların %75’i AR-GE için tahminen en az 7.02 bin YTL yatırım yapmaktadır.
a=50 için
%an=50x50/100=25 L=7.295 f
3
=13 Ef
m
=16
02 . 8
13
16 25
05 . 1 7.295 P
50
~
÷
+ =
YORUM-1: 50 firmanın %50’si AR-GE için en fazla 8.02 bin YTL yatırım yapmaktadır.
YORUM-2: 50 firmanın %50’si AR-GE için en az 8.02 bin YTL yatırım yapmaktadır.
YORUM-3: Firmaların %50’si AR-GE için tahminen en fazla 8.02 bin YTL yatırım yapmaktadır.
YORUM-4: Firmaların %50’si AR-GE için tahminen en az 8.02 bin YTL yatırım yapmaktadır.
a=75 için
- 22 -
%an=75x50/100=37.50 L=9.395 f
5
=7 Ef
m
=34
92 . 9
7
34 5 . 37
05 . 1 395 . 9 P
75
~
÷
+ =
YORUM-1: 50 firmanın %75’i AR-GE için en fazla 9.92 bin YTL yatırım yapmaktadır.
YORUM-2: 50 firmanın %25’i AR-GE için en az%9.92 bin YTL yatırım yapmaktadır.
YORUM-3: Firmaların %75’i AR-GE için tahminen en fazla 9.92 bin YTL yatırım yapmaktadır.
YORUM-4: Firmaların %25’i AR-GE için tahminen en az 9.92 bin YTL yatırım yapmaktadır.
AĞIRLIKLI, GEOMETRİK VE HARMONİK ORTALAMA
AĞIRLIKLI ORTALAMA
Sınıflandırılmamış bazı veri kümelerinde verilerin önem dereceleri farklı olabilir. Bu farkların
etkisi de ağırlık biçiminde hesaplamaya katılarak Ağırlıklı Ortalama elde edilir. Ağırlıklı
ortalama aşağıdaki eşitlik ile hesaplanmaktadır. X
i
değerini alan f
i
tane denek olmak üzere,
¯ ¯
= =
=
k
1 i
i
k
1 i
i i
f X f AO
Sıklık tablosundan elde edilen ortalama da bir tür ağırlıklı ortalamadır. Benzer bir örnek:
ÖRNEK: Bir öğrencinin bir dönem boyunca aldığı derslere ilişkin ders kredisi ve not
değerleri aşağıda verilmektedir.
Ders Adı Kredisi Notu
Matematik I 4 B1
Okuma Becerileri 2 A2
Kimya I 4 B2
Fizik I 4 C2
Türk Dili I 2 B1
Buna göre bu öğrencinin dönem ağırlıklı ortalaması;
AO=(4x3+2x3.5+4x2.5+4x1.5+2x3)/18=2.277 olarak bulunur.
ÖRNEK: Bir iş yerinde çalışan 20 işçinin günlük ücreti 2500 YTL, 33 işçinin 3000 YTl, 40
işçinin 3200 YTL ve 10 işçinin de 4000 YTL’dir. Bu iş yerinde ortalama ücreti hesaplayınız.
AO=(20x2500+33x3000+40x3200+10x4000)/100=3080 YTL olarak bulunur.
GEOMETRİK ORTALAMA
- 23 -
Geometrik ortalama ölçümler arasında değişme oranı çok olduğunda hesaplanan bir
ortalamadır. Genellikle nüfus büyüme hızı, gelişme hızı ya da endeks gibi hesaplamalarda
kullanılır. Geometrik ortalama uç değerlerden aritmetik ortalama kadar etkilenmez.
Herhangi bir denek değeri 0 ya da negatif olduğunda geometrik ortalama hesaplanamaz.
Sınıflandırılmamış verilerde geometrik ortalama
n / 1
n 2 1
n
n 2 1
) X ... X X ( X ... X X GO = =
formülü ile hesaplanmaktadır.
Sınıflandırılmış verilerde ise
n / 1 f f f
n
f f f
) S ... S S ( S ... S S GO
n
n
2
2
1
1
n
n
2
2
1
1
= = ile elde edilmektedir.
ÖRNEK: Bir bölgenin nüfusu 1980 yılında 4254670 kişi, 1982 yılında ise 4575470 kişi ise
1982 yılındaki nüfusu tahmin ediniz.
4 . 4412153 4575470 . 4254670 GO = =
Geometrik Ortalama ile Bileşik Faiz Formülü Arasındaki İlişki
Geometrik ortalamanın hesaplandığı eşitlikten yaralanılarak bileşik fazi formülüne
ulaşılabilir. Bunu aşağıdaki örnekle gösterelim.
ÖRNEK: Bir malın toptan satış fiyatı 1.yıldan 2.yıla %40, 2.yıldan 3.yıla ise % 50 oranında
artmıştır. İncelenen 2 yıl içindeki ortalama artış ne kadardır?
1.yıl satış fiyatı: 1 birim ise
2.yıl satış fiyatı: 1.4 birim,
3.yıl satış fiyatı: 2.1 birim olur.
45 . 1 50 . 1 x 40 . 1 GO ~ =
Gözlenen 2 yıl içinde malın toplam satış fiyatındaki ortalama artış yaklaşık % 45’dir.
Geometrik ortalama formülünden yararlanarak bileşik faiz formülüne ulaşılabilir.
- 24 -
45 . 1 50 . 1 x 40 . 1 ~
2
) 45 . 0 1 ( 50 . 1 x 40 . 1 + ~
2
) 45 . 0 1 ( 10 . 2 + ~
Bileşik faiz formülü,
P
t
=P
0
(1+r)
t
P
0
: Temel değer
P
t
: t zaman sonraki değer
r: Artış oranı
t: zaman
Buradan örneğimiz için P
0
= 1.00, P
t
= 2.10, r = 0.45, t = 2 olur.
Harmonik Ortalama
Genellikle ortalama hız, ortalama fiyat v.b. hesaplamalarda kullanılmaktadır: Aşağıdaki
formül ile hesaplanır.
)
X
...
X
(
n
O . H
n
1 1 1
1
1
+ +
=
ÖRNEK: Bir şehirler arası otobüs gittiği mesafesinin ilk üçte birinde 300km/s, ikinci üçte
birinde 450 km/s ve son üçte birinde 360 km/s hız yapmıştır. Buna göre aracın ortalama
hızı ne olmuştur.
360
360
1
450
1
300
1
3
1
1
=
+ +
=
) (
O . H km/s
DEĞİŞİM (YAYILIM) ÖLÇÜLERİ
- 25 -
Konum ölçüleri veri kümesinin ya da dağılımının merkezi hakkında bilgi varmektedir. Yalnızca
bu ölçülere bakılarak verinin dağılımı hakkında tam bir bilgi sahibi olmak mümkün değildir.
Veriler ne derecede dağılmakta ya da yayılım göstermektedirler?; ortalamadan uzaklıkları ne
kadardır? Gibi sorulara cevap vermek için değişim ölçüleri hesaplanmalıdır.
ÖRNEK: NEWBOLD ( s.16). 2 firmanın 7 ustabaşısının yıllık kazançları aşağıda veilmiştir.
A FİRMASI: 34500 30700 32900 36000 34100 33800 32500
B FİRMASI: 34900 27500 31600 39700 35200 33800 31700
İki firmaya ilişkin ortalama ve ortanca değerleri hesaplandığında eşit bulunmaktadır.
Ortalama= 33500 ve Ortanca=33800.
Konum ölçülerine baktığımızda 2 firma arasında bir farklılık görünmüyor. Gerçekte verilerin
yayılımına dikkat ettiğimizde, A firmasında çalışanların birbirlerine daha yakın kazanç elde
ettiklerini, buna karşın B firmasındakilerin ise kazançların birbirlerinden daha uzak olduğunu
görmekteyiz. B firmasına çalışanların kazançları daha fazla farklılık göstermektedir. Az
sayıdaki bu verilere bakarak bu sonuca varabiliyoruz. Ancak veri sayısının fazla olduğu
durumda, bakarak bir sonuça ulaşmamız imkansızlaşacaktır.
DEĞİŞİM GENİŞLİĞİ (ARALIK): Bir veri kümesindeki en büyük değer ile en küçük değer
arasındaki farktır. Değişim genişliği R (RANGE) harfi ile gösterilir.
R= X
maks.
- X
min.
ÇEYREK SAPMA: Ortalam yerine ortanca kullanıldığında ya da aşırı uç değerler
bulunduğunda değişim genişliği yerine ÇEYREK SAPMA (Q) kullanılır.
3 . 1
2
02 . 7 62 . 9
2
Q Q
Q
1 3
=
÷
=
÷
=
Dağılımdaki tüm değerler kullanılmadığı için bilgi kaybı olabilir.
ORTALAMA MUTLAK SAPMA: Verilerin ortalamadan farklarının (sapmalarının) mutlak
değerlerinin ortalamasıdır.
n
| x X |
MS
n
1 i
i ¯
=
÷
=
formülü ile hesaplanır.
VARYANS ve STANDART SAPMA
- 26 -
Bir veri dağılımındaki değişimin önemli bir ölçüsü varyanstır. Varyansın karekökü alınarak
standart sapma elde edilir.
Sınıflandırılmamış verilerde varyans ve standart sapma formülleri ve verilerimiz için
sonuçları:
84 . 3
49
2168 . 192
1 n
) x x (
S
n
1 i
2
i
2
~ =
÷
÷
=
¯
=
Kitle için:
N
) X (
N
1 i
2
i
2
¯
=
u ÷
= o
S=1.96
S= Standart Sapma S
2
=Varyans
Örneklem için neden (n-1)’e bölünüyor ?
20 koltuk bulunan bir salona öğrenciler sırasıyla girsinler. İlk öğrencinin 20 koltuktan birini seçme serbestliği var.
İkinci öğrencinin kalan 19 koltuktan birini seçme serbestliği var. Bu şekilde devam edilirse, 19. öğrencinin kalan 2
koltuktan birini seçme serbestliği var. Ancak 20. öğrencinin koltuk seçme serbestliği kalmamıştır. Demek ki 19
öğrencinin seçme serbestliği varken 1 öğrencinin yoktur.
Sınıflandırılmış verilerde ise aşağıdaki formüller yardımıyla hesaplanır.
|
|
|
|
.
|

\
|
÷
÷
=
¯ ¯
= =
1 n
n / ) m f ( m f
S
k
1 i
2
k
1 i
i i
2
i i
2
94 . 3
1 50
50 /
2
) 65 . 425 ( 739 . 3816 2
S ~
÷
÷
= S=1.98
ÖRNEK: NEWBOLD ustabaşı örneği.
A Firması için 2414286
2
= o , o=1554
B Firması için 12368571
2
= o , o=3517
DEĞİŞİM, ÇARPIKLIK VE BASIKLIK KATSAYISI
Değişim Katsayısı
Standart sapma ortalamanın yüzdesi olarak tanımlandığında "Değişim Katsayısı" olarak
adlandırılır. Özellikle farklı ölçü birimleri kullanan iki dağılımın değişimlerinin
karşılaştırılmasında kullanılır. Aşağıdaki eşitlik ile hesaplanmaktadır.
100
X
S
V = 23 100
49 . 8
98 . 1
V = =
- 27 -
Çarpıklık ve Basıklık
Dağılımın ortalamaya göre biçimine ilişkin bazı bilgileri çarpıklık ve basıklık katsayıları ile
öğrenebiliriz.
Çarpıklık katsayısı aşağıda verilen eşitlik ile elde edilebilir.
3
n
1 i
3
i
S
n / ) x X (
ÇK
¯
=
÷
=
ÇK=0 ise dağılım simetriktir.
ÇK<0 ise dağılım sola doğru çarpık ya da - yöne eğilimlidir.
ÇK>0 ise dağılım sağa doğru çarpık ya da + yöne eğilimlidir.
Basıklık Katsayısı ise aşağıdaki eşitlik ile hesaplanabilir:
3
4
1
4
÷
÷
=
¯
=
S
n / ) x X (
B
n
i
i
B=0 ise dağılımın yüksekliği standart normal dağılıma uygundur.
B<0 ise dağılım standart normalden basıktır.
B>0 ise dağılım standart dağılımdan sivridir.
Verilerimizden elde edilen çarpıklık ve basıklık katsayısı değerleri:
80 . 0
S
n / ) x X (
ÇK
3
n
1 i
3
i
~
÷
=
¯
=
13 . 0 3 13 . 3 3
S
n / ) x X (
B
4
n
1 i
4
i
~ ÷ ~ ÷
÷
=
¯
=
Verilerimiz sağa çarpık ve standart dağılımdan daha sivri bir dağılıma sahiptir.
- 28 -
UYGULAMA-1
Aşağıda 45 ailenin yıllık gelirleri (1000 YTL) verilmektedir. Bu verilerden yararlanılarak sıklık
çizelgesi, birikimli sıklık çizelgesi, konum ölçüleri, değişim ölçüleri elde edilmektedir.
12.4 13.7 27.5 19.4 12.5 28.3 36.3 29.7 19.7
19.6 32.6 9.9 21.6 41.2 36.4 19.8 23.4 9.6
41.7 30.4 11.4 7.5 38.7 20 38.2 11.3 25.6
17.3 26.8 22.1 20.7 24.3 9.9 23.2 35.8 14.2
21.9 23.8 16.4 24.7 21.5 22.2 29.8 29.3 21.4
Verileri küçükten büyüğe doğru sıralayalım.
7.5 9.6 9.9 9.9 11.3 11.4 12.4 12.5 13.7
14.2 16.4 17.3 19.4 19.6 19.7 19.8 20 20.7
21.4 21.5 21.6 21.9 22.1 22.2 23.2 23.4 23.8
24.3 24.7 25.6 26.8 27.5 28.3 29.3 29.7 29.8
30.4 32.6 35.8 36.3 36.4 38.2 38.7 41.2 41.7
En Küçük (Min.)= 7.5
En Büyük (Max.)= 41.7
Dağılım Genişliği (Range)= Max. - Min. = 41.7 - 7.5 = 34.2
k (sınıf sayısı) = 7 alınırsa
c (sınıf aralığı) = (34.2+0.1) / 7= 34.3/ 7 = 4.9 olarak bulunur.
Sıklık çizelgesini düzenleyelim:
Alt Sınır(A.S) Üst Sınır(Ü.S.) Sınıf Değeri (m
i
) Sıklık (f
i
) Göreli Sıklık (p
i
) bi .

7.5 12.3 9.9 6 0.133 -3
12.4 17.2 14.8 5 0.111 -2
17.3 22.1 19.7 12 0.267 -1
22.2 27 24.6 8 0.178 0
27.1 31.9 29.5 6 0.133 1
32 36.8 34.4 4 0.089 2
36.9 41.7 39.3 4 0.089 3
m
i
(sınıf değeri)= (AS
i
+ ÜS
i
) / 2
p
i
(göreli sıklık)= f
i
/ n
- 29 -
Birikimli sıklık çizelgesini düzenleyelim:
A.S. Ü.S. f
i
m
i
SA
i
D. D.A.f
i
D.D.Ç.f
i
D. D.A.p
i
D. D.Ç.p
i
7.45 0 45 0.000 1.000
7.5 12.3 6 9.9
12.35 6 39 0.133 0.867
12.4 17.2 5 14.8
17.25 11 34 0.244 0.756
17.3 22.1 12 19.7
22.15 23 22 0.489 0.511
22.2 27 8 24.6
27.05 31 14 0.689 0.311
27.1 31.9 5 29.5
31.95 37 8 0.822 0.178
32.0 36.8 4 34.4
36.85 41 4 0.911 0.089
36.9 41.7 4 39.3
41.75 45 0 1 0
HİSTOGRAM GRAFİK
Si
39.300 34.400 29.500 24.600 19.700 14.000 9.900
f
i
14
12
10
8
6
4
2
Yıllık geliri 25 Bin YTL’den fazla olan aile sayısını bulmak isteyelim. Bunu interpolasyon yardımıyla
yapabiliriz.
SA
i
D.D.Ç.f
i
22.15 22
25 x
27.05 14
22 14
22
15 22 05 27
15 22 25
÷
÷
=
÷
÷ x
. .
.
eşitliği ile x aşağdaki gibi bulunur.

8
22
9 4
85 2
÷
÷
=
x
.
.
17 ~ x bulunur.
- 30 -
Şimdi yıllık geliri 15 Bin YTL’den az olan aile sayısını bulalım.
SA
i
D.D.A.f
i
12.35 6
15 x
17.25 11
6
6 11
35 12 15
35 12 25 17
÷
÷
=
÷
÷
x .
. .
eşitliği ile x aşağdaki gibi bulunur.

6
5
65 2
9 4
÷
=
x .
.
9 ~ x bulunur.
ORTALAMA, TEPE DEĞERİ (MOD) VE ORTANCA (MEDYAN)
Ortalama ( x )
n
s f
x
k
i
i i ¯
=
=
1
= (9.9x6+14.8x5+...+19.7x12)/45 = 1038.4/45 = 23.075
Tepe Değeri ( xˆ )
2 1
1
ˆ
d d
d
c A x
s
+
+ =
A
s
=17.3 En büyük sıklığın bulunduğu sınıfın alt sınırı
d
1
=12-5=7 En büyük sıklık - bir önceki sıklık
d
2
=12-8=4 En büyük sıklık-bir sonraki sıklık
42 20 12 3 3 17
4 7
7
9 4 3 17 . . . . . xˆ = + =
+
+ =
Ortanca ( x' )
i
i
m
m
f
f
) n yada ( n
c L x
¯
÷
=
÷
+
+ = '
1
1
2
1
¦
¹
¦
´
¦
+
=
ise n tek ,
2
1
ise çift n ,
2
n
n
j
L= DDA kolonunda j'nin bulunduğu sınıfın alt SA
i
değeri
n=45 olduğundan j=46/2=23 bulunur.
L=17.25
11
1 4
1
1
1
= =
¯ ¯
÷
=
÷
= m
m
i
m
m
f f
95 21
12
11 2 46
9 4 25 17
2
1
1
.
/
. .
f
f / n
c L x
i
i
m
m
=
÷
+ =
÷
+ = '
¯
÷
=
olarak bulunur.
Ortalama, ortanca ve tepe değeri arasındaki bağıntı
23.175 > 21.95 > 20.42 olduğundan dağılım sağa doğru çarpıktır.
- 31 -
YÜZDELİKLER, ÇEYREK DEĞERLER
i
i
m
m
a
f
f an %
c L P
¯
÷
=
÷
+ =
1
1
P
a
=a. yüzdelik
L=%an değerini içine alan DDA sıklıklarının minimum olanına karşılık gelen SA değeri
Ef
m
=%an değerini içine alan DDA sıklığı
f
i
=yüzdeliğin bulunduğu sınıfın sıklığı
a=25 için
%an=25x45/100=11.25
L=17.25
f
3
=12
Ef
m
=11 35 17
12
11 25 11
9 4 25 17
25
.
.
. . P =
÷
+ =
a=50 için
%an=50x45/100=22.5
L=17.25
f
3
=12
Ef
m
=11 95 21
12
11 5 22
9 4 25 17
50
.
.
. . P =
÷
+ =
a=75 için
%an=75x45/100=33.75
L=27.05
f
5
=6
Ef
m
=31 29 29
6
31 75 33
9 4 05 27
75
.
.
. . P =
÷
+ =
VARYANS, STANDART SAPMA
|
|
|
|
.
|

\
|
÷
÷
=
¯ ¯
= =
1
1
2
1
2
2
n
n / ) s f ( s f
S
k
i
k
i
i i i i
201 76
1 45
45 4 1038 52 27314
2
2
.
/ . . (
S =
|
|
.
|

\
|
÷
÷
=
S=8.73
- 32 -
ALIŞTIRMALAR
1) Bir benzin istasyonu rasgele seçtiği 30 müşterisinin aldığı benzin miktarlarını litre olarak aşağıdaki
gibi kaydetmiştir. Sıklık ve birikimli sıklık çizelgelerini 7 sınıf için düzenleyiniz. Ortalama, ortanca,
tepe değeri ve varyansını çizelgelerden yararlanarak hesaplayınız. (Cula, s.76)
2 2 3 4 6 7 7 8 8 9
10 10 10 11 11 11 11 12 12 12
13 13 14 16 18 20 25 25 28 28
2) İktisat bölümünde okuyan 40 öğrencinin bir aylık giderleri aşağıda verilmiştir. Sıklık ve birikimli
sıklık çizelgelerini 6 sınıf için düzenleyiniz.
3) Aşağıda 10 şirketin tahvil fonlarının beş yıldaki getiri yüzdeleri verilmiştir. Getiri yüzdelerinin
örneklem ortalamasını, varyansını ve standart sapmasını bulunuz.
99.7 77.5 86.3 85.6 69.5 96.6 83.1 75.1 90.4 82.1
4) Aşağıda 9 hisse senedinin belirli bir gündeki staış fiyatları verilmiştir. Satış fiyatlarının örneklem
ortalamasını, ortancasını, varyansını ve standart sapmasını bulunuz.
7.40 8.80 4.04 7.45 6.00 5.10 9.90 3.34 18.70
5) Bir apartmandaki 10 dairenin kira tutarları (YTL) aşağıdaki gibidir. Kira tutarlarının ortalamasını,
ortancasını, tepe değerini ve varyansını hesaplayınız.
300 500 350 400 600 450 550 500 350 500
6) Bir tekstil firması yılda 3 milyon triko, 500 bin tişört, 400 bin gömlek ve 500 bin çorap üretmektedir.
Sıklık dağılımını oluşturunuz ve daire dilim grafiği çiziniz.
100 150 200 200 250 300 300 300 300 300
350 350 350 400 400 400 400 400 400 400
450 500 500 500 500 500 500 500 500 500
500 500 600 600 600 650 750 800 800 850
- 33 -
BÖLÜM 2 OLASILIK
2.1. GİRİŞ
Olasılık, günlük yaşamımızda sıkça kullandığımız, yararlandığımız bir kavramdır. Örneğin meteoroloji
uzmanı sabah haberlerinde o gün %80 olasılıkla yağmur yağacağını, sağlık uzmanları sigara içenlerin
içmeyenlere oranla kansere yakalanma riskinin daha yüksek olacağını, sınavı başarısız geçmiş bir öğrenci o
dersten geçme şansının çok az olacağını söyler. Herhangi bir olayın meydana gelme şansını ölçmeyle
ilgilenen olasılık, istatistiğin önemli bir bölümünü oluşturmaktadır. İstatistiğin çıkarsama (öngörü) temelini
oluşturan olasılık, belirsizlik durumunda sağlıklı kararlar vermeyi sağladığı için, planlama çalışmalarında
yoğun bir biçimde kullanılmaktadır. Örneğin bir firmanın gelecek yıldaki satış kestirimleri, bir kısmı
gerçekleşecek bir kısmı gerçekleşmeyecek bir çok varsayıma dayalıdır. Bu nedenlerden dolayı olasılık
kuramı, bizlere belirsizlik altında ya da mevcut bilgilerin tam ve sağlıklı olmaması gibi durumlarda doğru ve
sağlıklı kararlar verebilmede yardımcı olacaktır. Bu bölümde olasılığa ilişkin temel kavramlar verilecek,
daha sonra olasılık hesaplama kuralları ele alınacaktır.
Olasılığın Başlangıcı…
Arkeologlar tarih öncesi barınaklarda, medeniyetler boyunca değişik toplumlar için oyun ve şans oyunlarının
önemli bir eğlence aracı olduğunu gösteren kanıtlar buldular. Yunan, Mısır, Çin ve Hindu hanedanlarının
büyük matematiksel buluşları ve insanların oyun oynamaya olan eğilimleri dikkate alındığında, olasılık
matematiğinin diğerleri arasında en erken gelişmeye başladığı tahmin edilebilir. Buna karşın, 17. yy da
fransız matematikçiler Pierre de Fermat ve Blaise Pascal’a kadar, olasılık matematiğinde dikkate değer bir
gelişme olmamıştır.
Noktalar Problemi
Rönesans Avrupa’sında matematiksel olasılığın gelişimine ilham olan problem budur. Kısaca şöyle
tanımlanabilir:
İki eşit yetenekte oyuncu belli bir para karşılığında bir şans oyunu oynarlarken, oyun kesiliyor. Bu
aşamadaki oyun skoruna göre para nasıl bölünmelidir?
Burada “eşit yetenekli” her oyuncunun oyuna eşit kazanma şansı ile başladığı anlamına gelir. Aşağıdaki
senaryoyu takip ediniz.
Pascal ve Fermat Paris’te bir kafede oturuyorlar ve daha zor senaryolar tartışarak geçen yorucu saatlerden
sonra, oyunların en kolayı olan, para atma oyununu oynamaya karar verirler. Eğer tura gelirse Fermat, yazı
gelirse Pascal bir puan alacaktır. İlk kez on puan alan kazanacaktır. Sonuçta ne olursa olsun birinin diğerini
yemeğe götüreceğini bilerek, her biri ortaya 50 Frank para koyuyor, böylece ortada 100 Frank bahis oluyor.
Kazanan hepsini alacak. Ama sonra ilginç birşey oluyor. Fermat 8 e karşı 7 yenerken, bir arkadaşının hasta
olduğuna dair bir mesaj alıyor ve Toulouse’a gitmesi gerekiyor. Mesajı getiren adam, hemen hareket etmek
şartıyla onları götürebileceğini söylüyor. Tabii ki Pascal durumu anlayışla karşılıyor, ama ortadaki parayı
nasıl bölüştürecekler?
Fermat bir mektubunda şu teklifi sunuyor:
“Değerli Blaise,
100 Frankı bölüştürme problemi hakkında, adil olduğunu düşüneceğin bri çözüm buldum. Benim sadece 2
senin de 3 puana ihtiyacın olduğunu düşünürsek, 4 atışta oyun kesinlikle bitmiş olacaktı.
Bu dört atışta, eğer galibiyet için gereken üç puanı alamazsan, bu benim kazanmam için gereken iki puanı
aldığım anlamına gelir. Benzer yolla, eğer ben iki puanı alamazsam, sen kazanman için gerekli olan en az üç
- 34 -
puanı almış ve kazanmışsın demektir. Böylece, aşağıdaki olası oyun senaryolarının eksiksiz olduğuna
inanıyorum. ‘h’ harfi tura, ‘y’ harfi de yazıyı göstermektedir. Benim kazandığım senaryolara yıldız koydum.
t t t t * t t t y * t t y t * t t y y *
t y t t * t y t y * t y y t * t y y y
y t t t * y t t y * y t y t * y t y y
y y t t * y y t y y y y t y y y y
Bu çıktıların hepsinin eşit olasılıklı olduğunda hem fikir olduğumuzu düşünüyorum. Bu yüzden, parayı
benim lehime olarak 11:5 oranında dağıtmamız gerektiğine inanıyorum, yani ben (11/16)*100=68.75 Frank
almalıyım ve sen de 31.25 Frank almalısın tabii.
Paris’te herşeyin yolunda olması temennisiyle,
Arkadaşın ve meslektaşın,
Pierre”
2.2. RASGELE DENEY, RASGELE SONUÇ
Pekçok gözlemden sadece bir tanesinin gerçekleşme sürecine “Rasgele (Rassal) Deney (Deneme)”
denir. Örneğin; madeni para ile yapılan yazı-tura atışı, zar atışı, üretilen bir malın hatalı olup-
olmaması, bir hisse senedinin karlı olup-olmaması, bir öğrencinin dersi geçme notu,...
Rasgele bir deneyin mümkün her bir sonucuna “rasgele sonuç” denir. Tüm mümkün sonuçlarının
kümesine ise “örneklem uzayı” denir ve “S” ile gösterilir.
Örneğin;
RASGELE DENEY 1: Bir madeni paranın bir defa atışı.
RASGELE SONUÇ 1: Yazı ya da Tura
S={Yazı, Tura}
RASGELE DENEY 1: Bir zar atışı
RASGELE SONUÇ 1: Bir, İki, Üç, Dört, Beş ya da Altı
S={1, 2, 3, 4, 5, 6}
RASGELE DENEY 1: Üretilen bir malın hatalı olup-olmaması
RASGELE SONUÇ 1: Hatalı ya da hatasız
S={Hatalı, Hatasız}
RASGELE DENEY 1: Bir öğrencinin dönem başarısı.
RASGELE SONUÇ 1: A1, A2, B1, B2, C, F3, F2, F1
S={Yazı, Tura}
Bir deneyin örneklem uzayı Venn ya da ağaç diyagramı çizilerek de oluşturulabilmektedir. Venn
diyagramı, bir deneyin tüm olası sonuçlarının (kare, dikdörtgen ya da daire gibi) bir şekille
gösterilmesidir. Ağaç diyagramındaysa her bir sonuç, ağacın bir dalıyla ifade edilmektedir. Venn ve
- 35 -
ağaç diyagramları olasılık kavramlarının, görsel ifade yoluyla kolay anlaşılmasına yardımcı
olmaktadır.
S
Yazı
Tura

BÖLÜM 1 GİRİŞ
Günümüzde artık neredeyse her gün duyduğumuz “İSTATİSTİK” sözcüğü acaba gerçekte neyi ifade etmektedir? Özellikle medyada her gün bir kısım istatistiksel bilgiler sunulmakta, doğru ya da yanlış yorumlar yapılmaktadır. Ekonomik analizlerde, spor programlarında, seçim süreçlerinde, sağlık konularında ve daha birçok alanda sıkça kullanılan istatistik neden bu kadar önemlidir? Aklımıza gelen bu sorulara, bu bölümde kısaca cevap verilmeye çalışılacak, istatistiğin temel kavramları ele alınarak bir giriş yapılacaktır. İSTATİSTİK (STATISTICS) NEDİR? Yaşantımızın her anında bir karar verme durumu söz konusudur. Bu kararları verirken sahip olduğumuz bilgileri düşünce sürecinden geçirerek sonuca varmaya çalışırız. “Peki sahip olduğumuz bilgiler her zaman yeterli midir?, Bu bilgileri nasıl elde ediniriz?” v.b. sorulara vereceğimiz cevaplar bizi istatistiğe yönlendirecektir. yaşamda elbetteki alınacak kararların, içinde İhtimallerin bu kadar çok olduğu koşulların en iyi biçimde bulunulan

değerlendirilerek alınması gerekmektedir. Bu değerlendirme sürecinde en güçlü yardımcı araçlardan birisi istatistiktir. İstatistik, matematiğe dayalı olan kuramını uygulamaya geçirerek her türlü alanda büyük katkılar sağlamaktadır. Günümüzde ekonomi, işletme, sağlık, spor, mühendislik, genetik, astronomi, sanat v.d. hemen hemen tüm alanlarda kullanılan istatistiksel yöntemler, hızla artan bir öneme sahiptir. Bu nedenle istatistiğin doğru biçimde anlatılması gerekmektedir. Burada temel düzeyde istatistik konuları ele alınarak, öğrencilere günlük yaşamlarında ya da iş yaşamlarında yararlı olacak bilgileri vermek amaçlanmaktadır . Bir tanım olarak istatistik; belirsizlik altında bir konuda karar verebilmek amacıyla, ilgilenilen konuya ilişkin verilerin toplanması, düzenlenmesi, özetlenmesi, çözümlenmesi ve sonuçlarının yorumlanmasına yönelik olarak kullanılan yöntemler topluluğu olarak ifade edilebilir. Kısacası veri bilimidir ya da verilerin dilidir.

-2-

ÖNEMLİ KAVRAMLAR, TERİMLER, TANIMLAR Araştırma (Research) İlgilenilen konuya ilişkin sorunların saptanması, çözüm yollarının planlanması, uygulamaya konulması ve sonuçlarının değerlendirilmesine yönelik yapılan çalışmalardır. Araştırmanın konusu ve amacı belirgin olmalıdır. Zaman, personel ve maliyet dikkate alınarak, araştırmanın sınırı iyi belirlenmelidir. Araştırmada görev alan araştırıcılar ya da uzmanlar yeterli bilgi düzeyine sahip olmalıdır. Araştırmanın sonucunda elde edilen bilgiler doğru biçinde değerlendirilmelidir. Ölçme ve Ölçü (Ölçek) Ölçme (Measurement): Araştırma konusu ile ilgili sayısal değerleri elde etme işlemine “ ölçme” denir. Ölçme başlı başına bir çalışma alanıdır. Birçok yöntem ve teknik kullanılmaktadır. Ölçek(Scale): Sayısal değerleri elde etmek için kullanılan araç ya da gereçlere “Ölçek” ya da “Ölçek ya da Ölçü” denir. Ölçek türleri aşağıda verilmektedir: Sınıflamaya dayalı (Nominal) Ölçek: Cinsiyet (E, K); Sektör (Otomotiv, İmalat, Tarım, Maden,...; Medeni Durum; v.b; Ülkeler; ...) Sıralamaya dayalı (Ordinal) Ölçek: Ünvanlar, Rütbeler, Sınıflar,... Aralıklı (Interval) Ölçek: Başlangıç ve bitiş noktası vardır. Geçme notları, Sıcaklık ölçüleri, Zeka Ölçekleri,... Orana dayalı (Ratio) Ölçek: Sabit bir başlangıç noktası vardır. Hacim ve ağırlık ölçüleri, Uzaklık ölçüleri, sermaye, ... Kitle (Yığın, Anakütle, Population) Araştırma kapsamına giren, aynı özellikleri taşıyan birimlerin ya da bireylerin oluşturduğu topluluğa KİTLE denir. Kitlenin büyüklüğü araştırmanın özelliğine göre değişir. Nüfus sayımı için kitle Türkiye’dir. Denizli’deki üniversite öğrencilerinin giderleri için kitle Pamukkale Üniversitesi öğrencileridir. Kitle büyüklüğüne bağlı olarak her zaman tüm birimler (bireyler) hakkında bilgi sahibi olmak mümkün değildir. Bundan dolayı geniş kitlelerde araştırmalar; zaman, maliyet, personel, ulaşım, vb. nedenlerden dolayı tüm birimler yerine daha az sayıdaki birimler seçilerek yürütülür.

-3-

Küme Örneklemesi. sıkça kullanılan bazı parametreler ve istatistikler aşağıda verilmektedir: Parametre Kitle Ortalaması :  Kitle Varyansı : 2 İstatistik Örneklem Ortalaması : x Örneklem Varyansı : S2 -4- . Kitledeki Gözlem Sayısı :N Örneklemdeki Gözlem Sayısı: n Parametre (Parameter) ve İstatistik Kitle özelliklerinin sayısal değerlerine PARAMETRE denir. Araştırma kitle yerine örneklem üzerinde uygulanıyorsa. Olasılığa Bağlı ve Olasılığa Bağlı Olmayan olarak 2 grubta toplanabilir. Observation) Kitle ya da örneklemde yer alan her birime gözlem ya da denek denir. Sıralı Küme Örneklemesi.Örneklem (Sample) ve Örnekleme (Sampling) Bir kitleden. Kartopu Örneklemesi. Bunun yapılabilmesi için incelenecek kitlenin büyüklüğünün. parametre değerleri tahmin edilir. Sistematik Örnekleme. Örnek olarak. Gözlem (ya da denek) sayısı aşağıdaki biçimde simgeleştirilmektedir. Gözlem (ya da denek. Örneklem seçmek için kullanılan yöntemler topluluğu ise ÖRNEKLEME olarak adlandırılır. Örnekleme yöntemleri en genel şekliyle. örneklemden elde edilen sayısal değerlere İSTATİSTİK denir. belirli yöntemler kullanılarak seçilen aynı özellikleri taşıyan bir kısım bireyin oluşturduğu topluluğa ÖRNEKLEM denir. Uzman Örneklemesi. Olasılığa Bağlı Olmayan Bazı Örnekleme Yöntemleri: Kota Örneklemesi. Gelişen teknoloji ile birlikte bu tür tam sayımlar daha kolay yapılabilir hale gelmiştir. Bu durumda. kitledeki tüm birimlerine ulaşılarak istenen bilginin elde edilmesi işlemidir. Tam Sayım Bir araştırma kapsamında. belirlenen maliyet ve zaman gibi kısıtlara uygun olması gerekir. Tabakalı Örnekleme. Bazı durumlarda (nüfus sayımları gibi) kitle büyük olsa bile tam sayım yapılması zorunlu olmaktadır. Olasılığa Bağlı Bazı Örnekleme Yöntemleri: Basit Rasgele Örnekleme.

Cari Fiyat. İhracat-İthalat Değerleri ya da miktarları. 2 gibi kesin değerler alır. kilo. şirket türü. tek değişkenli. fiyat. vb. denekten deneğe değişebilir. Sürekli ve Kesikli değişkenler olarak sınıflandırılabilir. Sürekli Değişken: Değişkenler ölçülerek ya da sıralanarak elde edilir... -5- . İki ölçüm arası sonsuz sayıda noktaya bölünebilir. Örnek: Nitel Değişkenler Cinsiyet Medeni durum Şirket Türü Ülkeler Nicel Değişkenler İhracat Miktarı Öğrenci Sayısı TÜFE Endeksi Ücretler Değişkenler..vb. Dolar Alış-Satış Kurları. yazı-tura. Ara değerler söz konusu değildir. Veriler. Kesikli Değişken: Ölçümler 0.Değişken (Variable) Nicel (kantitatif) ya da nitel (kalitatif) anlamda bir özellik ya da karakterde belirgin olarak görülen farklılık.. Örneğin. çift değişkenli ya da çok değişkenli olarak da kullanılabilir. Değişkenler. Nicel ve Nitel değişkenler olarak sınıflandırılabilir.. Nitel değişkenler. Örneğin. genellikle kesikli değişkenlerdir. Aralık biçiminde ifade edilebilirler.. boy uzunluğu. cinsiyet... Örneğin. GSMH. ülke kodları. Bir değişken. DEĞİŞKEN ile gösterilebilir. Değişkenlere karşılık gelen denek ya da gözlem değerlerine de VERİ denir. 1. gelir.

Temel olarak 2 tür veri vardır: NİCEL (Quantity) VERİ: Sayısal bir ölçekle ölçülerek elde edilmiş verilerdir. araştırma konusuna ve araştırılan topluluğa özgü bir dağılım gösterirler. -6- . veri kavramı ve verilerin özetlenmesinde kullanılan temel yöntemler ele alınacak. Veri toplamak için farklı yöntemler kullanılabilir: Mevcut kaynaklardan (eski kayıtlar..) yararlanarak. Dağılımda yer alan verilerin ortalaması hesaplanabilir. göz rengi. Veri (Data. Dağılım (Distribution) Kitlede ya da örneklemde yer alan her değişkene ilişkin veriler. Boy uzunluğu. fiyat. arşivler.. vb. Verilerin. Datum) Belirli amaçlar için toplanan bilgilere veri denir.. Anket yaparak. Deney yaparak. Gözlem yaparak.. ortalamanın iki yanında ve farklı uzaklıklarda yer alırlar. Simülasyon yoluyla bilgisayarda yapay veri üreterek.BÖLÜM 2 VERİLERİN ÖZETLENMESİ Bu bölümde. çeşitli uygulamalar ile konuların daha iyi anlaşılması sağlanmaya çalışılacaktır. NİTEL (Qualify) VERİ: Kategoriler biçiminde sınıflandırılabilen verilerdir. Cinsiyet.. yıllıklar. ortalamanın iki yanında ne şekilde yer aldığına ilişkin görünüme verilerin DAĞILIMI denir. raporlar. Veriler... İstatistikte kullanılan dağılım kavramı genel olarak 3 başlık altında ele alınmaktadır: i) Sıklık Dağılımları ii) Olasılık Dağılımları iii) Örneklem Dağılımları Bunlar ilerleyen kısımlarda ya da bölümlerde ayrıntılı olarak ele alınacaktır.

8 6. vb.2 Firma No 31 32 33 34 35 36 37 38 39 40 Miktar 9. Verilerin düzenlendiği çizelgelere sıklık çizelgeleri.5 9.0 7..9 6.1 13. Verilerin yapısına (nitel. düzenlenmemiş ham ya da sınıflandırılmamış verilerdir.5 9.0 9.2 8. verilerin gösterdiği dağılıma sıklık dağılımı denir.5 7.7 6.7 6.5 Firma No 41 42 43 44 45 46 47 48 49 50 Miktar 7. ilgilenilen olay ya da problem açısından ilk yapılacak iş ve son derece önemli bir işlemdir. ÖRNEK: Bir finans analisti.. bilgisayar donanım ve yazılım şirketlerinin AraştırmaGeliştirme(AR-GE) faaliyetlerine ayırdıkları kaynak miktarıyla ilgilenmektedir.3 8.6 7.2 7.4 6. Uygulamalarda veri kümeleri çok sayıda gözlem içerebilmektedir. Tablo1.2 5. özellikleri hakkında bilgi edinmek amacıyla.2 8.2 8.8 11. -7- .7 5.9 6. Bu analist yüksek teknolojiye sahip 50 firmayı örneklem olarak belirlemiş ve bir önceki yıl gelirlerinden AR-GE’ye ayırdıkları kaynak miktarlarını (1000 YTL) elde etmiştir. NİCEL VERİLERDE SIKLIK ÇİZELGELERİ Bir araştırma sonunda elde edilen sürekli nicel veriler.2 9.1 13. Aşağıda örnek olarak sunulan veriler düzenlenmemiş ham verilerdir.5 8.4 10. Firmaların AR-GE faaliyetlerine ayırdıkları kaynak miktarları Firma No 1 2 3 4 5 6 7 8 9 10 Miktar 13.8 9. nicel. Bu nedenle verilerin özetlenmesi.9 5.9 7. Analistin amacı bu veri kümesini özetleyerek bir takım bilgilere ulaşmaktır. Konunun daha iyi anlaşılması için bu örnek üzerinden uygulamalar yapılacaktır.) göre sıklık çizelgeleri düzenlenir.6 10.5 9.1 Firma No 11 12 13 14 15 16 17 18 19 20 Miktar 8.5 11.2 6.5 9.9 6.6 10.1 7.5 8. düzenlemeler yapılarak özet halinde sunulurlar.4 10.9 7.5 Bu verilerin kaynak miktarına göre küçükten büyüğe doğru sıralanmış şekli.6 11.SIKLIK DAĞILIMLARI Çeşitli yollarla toplanan veriler.5 6. Tablo2’de verilmektedir.0 7.1 Firma No 21 22 23 24 25 26 27 28 29 30 Miktar 8.7 7.5 8. Veriler Tablo 1’de verilmiştir.0 7.

5 6.2 8. Sınıf sayısının genellikle 7 ile 20 arasında olması istenir.9 7.2 8.2 7.En küçük değer =13.6 6. k=1+3.0 8.8 6.8 9.4 Firma No 35 33 4 5 36 14 26 31 6 17 Miktar 8.6 11. Araştırmacı tarafından belirtilen sınıf sayısı.1 10.5 (dağılımın üst sınırı) En küçük değer (Minimum) : 5.2 (dağılımın alt sınırı) Dağılım Genişliği (DG): Dağılım sınırları arasındaki farktır.0 9.9 Firma No 28 38 10 41 29 32 24 19 40 23 Miktar 6. Sınıf Aralığı: Ard Arda gelen iki sınıfın alt sınırları ya da üst sınırları arasındaki farktır.0 8.2 9.9 6.0 6.4 7.2 8.5 9. Dağılım Sınırları: Bir dağılımda (veri kümesinde) yer alan en küçük ve en büyük denek değerleridir.5 8.6 5.5 6. Sınıf sayısı. En büyük değer (Maksimum): 13.5 7.1 8. Bu durumda Sınıf Aralığı: -8- .7 13.5 7.Tablo2.9 8.1 11.5.2 = 8.8 7.5 10. çok sayıda veri olduğunda aşağıda verilen Sturges’in formülü ile de bulunabilir.3log(n) Sınıfın Alt Sınırı: Bir sınıfta yer alan en küçük değerdir.5 Sıklık Çizelgesinin Elde Edilişi Sıklık çizelgesinin elde edilişinde kullanılan tanımlar adımsal olarak verilerek yukarıdaki örnekle bu tanımlar pekiştirilmeye çalışılacaktır.5 13.1 7.4 9.5 10.7 Firma No 43 49 12 11 22 15 21 27 30 2 Miktar 7. DG=En büyük değer .2 13.5 6. Sıralanmış Kaynak Miktarı Verileri Firma No 45 46 44 48 25 39 50 7 13 18 Miktar 5. c ile gösterilir.5 .7 9.2 7. Örneğimizde sınıf sayısı 8 olarak alınsın. Sınıfın Üst Sınırı: Bir sınıfta yer alan en büyük değerdir. Sınıf aralığı.5 9.9 6.7 7.1 7.9 Firma No 9 3 37 8 20 34 47 42 1 16 Miktar 10.3 11.2 5. k ile gösterilir.3 Sınıf: Eşit ya da birbirine yakın değerli deneklerin oluşturduğu her bir gruba SINIF denir.6 9.

. Bu iki durumda sınıf sayısı artırılır ya da azaltılır. Sıklık: Bir sınıfta yer alan denek sayısı o sınıfın sıklığıdır. Toplamları 1 olmalıdır. Eğer son sınıfta en büyük denek değeri yer almıyorsa sınıf sayısı daha büyük olmalıdır. İşaretlerin sayısı sınıf sıklıklarını verir.2..sınıfın alt sınırı ÜSi: i. Diğer sınıfların üst sınırları da ardı ardına sınıf aralığı eklenerek bulunur. Örneğimizde tam kısımdan sonra 1 hane olduğu için a=0. Bunun için önce her sınıfın sıklığı işaretleme (çeteleme) ile bulunur. Sınıf (Orta) Değeri (m): Bir sınıfın alt ve üst sınırlarının ortalaması o sınıfın sınıf değeri ya da sınıf orta değeridir. Seçilen sınıf sayısının uygun olup olmadığını tespit etmek için son sınıfta en büyük denek değerinin yer alıp almadığın bakılmalıdır. Sınıf aralığı (c=1. Bu durumda seçilen sınıf sayısı veriler için büyüktür.. Sıklıklar toplamı denek sayısına eşittir. n f i 1 i n Örneğimizde ise k=8 tane sınıf olduğundan f i 1 8 i  50 ’dir.3  0. Göreli Sıklıklar pi ile gösterilir. mi  ASi  ÜSi .sınıfın üst sınırı Göreli Sıklık(Sıklık Yüzdesi): Her sınıfa düşen denek sayısının toplam denek sayısına göre yüzdesidir. ilk sınıfın alt sınırı saptanır.1 alınır. c 8.05 8 8 Sınıf sayısı ve aralığı belirlendikten sonra. Sınıflar oluşturulduktan sonra sınıfların sıklıkları bulunur.1) ard arda eklenerek diğer sınıfların alt sınırları bulunur. İlk sınıfın üst sınırı ise ikinci sınıfın alt sınırının son hanesinden 1 çıkarılarak bulunur. i  1.. -9- .c DG  a SINIFSAYISI a: veri kümesindeki verilerin ondalık kısmındaki hane sayısı ile ilgilidir. k 2 ASi: i. En büyük denek değeri son sınıftan bir önceki sınıfta da yer alabilir.1 8. f ile gösterilir. Bu değer genellikle dağılımın en küçük değeridir.4   1. Sınıf değeri bir sınıfı tek bir değerle temsil eder ve m ile gösterilir.

40 10.10 - . Bir sınıf ara değerine karşı gelen den daha az ve den daha çok birikimli sıklıklar toplamı denek sayısına eşittir.34 9.24 7.24 0.35 9.59 (5.44 11. (kitle için yorum) Sınıf Ara Değerleri (SA): Sınıflar arasındaki değerlerdir. Birikimli Sıklık: Sınıf sıklıklarının üst üste eklenmesi ile oluşan sıklıklar birikimli sıklıklardır. hesaplanan son sınıf ara değerine sınıf aralığı (c) eklenerek bulunur.97 12.45 11.02 0. hesaplanın birinci ve ikinci sınıflar arasındaki değerinden sınıf aralığı (c) çıkarılarak bulunur. Den Daha Çok Birikimli Sıklık: Sınıf ara değerinden daha çok değeri olan sınıf sıklıklarının birinci sınıftan başlayarak eklenmesi ile elde edilir.08 0.72 //// ///// ///// // ///// ///// /// ///// ///// // ///// / //// Toplam: 4 12 13 5 7 5 1 3 50 1.49 12..29 bin YTL arasında yatırım yapan firmalar yer alır ve bu sınıftaki firmalar ortalama 6. i  1.55 6.30 8.77 bin YTL yatırım yapmaktadırlar.54 13..06 1 2 3 4 5 6 7 8 5.29 8. AR-GE’ye yatırım yapan 50 firmanın 12 tanesi ya da %24’ü AR-GE’ye ortalama 6.50 12.2.10 0. Birinci sınıfın üst sınırı ile ikinci sınıfın alt sınırının ortalaması. Sınıf ara değerlerinin sayısı (k+1)’dir.77 bin YTL yatırım yapmışlardır. AR-GE faaliyetleri için ayrılan kaynak miktarı verileri için sıklık çizelgesi Sınıf Alt Sınır (AS) Üst Sınır (ÜS) Sınıf Orta (mi) 6.20 6.pi  fi .07 Değeri Çeteleme Sıklık (fi) Göreli Sıklık (pi=fi/n) 0. AR-GE’ye yatırım yapan firmaların %24’ü AR-GE’ye tahminen ortalama 6.87 9.10 0.15+6.82 8. sanki son sınıftan sonra bir sınıf daha varmış gibi kabul edilerek.92 10. Son sınıf ara değeri ise.77 bin YTL AR-GE’ye yatırım yapar.25 ile 7. k n p i 1 n i 1 Çizelge1.39 10..00 Çizelge 1 için örnek yorumlar: İkinci sınıfta AR-GE’ye 6. birinci sınıf ile ikinci sınıf arasındaki sınıf ara değerini verir. Birikimli sıklıklar denek sayısına oranlanırsa den daha çok birikimli ..25 7.24)/2=5.26 0. İlk sınıfın ara değeri birinci sınıftan önce bir sınıf varmış diye kabul edilerek.77 7.14 0.02 13. Den Daha Az Birikimli Sıklık: Sınıf ara değerinden daha az değeri olan sınıf sıklıklarının birinci sınıftan başlayarak eklenmesi ile elde edilir.

545 13. . AR-GE’ye yatırım yapan firmalardan tahmini olarak %8’i AR-GE’ye 6.00 1 47 3 0.55 ÜS 6. (kitle için yorum) 50 firmadan sadece 46 tanesi ya da %92’si AR-GE’ye 6. AR-GE’ye yatırım yapan firmalardan tahmini olarak %92’i AR-GE’ye 6. Alt sınır.92 fi Birikimli Sıklıklar Den Daha Den Daha Çok Az 0 50 Birikimli Sıklık Yüzdeleri Daha Den Daha Den Çok Az 0.245 7.49 11. AR-GE faaliyetleri için ayrılan kaynak mikatarı verileri için Birikimli Sıklık Çizelgesi Sınıf 1 2 3 4 5 6 7 8 AS 5.25 7.42 12 16 34 0.00 1.39 9. Veriler ondalıklı değil ise sınıf ara değerinin anlamı yoktur.595 3 50 0 1.345 10. sınıf değeri. sınıf ara değeri.58 0.59 13.94 0. üst sınır.245 bin YTL’den daha çok yatırım yapmaktadır.18 5 34 16 0.30 8.68 Sınıf Ara Değeri 5.245 bin YTL’den daha az yatırım yapmıştır.06 5 46 4 0.35 9.245 bin YTL’den daha çok yatırım yapmıştır.245 bin YTL’den daha az yatırım yapmaktadır.sıklık yüzdeleri ve den daha çok birikimli sıklık yüzdeleri elde edilir.00 0.11 - .20 6. Çizelge2’deki sınıf ara değeri kolonu olmaz ve birikimli sıklık ve birikimli sıklık yüzdeleri alt sınır ve üst sınır değerlerine göre yorumlanır.08 7 41 9 0.92 0. birikimli den daha az ve den daha çok sıklıklar ve birikimli den daha az ve den daha çok sıklık yüzdelerinden oluşan çizelgeye Birikimli Sıklık Çizelgesi denir(Çizelge 2).24 6. (kitle için yorum) Dikkat: Rakamların geldiği yerlere dikkat ederek benzer yorumlar diğer sınıflar içinde yapılabilir.40 10.54 12. Çizelge2.345 9.295 8.34 8. Birikimli sıklık yüzdeleri sınıf ara değerinden daha az ya da daha çok büyük değerli denek değerlerinin yüzdesini verir.32 13 29 21 0.32 0.495 12.29 7. sıklık ve göreli sıklık bilgilerinin oluşturduğu çizelgeye Sıklık Çizelgesi (Çizelge 1) ve Alt sınır.00 Çizelge 2 için örnek yorumlar: 50 firmadan sadece 4 tanesi ya da %8’i AR-GE’ye 6.68 0. üst sınır.44 10.145 4 4 46 0.445 11.82 0.45 11.08 0.50 12.

87 9. Bu durumdaki firma sayısı ise 40 tanedir. Büyük olasılık ile verilerin ortalaması ortancadan büyüktür. Tablodaki bilgiler görsel olarak bu histogramdan da yorumlanabilir. . yaprak kısmına ise ondalıktan sonraki kısım yazılarak dal-yaprak çizimi gerçekleştirilir. Benzer yorumlar bu çizimden de yapılır.Miktarı Çizelge1’de verilen göreli sıklık ve sınıf değerleri kullanılarak histogram çizilmiş ve yukarıda verilmiştir. Grafikten yorumlar subjektif’tir.9’dan daha az AR-GE’ye yatırım yaptığı söylenebilir.HİSTOGRAM : 14 12 10 Sıklık 8 6 4 2 0 5. 50 firmanın çoğunluğunun %9.92 10. Histogramdan veri dağılımının sağa çarpık olduğu gözlenmektedir. Dal 5 6 7 8 9 10 11 12 13 Yaprak 269 055568999 11224557789 001222458 02455679 1556 137 255 Dal kısmında ondalıktan önceki verinin tam kısmı.97 12.Veri kümesinin sağa çarpıklığı buradan da gözlenebilir. Eğer ortalama ve ortanca hesaplanırsa bu kolaylıkla görülebilir.12 - .72 6. Diğer benzer ya da farklı yorumlamak mümkündür.02 13.77 7.07 K.82 8. DAL YAPRAK ÇİZİMİ: Veri kümesinin görsel olarak bir diğer gösterimi Dal-yaprak çizimidir.

345) X  21 0.2 0.395 Den Daha çok Sıklığı 21 X 16 (9  8.13 - .3 0.30 13.395  8.80 7.1 0.655 X  21     X  17.05 5 Enterpolasyon yöntemi ile %9’dan daha çok yatırım firma sayısının yaklaşık 18 olduğu bulunur.25 Sıklık Yüzdesi 0.10 11.40 Kaynak M iktarı Enterpolasyon yöntemi ile ara değer bulma Yukarıdaki örnekte size %9’dan daha çok yatırım firma sayısı ne olduğu sorulduğunda tablodan direk bu soruya cevap vermeniz mümkün değil ama enterpolasyon yöntemi ile cevap vermeniz mümkündür. Sınıf Ara Değeri 8.DAĞILIM POLİGONU: 0.345) 16  21 1.00 10.15 0. NİTEL VERİLERDE SIKLIK ÇİZELGESİ .00 9.20 12.05 0 5.70 6.90 9.345 9. Enterpolasyon yöntemi ara değer bulmada kullanılan bir yöntemdir.88  18 (9.

5’inin uçak ile seyahat ettikleri tahmin edilmektedir.5’i (380 tanesi) uçak ile seyahat etmişlerdir.475 0.275 Kara Hava Deniz 0. göreli sıklık kolonları yer alır.475 SIRALANABİLEN VERİLERDE SIKLIK ÇİZELGESİ . 800 turistin yararlandıkları taşıt türlerine göre sıklık çizelgesi Taşıt Türü Kara Taşıtı Hava Taşıtı Deniz Taşıtı Toplam Yorumlar: 2003 turizm sezonunda ülkemize gelen 800 turistin %47. Sınıflar bağımsız olduğu için sıklık çizelgesinde sadece sınıf ve sıklık.SINIFLANABİLEN VERİLERDE SIKLIK ÇİZELGESİ Sınıflanan verilerde. sınıflar bağımsız olarak elde edildiği için her sınıfa düşen denek sayıları sıklık çizelgesini oluşturur. ÖRNEK: 2003 turizm sezonunda ülkemize gelen 800 turistin ülkeye gelişte yararlandıkları taşıt türlerine göre dağılımının sıklık çizelgesi aşağıdaki çizelgede verilmiştir.14 - . 2003 turizm sezonunda ülkemize gelen turistlerin yaklaşık %47.250 1. Daire Dilimleri Grafiği Sıklık (f i) 220 380 200 800 Göreli Sıklık (pi=fi/n) 0.25 0. Çizelge 3.275 0.000 0.

3) 17 (%22. Dağılım sınırları belli olmayan verilerin sıklık çizelgeleri açık uçlu düzenlenir. tahmin edilen değerlerden ötürü hatalı sonuç bulma olasılığı küçük olabilir.2) 1 (%1.0) 10 (%12. 77 öğrencinin Ekonomi sınav sonuçlarının sıklık çizelgesi Notlar Sıklık (fi) Göreli Sıklık (pi=fi/n) Ve Daha Az Birikimli Sıklığı Ve Daha Çok Birikimli Sıklığı F C B2 B1 A2 A1 29 31 7 6 3 1 77 0. sınıf değerlerine bağlı olan hesaplamalarda güçlük yaratabilir.9) (%87.Veriler belli bir sıralama ölçütüne göre sıralanabilen sınıflara ayrılır ve her sınıfa düşen deneklerin sayısı saptanırsa sıralanabilen verilerde sıklık çizelgesi elde edilir. Çizelge 4.039 0.3’ü C ve daha yüksek not almıştır EŞİT OLMAYAN ARALIKLI VE AÇIK UÇLU SIKLIK ÇİZELGESİ Eşit olmayan aralıklı sıklık çizelgeleri.3) Yukarıdaki sıklık çizelgesinden yararlanarak bazı yorumlar yapılabilir: Ekonomi dersini alan öğrencilerin %3.9) 4 (%5. .8) (%98.7) (%100) 77 (%100) 48 (%62. Açık uçlu sıklık çizelgeleri. Eşit olmayan aralıklı sıklık çizelgelerinde. Düşük gelirlerde sıklık yayılması olmasına karşın yüksek gelirlerde sıklıklar azalır.7) (%77.071 0. ÖRNEK: Ekonomi dersinin genel sınav sonuçlarının sıklık çizelgesi aşağıdaki çizelgede verilmiştir.402 0.091 0. Açık uçlu sınıf sıklıkları küçük olduğu için. Ekonomi dersini alan öğrencilerin %62. gelir dağılımı eşit olmayan aralıklı çizelgesi oluşturulur. uçların birinde ayrıntıların yok olduğu diğerinde gereksiz olduğu durumlarda düzenlemelidir.9’u dersi A2 notu ile başarmıştır.0) (%94. sınıflandırmada yorum ve grafik çiziminde kolaylık sağlanması için aralıklar en küçük aralığın katları olarak alınmalı ve değişik aralık sayısı da az olmalıdır.000 29 60 67 73 76 77 (%37. uçlara doğru sıklık yoğun olduğunda ya da dağılım aşırı derecede çarpıklaştığında. Böyle durumlarda kesin olmayan sınıf değerleri tahmin edilir.013 1.377 0. Örneğin. ÖRNEK: Bir ildeki 30 ilkokulun derslik sayılarının dağılımı incelensin.15 - .

9 11 ve 13 olan ilkokul sayısı sıfır olduğu için eşit olmayan aralıklı sıklık çizelgesi düzenlenebilir: Derslik Sayısı 5 6 7-9 10-12 13-15 İlkokul Sayısı 6 8 1 12 3 ÖRNEK: 108 kişinin yetenek test puanlarına göre dağılımı. açık uçlu sıklık çizelgesine örnektir: Puan 100’den az 100-119 120-139 140-159 160-179 180-199 200 ve çok Sıklık(fi ) 7 11 24 36 19 8 3 MERKEZİ KONUM (EĞİLİM) ÖLÇÜLERİ .Derslik Sayısı: 5 İlkokul Sayısı: 6 6 8 7 0 8 1 9 10 11 12 13 14 15 0 9 0 3 0 2 1 Verilerin.16 - . derslik sayısı 7.

Sınıflandırılmamış verilerde aritmetik ortalama. x   xi / n i 1 n formülü ile bulunur.20 değerleridir. Bu ölçüler Tablo1’de verilen verilen veriler üzerinde uygulanarak aşağıda tek tek ele alınmaktadır. verilerin dağılımdaki yerlerini.5  424.6  . Sınıflandırılmış verilerde ise aşağıdaki formüller kullanılmaktadır: i) Formül1 x f m i 1 i k i n = (5.07x3)/50 = 425.2  5.50 ve 8. Ham verilerimizde bu değer 6. Elimizdeki verilerin aritmetik ortalaması..6 / 50  8..49 olarak bulunur.65/50 = 8. birbirlerine olan uzaklıklarını kısacası konumlarını belirlemek için kullanılan ölçülerdir. Sınıflandırılmış verilerde ise tepe değeri aşağıdaki gibi hesaplanır. ˆ x  As  c d1 d1  d 2 As=En büyük sıklığın bulunduğu sınıfın alt sınırı .Konum ölçüleri. x  5.+13. Aritmetik Ortalama ( x ) En sık biçimde kullanılan merkezi konum ölçüsüdür..17 - ..72x4+6.  13.80x12+.513 ii)Formül2 x  Ac f b i 1 i k i n A=Herhangi bir sınıf değeri (genellikle orta kısımlardaki sınıflardan seçilir) bi=(Si-A)/c ˆ Tepe Değeri (Mod) ( x ) Sınıflandırılmamış verilerde tepe değeri en sık tekrar eden değerdir.

n tek ise (n+1)/2'nci değerdir.295  1.bir önceki sıklık d2=En büyük sıklık-bir sonraki sıklık O halde. n tek ise L= DDA kolonunda j'nin bulunduğu sınıfın alt SAi değeri n=50 olduğundan j=59/2=25 bulunur.295  f m   f m  16 m 1 m 1 i 1 4 1 x  L  c n / 2  fm m 1 i 1 fi  7.00 ortanca değerimizdir. 13 Ortalama.02 olarak bulunur.d1=En büyük sıklık . Veri sayısı çift olduğundan (50)/2=25'inci değer olan 8. L=7.05 1  7. ortanca ve tepe değeri arasındaki bağıntı: ˆ x  x   x ise sıklık dağılımı simetrikdir. As=7.30  1. Sınıflandırılmış verilerde ise ortanca aşağıdaki gibi hesaplanır.42 1 8 Ortanca (Medyan)( x  ) Sınıflandırılmamış verilerde ortanca. n ( yada n  1) i1   fm 2 m 1 x  L  c fi n 2  j  n 1  2  .05 50 / 2  16  8.30 d1=13-12=1 d2=13-5=8 ˆ x  7.18 - . n çift ise n/2'nci değer. n çift ise . .

ˆ x  x   x ise sıklık dağılımı negatif yöne eğilimli ya da sola doğru çarpıktır.19 - . ÇEYREK DEĞERLER (DÖRDEBÖLENLER) . Hali hazırda verilerin histogram grafiğinden de bu görünmekteydi. ˆ x  x   x ise sıklık dağılımı pozitif yöne eğilimli ya da sağa doğru çarpıktır. ˆ Verilerimiz için x < x  < x olduğundan dağılımın sağa çarpık olduğu söylenebilir. YÜZDELİKLER.

n tek ise X j 4  Q3    X j  X j1 . . 2 ve 3. j n 1 . ve 3.50.9)=7. Ancak kullanımda tercih edilmeyen bir ölçüdür. yüzdelik kendisinden önce deneklerin %40'ını kendisinden sonra deneklerin % 60'ının olduğu değerdir.5= 37 Bu durumda.50=121/2 olduğundan 12. veri arasında kalmaktadır (% 50 lilik bir fazlayla). yüzdelik) (Üst dördebölen) Sınıflandırılmamış verilerde aşağıdaki eşitlikler ile 1.65 1 olduğundan 37 ile 38. n çift ise  2 4  n ya da n+1 dördün katı değilse. j=50/4=12.7-9. veri arasında kalmaktadır. yüzdelik) (Alt dördebölen) Q2= 2.Q1 Sınıflandırılmış verilerde ise aşağıdaki formül ile hesaplanmaktadır: .6+0. Örneğin. çeyrek değerler bulunur:  X j  Q1    X j  X j1  2  .50x(9.1-6. n tek ise 4 n . DBA=Q3.50x(7. j . yüzdelik) aynı zamanda ortancadır.20 - . Q1=6. yüzdelik değerleri.9+0. 2 Dördebölenler Aralığı: Aşırı uç değerden çok az etkilenen bir konum ölçüsüdür. j  3n .00 3. Q1= 1.6)=9. 40.çeyrek değer (25. çeyrek dğerlerdir. n çift ise 4 3(n  1)  . 1.çeyrek değeri için j=3x50/4=37.Yüzdelik (Percentile): Kendinden önce ve sonraki belirli oranlarda değerler olan noktanın değerini ifade etmektedir. çeyrek değer (50. ile 13. çeyrek değerler araya katma yolu bulunurlar. Q3= 3. Verilerimiz için n=50 olduğundan dördün katı değildir. Çeyrek Değer (Quartile): 25. çeyrek değer (75. j . Q3=9. Bu durumda. ve 75.

5  4  7. a=50 için %an=50x50/100=25 L=7. YORUM-3: Firmaların %25’i AR-GE için tahminen en fazla 7. YORUM-3: Firmaların %50’si AR-GE için tahminen en fazla 8.05 25  16  8.34 bin YTL yatırım yapmaktadır.245 f2=12 f m=4 P25  6.245  1.00.34 bin YTL yatırım yapmaktadır. f2=12. YORUM-4: Firmaların %75’i AR-GE için tahminen en az 7.1 12.02 12 YORUM-1: 50 firmanın %25’i AR-GE için en fazla 7.34 bin YTL yatırım yapmaktadır.1 5 4  6. YORUM-2: 50 firmanın %90’ı AR-GE için en az 6.02 13 YORUM-1: 50 firmanın %50’si AR-GE için en fazla 8.50 L=6.295  1.02 bin YTL yatırım yapmaktadır.02 bin YTL yatırım yapmaktadır.34 bin YTL yatırım yapmaktadır. YORUM-2: 50 firmanın %75’i AR-GE için en az 7.02 bin YTL yatırım yapmaktadır.02 bin YTL yatırım yapmaktadır.02 bin YTL yatırım yapmaktadır. a=25 için %an=25x50/100=12. YORUM-3: Firmaların %10’u AR-GE için tahminen en fazla 6. YORUM-2: 50 firmanın %50’si AR-GE için en az 8. f m=4 P10  6. a=75 için .02 bin YTL yatırım yapmaktadır. YORUM-4: Firmaların %50’si AR-GE için tahminen en az 8.21 - . L=6.02 bin YTL yatırım yapmaktadır.245  1.34 12 YORUM-1: 50 firmanın %10’u AR-GE için en fazla 6.02 bin YTL yatırım yapmaktadır.245. YORUM-4: Firmaların %90’ı AR-GE için tahminen en az 6.%an  Pa  L  c Pa=a.295 f3=13 f m=16 P50  7. yüzdelik m 1 fm i 1 fi L=%an değerini içine alan DDA sıklıklarının minimum olanına karşılık gelen SA değeri f m=%an değerini içine alan DDA sıklığı fi=yüzdeliğin bulunduğu sınıfın sıklığı Verilerimiz için aşağıdaki yüzdelikleri bulalım: a=10 için %an=10x50/100=5.

395 f5=7 fm=34 P75  9. Bu farkların etkisi de ağırlık biçiminde hesaplamaya katılarak Ağırlıklı Ortalama elde edilir. Ağırlıklı ortalama aşağıdaki eşitlik ile hesaplanmaktadır. Xi değerini alan fi tane denek olmak üzere.395  1. AĞIRLIKLI.5+4x2. 40 işçinin 3200 YTL ve 10 işçinin de 4000 YTL’dir. Bu iş yerinde ortalama ücreti hesaplayınız.5  34  9.92 bin YTL yatırım yapmaktadır. 33 işçinin 3000 YTl.05 37.277 olarak bulunur.92 7 YORUM-1: 50 firmanın %75’i AR-GE için en fazla 9. YORUM-3: Firmaların %75’i AR-GE için tahminen en fazla 9. Benzer bir örnek: ÖRNEK: Bir öğrencinin bir dönem boyunca aldığı derslere ilişkin ders kredisi ve not değerleri aşağıda verilmektedir. ÖRNEK: Bir iş yerinde çalışan 20 işçinin günlük ücreti 2500 YTL. Ders Adı Matematik I Okuma Becerileri Kimya I Fizik I Türk Dili I Kredisi 4 2 4 4 2 Notu B1 A2 B2 C2 B1 Buna göre bu öğrencinin dönem ağırlıklı ortalaması. AO=(20x2500+33x3000+40x3200+10x4000)/100=3080 YTL olarak bulunur.5+2x3)/18=2. GEOMETRİK ORTALAMA . YORUM-4: Firmaların %25’i AR-GE için tahminen en az 9. YORUM-2: 50 firmanın %25’i AR-GE için en az%9. AO=(4x3+2x3.92 bin YTL yatırım yapmaktadır. GEOMETRİK VE HARMONİK ORTALAMA AĞIRLIKLI ORTALAMA Sınıflandırılmamış bazı veri kümelerinde verilerin önem dereceleri farklı olabilir. k k AO   f i X i i 1 f i 1 i Sıklık tablosundan elde edilen ortalama da bir tür ağırlıklı ortalamadır.5+4x1.%an=75x50/100=37.50 L=9.92 bin YTL yatırım yapmaktadır.92 bin YTL yatırım yapmaktadır.22 - .

yıldan 3.X n  (X 1X 2 .yıl satış fiyatı: 1.50  1. 1/ n Sınıflandırılmış verilerde ise GO  n S 1 S 2 .X n ) formülü ile hesaplanmaktadır. . 2.yıla %40. Bunu aşağıdaki örnekle gösterelim.S n ) f1 f2 fn f1 f2 fn 1/ n ile elde edilmektedir..40 x1... ÖRNEK: Bir malın toptan satış fiyatı 1..4 birim. Genellikle nüfus büyüme hızı. 1982 yılında ise 4575470 kişi ise 1982 yılındaki nüfusu tahmin ediniz. İncelenen 2 yıl içindeki ortalama artış ne kadardır? 1. ÖRNEK: Bir bölgenin nüfusu 1980 yılında 4254670 kişi..yıldan 2... Herhangi bir denek değeri 0 ya da negatif olduğunda geometrik ortalama hesaplanamaz. GO  4254670.45 Gözlenen 2 yıl içinde malın toplam satış fiyatındaki ortalama artış yaklaşık % 45’dir.1 birim olur.yıl satış fiyatı: 2. Sınıflandırılmamış verilerde geometrik ortalama GO  n X 1X 2 .yıl satış fiyatı: 1 birim ise 2.23 - .4 Geometrik Ortalama ile Bileşik Faiz Formülü Arasındaki İlişki Geometrik ortalamanın hesaplandığı eşitlikten yaralanılarak bileşik fazi formülüne ulaşılabilir. Geometrik ortalama formülünden yararlanarak bileşik faiz formülüne ulaşılabilir. 3.S n  (S 1 S 2 .Geometrik ortalama ölçümler arasında değişme oranı çok olduğunda hesaplanan bir ortalamadır.4575470  4412153.yıla ise % 50 oranında artmıştır. gelişme hızı ya da endeks gibi hesaplamalarda kullanılır.. Geometrik ortalama uç değerlerden aritmetik ortalama kadar etkilenmez. GO  1.

H.40x1. H.45) 2.1. Pt= 2.00.40 x1.b.O  1 1 1 1 (  .45 1..45.10  (1  0. t = 2 olur. hesaplamalarda kullanılmaktadır: Aşağıdaki formül ile hesaplanır.50  1.O  1  360 km/s 1 1 1 1   ( ) 3 300 450 360 DEĞİŞİM (YAYILIM) ÖLÇÜLERİ .. ikinci üçte birinde 450 km/s ve son üçte birinde 360 km/s hız yapmıştır.50  (1  0. Pt=P0 (1+r)t P0: Temel değer Pt: t zaman sonraki değer r: Artış oranı t: zaman Buradan örneğimiz için P0= 1.45) 2 2 Bileşik faiz formülü.10.  ) n X1 Xn ÖRNEK: Bir şehirler arası otobüs gittiği mesafesinin ilk üçte birinde 300km/s. Harmonik Ortalama Genellikle ortalama hız. ortalama fiyat v. r = 0.24 - . Buna göre aracın ortalama hızı ne olmuştur.

R= Xmaks. B firmasına çalışanların kazançları daha fazla farklılık göstermektedir. A firmasında çalışanların birbirlerine daha yakın kazanç elde ettiklerini. buna karşın B firmasındakilerin ise kazançların birbirlerinden daha uzak olduğunu görmekteyiz.25 - .02   1.62  7. Az sayıdaki bu verilere bakarak bu sonuca varabiliyoruz.3 2 2 Dağılımdaki tüm değerler kullanılmadığı için bilgi kaybı olabilir. n MS  | X i 1 i x| n formülü ile hesaplanır. ortalamadan uzaklıkları ne kadardır? Gibi sorulara cevap vermek için değişim ölçüleri hesaplanmalıdır. DEĞİŞİM GENİŞLİĞİ (ARALIK): Bir veri kümesindeki en büyük değer ile en küçük değer arasındaki farktır. Q Q 3  Q1 9.Xmin. ÇEYREK SAPMA: Ortalam yerine ortanca kullanıldığında ya da aşırı uç değerler bulunduğunda değişim genişliği yerine ÇEYREK SAPMA (Q) kullanılır. 2 firmanın 7 ustabaşısının yıllık kazançları aşağıda veilmiştir. Yalnızca bu ölçülere bakılarak verinin dağılımı hakkında tam bir bilgi sahibi olmak mümkün değildir. Değişim genişliği R (RANGE) harfi ile gösterilir.16). ORTALAMA MUTLAK SAPMA: Verilerin ortalamadan farklarının (sapmalarının) mutlak değerlerinin ortalamasıdır. A FİRMASI: 34500 B FİRMASI: 34900 30700 27500 32900 31600 36000 39700 34100 35200 33800 33800 32500 31700 İki firmaya ilişkin ortalama ve ortanca değerleri hesaplandığında eşit bulunmaktadır. bakarak bir sonuça ulaşmamız imkansızlaşacaktır. Veriler ne derecede dağılmakta ya da yayılım göstermektedirler?.Konum ölçüleri veri kümesinin ya da dağılımının merkezi hakkında bilgi varmektedir. Konum ölçülerine baktığımızda 2 firma arasında bir farklılık görünmüyor. ÖRNEK: NEWBOLD ( s. VARYANS ve STANDART SAPMA . Ortalama= 33500 ve Ortanca=33800. Gerçekte verilerin yayılımına dikkat ettiğimizde.. Ancak veri sayısının fazla olduğu durumda.

öğrencinin kalan 2 koltuktan birini seçme serbestliği var. Demek ki 19 öğrencinin seçme serbestliği varken 1 öğrencinin yoktur. =3517 DEĞİŞİM. Bu şekilde devam edilirse.65) / 50 S   3.94 50  1 ÖRNEK: NEWBOLD ustabaşı örneği. Sınıflandırılmamış verilerde varyans ve standart sapma formülleri ve verilerimiz için sonuçları: n N S  2  (x i 1 i  x) 2 n 1 S=1. =1554 B Firması için   12368571 .26 - . öğrencinin koltuk seçme serbestliği kalmamıştır. Ancak 20. 19. k  k  2 2   f i m i  ( f i m i ) / n  2 i 1  S   i1   n 1     2 2 3816. Varyansın karekökü alınarak standart sapma elde edilir. İkinci öğrencinin kalan 19 koltuktan birini seçme serbestliği var.98 100  23 8. Sınıflandırılmış verilerde ise aşağıdaki formüller yardımıyla hesaplanır.49 . ÇARPIKLIK VE BASIKLIK KATSAYISI 2 2 S=1.739  ( 425. A Firması için   2414286 . V S 100 X V 1.2168  3. İlk öğrencinin 20 koltuktan birini seçme serbestliği var.96  192. Özellikle farklı ölçü birimleri kullanan iki dağılımın değişimlerinin karşılaştırılmasında kullanılır. Aşağıdaki eşitlik ile hesaplanmaktadır.84 49 Kitle için:   2  (X i 1 i  ) 2 N S= Standart Sapma S2=Varyans Örneklem için neden (n-1)’e bölünüyor ? 20 koltuk bulunan bir salona öğrenciler sırasıyla girsinler.Bir veri dağılımındaki değişimin önemli bir ölçüsü varyanstır.98 Değişim Katsayısı Standart sapma ortalamanın yüzdesi olarak tanımlandığında "Değişim Katsayısı" olarak adlandırılır.

27 - . ÇK<0 ise dağılım sola doğru çarpık ya da . Verilerimizden elde edilen çarpıklık ve basıklık katsayısı değerleri: n ÇK   (X i 1 i  x) / n S 3 3  0. B>0 ise dağılım standart dağılımdan sivridir.yöne eğilimlidir. ÇK>0 ise dağılım sağa doğru çarpık ya da + yöne eğilimlidir. B<0 ise dağılım standart normalden basıktır. ÇK   (X i 1 n i  x) / n S 3 3 ÇK=0 ise dağılım simetriktir.80 B  (X i 1 n i  x) / n S 4 4  3  3. Çarpıklık katsayısı aşağıda verilen eşitlik ile elde edilebilir.13 Verilerimiz sağa çarpık ve standart dağılımdan daha sivri bir dağılıma sahiptir. .Çarpıklık ve Basıklık Dağılımın ortalamaya göre biçimine ilişkin bazı bilgileri çarpıklık ve basıklık katsayıları ile öğrenebiliriz. Basıklık Katsayısı ise aşağıdaki eşitlik ile hesaplanabilir: B  (X i  x ) 4 / n i 1 n S4 3 B=0 ise dağılımın yüksekliği standart normal dağılıma uygundur.13  3  0.

5 12.6 25.7 9.2 k (sınıf sayısı) = 7 alınırsa c (sınıf aralığı) = (34.7 41.4 19.3 35.6 7.6 41.7 22.8 29.3 30. Bu verilerden yararlanılarak sıklık çizelgesi.UYGULAMA-1 Aşağıda 45 ailenin yıllık gelirleri (1000 YTL) verilmektedir.3 36.8 29.7 23.7 32. 12.4 20 9.8 19.2 13.7 24.3 19.6 30.9 13.4 19.9 26.S) Üst Sınır(Ü.7 24.2+0.6 22. konum ölçüleri.3 19.4 21.5 20 23.7 24.6 35.7.9 19.4 22.28 - .133 0.8 23.8 9.2 36.2 27.5 28.5 9.4 19.9 36.7 12.3 22.1 27. mi (sınıf değeri)= (ASi + ÜSi) / 2 pi (göreli sıklık)= fi / n .7 9.5 En Büyük (Max.3 21.3 19.3 38.089 0.3 11.4 24.1 32 36.8 29.Min.2 28.7 .4 Verileri küçükten büyüğe doğru sıralayalım.2 12.133 0.7 En Küçük (Min.6 14.3 6 5 12 8 6 4 4 Sıklık (fi) Göreli Sıklık (pi) 0.2 22.5 20.4 21.4 19.7 32. değişim ölçüleri elde edilmektedir.9 17.3 38.2 23.1 16.3 21.8 27.6 9.9 14.8 23.2 29.4 11. Sıklık çizelgesini düzenleyelim: Alt Sınır(A.2 21.1 27 31.7 17.4 39.4 9.6 25.267 0.7 23.3/ 7 = 4.5 34.5 36.8 41.9 12. .8 36.2 29.2 21.4 29.111 0.7 Dağılım Genişliği (Range)= Max.9 22. = 41. birikimli sıklık çizelgesi.6 16.7 20.)= 41. 7.3 21.9 11.5 41.089 -3 -2 -1 0 1 2 3 bi .5 = 34.5 24.2 38.4 17.) Sınıf Değeri (mi) 7.9 olarak bulunur.4 21.5 14.8 38.4 26.8 41.3 17.)= 7.7 12.4 11.6 29.1) / 7= 34.178 0.S.

8 36.4 36.756 0. D.300 Si Yıllık geliri 25 Bin YTL’den fazla olan aile sayısını bulmak isteyelim.489 0.7 22. 7.pi 1.15 14  22 2.9 SAi 7.S. D.8 17.95 37 34.85 41 39.9 32.pi 0.9 8 x  17 bulunur.244 0.5 31.0 36.822 0.Ç.2 27 27.25 11 19.3 22.D.29 - .05  22.4 17.fi 22 x 14 25  22.6 27.35 6 12.7 14.400 39.D.5 12.15 25 27.911 1 D.133 0.05 31 29. Ü.600 29.000 0.45 D.3 fi 6 5 12 8 5 4 4 mi 9.75 45 HİSTOGRAM GRAFİK 14 12 10 8 6 4 fi 2 9. D.2 17.089 0 12.1 31.A. 27.85 x  22  4 . .689 0.000 0.900 14.Ç.Birikimli sıklık çizelgesini düzenleyelim: A.fi 0 D.700 24.S.000 19.Ç.A.867 0.511 0. SAi 22.311 0.500 34. Bunu interpolasyon yardımıyla yapabiliriz.fi 45 39 34 22 14 8 4 0 D.05 D.178 0.15 23 24.15 x  22  eşitliği ile x aşağdaki gibi bulunur.1 22.9 41.3 41.

35 11  6  eşitliği ile x aşağdaki gibi bulunur. 15  12.30 - . n çift ise .25 D. .42 74 n( yada n  1 ) i 1   fm 2 m 1  Lc x fi n  j 2 n 1   2 .. ORTALAMA.25  4.bir önceki sıklık En büyük sıklık-bir sonraki sıklık ˆ x  17.9x6+14.65 x  6 x  9 bulunur.35 x6 4.fi 6 x 11 17.12  20.175 > 21. n tek ise L= DDA kolonunda j'nin bulunduğu sınıfın alt SAi değeri n=45 olduğundan j=46/2=23 bulunur.95 olarak bulunur.3 d1=12-5=7 d2=12-8=4 d1 d1  d 2 En büyük sıklığın bulunduğu sınıfın alt sınırı En büyük sıklık .25  12. TEPE DEĞERİ (MOD) VE ORTANCA (MEDYAN) Ortalama ( x ) k x i 1  f i si n = (9.+19.9 Ortanca ( x  ) 7  17.35 15 17.3  3.075 ˆ Tepe Değeri ( x ) ˆ x  As  c As=17.25 i 1 4 1 m 1  f m   f m  11 m 1 x  L  c n / 2   fm m 1 i 1 fi  17..42 olduğundan dağılım sağa doğru çarpıktır.9 46 / 2  11  21. 12 Ortalama.4/45 = 23. ortanca ve tepe değeri arasındaki bağıntı 23.95 > 20.8x5+.3  4. SAi 12. L=17.9 5  2.A.7x12)/45 = 1038.D.Şimdi yıllık geliri 15 Bin YTL’den az olan aile sayısını bulalım.

5 L=17. yüzdelik L=%an değerini içine alan DDA sıklıklarının minimum olanına karşılık gelen SA değeri fm=%an değerini içine alan DDA sıklığı fi=yüzdeliğin bulunduğu sınıfın sıklığı a=25 için %an=25x45/100=11. STANDART SAPMA k  k  2 2   f i si  (  f i si ) / n  2 i 1  S   i 1   n 1      ( 27314.25 f3=12 fm=11 a=75 için %an=75x45/100=33.201 S    45  1   S=8.9 33.75  31  29.25  4.5  11  21.4 2 / 45  2   76.9 11.25 f3=12 fm=11 a=50 için %an=50x45/100=22.25  11  17. ÇEYREK DEĞERLER %an   f m m 1 i 1 Pa  L  c fi Pa=a.31 - .73 .52  1038.05 f5=6 fm=31 P50  17.75 L=27.05  4.25  4.95 12 P25  17.25 L=17.35 12 P75  27.29 6 VARYANS.YÜZDELİKLER.9 22.

(Cula. tepe değerini ve varyansını hesaplayınız.76) 2 10 13 2 10 13 3 10 14 4 11 16 6 11 18 7 11 20 7 11 25 8 12 25 8 12 28 9 12 28 2) İktisat bölümünde okuyan 40 öğrencinin bir aylık giderleri aşağıda verilmiştir. 500 bin tişört.70 5) Bir apartmandaki 10 dairenin kira tutarları (YTL) aşağıdaki gibidir.90 3.45 6. Getiri yüzdelerinin örneklem ortalamasını.1 4) Aşağıda 9 hisse senedinin belirli bir gündeki staış fiyatları verilmiştir. 300 500 350 400 600 450 550 500 350 500 6) Bir tekstil firması yılda 3 milyon triko. tepe değeri ve varyansını çizelgelerden yararlanarak hesaplayınız. 99. 400 bin gömlek ve 500 bin çorap üretmektedir.6 83. Sıklık ve birikimli sıklık çizelgelerini 6 sınıf için düzenleyiniz.04 7.5 96. Satış fiyatlarının örneklem ortalamasını. ortancasını. 100 350 450 500 150 350 500 500 200 350 500 600 200 400 500 600 250 400 500 600 300 400 500 650 300 400 500 750 300 400 500 800 300 400 500 800 300 400 500 850 3) Aşağıda 10 şirketin tahvil fonlarının beş yıldaki getiri yüzdeleri verilmiştir.10 9.4 82.00 5. Sıklık dağılımını oluşturunuz ve daire dilim grafiği çiziniz.1 75. Sıklık ve birikimli sıklık çizelgelerini 7 sınıf için düzenleyiniz.ALIŞTIRMALAR 1) Bir benzin istasyonu rasgele seçtiği 30 müşterisinin aldığı benzin miktarlarını litre olarak aşağıdaki gibi kaydetmiştir.80 4. ortanca. Ortalama. varyansını ve standart sapmasını bulunuz.6 69. Kira tutarlarının ortalamasını. varyansını ve standart sapmasını bulunuz.7 77.34 18.32 - .3 85.5 86. 7. ortancasını.1 90. s.40 8. .

Fermat 8 e karşı 7 yenerken. oyunların en kolayı olan. Bu nedenlerden dolayı olasılık kuramı. Herhangi bir olayın meydana gelme şansını ölçmeyle ilgilenen olasılık. bizlere belirsizlik altında ya da mevcut bilgilerin tam ve sağlıklı olmaması gibi durumlarda doğru ve sağlıklı kararlar verebilmede yardımcı olacaktır. medeniyetler boyunca değişik toplumlar için oyun ve şans oyunlarının önemli bir eğlence aracı olduğunu gösteren kanıtlar buldular. yararlandığımız bir kavramdır. sağlık uzmanları sigara içenlerin içmeyenlere oranla kansere yakalanma riskinin daha yüksek olacağını. İstatistiğin çıkarsama (öngörü) temelini oluşturan olasılık. istatistiğin önemli bir bölümünü oluşturmaktadır. yy da fransız matematikçiler Pierre de Fermat ve Blaise Pascal’a kadar.1. 100 Frankı bölüştürme problemi hakkında. daha sonra olasılık hesaplama kuralları ele alınacaktır. Örneğin meteoroloji uzmanı sabah haberlerinde o gün %80 olasılıkla yağmur yağacağını. sen kazanman için gerekli olan en az üç . 4 atışta oyun kesinlikle bitmiş olacaktı. Olasılığın Başlangıcı… Arkeologlar tarih öncesi barınaklarda. İlk kez on puan alan kazanacaktır. eğer galibiyet için gereken üç puanı alamazsan.33 - . Aşağıdaki senaryoyu takip ediniz. bir arkadaşının hasta olduğuna dair bir mesaj alıyor ve Toulouse’a gitmesi gerekiyor. olasılık matematiğinde dikkate değer bir gelişme olmamıştır. para atma oyununu oynamaya karar verirler. her biri ortaya 50 Frank para koyuyor. eğer ben iki puanı alamazsam. Yunan. belirsizlik durumunda sağlıklı kararlar vermeyi sağladığı için. Bu dört atışta. GİRİŞ Olasılık. yazı gelirse Pascal bir puan alacaktır. Bu aşamadaki oyun skoruna göre para nasıl bölünmelidir? Burada “eşit yetenekli” her oyuncunun oyuna eşit kazanma şansı ile başladığı anlamına gelir. planlama çalışmalarında yoğun bir biçimde kullanılmaktadır. Benzer yolla. Eğer tura gelirse Fermat. Mesajı getiren adam. adil olduğunu düşüneceğin bri çözüm buldum. Kısaca şöyle tanımlanabilir: İki eşit yetenekte oyuncu belli bir para karşılığında bir şans oyunu oynarlarken. Örneğin bir firmanın gelecek yıldaki satış kestirimleri. hemen hareket etmek şartıyla onları götürebileceğini söylüyor. 17. bir kısmı gerçekleşecek bir kısmı gerçekleşmeyecek bir çok varsayıma dayalıdır. Benim sadece 2 senin de 3 puana ihtiyacın olduğunu düşünürsek. olasılık matematiğinin diğerleri arasında en erken gelişmeye başladığı tahmin edilebilir.BÖLÜM 2 OLASILIK 2. ama ortadaki parayı nasıl bölüştürecekler? Fermat bir mektubunda şu teklifi sunuyor: “Değerli Blaise. sınavı başarısız geçmiş bir öğrenci o dersten geçme şansının çok az olacağını söyler. Bu bölümde olasılığa ilişkin temel kavramlar verilecek. Kazanan hepsini alacak. Mısır. Ama sonra ilginç birşey oluyor. Çin ve Hindu hanedanlarının büyük matematiksel buluşları ve insanların oyun oynamaya olan eğilimleri dikkate alındığında. Tabii ki Pascal durumu anlayışla karşılıyor. Buna karşın. Pascal ve Fermat Paris’te bir kafede oturuyorlar ve daha zor senaryolar tartışarak geçen yorucu saatlerden sonra. bu benim kazanmam için gereken iki puanı aldığım anlamına gelir. Sonuçta ne olursa olsun birinin diğerini yemeğe götüreceğini bilerek. günlük yaşamımızda sıkça kullandığımız. oyun kesiliyor. Noktalar Problemi Rönesans Avrupa’sında matematiksel olasılığın gelişimine ilham olan problem budur. böylece ortada 100 Frank bahis oluyor.

RASGELE SONUÇ Pekçok gözlemden sadece bir tanesinin gerçekleşme sürecine “Rasgele (Rassal) Deney (Deneme)” denir. Tura} Bir deneyin örneklem uzayı Venn ya da ağaç diyagramı çizilerek de oluşturulabilmektedir. parayı benim lehime olarak 11:5 oranında dağıtmamız gerektiğine inanıyorum. madeni para ile yapılan yazı-tura atışı.puanı almış ve kazanmışsın demektir.. Dört. Beş ya da Altı S={1. Arkadaşın ve meslektaşın. 5.2. ağacın bir dalıyla ifade edilmektedir. ‘y’ harfi de yazıyı göstermektedir. bir deneyin tüm olası sonuçlarının (kare. Venn diyagramı. dikdörtgen ya da daire gibi) bir şekille gösterilmesidir. B2. bir hisse senedinin karlı olup-olmaması. RASGELE DENEY. F1 S={Yazı. B1. yani ben (11/16)*100=68. F2. Pierre” 2. Böylece. bir öğrencinin dersi geçme notu. ‘h’ harfi tura. Tüm mümkün sonuçlarının kümesine ise “örneklem uzayı” denir ve “S” ile gösterilir. 2. 4..34 - . üretilen bir malın hatalı olupolmaması. Örneğin.25 Frank almalısın tabii. RASGELE SONUÇ 1: A1.75 Frank almalıyım ve sen de 31. C. İki. zar atışı. Örneğin. aşağıdaki olası oyun senaryolarının eksiksiz olduğuna inanıyorum. Benim kazandığım senaryolara yıldız koydum. RASGELE DENEY 1: Bir madeni paranın bir defa atışı. Venn ve . Tura} RASGELE DENEY 1: Bir zar atışı RASGELE SONUÇ 1: Bir. RASGELE SONUÇ 1: Yazı ya da Tura S={Yazı. Hatasız} RASGELE DENEY 1: Bir öğrencinin dönem başarısı. Bu yüzden.. Üç. Rasgele bir deneyin mümkün her bir sonucuna “rasgele sonuç” denir. Ağaç diyagramındaysa her bir sonuç. A2. Paris’te herşeyin yolunda olması temennisiyle. 6} RASGELE DENEY 1: Üretilen bir malın hatalı olup-olmaması RASGELE SONUÇ 1: Hatalı ya da hatasız S={Hatalı. F3. 3. tttt* t yt t* yttt* yytt* ttty* t yt y* ytty* yyt y t t yt * t yyt* yt yt* y y yt ttyy* tyyy ytyy yyyy Bu çıktıların hepsinin eşit olasılıklı olduğunda hem fikir olduğumuzu düşünüyorum.

ağaç diyagramları olasılık kavramlarının.35 - . görsel ifade yoluyla kolay anlaşılmasına yardımcı olmaktadır. S Yazı Tura .

You're Reading a Free Preview

İndirme
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->