You are on page 1of 8

G

EÇERLİK

Nitelikler içerisinde en önemlisidir. Bir ölçme aracının


ölçmeyi amaçladığı özellikleri başka değişkenlerle
karıştırmadan ölçebilmesidir. Ölçme aracı neyi ölçmek için
hazırlanmışsa, bunlar dışındaki etken ve özelliklerin
ölçmeyi etkilememesidir.

Örnek: Bir biyoloji testi yüksek okuma gücü ve kelime


bilgisi gerektirecek şekilde hazırlanmışsa ve çocuğun bu
kabiliyetleri düşükse, biyolojiyi iyi bilse bile zayıf alır. O
öğrenci için o testin geçerliliği düşüktür.

Uygulamada ve özellikle eğitimde, ölçmek istediğimiz bilgi


ve becerilerin tümünü bir sınavla ölçmek olanaksız olduğu
gibi sonuca başka faktörlerde etki eder. Bu nedenle
ölçmeye hata karışır.

● Eğitimde kullanılan ölçme araçlarının geçerliği tam


değildir.
●Testin geçerliği bir derece sorunudur. Tamamen geçerli
ya da tamamen geçersiz olması söz konusu değildir. Az
geçerli veya çok geçerli olabilir.
● Güvenirlik geçerliğin önemli parçasıdır. Geçerli
olabilmesi için test öncelikle güvenilir olmak zorundadır.

G
eçerlikBulmaYöntemleri
1. Kapsam geçerliği

Testi oluşturan maddelerin ölçülen davranışlar evrenini


temsil etme düzeyi hakkında karara varma işidir. Kapsam
geçerliği aranırken;

• Bir ölçme aracının konu ve davranış boyutuna bakılır.


• Test maddelerinin ölçülmek istenilen davranışı
ölçmede uygun olup olmadığına bakılır. Bunun
sonucunda da yargıya varılır.

Öğrenci başarısını ölçmede kullanılan başarı testlerinin


geçerliliğini bulmada en uygun yöntem kapsam
geçerliliğidir.Testi oluşturan maddelerin konu ve davranış
boyutu analizi işi testi hazırlayan kişi yapabileceği gibi
aynı konuda uzman bir ekipte yapabilir.

Kapsam Geçerliliğinin Aşamaları


1. Ölçülecek değişkenle ilgili davranışlar evreninin
belirlenmesi
2. Testi oluşturan davranışların belirlenmesi
3. Testi oluşturan davranış örneklemin, evreni temsi
düzeyinin tespit edilmesi

4. Testteki soruların ilgili olduğu davranışı ölçmeye


uygun olup olmadığının kontrol edilmesi

Diğer bir yöntem de öğrencilerin bu maddeden aldıkları


puanlarla, testin tümünden aldıkları puanlar arasında ne
düzeyde bir benzerlik olduğunun bulunmasıdır.(madde
ayırıcılık gücü) Madde ayırıcılık gücü -1 ile +1 arasında
değer alabilir. Eğer madde 0.2‘nin altındaysa madde
testten atılmalıdır ve geçersizidir.Bu tür test
maddelerinin teste alınmaması geçerliliği ve güvenirliliği
yükseltir.

Eğer testimiz iki boyutlu ve daha fazla ise homojen


maddeler bir araya alınarak alt testler
oluşturulabilinir.Bu alt testler için güvenirlik ve geçerlilik
hesaplanır.

Testin kapsam geçerliliğini tespit ederken testi oluşturan


davranışların evreni temsil edip etmediğini belirtmek için
belirtke tablosu hazırlanmalıdır.Belirtke tablosunda en
azında uygulama düzeyine kadar soru bulunmalı ve her
örneklem davranış için soru bulunmalıdır. Bilişsel alan
basamakları kısaca aşağıdaki gibidir:

Bilişsel alanda altı basamak vardır. Gelişmiş olan her basamak


öncekileri kapsar.

f Değerlendirme a+b+c+d+e+f
e Sentez a+b+c+d+e
d Analiz a+b+c+d
c Uygulama a+b+c
b Kavrama a+b
a Bilgi a

1. Bilgi: Daha çok ezbere dayalı olan kavramlar, kuramlar,


özellikler, tarihi olgular, genellemeler vb.
2. Kavrama: Kavrama basamağının üç alt basamağı vardır.
Çevirme, yorumlama ve ötelemedir. Kavrama bilgiye dayalı olmak
zorundadır.
2.1. Çevirme: Bir metni İngilizce’ye çevirmek, verilere göre
grafik çizmek veya tablo yapmak vb.
2.2. Yorumlama: Örnek vermek, uzun bir parçayı özetlemek vb.
2.3. Öteleme: Tahmin, kestirme veya yordama yapmaktır.
Mevcut verilere göre hava tahmini yapmak gibi.
3. Uygulama: Çoğunlukla matematikle ilgilidir. Ancak sosyal
bilimlerde de olabilir. Derste verilmeyen bir sorunun sınavda
matematiksel işlemle veya problem çözme aşamalarını kullanarak
çözülmesidir. Uygulamada ipucu kelime “yeni” bir problemin
oluşturulmasıdır.
4. Analiz: Bir bütünün parçalara ayrılmasıdır. Bir motoru
parçalarına ayırmak. Bir makaleyi ana bölümlere ayırmak vb.
5. Sentez: Bir bütün oluşturmaktır. Doktora tezi yapmak,
makale hazırlamak vb.
6. Değerlendirme: Karşılaştırma yapmaktır.

Aşağıda örnek belirtke tablosu verilmiştir:

Tablo: Gelişim ve öğrenme dersi Vize sınavı için Davranışlar


örneklemi için kapsam geçerliliği yüksek belirtke tablosu

Davranış düzeyleri Bilgi Kavrama Uygulama Toplam

Konu(Üniteler)
1.Giriş,fiziksel 8 20 0 28
gelişim
2.Bilişsel gelişim 4 16 0 20
3.Ahlaki gelişim 12 8 0 20
4.Öğrenme ilkeleri 4 8 4 16
5.Bilgi işleme kuramı 4 8 4 16
Toplam 32 60 8 100

Bu tabloda görüldüğü üzere tüm davranışlardan örneklem


alınmıştır. Ayrıca bu davranışlardan bazıları içinde uygulama
düzeyinde sorular sorulmuştur. Teste hem bilgi hem kavrama hem
de uygulama düzeyinde sorular vardır.

2.Ölçüt Geçerliliği
Geçerliği çalışılan bir ölçme aracıyla aynı özellikleri ölçen ve
geçerli olduğu kabul edilen bir başka ölçme aracının aynı kişilere
uygulanması sonucunda elde edilen ölçümler arasındaki korelasyona
ölçüt geçerliliği denir.

Genel olarak 2 tür ölçüt geçerlilik katsayısı tanımlanmaktadır:

a. Uyum geçerliliği: Yeni geliştirilen test ile daha önceden


hazırlanmış ve yeni testle aynı amaca hizmet eden
geçerli olduğu bilinen diğer bir test aynı gruba
uygulanır ve sonuçları karşılaştırılır. Sonuçlar birbirine
benzediği oranda geçerliliği yüksektir. Bu geçerlilik
belirleme yöntemine uyum (uygunluk) geçerliliği adı
verilir.

b.Yordama Geçerliliği: Bir testin gelecekteki başarıyı


tahmin etme düzeyine yordama (tahmin) geçerliliği adı
verilir. Yordamada da ölçüt geçerliliği söz konusudur.
Örnek: Üniversite sınavında alınan puanla
üniversiteye girmiş birinin orada aldığı notlar
arasındaki korelasyon katsayısı, ÖSS’nin
yordama katsayısıdır.

3.Yapı Geçerliliği-Teorik Yapıyı Destekleme

Ölçme aracı içerisinde yer alan maddelerin, diğer


maddelerle bütünlük içerisinde olmasıdır. Yapı geçerliği
daha çok psikolojik ölçümlerle ilgili görülmüştür. (İlgi,
kişilik, tutum vs.) Teorik ile ilgilidir.
Zekâ testi hazırlanırken; Zekâ, soyut bir yapıdır.
Öncelikle bu soyut yapıdan ölçülebilir davranışlar çıkarılır
ve bu davranışları ölçecek testler geliştirilir. Bu
hazırlanan testlerin zekâ ile ilişkisi yapı geçerliğini
gösterir. (Testin tüm soruşlarının zekâyı ölçer nitelikte
olmasıdır. )
Yapı geçerliğini belirleme, ölçülmek istenen özelliğe az
sahip ve çok sahip iki gruba aynı test uygulanır ve bu
testin iki grubu ne kadar ayırdığına bakılır.
Günümüzde istatistiksel olarak bir ölçe aracının yapı
geçerliliğini çalışmada;

• Açıklayıcı faktör analizi


• Doğrulayıcı faktör analizi
• Yapısalcı eşitleme modeli kullanılmaktadır.

4) Görünüş geçerliği:

Testin ölçmek istediği özelliği ölçüyor görünmesidir.


Testin bütünü için gerekli olan bu görünüş geçerliği her
bir soru içinde gereklidir Kapağında fizik testi yazan
kitapçıktaki sorular fizik bilgisini ölçüyorsa görünüş
geçerliği vardır denir.

Örnek: Yarılanma süresi 20 yıl olan bir radyoaktif


maddenin 200 yıl sonra ne kadarı kalır? Sorusunun hangi
alanla ilgili olduğu belli değildir. (Cevap için fizik veya
kimya bilgisine gerek yoktur – görünüş geçerliği zayıftır)
Bazı testlerin görünüş geçerliğinin saklanması gerekir.
Ör. Kişilik testleri (Kişiler doğru cevap vermekten
kaçabilir.)

G
eçerliği EtkileyenFaktörler
● Güvenirlik: Geçerlik için güvenirlik şarttır. Ancak tek
başına yeterli değildir.
● Ölçme sisteminden kaynaklanan hatalar: Sabit hatalar
ve sistematik hatalar geçerliği düşürür. (Güvenirliği
etkilemez)
● Ölçme yöntemi puanı etkiler: Sözlü, doğru-yanlış testi
gibi yöntemler puanı etkiler.
● İstenmeyen değişkenlerin ölçümlere karışması: Testin
başka özellikleri ölçmesi geçerliği düşürür. ÖR: Psikoloji
sınavında gramer hatalarına da puanlama yapma.
● Dersin kapsamı dışında sorular hazırlanması
● Maddelerin zorluk derecesi (Sorular orta güçlükte
olmalı)
● Sorularla ilgili ipuçları vermek geçerliği düşürür.
● Sınav planı (Belirtke tablosu)
● Cevap şıklarının dizilişi (a a a a gibi aynı şıklar arka
arkaya gelmemelidir)
● Her sınavda farklı sorular sorulmalıdır. (İki sınıfa veya
aynı sınıfa aynı sorular sorulmamalıdır.)

GÜVENİRLİK VE GEÇERLİK ARASINDAKİ İLİŞKİ


● Geçerlik için güvenirlik ön şarttır. Ancak güvenilir olan
bir ölçme aracı geçerli olmayabilir. Ör: Normalden 2
santim kısa olan bir cetvel her ölçme işleminde aynı
sonucu verir (güvenilirdir). Yani test tutarlı ölçüm
yapabilir ancak ölçmek istenilen özelliği ölçmüyordur.
● Geçerlik, güvenirliğin en fazla kareköküne eşittir. Fazla
olamaz.
● Güvenirlik düştükçe geçerlikte düşer. Ancak güvenirliği
yüksek olan bir testin geçerliği düşük olabilir.
● Bir ölçme aracının güvenirliğini sağlayan bütün
çalışmalar, geçerliği de arttırır.
● Bazen güvenirliği arttırırken geçerliğin düştüğü
durumlar olabilir.

Örnek: testi homojenleştirilerek (aynı tip soru ilave


ederek) güvenirlik artabilir ancak bunun kapsamı daraltma
riski vardır. Geçerlik düşer.

Şekil: Güvenirlilik ve geçerlilik arasındaki ilişki

You might also like