Ölçme Ve Değerlerdirme Özet

Ölçme: Geniş anlamıyla, herhangi bir niteliği gözlemek ve gözlem sonucunu sayılarla ya da sembollerle ifade etmektir. Ölçme başka bir ifadeyle nitelikleri nicelendirme işlemidir. Ölçme bireyin ya da bireylerin belli bir özelliğe sahip olma derecesinin sayısal olarak betimlenmesidir. Benim boyum 1.85’dir. Bugün havanın sıcaklığı 25 derecedir. Ahmet Tarih dersi sınavından 8 puan aldı. Standart ölçme araçları: metre, kg, standart testler, litre.

Bir öğretmenin sınıfta sorduğu sorulara doğru cevap veren her öğrenciye bir artı vermesi. Bisikletin değeri 300 YTL’ dir. Ayşe çok güzel bir kızdır.
Ölçme işleminin aşamaları:
Ölçülecek bir değişkeni ya da özelliği belirleme.

Özelliği ya da değişkeni gözlemleme.
Gözlemi uygun zamanda gerçekleştirme.
Sonucu sayı ya da sembolle ifade etme.
Ölçek: Ölçme dilimizde birim derecelendirilmiş araç anlamlarında kullanılır. Literatürümüzde ise bir ölçme kümesinin sahip olduğu matematiksel özellikler ölçek anlamında kullanılır. Diğer bir tanım ise; nesnelere verilen sayıların anlamlarını ya da nesnelere sayılar vermede ve nesnelere verilen sayıların kullanılmasında uyulması gereken kurallar ve kısıtlamaları belirtmek için kullanılır. Đkinci anlamda ölçek; cetvel ve metre gibi ölçme araçları bölümlenmiş bir ölçme aracını belirtmek için kullanılır. Çeşitleri:
1. Sınıflama (Adlandırma) Ölçeği: Üst düzey bilgiler vermezler. Sadece frekans ve %

hesaplama gibi basit işlemler yapar. Gözlemlerin en basit biçimi olup taşıdığı bilgiler en az olan ölçeklerdir. Bireylerin ya da objelerin belirli özellikleri doğrultusunda benzeyip benzemedikleri biçimde yapılandırmasıdır. Özelliklerine bakarsak:

Nesnelerin belirli yönlerinden benzeyip, benzemediklerine göre sınıflamaktır.
Nesnelerin farklılık ve benzerliklerini belirlenir.
Nesnelerin sınıf, tip ve kategorilerine göre sınıflanır.
Đllere plaka numarası verme, kız – erkek öğrencileri ayırma, kısa – uzun boylu öğrencileriayırma.
Basit istatistik işlemler yapma. ÖSS’yi kazanan adayların bölüm tercih sıralama listesi.
Değişkenler taşıdıkları özelliğe göre sınıflara tasnif edilirler.
Sınıflama ölçeğinde sınıflar oluşturulduğundan dolayı, bu sınıflardan herhangi birine giren tümelemanlar eşit, farklı sınıflardan alınan elemanlar ise farklı olurlar.
Eğitimde nadiren kullanılır; bazı tanımlayıcı nitelikler (göz ve saç rengi gibi değişkenler),insanların yaşadığı coğrafi bölgeler gibi değişkenler bu ölçeğe örnektirler.
Bu ölçek değişkenleri sadece gruplara tasnif ettiğinden matematiksel olarak elimizde sadecefrekanslar vardır. Dolayısıyla, frekanslara dayalı analizler dışında bir çok matematiksel işlemi yapmak anlamsızdır. Örneğin elmalarla armutların ortalamasını alamayız. Matematiksel işlem olarak sadece sınıf içindeki elemanların sayısı yani frekanslar belirlenir.
Bu ölçekte bazen isimler yerine sayılar kullanılabilir. Mesela bir ankette kız öğrencilere “1” ile, erkeklere ise “2” ile kodlanması. Futbolda kalecilere “1” numarasının verilmesi, okul kimlik numaralarında sayıların kullanılması durumlarında, kullanılan numaraların sayısal bir anlamı yoktur, bunlar sadece koddurlar. Numarası “11” olan bir oyuncunun numarası “1” olan oyuncudan daha iyi olduğunu söyleyemeyiz.
Sınıftaki öğrencilerin velilerinin mesleklerini belirlemek için bir anket hazırlanmış ve bu ankete memur, esnaf, işçi gibi ifadeler yazılmıştır. Bu ifadeler sınıflama ölçeğinde yer alır.

2. Sıralama Ölçeği: Sınıflama ölçeğine göre bir üst düzeyde ölçme sonuçları veren ölçek türüdür. Bireylerin ya da objelerin ölçülen özellikleri doğrultusunda sıraya konması ve sıradaki yerine göre bir sayı verilmesi durumu söz konusudur. Özellikler;

Nesneleri belli özelliğine sahip oluş miktarı bakımında sıralamaktır.
Öğrencileri boy sırasına, sınav notlarına göre sıralama.
Ortanca ve yüzdelikler belirlenir.
Niteliklerin belli bir boyutta, büyükten küçüğe, küçükten büyüğe, iyiden kötüye veya kötüdeniyiye doğru sıralanmasıyla elde edilir. Bu sıralar sayı ile ifade edileceği gibi bazı sıfatlarla da ifade edilebilirler; pekiyi-iyi-orta-geçer-kalır, en uzun-uzun-kısa gibi. Bu tür ölçeklerde öğrencilerin tüm grup içindeki yeri belirlenmektedir.
Sıralama ölçeğinde, sınıflamadan fazla olarak sıralar arasındaki büyüklük küçüklük ilişkisi vardır.
Bu ölçekte belli bir boyutta sıralar arasındaki büyüklük, küçüklük anlamlıdır. Buna rağmen, iki sıra arasındaki farkın miktarını söylemenin bir anlamı yoktur. Başarı sıralamasına göre veya boy uzunluğu sıralamasına göre, ikinci öğrencinin dördüncü öğrenciden iki birim daha üstün olduğu söylenemez. Her bir ardışık sıra numarası alan öğrenciler arasındaki fark bir derece de olsa da bu farkın aynı miktarı ifade ettiği söylenemez. Sınıftaki en başarılı ilk beş öğrencinin belirlenmesi.

3. Eşit Aralıklı Ölçekler: Bireyler ya da objelerin ölçme konusu olan özellikleri reel sayılar kümesinin elemanlarıyla bire bir olarak eşlenirler. Bir çok nesne ya da bireyin belirlenmiş bir başlangıç (izafi 0 noktası) noktasına göre ve belli bir özelliğe göre sahip oluş düzeylerine göre eşit aralıklarla sıralanması durumudur. Mutlak Sıfır (0): 0 kg, 0 cm gibi. Đzafi 0 ise; öğrencinin sınavda 0 alması. Bir öğrenci sınavdan 0 alıyorsa bu onun hiçbir şey bilmediği anlamına gelmez. Saatimizin 00:00 göstermesi ya da termometrenin 0 dereceyi göstermesi ortamda hala sıcaklığın olduğuna işarettir. Özellikleri:

Nesnelerin belirli bir başlangıç noktasına göre ve belli bir özelliğe sahip oluş derecesi bakımından eşit aralıklarla sıralanmasıdır.
Başlangıç noktası (0 noktası) tanımlanmıştır. 0 noktası keyfidir ve eşit aralıklarla bölümlenmiştir.
Termometre, takvim, saat, sınavlar.
Aritmetik ortalama ve standart sapma bulunur.
Türkçe dersinin sınavında 90 alan bir öğrencinin zekası 45 alan bir öğrencinin zekasından tamiki kat fazladır anlamı çıkmaz.
Hava sıcaklığının 18 derece olarak belirlenmesi.
Bir öğrenciye uygulanan zeka testi sonucu.
Bir öğrencinin falanca dersine tutumu.
Matematik dersi 90 olan bir bireyin notu matematik dersi 45 olan bireyin notunun tam ikikatıdır anlamı çıkmaz. Çünkü 0 noktası görecelidir yani izafidir.
Buraya kadar eğitimde uygulanabilir.
Eşit aralık ölçeklerde ölçümler arasındaki farkın miktarı anlamlıdır zeka puanı 120 olan birininzeka puanı 60 olan birinden 60 daha fazla aldığını söyleyebiliriz. Yani iki ölçüm arasındaki
farkın miktarı anlam kazanmaktadır.

4. Oranlı Ölçek: En üst düzeydeki ölçektir. Aralık ölçeğinden ayrıldığı nokta “0” noktasıdır zaten

eğitimde de kullanılmamasının nedeni de budur. Oran ölçeğinde “0” gerçek (mutlak) “0”’dır. Oran ölçeğinde elde edilen ölçme sonuçları çarpım ve bölme yapılabildiğinden matematiksel 4 işlem ve bu işlemlere dayanan tüm istatistiksel işlemler yapılabilir ve bu da anlamlı olur. Özelliklerine bakarsak:

Başlangıç noktası olan 0 noktası gerçek bir sıfır noktasıdır.
0 noktası ölçülen özelliğin hiçliğini, yokluğunu gösterir.
Uzunluğun ya da ağırlığın ölçülmesidir.
Her türlü istatistik işlemi yapılır.
Sınıftaki öğrenci sayısının belirlenmesi.
Basketbol takımına girecek öğrenciler için boy uzunluğu sınırı belirleme.
Boyu 90 cm olan bireyin boyu 45 cm olan başka bir bireyin boyunun tam 2 katıdır anlamı

çıkar.

ÖLÇME TÜRLERĐ
1. Doğrudan (Temel) Ölçme: Ölçülen özellikle kullanılan ölçme aracının niteliği benzerdir

(aynıdır). Ölçülecek değişken dolaysız (doğrudan) ölçülür. Özellik kendisine ilişkin ölçme aracı ile ölçülür. Geçerliği ve güvenirliği yüksek bir ölçme elde edilir. Ağırlığı başka bir ağırlık ölçüsü ile ölçmek, uzunluğu bir başka uzunluk ölçüsü ile ölçmek.

Bir masanın boyunun cetvel ile ölçülmesi.
Bir paketin kefeli terazi ile ölçülmesi.
Bir sınıftaki öğrenci sayısının belirlenmesi.
Öğrencilerin boy uzunluklarının belirlenmesi.
Bir öğrencinin sahip olduğu kitap sayısının belirlenmesi.
Ahmet’in kaç kardeşi olduğunun belirlenmesi.
Sosyal Bilimler dersinde ölçme işlemi gerçekleştirmek zordur bunun nedeni ise, özelliklerinin doğrudan gözlenememesi.

2. Dolaylı Ölçme: Ölçülen özellik ile kullanılan ölçme aracının niteliği benzer değildir (farklıdır), ölçülecek değişkenin dolaysız (doğrudan) bir şekilde gözlenmediği durumlarda başvurulur. Özellik kendisine ait olmayan başka bir araçla ölçülür. Geçerlik ve güvenirlik düşüktür. Eğitimdeki ölçmeler tamamıyla dolaylı ölçmelerdir. Her türlü sınav dolaylı ölçmedir. Bir değişkenin (o değişkenin bir göstergesi olduğu kabul edilen) başka bir değişken ya da tanımlanan bir bağıntı yardımıyla ölçülmesidir.

Bir öğrencinin bilgisinin sınav ile ölçülmesi. Resim öğretmenin öğrencinin yaptığı resme bakarak not vermesi.
Öğrencinin zeka düzeyinin ölçülmesi.
Öğrencilerin yeteneklerinin ve kişilik özelliklerinin ölçülmesi.
Bir dersten geçme notunun belirlenmesi.
Bir paketin yaylı terazi ile ölçülmesi.
Bir odanın sıcaklığının termometre ile ölçülmesi.DEĞERLENĐRME
Değerlendirme, ölçme sonuçlarının aynı alana ait bir kriter ile kıyaslanarak bir değer
yargısına ve oradan da bir karara ulaşma sürecidir .Öğretmen öğrencisine: “Bu dersten tekrara kaldın” demiştir. Öğretmenin bu ifadesi Karar’dır.. Ölçme ve değerlendirme etkinliklerinin eğitimin sürecindeki temel işlevi:
Davranışların kazanılma düzeyini belirleme.
Öğrencilerin hazır bulunuşluk seviyelerini belirleme ve bilgi edinme.
Öğrenciyi motive etme.
Öğrencilerin geleceklerine yönelik karar alma.
Ölçme Sonucu (ölçüm) Kriter (ölçüt) Değer Yargısı KARAR
(Ali, 163 cm boyundadır.) (Polis okuluna ön kayıt (Ali’nin boyu kısadır.) (Ali polis okuluna
yapmak için 167 cm giremez.) boya sahip olmak
gerekmektedir.)
Ölçüt: Ölçme sonuçlarını karşılaştırdığımız ya da kıyasladığımız sabit değere kriter (ölçüt) denir. Ölçüt olarak; programın hedefleri, öğrencinin yeteneği, grup başarısı, öğrenme eksiklikleri kullanılabilir. Öğretmenin öğrenciye ilişkim kanaati kullanılmaz. Bir öğretmen, dersinde 3 kez artı alana, sınavda 5 puan fazla vermektedir. 3 kez artı alma ölçüttür.
Kullanılan Ölçüte Göre

1. Norm Dayanıklı (Bağıl): Bireyin başarısının içinde bulunduğu gruba göre değerlendirmedir.

Çan eğrisi buna örnektir. Grup olarak ele alınır. Türkçe dersinde öğrencilerin dönem sonunda alacakları notu belirlenen sınıfın aritmetik ortalamasını dikkate alma. Đngilizce bilgisi en iyi olan ilk 5 öğrenciyi belirleme. Bağıl değerlendirmede, sınıftaki diğer öğrencilerin başarısı, öğrencinin yeteneği, ülke çapındaki normlar, erişi düzeyi ölçüt olarak kullanabiliriz. Matematik olimpiyatlarına katılacak öğrencilere uygulanan bir testin sonucuna bağlı olarak en iyi üç

öğrenciyi seçmek. Sınıfın öğrenme düzeyine göre geri kalan öğrencileri belirleme. Aritmetik

ortalamanın altında kalan öğrencileri başarısız sayma.
2. Kriter Dayanıklı (Mutlak): Bireyin başarısını daha önceden konulmuş bir kuralı yerine getirip

getirmediğine bakılır. Bireyin başarısı tamamıyla kendi çabasıyla alakalı. Matematik dersinde öğrencilerin öğrenme eksikliklerini belirleme. Beden dersinde 100 metreyi 12 sn. de koşan öğrencileri başarılı kabul etme. Matematik dersinde başarılı olmak için en az 60 puan almak gerekmektedir. Bu ifadede yer alan “60” puan mutlak ölçüttür. Đçerikte yer alan konuların en az %80’nini öğrencilere kazandırma. Hedef – davranışların %70’sine ulaşamayan öğrencilere ek öğretim faaliyetlerini düzenleme.

Kullanılma Amaçlarına Göre

Biçimlendirici/Đzlemeye Değerlendirme (Formatif): Eğitim – öğretim sürecinde devametmekte yapılan sınavların hepsi bu değerlendirmeye girer. Her konu sonu testleri, deneme sınavları. Üniteler arasındaki aşamalılığı ve geçişi sağlar, öğrenme yetersizlikleri belirlenir ve önlem alınır. ünitedeki öğrenme eksikleri belirlenir. Ünitenin hedef – davranışlarında gerçekleşme düzeyi belirlenir. Öğrencilere ara sınav yapılarak not verilir. Öğrencilerin öğrenme süreci takip edilir.
Düzey Belirleyici (Summatif): Eğitim –öğretim sonunda yapılır. Hedeflere ne derecede ulaşıldığını gösterir. Vizeler (biçimlendirici), final sınavları ise (düzey) belirleyicidir. KPSS sınavı. Öğretme – öğrenme etkinliklerinin sonunda öğrencilerin son durumlarını belirlemek amacıyla yapılan düzey belirleyici değerlendirmede ölçme araçları olarak: Başarı sınavı, bitirme sınavı (final), yeterlilik sınavı, uzmanlık sınavı, erişi testi.

Öğretim programının hedeflerine ulaşma düzeyi, öğrenme düzeyi ve öğrencileri başarı düzeyini belirlemek için yapılır.

3. Tanıma – Yerleştirmeye göre Değerlendirme:

Öğrenme sürecinin başında ya da bir dersin giriş bölümünde yapılan değerlendirmedir.
Öğrencilerin belli bir kurs, ders ya da ünitenin ön koşulu niteliğindeki giriş davranışlarına sahipoluş derecelerini belirlemek.
Öğrencileri düzeylerine göre gruplama.
Öğrencilerin giriş davranışlarını belirleme.
Öğrencileri bir programa yerleştirme.
Öğrencilerin hazır bulunuşluk düzeylerini belirleme.
Üniversiteye yeni başlayan öğrencilere Đngilizce dersinde yapılan bir testin sonucuna dayalıolarak öğrencilerin %30’u dersten muaf sayılmışlardır. Bu değerlendirmenin amacı tanıma
yerleştirmeye yönelik değerlendirmedir.
Dip Not: Dershanelerin sene öncesinde yapılan sınavlar tanımlayıcı değerlendirme türleridir.
Bir Ölçme Aracında Bulunması Gereken Nitelikler

1. Güvenirlik:

Ölçme araçlarının kararlılığı, tutarlılığı (aynı ve benzer sonuçları vermesi) ve duyarlılığı(hatalardan arınıklığı) dır.
Ölçme aracının hatalardan arınık olma.
Bir ölçme aracının birden fazla uygulandığında benzer ya da yakın sonuçların alınması(tutarlığı) güvenilir olduğunu gösterir.
Bir ölçme işlemi ne kadar az hata yaparsa (duyarlılık) güvenirliği o kadar yüksek olur.
Ölçme aracı gerçeği yansıtma derecesidir.
Bir testin güvenirliğini doğrudan artıran faktör “cevap anahtarı” hazırlamadır.

2. Geçerlik:

Ölçme aracının kullanılış amacına hizmet etme derecesidir.
Ölçme aracının neyi ölçmek istiyorsa onu başka özelliklerle karıştırmadan ölçmesidir.
Bir ölçme aracının geçerli olabilmesi için önce güvenilir olması ön koşuldur.

3. Kullanabilirlik:
Ölçme aracının emek, maliyet, zaman, hazırlanışı ve uygulama koşulları gibi yönlerden uygun

olmasıdır.

Dip Not: Bir ölçme aracında güvenirlik, geçerlik eşit öneme sahiptir. Bir ölçme aracı geçerliyse mutlaka güvenirlidir. Ancak güvenilir olan her ölçme aracı geçerli olmayabilir. Bir ölçme aracı önce güvenilir ve geçerli arkasında da kullanışlı olmalıdır. Ölçme ve değerlendirme sürecine karışan hata kaynakları: Ölçmeyi yapan kişi, ölçmede kullanılan araçlar, ölçülen özellikler, ölçmenin yapıldığı ortam.

GÜVENĐRLĐK
Bir ölçme aracının ölçümlerine birçok kaynaktan hata karışabilir. Güvenirlik ölçme aracının

hatalardan arınıklık düzeyidir. Yani ölçme sonuçlarına hata karıştırmadan ölçme yapabilmesidir. Ölçme sonucundaki hata miktarı düştükçe güvenirlik artar. Bir ölçme işleminde hata miktarı arttıkça güvenirlik de düşer.

Güvenirlik ölçme aracının kararlılığı ve tutarlılığı ile ilgilidir. Ölçme aracının birkaç kez uygulandığında benzer (birbirine yakın) sonuçları vermesi düzeyidir. Teknik anlamda ise güvenirlik gerçek puanlar ile gözlenen puanlar arasındaki korelasyonun karesidir. Ölçme hatası: Gerçek ölçme sonucu ile yapılan ölçme sonuçları arasında meydana çıkan farktır.

1. Sabit Hata: Hata miktarı ölçümden ölçüme değişmez. Hata miktarı her ölçme işleminde aynı orandadır. Daha çok ölçmenin güvenirliği ile ilgilidir. Sınav aracı, yanlış cevap anahtarı, soruların sınavda yoklanacak hedef davranışları uygun örneklendirmemesi durumlarında ortaya çıkar.

Terazinin her ölçtüğü nesneyi 10 gr. fazla ölçmesi.
Bir öğretmenin okuduğu her sınav kağıdına 10 puan fazla vermesi.
Dikkat edilirse hata işlemi hep aynı nesnelere veriliyor.

2. Sistematik Hata: Hata miktarı ölçümden ölçüme belli oranda artar ya da azalır. Ölçme aracı

belirli şartlar gerçekleştiği zaman hata yaparsa. Öğretmenin (ölçmeyi yapanın) yanlılığından kaynaklanır. Ölçülen büyüklüğe, ölçmeciye ve ölçme koşullarına bağlı olarak miktarı değişen hatadır. Puanlayıcının subjektif olduğu (taraflı – yanlı) hatalardır. Daha çok ölçmenin geçerliği ile ilgilidir. Bir testin sistematik hatalardan arınıklılığının artması testin geçerliğini artırır. Diğer hata türleriyle birlikte ele alındığında geçerliği düşürür.

Öğretmenin sadece erkek öğrencilere 10 puan fazla vermesi.
Yazısı güzel olan öğrencilere 5 puan fazla verilmesi.
Terazinin 2 kg. ve üstü ağırlık ölçümlerinde 10 gr. eksik tartması.
Öğretmenin 50 puanlık sınav kağıdına 5, 60 puanlığa 10, 70 puanlığa 15 puan fazla vermesi.
Terazinin 1kg’lık nesneyi 100 gr, 2 kg’lık nesneyi 200 gr, 3 kg’lık nesneyi 300 gr eksikgöstermesi.

3. Rasgele (Random) Hata: Hata miktarı kuralsız olarak artar ya da azalır. Hatanın kaynağı

bilinmez. Daha çok ölçmenin güvenirliği ile ilgilidir. Kaynağı bilinmeyen ve ölçme sonuçlarına gelişi güzel karışan hatalardır. Örneğin; öğrencinin sınav günü hasta olması, sınav salonuna güneş vurması, şans başarısı, kopya çeken öğrencinin aldığı puan.

Terazinin bir nesneyi 100 gr. eksik, başka bir nesneyi 50 gr. fazla, başka bir nesneyi 15 gr. eksik tartması.
Öğretmenin bir sınav kağıdına 10 puan eksik, başka bir kağıda 15 puan fazla, bir diğer kağıda 20 puan eksik vermesi.
Cevap kağıdına kodlama yapılırken kaydırma yapılması.
Birkaç öğrencinin sınav sonuçlarının fazla gelmesi.
Bir öğretmenin sınav kağıtlarını okurken zaman zaman açık olan TV’den gelen sesler dikkatiniçekmiş ve bazı kağıtları puanlamada hatalar yapmıştır bu hata tesadüfi hatadır.
Dip Not: Sabit ve sistematik hatalar düzeltilebilir. Tesadüfi hatalar nerden geldiği bilinmediği için düzeltilemez. En çok tesadüfi (Random) hata güvenirliği düşürüyor. Eğitimde kullanılan ölçme araçlarında her zaman bir miktar hata payı vardır. Bunun olası nedeni ise, ölçülen özelliklerin dolaylı olarak ölçülmesinden kaynaklanır.

Ölçmeciden kaynaklanan hatalar

Ölçmecinin taraflı davranması – dikkatsiz davranması. Kız öğrencilere ya da yazısı güzel öğrencilere 5 puan

	fazla not vermek.
Ölçme aracından kaynaklanan hatalar	Soruların anlaşılamaması, ölçme aracının birden fazla davranışı karmaşık ölçmesi, soruların iyi düzenlenmemiş olması, soruların okunamıyor olması gibi hatalar.
Ölçmenin yapıldığı ortamdan kaynaklanan hatalar	Sınav yerinin ısı, ışık ve havalandırmasının yetersiz olması, ses ve gürültünün rahatsız edici olması.
Ölçülen kişiden kaynaklanan hatalar	Öğrencinin derse ve sınava tutumu, sorumluluğu, kişiliği, yorgunluğu, isteksizliği.
Ölçme aracının çeşidinden kaynaklanan hatalar	Sözlü sınav yerine, yazılı sınavın kullanılması.

Bir Ölçme Aracının Güvenirliğini Hesaplama Yöntemleri
Bir ölçme aracının güvenirliğini belirlemek için güvenirlik katsayısı (r) bulunur. Güvenirlik

katsayısı gerçek ölçümlerin sonucunun (varyansının) gözlenen puanların sonucuna (varyansına) oranıdır. Güvenirlik katsayısı 0.00 ile +1.00 arasında değişir. Katsayı 1.00’a yaklaştıkça güvenirlik artar, 0.00’a yaklaştıkça güvenirlik düşer.
1. Test – Tekrar Test Yöntemi: Standart bir test, bu test bir öğrenci grubuna uygulanır belli bir

süre geçtikten sonra aynı test aynı şartlarda aynı gruba uygulanır sonuç aynıysa test güvenilirdir. Bir testin (aynı testi) aynı gruba aralıklı olarak (değişik zamanlarda) iki defa uygulanışı sonucu elde edilen sonuçların korelasyonu (güvenirlik katsayısı) bulunur. Test – tekrar test yöntemi ile elde edilen güvenirlik katsayısı, 1.00’a yakınsa ölçme aracının hatalardan arınıklığının, kararlığının ve tutarlığının yüksek olduğu söylenebilir. Bir ölçme aracı birden fazla uygulandığında benzer sonuçlar vermesi tutarlı olduğunu kanıtlar. Bu yönteme en uygun zeka testleridir.

Korelasyon: Đki değişkenin arasındaki ilişkiye korelasyon bu ilişkinin miktarına ise korelasyon miktarı denir. 3 tip korelasyon söz konusu.
-1 0 +1

(negatif) (ilişki yok) (pozitif)
+1: Đki değişkeninde aynı anda artması lazım. Düzenli ders çalışma ile sınavda başarılı olma pozitif korelasyon var. Korelasyon katsayısı (r) ile gösterilir.
-1: Biri artarken diğeri azalıyorsa aralarında negatif korelasyon vardır. Sigara içme ile sağlıklı olma.
0: Đki değişken arasında hiçbir bağlantı ilişkisi yok. Cinsiyetle zeka arasındaki ilişki gibi.
-1 0 +1
a) 0.06 b) 0.17 c) 0 d) -0.08 e) -0.32 ilişki en üst seviyede olan şık e) şıkkıdır.

Paralel (Eşdeğer) Formlar Yöntemi: Bir testin iki eş değer formunun aynı zamanda aynıgruba uygulanması ile elde edilen sonuçların korelasyonu bulunur. Eşdeğer form, iki testin maddelerinin kapsamı, sayısı, güçlüğü ve niteliği bakımından denk olmaları anlamına gelir. Paralel testler yöntemi ile elde edilen güvenirlik katsayısı, 1.00’a yakınsa ölçme aracının hatalardan arınıklığının ve tutarlığının yüksek olduğu söylenebilir. Eğitimde hiçbir test korelasyon katsayısı 0 altında çıkmamalı.
Đki Yarı (Eşdeğer Yarılar) Yöntemi: Oluşturulan test aynı konuya ait olmalı. Test ortadan ikiye bölünür. Ayrılan bölümler eşit olmalı yani birinci bölümde 15 soru var ise ikince bölümde de 15 soru olmalı. 1. soru hangi hedef-davranışı ölçüyorsa diğer bölümdeki testimizdeki birinci soruya karşılık gelen soruda aynı hedef-davranışı ölçmelisidir. Đki test arasındaki korelasyon yüksekse test güvenilir demektir.
Đç Tutarlılık Güvenirliliği (KR – 20): Bir testi oluşturan maddelerin kendi aralarındaki tutarlılığın hesaplanmasıyla ortaya çıkan güvenilirliktir. Bir soru diğer soruların diğer cevabını içermemeli. Çelişen sorular, birbirinin cevabını içeren sorular olmamalı. KR – 20 (güvenirlik katsayısı) bir defada uygulanan bir ölçme aracının (tek form) iç tutarlığını veren bir katsayıdır.

KR – 20 güvenirlik katsayısı 0,81 olan bir test için kesin olarak, test maddeleri arasındaki

tutarlık yüksektir denilebilir.
Dip Not: Bir testin güvenirlik katsayısı 0 yaklaştıkça güvenirliği düşer. Eksi çıkan sonuçlar atılmalıdır. Mümkün olduğunca +1 yakın olmalıdır. Hazırlanan testlerin hiç biri +1 olamaz mutlaka ölçmeye hata karışır.

Güvenirliği Artırma Yöntemleri ve Dikkat Edilmesi Gerekenler

Bir sınavda soru sayısı arttıkça güvenirlik artar. Soru sayısının artmasıyla öğrencilerin sallamaşansı azalacağı için güvenirliği artırır. Soru sayısı fazla olan çoktan seçmeli testlerin
güvenirliliği, soru sayısı az olan yazılı yoklamalardan daha yüksektir.
Soruların öğrenciler tarafından açıkça anlaşılır olması ve kesin yanıtının olması güvenirliğiartırır. Bu durum öğrencilerin gelişi güzel cevaplarını engellediği için güvenirliği artırır.
Öğrenciler sınava motive edilmeleri soruları dikkatli yanıtlamalarını sağlayacağındangüvenirliği artırır.
Sınav için yeterli sürenin verilmesi güvenirliği artırır. Fazla süre verilmesi nedeniyle kopyaçekilmesi nedeniyle geçerlilik düşer.
Ölçmede duyarlılığı yüksek olan araçların (daha küçük birimleri ölçebilen) kullanılmasıgüvenirliği artırır. Bir ölçme işleminde hata oranın az olması duyarlığı yüksek olduğunu
gösterir.
Ölçme aracındaki soruların güçlüğü “orta düzey” olmalıdır. Soruların çok kolay ya da çok zorolması güvenirliği düşürür. Sorular, cevaplayacak öğrencilerin yaklaşık yarısı tarafından doğru cevaplandırılacak güçlükte olmalıdır. Soruların çok kolay veya çok zor olması bilenle bilmeyen öğrencilerin birbirinden ayrılmamasına neden olduğu için güvenirliği düşürür.
Sınavın puanlanmasının nesnelliği güvenirliği artırır. Objektif puanlanabilen sınavların puanlanmasında hatalar az olacağı için güvenirlik yüksektir. Bir testin değişik kişilerce ya da aynı kişi tarafından farklı zamanlarda puanlanması ile elde edilen sonuca “Puanlama Güvenirliği” denir. Sınavın objektif puanlanması güvenirliği artırır. Objektif olma puanlama biçimiyle alakalıdır.
Öğrencilerin sınavlar ile ilgili fikirleri ve ön yargıları da güvenirliği etkiler. Öğrencinin sınavı bir ölüm – kalım meselesi haline getirmesi güvenirliği düşürür.
Bir ölçme aracının güvenilir olması öncelikle, test puanlarına karışan hata miktarının az olmasıyla gerçekleşmiş olur.Geçerlik

Bir ölçme aracının neyi ölçmek amacıyla hazırlandıysa o amaca hizmet etmesine geçerlik denir.
Bir ölçme aracının ölçmeyi amaçladığı özellikleri diğer özelliklerle karıştırmadan ölçebilmesi düzeyine geçerlik denir.
Geçerlik ölçme aracının ölçmeyi amaçladığı değişkeni ne derece ölçebildiği düzeyidir. Geçerliliği düşüren etmenler:
- Bir ölçme aracından elde edilen puanlara ölçme aracının ölçmeyi hedeflediği özelliklerindışındaki özelliklerin karışması (yazı güzelliği, ifade biçimi, yanlılık vb.) o ölçme aracından
  elde edilen puanların geçerliğini düşürür.
- Bir ölçme aracı ölçmek istediği bir özelliği eksik bir biçimde ölçerse geçerliği düşük olur.Örnek; pusula yönleri belirlemek için geliştirmiş bir ölçme aracıdır ve biz pusulayı saati göstermesi için kullanamayız. Pusula, ile yönleri belirlemenin dışında başka özellikleri ölçmeye kalkıştığınızda geçerli olmayan sonuçlarla karşı karşıya kalırız.
- Ölçme aracı, ölçmek istediği özellikleri diğer özelliklerle karıştırmamalıdır. Bir sınav ile öğrencinin belirli bir alandaki bilgi düzeyini ölçmeyi hedeflediğimizde, bunun dışındaki nitelikleri de ölçmeye kalktığımızda (sayfa düzeni, güzel yazı, ifade biçimi) geçerliği düşürürüz.Güvenirlik ve Geçerlik Arasındaki Đlişki
  Bir ölçme aracının geçerli olması için güvenilir olması ön koşuldur. Yani bir ölçme aracının
  geçerli olması için önce güvenilir olmalıdır. Buna karşılık güvenilir olan bir ölçme aracı geçerli olmayabilir. Yani test tutarlı ölçme yapabilir ama ölçmek istediği özelliği ölçmüyor olabilir.

Geçerlik Türleri

1. Kapsam Geçerliği:

En önemli sayılabilecek geçerlilik türüdür.
Bir ölçme aracının ölçme yapacağı hedef – davranışları (konuları) yeterli olarak ölçebilmederecesidir. Yani ölçme aracının ölçmek istediği davranışları ne derecede kapsadığı geçerliğini
gösterir.
30 soruluk program geliştirme testi hazırlanırken tüm sorular bilişsel hedeflere ayrılmışsa oölçme aracının kapsam geçerliliğinden söz etmek mümkün değildir.
Kapsam geçerliliğini artırmak için belirtke tablosundan yararlanılır. Bir de uzman görüşünebaşvurulmalıdır.
Ölçülmesi hedeflenen evreni (hedefler – konular) yeterli ve dengeli olarak örnekleyen vekapsadığı maddelerin (soruların) her birinin ölçmeyi hedeflediği, hedef – konuyu gerçekten
ölçebildiği bir test kapsam geçerliğine sahiptir.
Örnek, bir derste toplam 10 ünite işlenmiş, sınavında ise 5soru sorulmuştur. Sorular 2. 5. 7. 8.9. ünitelerden sorulmuş olsun. Böyle bir sınavda kullanılan sorular işlenen tüm üniteleri yeteri kadar temsil edemediği için sınavın kapsam geçerliği düşüktür. Ya da testteki bir madde (soru) ilgili hedef – davranışı yeterince kapsamıyorsa kapsam geçerliği düşüktür.
Eğer ölçme aracı (sınav) öğrencinin dersin hedeflerini gerçekleştirme derecesi yerine, kişiliği ya da görünümü gibi (ölçmek istediği özelliklerin dışındaki özellikler) faktörlere dayalı olarak yapılması durumunda yapılan ölçmenin geçerliği yoktur.
Kapsam geçerliğinin aşamaları: ölçülecek nitelik ile ilgili davranışların belirlenmesi, ölçme aracını oluşturan davranışların (örneklemin) belirlenmesi, ölçme aracını oluşturan davranışlar örnekleminin evreni temsil etme düzeyinin belirlenmesi , ölçme aracındaki soruların ilgili olduğu davranışı ölçmeye uygun olup olmadığının kontrol edilmesi.

2. Ölçüt Geçerliği: 120 soruluk bir test hazırlanır gruba uygulanır, çıkan sonuçlar daha önceden güvenirliliği denetlenmiş bir sınav (KPSS 2004) ile karşılaştırılır sonuçlar benzerse hazırladığımız sınavın geçerliğinden söz edebiliriz. Ölçüt geçerliği; geçerliği çalışılan bir ölçme aracı ile geçerli olduğu kabul edilen başka bir ölçme aracının aynı bireylere uygulanarak elde edilen ölçümler arasındaki korelasyondur.

Yordama Geçerliği: Yordama tahmin etmek demektir. Mevcut verilerden faydalanarak gelecek ile ilgili kestirimlerde (tahminlerde) bulunmaktır. ÖSS sınavında ilk 100 giren bir öğrencinin üniversite öğreniminde de başarılı olacağını tahmin etmek yorumlamak yordam geçerliğine girmektedir. Özetle ileriye yönelik bir tahmin söz konusudur. Öğrencilerin lise birinci sınıftaki notlarına bakarak, alan ve bölüm seçmelerini sağlama.
Uygunluk Geçerliği: Bu sefer tahminimizi, yorumumuzu geriye dönük yaparsak bu geçerliliğin alanına girmiş olur. Örnek, ÖSS sınavında ilk 100 giren bir öğrencinin lise öğrenimin de başarılıdır demek bu geçerlik alanına girmektedir.

Yapı Geçerliği: Bir testin, veya ölçme işleminin teorik bir yapıyı ölçüp ölçmediğinin belirlenmesidir. Başka bir ifadeyle bir ölçme aracının teorik olarak ölçmek istediği yapıyı ölçmeye uygun olup olmadığına dair kanıt toplama çalışmasıdır. Yapı geçerliği çalışmalarında bir grubun ve grupta yer alan bireylerin sahip olduğu teorik yapıyı (kişilik, yaratıcılık, ilgi, zeka, tutum) belirlemeye çalışılır. Yapı geçerliğinin temel mantığı; ölçülmesi planlanan teorik yapıya yüksek derecede sahip olan bir grupla düşük derecede sahip olan bir gruba testi uygulayıp, testin bu grupları ne derece uygun olarak ayırıp, ayırmadığına bakmaktır.
Görünüş Geçerliği: Bir ölçme aracının, ölçmek istediği değişkeni ne derece ölçebilir göründüğüdür. Genelde ölçme aracının görünüş geçerliği uzman incelemesiyle belirlenir. Testin bütünü için gerekli olan görünüş geçerliği her bir soru içinde geçerlidir. Testteki her bir soru ölçmek istediği özelliği ölçüyor görülmelidir. Test kitapçığının üzerinde ne yazıyorsa testte de o alanla ilgili sorular yer almalıdır.Geçerliği Artırma Yolları

1. Güvenirliği artırmak için alınan tüm tedbirler geçerlilik için de geçerli.

Teste alınacak her sorunun, ölçülecek kapsamdan bir davranış ölçmesine dikkat göstermek geçerliği artırır. Soruların dersin içeriğine göre orta zorlukta olmalıdır.
Sınavda kullanılacak soruların; kopya, ipuçlarından yararlanma, tahminle doğru yanıtlanabilmesi gibi geçerli olmayan davranışların kullanılması geçerliği düşürür.
Soruların hem konuları kapsayıcı hem de dengeli olarak teste alınması geçerliği artırır.
Aynın sorunun her yıl tekrar sorulması, sınavdan önce soruların verilmesi kopya çekilmesigeçerliği düşürür.
Đyi bir sınav planı hazırlanmalıdır.
Dersin hedef – davranışları ile ilgili soru hazırlanmalıdır.Kullanışlık
Bir ölçme aracı ekonomik olması gerekir. Maliyetinin ucuz olması ve tekrar tekrar

uygulanması gibi. Hazırlama ve uygulama süresinin uygun olması gerekir. Çoktan seçmeli testler en zor; yazılı yoklamalar en kolaydır. Sözlü yoklamalar, en kolay olmaz çünkü her öğrenciye farklı soru hazırlanacağından. Dış görünüşün okunabiliyor olması gerekir. Soruların aynı puntoda yazılması gibi saklanması da kolay olmalıdır.

Sınav Planı

1. Sınavın amacını belirleme.

Öğrenciler arasında seçme yapmak için.
Öğrencileri tanıma ve bir programa – alana yerleştirmek, öğrenme düzeyini ve öğrenmeeksikliklerini belirlemek için.
Öğrencilerin öğrenmelerine ilişkin sonuç belirlemek için yapılıyor olabilir.

Ölçülecek davranışların belirlenmesi.
Belirtke tablosunun hazırlanması.

Dersin içeriğinin (işlenecek konuların) hangi hedef – davranış alanlarına göregerçekleştirilebileceğine bakılarak uygun soru geliştirilir.
Sorulacak soruların evrenini temsil gücü yüksek ve geçerli sorular belirlenir.

4. Soru sayısını belirleme.

Sınavın süresi.
Soru tipi.
Soruların güçlük derecesi.
Öğrencilerin düzeyi.
Sınavın amacı.

5. Soru tipini belirleme.
Kullanılacak soru tipi belirlemede ölçülmesi istenilen hedef davranışların alanı (bilişsel,

psikomotor, duyuşsal) ve konunun özelliği dikkate alınır.
6. Sınavın güçlük derecesini belirleme.
Öğrenme düzeyini ve başarıyı ölçmeyi amaçlayan bir sınavın güçlük derecesi “orta düzey”

(0,50) olmalıdır. Yani sınav ne çok zor, ne de çok kolay olmalıdır.
7. Sınavın süresini belirleme.
Bir sınavın amacı, soru sayısı, zorluk düzeyi, soru tipi öncelikle ve sınava giren öğrencilerden

en zayıf olan öğrencinin durumu dikkate alınarak bir düzenleme yapılır.

Soruların yazımı.
Puanlamanın nasıl olacağını belirleme.

Her sorunun önem düzeyine göre ağırlığının belirlenmesi ve puanlama güvenirliğinin nasıl

sağlanacağının (hatalar arındırılması) belirlenmesidir.
Test planı yapılırken dikkate alınması gereken öğeler; ölçülecek davranışla ilgili içerik,

testin güçlük derecesi, testin puanlama biçimi, kullanılacak soru tipi. Testlerin Sınıflandırılması

Öğretmen Yapımı Testler: Öğretmenin kendi hazırladığı ve kendi öğrencilerine uyguladığı testlerdir. Geçerlik ve güvenirlik düşüktür. Yazılı yoklamalar.
Standart (Yapılandırılmış) Testler: Bir grup uzman tarafından standart koşullarda ve normlara göre hazırlanmış ve kitapçık haline getirilmiş testlerdir. Örneğin; ÖSS, LES, KPSS,

OKS. Bu testler, güvenirliği, geçerliği ve objektifliği istatistiki yöntemlerle belirlenerek

uygulanır ve objektif sonuçlar verir.

Kağıt – Kalem Testleri: Sınava giren öğrencilerin yazılı durumdaki soruların cevaplarınıyazılı olarak ifade ettiği testlerdir. Örneğin; yazılı yoklama, kağıt kalem testlerinin geçerliği,
güvenirliği, puanlama güvenirliği düşük testlerdir.
Seçmeli Testler: Öğrencinin verilen bir grup seçenekten doğru olanı seçtiği ve işaretlediğitestlerdir. Bu tür testler geçerliği, güvenirliği ve objektifliği yüksek olan testlerdir. D – Y
testleri, kısa cevaplı testler, eşleştirmeler dahil.
Hız Testleri: Belli bir süre içerisinde öğrencinin kaç tane doğru cevabı vereceği ölçülentestlerdir. Bu tür testlerde hiçbir öğrenci soruların tamamını cevaplayamaz. Sallama hariç.
Güç Testleri: Öğrenciye yeterli zaman verilerek belli güçlük düzeyine sahip sorular sorularakperformansının ölçüldüğü testlerdir. KPSS, dershane sınavları.
Objektif Testler: Puanlanmasının, puanlayıcıya göre değişmediği, puanlayıcının görüş veduygularının puanlamayı etkilemediği testlerdir. Birden fazla puanlayıcı testi puanladığında
aynı ya da benzer sonucun alınmasıdır. Çoktan seçmeli testler, doğru yanlış testleri.
Sübjektif Testler: Puanlamasının, puanlayıcıya göre değiştiği, puanlayıcının görüş veduygularının puanlamaya etkilediği testlerdir. Yazılı yoklama, sözlü yoklama. Portfolyo (Tümel) Değerlendirme Yöntemi Kullanım Amacı ve Temel Đlkeleri

Öğrencilerin gelişim sürecini izlemek.
Öğrencileri ilgi ve alanlarına ve yetenekleri açısından tanımak.
En avantajı ise, öğretmenin öğrencilerini çok yönlü tanıması ve yeteneklerini ortayaçıkarmasıdır.
Öğrencinin öğretim programı dışındaki faaliyetlerini de kapsayan çok yönlü gelişimi hakkındabilgi verir.
Öğrencilerin sınıf içi etkinliklerine katılma düzeyi.
Öğrencilerin yıl içerisindeki gelişim düzeyinin izlenmesi.
Öğrencilerin inceleme, araştırma ve sorumluluk gibi kişisel özelliklerinin belirlenmesi.
Öğrenciyi ilgi ve yetenek alanlarına göre yönlendirme.
Öğrencinin öğrenme sürecindeki performansını gösterir.
Öğrenciyi öğrenme sürecinde aktif kılmak ve özgüvenini artırmak.
Öğrencinin yaratıcı özelliklerini ve üst düzey zihinsel becerilerini geliştirir.
Öğrencilerin bilişsel, psikomotor ve duyusal davranışların birlikte gelişmesini sağlar.
Öğretimi öğrenci merkezli duruma getirir. Öğrencide sorumluluk geliştirir.
Öğrencilerin ekiple çalışma yeteneklerini geliştirmek.
Öğrencinin gerçek öğrenme düzeyini belirlemek.
Sınırlığı ise:
Öğrencilerin aralarındaki rekabeti kaldırdığı için birbirlerinin çalışmalarını kopya ettiklerigörülebilir. Ayrıca portfolyode objektif değerlendirmenin yapılmasındaki zorluklar
portfolyonun diğer bir sınırlığıdır.
Dip Not: Klasik değerlendirmeden farklı olarak sonuca değil öğrenme sürecine dönük bir değerlendirmedir. Yazılı, sözlü testler söz konusu değil. Her öğrenciye ait izleme dosyaları mevcuttur.
Klasik Değerlendirme Yöntemleri (sonuç önemli)
Değerlendirme sürecinde yalnızca öğretmen aktiftir.
Ürün (sonuç) odaklı.
Ezbere dayalıdır.
Kağıt – kalem ya da standart testler kullanılır.
Geri bildirim ve sonuç net olarak verilir.
Ölçüt önceden konmuştur ve rekabet söz konusudur.
Özetleyici ve yargılayıcıdır (summatif).
Çağdaş Değerlendirme Yöntemleri (performans önemli)
Değerlendirme sürecinde öğretmen ve öğrenci birlikte aktiftir. Aile de katılabilir.

Süreç odaklıdır. Eğitim sürecinin kendisi önemlidir.
Düşünme ve değerlendirmeye dayalıdır. Öğrenci merkezli eğitim uygulamaları değerlendirilir.
Geri bildirim süreç içersinde öğrenciye ulaştırılır. Geliştirici (formatif) ve teşhis edicidir.
Puanlama, belirli betimsel değerlere göre verilmektedir. (Rubrik puanlama)
Ölçüt, öğrencilerle belirlenir ve grubun başarısını bireyin başarısını da etkiler.
Çok boyutlu ve değişik tipte ödev ürün ya da performans örnekleri kullanılır (Portfolyo).
Üst düzey zihinsel becerilerin kullanılma düzeyi değerlendirilir.Soru Hazırlarken Dikkat Edilecek Noktalar
Sorular net, açık ve anlaşılır olmalıdır. Soruda kullanılan dil basit ve dolaysız olmalı, gereksizkelimelerin kullanılmaması dikkat edilmeli. Bu sayede önce güvenirlik, sonrada geçerlik artar.
Soru hazırlamada belirtke tablosu kullanılmalıdır. Hangi hedef davranışların ölçüleceğibelirlenmelidir. Böylece içerik yada her hedef davranışı temsil edecek kadar ve uygun sorular
belirlenir. Böylece kapsam geçerliği artırılır.
Bir maddeyle (soruyla) birden fazla bilgi yoklanmamalıdır. Özellikle objektifliği yüksek olançoktan seçmeli test, eşleştirmeli test, doğru – yanlış gibi testlerde bir madde bir bilgi alanını
yoklamalıdır.
Madde (soru) cümlesi bir kaynaktan olduğu gibi (kitaptan ya da derste anlatıldığı gibi)alınmamalıdır. Maddeler her sınavda değiştirmeli, aynı sorular sorulmamalıdır. Sınavdan önce öğrencilere soru verilmemelidir. Böylece bilmediği halde istenmeyen değişkenler sınava katıldığı için geçerlik düşer.
Maddelerde ipucu olmamalı. Soru neyi ölçmeyi amaçlıyorsa bu özelliği bilen öğrenciyle bilmeyen öğrenciyi iyi ayırt etmelidir. Ayrıca bir soruyla ilgili doğru cevap ya da çeldirici diğer soruları aydınlatıcı olmamalıdır. Bu durumda önce geçerlik sonra da güvenirlik düşer.Eğitimde Kullanılan Ölçme Araçları

1. Yazılı Yoklamalar: Hazırlanmasının kolay olması, uzun zaman almaması ve öğretmenlerce iyi

biliniyor olmasından dolayı sık tercih edilen bir sınavdır. Yazılı yoklamaların en önemli tarafı (avantajı) bilgi düzeyinin üstündeki üst düzey zihinsel işlemler (uygulama, analiz, sentez, değerlendirme, organize etme, bilgileri değişik durumlarda uygulama, orijinal görüş ve ürünler ortaya koyabilme) gerektiren türdeki hedefleri ölçebilmesidir.

Özellikleri:
Az sayıda soru sorulur. Bu nedenle geçerlik ve güvenirlik düşük. Öğrenciye cevap özgürlüğü tanınır.
Hazırlanması kolay, puanlanması güç olması ve zaman alır.
Şans başarısı düşüktür.
Puanlanması subjektiftir. Puanlayıcı yanlılığını katabilir.
Üst düzey zihinsel hedef alanlarını ölçebilir.
Hangi Durumlarda Kullanılmalı:

Sınava girecek öğrenci sayısının az ise kullanılmalı.
Öğrencilerin gelecekleri ile ilgili kritik kararlar güvenilir sınavlara dayandırılmalıdır. Sorusayısının az, puanlama güvenirliğinin düşük olması nedeni ile yazılı yoklama bu amaç için
kullanılmamalıdır.
Öğrencinin yazılı ifade gücü, noktalama işaretlerini doğru kullanabilme, dilbilgisi gibiözelliklerini ölçmede kullanılabilir.
Sentez ve değerlendirmede gibi üst düzey zihinsel davranışları ölçmede kullanılabilir. Dikkat Edilecek Noktalar:
- Uzun cevap gerektiren az sayıdaki sorular yerine (geçerliği ve güvenirliği düşürdüğü için) kısacevaplı çok sayıda soru kullanılmalıdır.
- Sorular açık, net ve anlaşılır olmalıdır.
  Puanlanması:
  Cevap anahtarı kullanılmamalıdır.
  Sınav kağıdı birden fazla puanlayıcı tarafından okunmalı (puanlama güvenirliği). Sınav kağıtlarındaki sorular sırayla okunmalıdır.

Öğretmen isimlere bakmamalı, puanlamaya yazı güzelliği, anlatım gücü, sayfa düzeni, gibi ölçülmesi amaçlanmayan etkenler olmamalıdır.

2. Sözlü Yoklamalar: Düşünme, ifade etme gibi becerileri ölçebilmekteyiz.

Uygulaması çok zaman alır.
Her öğrenciye farklı sorular hazırlanmalıdır.
Her sorunun güçlük düzeyi farklı olabilir. Ama sorular kolaydan zora doğru sıralanmalıdır.
Öğretmenin yaklaşımından, soruların güçlük düzeyinden ve sınavın yapıldığı ortamdan(öğrencilerin huzurunda) kaynaklanan nedenlerden dolayı psikolojik faktörler etkili olabilir.
Puanlama güvenirliği düşüktür.
Kapsam geçerliği düşük, şans başarısı da düşüktür.
Öğrencilerin kişilik özellikleri puanı etkiler.
Sözlü ifade yeteneği, etkili konuşabilme gibi özellikler öğretmeni etkileyebilir.
Puanlamaya hata karıştığı için güvenirliği ve geçerliği düşüktür. Hangi Durumlarda Kullanılmalı:

Đngilizce, Türkçe gibi sözlü ifade becerisini geliştirmeyi ve ölçmeyi amaçlayan derslerde

kullanılır.
3. Kısa Cevaplı Testler (Boşluk Doldurma): Yazılı yoklamanın alternatifi olan bir sınav

türüdür. Özelikle alt düzey hedeflerin ölçülmesinde kullanılır. Bu testler bilgi düzeyinde kısmen de kavrama düzeyindeki davranışlar ölçülür. Bu kısa cevaplı testlerin en önemli sınırlığıdır. Cevap bir kelime, rakam veya en çok bir cümle ile verilebilen sınavlardır. Kısa cevaplı bir test maddesi direkt soru cümlesi olarak ya da eksik cümleli (doldurmalı test) olarak sorulabilir. Daha çok ilköğretimin ilk sınıflarında kullanılır.

Su, iki hidrojen ve …….. oluşur. Cevaplar 1 cümleyi geçmemeli.
Boşluk sorunun başında yer almamalı.
Sorunun cevabı kesin ve net olmalıdır. Atatürk …. doğdu. Cevap 1881’de, Selanik’te olabilir.Salt bu yüzden yanlış diyebiliriz.
Kısa zamanda çok soru sorabiliriz. Kapsam geçerliği fevkalade.
Sorular açık ve net ise o zaman puanlanması kolay ve objektiftir.
Şans başarısı düşük. Cevaplayan kişi istediğini yazabilir.
Hazırlaması kolaydır. Kalıp bir cümle alınır ve kelime çıkartılır.

4. Doğru Yanlış Testleri: Öğrencilerin belli konularındaki yanlış ve doğruları seçme gücünü

ölçen test türüdür. Testteki maddeler doğru ve yanlış önermelerden oluşur.

En kolay sınav türüdür. Şans başarısı en yüksek sınav türüdür.
Đlköğretim için ideal. Çünkü öğrencilerin seviyelerine uygun.
Güvenilir değildir. Şans başarısı yüksek olduğu için geçerliği yüksektir kısa zamanda çok sorusorulabilir.
Puanlanması kolay ve objektiftir.
Hazırlanması ve cevaplanması kolaydır.Hangi Durumlarda Kullanılmalı:

Đlkelerin ve genellemelerin yoklanması ve belli bir konuda seçme yapılması istenildiğinde. 5. Çoktan Seçmeli Testler:

Değerlendirmede objektiflik.
Geçerliği ve güvenirliği en yüksek olan sınav türüdür.
Hazırlanması uzun zaman alır, puanlanması az zaman alır, kolaydır.
Şans başarısı vardır. Konuyu hiç bilmeyen öğrenci sırf şansla cevabı bulabilir.
Đlköğretimin 1,2,3,4. sınıflarında test hazırlanırken seçenekler 3, 5,6,7,8. sınıflarda ise seçeneksayısı 4 olmalıdır.
Yanlış yanıtlanan sorular doğruları götürmesine düzeltilmiş puan denir.
Elde edilen puanlar üzerinde istatistiki işlemler ve madde analizi yapılabilir.
Sorunun tümü madde kökü denir. Bütün şıklara ise seçenekler denir. Doğru olmayan şıklaraise, çeldiriciler denir.

Çeldiriciler, bilmeyen öğrenciye ipucu vermemelidir. Çeldiriciler konuyu bilenleri bilmeyenleri yanıltmalıdır. Çeldiriciler madde kökündeki konuyla ilgisiz olmamalıdır. Çeldiricilerin doğru cevaba yakınlığı arttıkça madde zor bir soru olur ve bilenle bilmeyeni ayırt etme gücü artar.
Olumsuz özellikler ile ilgili çeldirici bulmakta zorlandığında, madde kökü olumsuz cümle formatı kullanılmalıdır.
Aşağıdakilerin hangisi daha doğrudur gibi bir soru olursa eğer, seçeneklerin hepside doğru olmalı ama cevap en doğru olmalıdır.Hangi Durumlarda Kullanılmalı:

Bilgi, kavrama, uygulama ve analiz düzeyindeki davranışları ve kısmen değerlendirmedüzeyindeki davranışları ölçmede etkilidir. Sentez düzeyindeki davranışları ölçebilmesi için
çok iyi hazırlanması gerekmektedir.
Yapılacak sınavın sonuçları öğrenci için çok önemli kararları gerektiriyorsa kullanılmalı.Bunun nedeni ise, geçerliğin, güvenirliğin ve puanlama güvenirliğinin yüksek olmasıdır.
Sınavla geniş öğrenme konuları ölçmek isteniyorsa kullanılır. Çok sayıda soru sorularak,konuları temsil gücü sağlanır – kapsam geçerliği sağlanır.

6. Eşleştirmeli Testler: Eşleştirmeli testler, çoktan seçmeli testlerin farklı bir biçimidir. Đki

bölümde verilen bilgiler, kelimeler, numaralar, semboller eşleştirilir. Öğrencilerin bilgiler,

nesnesel, olaylar hakkında ilişki kurma güçleri ölçülür.

Đlköğretim seviyesinde sıkça kullanılır.
Sorular cevaplarla eşleştirilir.
Soru sayısı güvenirlik artar. Şans başarısı düştüğü için.

7. Đş- Performans Testleri: Özellikle psiko – motor düzeyindeki hedeflerin (becerileri)

ölçülmesinde kullanılan bir test türüdür. Performans testleri öğrencilerin becerilerinin çeşitliliği bakımından ne derece yeterli olduklarının ölçülmesi, beceri eksikliklerini belirleme ve düzeltme, güçlü ve zayıf yönlerini analiz etme ve ölçme işlemini çalışma ya da öğretim (uygulama) sırasında doğrudan yapma gibi olanaklara sahiptir. Öğrencilerin ürün ya da performans ortaya koyabilme güçleri, değişik formatlara göre geliştirilen bu tür testlerle ölçülebilir. Ölçme işlemi doğrudan yapılır. Öğrencilere yeni yetenek alanları gibi bir özelliği yoktur.

Sonuçlar:
1. Ölçme testlerinin geçerlik ve güvenirlik bakımından sıralanması:
Çoktan seçmeli test, Doğru – yanlış testi, Yazılı yoklama, Sözlü yoklama
2. Diğer şartlar eşitlendiğini düşünürsek (şans başarısı eşit) yazılı yoklama genellikle daha az

güvenirliğe sahiptir.

Test ve Madde Đstatistikleri

Merkezi Eğilim Ölçüleri
Bir frekans dağılımında puanlar, dağılımın ortasında yığılma eğilimi gösterirler. Frekans

dağılımının bu genel özelliğine merkezi eğilim ölçüleri denir. Merkezi eğilim ölçüleri ham puanları (ölçme sonuçlarını) anlamlı hala getirmede kullanılan yöntemlerden birisidir. Elde edilen puanların grup içinde nerede toplandığını ortaya çıkarmada kullanılan merkezi puanların grup içinde nerede toplandığını ortaya çıkarmada kullanılan merkezi eğilim ölçülerinin başlıcaları:

1. Mod (Tepe Değer):

Bir puan dağılımında en çok tekrarlanan, frekansı en yüksek olan puanlara mod denir. Örneğin:1, 2, 2, 5, 5, 7, 7, 7, 7, 7, 9, 9, 9, 9 bu puanlarda 7 notu en çok tekrarlanan olduğu için moduna 7
diyebiliriz.
Not dağılımı şöyle de olabilirdi: 1, 2, 2, 5, 5, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 bu notlara dikkat edilirse7 ve 9 notu en çok tekrar edilen nottur. O zaman moda 7 ve 9 diyebiliriz. Mod 0’da olabilir. Bir
puan dağılımında birden çok mod bulunabilir. Bu tür dağılımlara çok modlu dağılımlar denir.
Mod, puan dağılımındaki uç değerlerden etkilenmez.
Mod bir puan dizisi hakkında bilgi veren ölçü birimi olmadığından hassas ve güvenilir bir ölçübirimi olarak kabul edilmez.

Notlar

Frekans

35	3
50	5
60	6
75	4
90	1
95	2

10 notunu 1 öğrenci almış.
En fazla 60 puanı alınmış o zaman mod 60 diyebiliriz.

2. Medyan (Ortanca):

Büyükten küçüğe doğru sıralanmış bir puan dizisini ortadan tam ikiye bölen değere medyandenir. Puan dizisinin yarısını bir tarafa yarısını da diğer tarafa ayırdığından “orta değer” adını
alır.
Örneğin; “60, 40, 30, 50, 50, 100, 80” notları 7 öğrencinin herhangi dersteki notları olsun.Öncelikle bu notlar büyükten küçüğe ya da küçükten büyüğe sıralanır.

30, 40, 50, 50, 60, 80, 100 ortadaki not yani “50” notu bize medyanı verecektir.
Notların sayısı çift olsaydı yani; 30, 40, 50, 50, 60, 80, 100, 100 o zaman tam ortadaki iki notun

aritmetik ortalamasını alacağız. 50+60/2=55 medyanımız 55 olacaktır.

Frekans toplamı bize öğrenci sayısını vermektedir. Bu grafikte öğrenci sayısı 25 kişidir. 25 yarısını alırız ikiye böleriz yani 13 frekans aralığında 13. kişiyi buluruz karşı gelen not bize medyanı verir. Frekansları yukarında aşağıya doğru 13’e gelecek kadar sayarız karşı gelen not 5’tir buda bize medyanı verir.

3. Aritmetik Ortalama:

En çok kullanılan merkezi eğilim ölçülerinden birisidir. Ölçme sonuçlarının normal dağılımgösterdiği ya da ona yakın olduğu durumlarda kullanılabilecek en uygun merkezi eğilim
ölçüsüdür.
Bir dizi ölçme sonuçlarının (puanlarının) toplamının diziyi meydana getiren ölçüm sayısınabölünmesiyle bulunur.
Bir dağılımda aritmetik ortalamanın büyük olması durumunda ortalama öğrenme düzeyi ya dagrubun (mutlak) başarı düzeyi yüksektir açıklaması yapılır.
Ortalama öğrenme düzeyi denirse o zaman aritmetik ortalama aklımıza gelmeli.Notlar karşılarına gelen frekansla çarpılır bulunan sayılar frekans toplamına yani öğrenci sayısına bölünmesiyle aritmetik ortalama bulunur.
Elde edilen ölçümlerin (puanların) tam ağırlık merkezidir. Hesaplanması kolaydır. Ve diğer istatistiksel ölçülere en anlamlı biçimde karşılaştırılabilir. Bu nedenle çoğu durumlarda en iyi yığılma ölçüsüdür.
Merkezi Değişim Ölçüleri

1. Ranj (Dizi Genişliği):

Bir dağılımdaki en yüksek puan ile en küçük puan arasındaki farktır. Örneğin 100 soruluk birtestte en yüksek puan 96, en küçük 25 ise ranj: 96 – 25 = 71’dir.
Sınıftaki öğrenme eksikliklerini yüzeyselde olsa da bilgi verir.

Not	Frekans
1	1
2	4
3	5
5	4
7	9
10	2

Not	Frekans
10	1
9	3
7	4
6	10
5	6
4	2
2	1

2. Standart Sapma (Standart Kayma) SX:

Dağılma ölçüleri içerisinde en yaygın ve en güvenilir olanı standart sapmadır. Standart kaymabir puan dizisindeki puanların aritmetik ortalamadan ne derece uzaklara yayıldıklarını gösterir.
Standart sapma bireyin ya da grubun notlarının aritmetik ortalamaya olan farkını gösterensayısal değerdir.
Bir dağılımda standart sapma küçük ise öğrencilerin öğrenme düzeyinin birbirine yakın ya daöğrencilerin arasındaki farklılaşmanın az olduğu (homojen), standart sapma büyük ise öğrencilerin öğrenme düzeyinin birbirine uzak ya da öğrenciler arasındaki farklılaşmanın fazla (heterojen) olduğu açıklaması yapılır.
Aritmetik ortalama ile standart sapmanın arası büyürse; heterojen yapı oluşur ve başarı düşer.
Aritmetik ortalama ile standart sapmanın arası küçükse; homojen yapı oluşur ve başarı artar.
Puan dağılımdaki dizi genişliği artıkça standart sapma büyür, dizi genişliği azaldıkça standartkayma küçülür. Öğrenciler arasındaki farklılaşmanın derecesini gösterir.
Notlar: 10, 7, 5, 4, 4, 2, 3 bu notların toplamı 35 öğrenci sayısı da 7 olduğuna göre aritmetik ortalama 5 olur. Aritmetik ortalamayı notlardan tek tek çıkarıp karelerini alırız bulunan farkların kareleri toplanır. Farkların kareleri toplamı öğrenci sayısına bölünür.

3. Ranj VX: Standart sapmanın SX karesidir. Örnek 1:

Hangi derste ortalama öğrenme düzeyi en yüksektir: Aritmetik ortalamaya bakılır en yüksek olan aritmetik ortalama; öğrenme düzeyi hakkında bize cevabı verir. Biyoloji dersinin aritmetik ortalaması en yüksek olduğu için cevap Biyolojidir.
Hangi derste ortalama öğrenme düzeyi en düşüktür: Yine aynı şekilde aritmetik ortalamaya bakılır bu sefer iki dersin de aritmetik ortalaması aynı o zaman standart sapmaya bakılır Sx fazla olan heterojen olduğu için daha başarısız sayılır. Yani cevap Coğrafya.Örnek 2:
En çok tekrarlanan not yani mod (tepe değer) 60 notudur 15 kişi tarafından alınmış.
Medyan ise, sınava giren öğrenci sayısı frekans toplamıdır. 65 kişi sınava giren öğrenci sayısı. 65/2=32,5 33. kişiyi alırız. 33. kişi tam ortadaki kişidir. Frekansın yukarıdan aşağıya doğru saymaya başlarsak 33. kişi bize bu grafiğin meydanını verecektir. Yani 60 olur. Aritmetik ortalamayı bulmak için ise notları tek tek frekansla çarpılır çıkan sonuç sınıf mevcuduna yani frekans toplamına bölünür.

4. Bağıl Değişkenlik Katsayısı (V): Birden çok derste puanların ne kadar farklılık gösterdiğini belirtir. V = Sx/X.100 yani standart sapma ile aritmetik ortalamaya böleriz ve 100 ile çarpılır.

Örnek: 35 öğrencinin girmiş olduğu 32 maddelik bir Türkçe testindeki ortalama 18 ve standart sapmada 5,4 bulunmuştur. Aynı sınıftaki öğrencilerin 55 maddelik bir Coğrafya testindeki ortalama 36, standart sapma 7,2 olduğuna göre hangi derste puanlar daha fazla değişkenlik gösterir.
V Türkçe = 5,4/18 . 100 = 30 V Coğrafya = 7,2/36 . 100 = 20 V Türkçe > V Coğrafya Türkçe dersinde farklılaşma daha çok.

Örnek:

Ders	Aritmetik Ortalama (X)	Standart Sapma (Sx)
Felsefe	67	2
Tarih	69	4
Coğrafya	67	4
Biyoloji	75	5
Matematik	70	4

Not	Frekans
20	5
40	10
50	10
60	15
70	10
80	10
100	5

Türkçe

Ders

(X)

(Sx)

Matematik	71	4
Coğrafya	70	4
Fizik	80	5
Kimya	75	4

1. Hangi derste ortalama öğrenme düzeyi en yüksektir ya da grubun başarı düzeyi en yüksektir.

Ortalama öğrenme düzeyinin ve grup başarısının yüksek olmasını gösteren en önemli etken aritmetik ortalamadır. Eğer aritmetik ortalama eşitse standart sapmanın en düşük olduğu derse

bakmalıyız. Görüldüğü gibi Fizik dersinin Aritmetik ortalaması en yüksek olduğu için ortalama

öğrenme düzeyi ve grubun başarı düzeyi en yüksektir denebilir.
2. Hangi derste ortalama öğrenme düzeyi en düşüktür ya da grubun başarı düzeyi en düşüktür. Bunun için aritmetik ortalamaya bakılır aritmetik ortalaması düşük olan ortalama öğrenme

düzeyi en düşük diyebiliriz. Bununla birlikte eğer aritmetik ortalamalar eşit ise standart sapmanın en büyük olduğu derste ortalama öğrenme düzeyi ve grubun başarı düzeyi en düşüktür. Tabloda Türkçe ve Coğrafya derslerinin aritmetik ortalamaları eşittir. Coğrafya dersinin standart sapması daha büyük olduğu için ortalama öğrenme düzeyi ve grubun başarı düzeyi en düşüktür.

3. Hangi derste grup en başarılıdır ya da grup başarısı en yüksektir.
Grup başarısının ya da en başarılı grubu gösteren en önemli gösterge standart sapmanın en

düşük olmasıdır. Bununla birlikte, standart sapmalar eşitse aritmetik ortalamanın en yüksek olduğu derste grup başarısı yüksektir ya da en başarılı gruptur. Tabloda standart sapmanın en düşük olduğu ders Türkçe’dir. Standart sapmalar eşit değilse aritmetik ortalama ne olursa olsun standart sapmanın en düşük olan ders alınmalıdır.

4. Hangi derste grup başarısızdır ya da grup başarısı en düşüktür.
Grup başarısızlığını ya da en başarısız grubu gösteren en önemli gösterge standart sapmanın en

büyük olmasıdır. Bununla birlikte, standart sapmalar eşit ise, bu sefer de aritmetik ortalamanın en düşük olduğu derse bakılır. Standart sapmalar eşit değilse; aritmetik ortalama ne olursa olsun standart sapmanın en büyüğü olan ders alınmalıdır.

Çarpıklık

Simetriklik (Normal Dağılım): Aritmetik ortalama = Medyan (Ortanca) = Mod (Tepe değer)
Sağa Çarpık Dağılım (Pozitif Kayışlı): Mod < Ortanca < Aritmetik ortalama, böyle bir durumda test zor diyebiliriz. Yapabildiğimiz yorumlar %100 doğru değildir. Başarıda düşük diyebiliriz. Sorular ve test zordur.
Sola Çarpık Dağılım (Negatif Kayışlı): Aritmetik ortalama < Ortanca < Mod, başarı yüksek diyebiliriz. Sorular ve test kolaydır.Ham Puanların Standart Puanlara Dönüştürülmesi

Bir öğrenci birden çok teste girmişse aldığı puana göre hangi testte daha başarılıdır.
Birkaç öğrencinin hangisi testlerden aldıkları puan göre daha başarılıdır.
Birkaç öğrencinin testlerden aldıkları puanlara göre başarı sırası nedir.
Z Puanı: Xi – X/Sx Xi: Bir öğrencinin o sınavdan aldığı not. X aritmetik ortalamadır.
T Puanı: 10 . Z + 50
Örnek: 100 maddeden oluşan bir test, 20 kişilik bir öğrenci grubuna uygulanmış ve puan dağılımının aritmetik ortalaması 40 ve standart sapması 8 olarak hesaplanmıştır.
Bu sınavdan 50 puan alan bir öğrencinin Z puanı kaçtır?
Z=Xi–X/Sx =50–40/8=1,25

Bu sınavdan 70 puan alan bir öğrencinin T puanı kaçtır? T = 10 . Z + 50 dır. Z = 70 – 40/8 = 3,75
T = 10 . 3,75 + 50 = 87,5 çıkar.

Madde Đstatistikleri

1. Madde Güçlük Đndeksi: (p)

Bir sorunun ne oranda zor olduğunu gösterir.
0,00 + 1,00 ideal güçlük indeksi 0,50 dir. 0’a yaklaştıkça sorunun zor olduğusöylenebilir. 1 yaklaştıkça sorunun kolay olduğu çok sayıda öğrencinin yanıtladığı için söylenebilir.

Doğru cevabı veren üst grup öğrenci sayısı + Doğru cevabı veren alt grup öğrenci sayısı/Toplam öğrenci sayısı

P=1’e yaklaştıkça maddeyi doğru cevaplayanların sayısı fazla ve madde kolay, P=0’ayaklaştıkça maddeyi yanlış cevaplayanların sayısı fazla ve madde zorlaşmakta açıklaması
yapılır. P=0,50 olması maddenin orta güçlükte olduğunu gösterir.
Bir maddeye ait p değeri 1 ise maddeyi herkesin doğru yanıtladığını gösterir. Yani bu maddeninbilenle bilmeyeni grupta ayırt edemediği söylenebilir.
Eğer p değeri 0 ise hiç kimsenin bu soruyu bilemediğini ve bilenle bilmeyeni ayırt edemediğinigösterir. Bir testte bu tür sorulardan kaçınılır. Soru öyle bir güçlük derecesinde olmalıdır ki
bilenler soruyu doğru cevaplasın, bilmeyenlerde soruyu yanlış cevaplandırsın P=0,50 olmalıdır.

2. Madde Ayırıcılık Đndeksi: rjx

Bir sorunun bilen öğrenciyle bilmeyen öğrenciyi birbirinden ayırt edebilme yeteneğini gösterir.
– 1,00 0 + 1,00 ideal olan 0,30’dan büyük olması gerekir. Mümkün olduğuncabire (+1) yaklaşması istenilen durum.
Madde ayırıcılığını yükseltmek için çeldiriciler doğru cevap olan anlama yaklaştırılmasıgerekir.
Madde yeteri kadar ayırt edici ise, test puanı yüksek olanların maddeyi doğru cevaplamaları,test puanı düşük olanların ise maddeyi yanlış cevaplamaları beklenir.
Maddenin, test puanı yüksek olan öğrenciler ile test puanı düşük olan öğrencileri birbirindenayırma özelliği düştükçe madde ayırıcılık gücü indeksi 0’a yaklaşır. Test puanı düşük olan öğrenciler maddeyi doğru cevaplamaları durumunda maddenin ayırıcılığı ters yönde yükselir ve madde ayırıcılık gücü indeksi – 1’e yaklaşır.
Doğru cevabı veren üst grup öğrenci sayısı – Doğru cevabı veren alt grup öğrenci sayısı/Üst ya da alt grup öğrenci sayısı
Örnek:
Üst Grup, Alt Grup: Bu gruplar sınavdaki notlar yüksekten düşüğe doğru sıralanır. Sınava 100 öğrenci girmişse ilk 33 kişi üst grupta yer alır. Son 33 kişi de alt grupta yer alır. Ortadaki 33 kişiyi almıyoruz. Yukarıdaki tabloda B şıkkı doğru yanıttır.
Madde güçlük indeksi: 50 + 10/240 = 0,25
Madde ayırıcılık indeksi: 50 – 10/120 = 0,33

Soru No: 48	A	B*	C	D	E
Üst Grup	20	50	20	10	20
Alt Grup	30	10	30	30	20

Örnek:

1. Hangi derste dağılım normaldir.
Aritmetik ortalama, mod ve medyanın eşit olduğu dağılımlar normaldir yani simetrikliktir.

Tarih dersi’nde dağılım normaldir yani simetriktir.

Dersler	Aritmetik	Mod	Medyan	Standart sapma	Ali’nin notu
Türkçe	68	75	70	5	55
Matematik	70	65	60	10	60
Tarih	80	80	80	7	73
Fizik	65	75	70	4	72
Coğrafya	60	70	65	3	69

2. Hangi derste grup homojendir ya da farklılaşma en düşük ya da öğrencilerin öğrenme düzeyi birbirine ne yakındır.

Bir dağılımda grubun homojen olmasını ve farklılaşma düzeyinin en düşük olmasını ve öğrencilerin öğrenme düzeyinin birbirine en yakın olmasını gösteren en önemli gösterge, standart sapmanın en küçük olmasıdır. Tablomuzda Coğrafya dersinin standart sapması en küçük derstir. Grubun homojendir, öğrenciler arasındaki farklılaşma en düşüktür ve öğrencilerin öğrenme düzeyi birbirine en yakındır yorumları yapılabilir.

3. Hangi derste grup heterojendir ya da farklılaşma en yüksek ya da öğrencilerin öğrenme düzeyi birbirine en uzaktır.

Bir dağılımda grubun homojen olmasını ve farklılaşma düzeyinin en düşük olmasını ve öğrencilerin öğrenme düzeyinin birbirine en yakın olmasını gösteren en önemli gösterge, standart sapmanın en büyük olmasıdır. Tablomuzda standart sapmanın en büyük olduğu ders Matematik dersidir. Bu ders için; öğrenciler arasındaki farklılaşma en yüksektir ve öğrencilerin öğrenme düzeyi birbirine en uzaktır yorumları yapılabilir.

4. Grup olarak en başarılı olunan ders.
Standart sapmanın en küçük olduğu derse bakılmalıdır. Böylece aritmetik ortamla ile

standart sapma bölgeleri arasındaki puanların en yakın olduğu Coğrafya dersidir.
5. Grup olarak en başarısız olunan ders.
Standart sapmanın en büyük olduğu derse bakılmalıdır. Böylece aritmetik ortamla ile

standart sapma bölgeleri arasındaki puanların en uzak olduğu Matematik dersidir.
6. Ortalama öğrenme düzeyi ya da grup başarı düzeyi en yüksek ve en düşük olan dersler.

Aritmetik ortalamanın en yüksek olduğu ders, ortalama öğrenme düzeyi en yüksek olan dersiverir. Tarih dersi (80), grup başarı düzeyi ve ortalama öğrenme düzeyi en yüksek olan derstir.
Aritmetik ortalamanın en düşük olduğu ders bizlere ortalama öğrenme düzeyinin en düşükolduğu dersi verir. Coğrafya (60), grup başarı düzeyi ve ortalama öğrenme düzeyi en düşük
olan derstir.

7. Ali’nin en başarılı ve en başarısız olduğu dersler.

Z formülünden yararlanılmaktadır. Z=Xi – X/ Sx
Tek tek bütün dersler için Z puanı bulunduğu zaman en başarılı ders Coğrafya; en başarısız dersise, Türkçe’dir. Z Coğrafya= 69 – 60/3=3 çıkar.

Örnek:

Bireyler	Test 1	Test 2	Test 3	Test 4	Toplam Ham Puan
A	45	40	55	30	160
B	30	55	40	34	159
C	28	65	35	25	153
D	30	70	20	20	150
X	25	55	40	25
Sx	7	5	10	9

1. A öğrencisi hangi derste daha başarılıdır.

Tek tek testlerin Z puanlarını buluruz hangi dersin Z puanı daha çok ise o dersten daha başarılıdiyebiliriz. Z1=45 – 25 /7=2,85; Z2=40 – 55/5=- 3; Z3=55 – 40/10=1,5; Z4=30 – 25/9=0,5
O halde 1. Test en başarılı olduğu testtir.
Test 2’deki en başarılı öğrenci kimdir.
ZA=40 – 55/5=-3; ZB=55 – 55/5=0; ZC=65 – 55/5=2; ZD=70 – 55/5=3 çıkar. En başarılı öğrenci

D olur. Örnek: