
Ölçme: Geniş anlamıyla, herhangi bir niteliği gözlemek ve gözlem sonucunu sayılarla ya da sembollerle ifade etmektir. Ölçme başka bir ifadeyle nitelikleri nicelendirme işlemidir. Ölçme bireyin ya da bireylerin belli bir özelliğe sahip olma derecesinin sayısal olarak betimlenmesidir. Benim boyum 1.85’dir. Bugün havanın sıcaklığı 25 derecedir. Ahmet Tarih dersi sınavından 8 puan aldı. Standart ölçme araçları: metre, kg, standart testler, litre.
Bir öğretmenin sınıfta sorduğu sorulara doğru cevap veren her öğrenciye bir artı vermesi. Bisikletin değeri 300 YTL’ dir. Ayşe çok güzel bir kızdır.
Ölçme işleminin aşamaları:
Ölçülecek bir değişkeni ya da özelliği belirleme.
Özelliği ya da değişkeni gözlemleme.
Gözlemi uygun zamanda gerçekleştirme.
Sonucu sayı ya da sembolle ifade etme.
Ölçek: Ölçme dilimizde birim derecelendirilmiş araç anlamlarında kullanılır. Literatürümüzde ise bir ölçme kümesinin sahip olduğu matematiksel özellikler ölçek anlamında kullanılır. Diğer bir tanım ise; nesnelere verilen sayıların anlamlarını ya da nesnelere sayılar vermede ve nesnelere verilen sayıların kullanılmasında uyulması gereken kurallar ve kısıtlamaları belirtmek için kullanılır. Đkinci anlamda ölçek; cetvel ve metre gibi ölçme araçları bölümlenmiş bir ölçme aracını belirtmek için kullanılır. Çeşitleri:
1. Sınıflama (Adlandırma) Ölçeği: Üst düzey bilgiler vermezler. Sadece frekans ve %
hesaplama gibi basit işlemler yapar. Gözlemlerin en basit biçimi olup taşıdığı bilgiler en az olan ölçeklerdir. Bireylerin ya da objelerin belirli özellikleri doğrultusunda benzeyip benzemedikleri biçimde yapılandırmasıdır. Özelliklerine bakarsak:
- Nesnelerin belirli yönlerinden benzeyip, benzemediklerine göre sınıflamaktır.
- Nesnelerin farklılık ve benzerliklerini belirlenir.
- Nesnelerin sınıf, tip ve kategorilerine göre sınıflanır.
- Đllere plaka numarası verme, kız – erkek öğrencileri ayırma, kısa – uzun boylu öğrencileriayırma.
- Basit istatistik işlemler yapma. ÖSS’yi kazanan adayların bölüm tercih sıralama listesi.
- Değişkenler taşıdıkları özelliğe göre sınıflara tasnif edilirler.
- Sınıflama ölçeğinde sınıflar oluşturulduğundan dolayı, bu sınıflardan herhangi birine giren tümelemanlar eşit, farklı sınıflardan alınan elemanlar ise farklı olurlar.
- Eğitimde nadiren kullanılır; bazı tanımlayıcı nitelikler (göz ve saç rengi gibi değişkenler),insanların yaşadığı coğrafi bölgeler gibi değişkenler bu ölçeğe örnektirler.
- Bu ölçek değişkenleri sadece gruplara tasnif ettiğinden matematiksel olarak elimizde sadecefrekanslar vardır. Dolayısıyla, frekanslara dayalı analizler dışında bir çok matematiksel işlemi yapmak anlamsızdır. Örneğin elmalarla armutların ortalamasını alamayız. Matematiksel işlem olarak sadece sınıf içindeki elemanların sayısı yani frekanslar belirlenir.
- Bu ölçekte bazen isimler yerine sayılar kullanılabilir. Mesela bir ankette kız öğrencilere “1” ile, erkeklere ise “2” ile kodlanması. Futbolda kalecilere “1” numarasının verilmesi, okul kimlik numaralarında sayıların kullanılması durumlarında, kullanılan numaraların sayısal bir anlamı yoktur, bunlar sadece koddurlar. Numarası “11” olan bir oyuncunun numarası “1” olan oyuncudan daha iyi olduğunu söyleyemeyiz.
- Sınıftaki öğrencilerin velilerinin mesleklerini belirlemek için bir anket hazırlanmış ve bu ankete memur, esnaf, işçi gibi ifadeler yazılmıştır. Bu ifadeler sınıflama ölçeğinde yer alır.
2. Sıralama Ölçeği: Sınıflama ölçeğine göre bir üst düzeyde ölçme sonuçları veren ölçek türüdür. Bireylerin ya da objelerin ölçülen özellikleri doğrultusunda sıraya konması ve sıradaki yerine göre bir sayı verilmesi durumu söz konusudur. Özellikler;
1
- Nesneleri belli özelliğine sahip oluş miktarı bakımında sıralamaktır.
- Öğrencileri boy sırasına, sınav notlarına göre sıralama.
- Ortanca ve yüzdelikler belirlenir.
- Niteliklerin belli bir boyutta, büyükten küçüğe, küçükten büyüğe, iyiden kötüye veya kötüdeniyiye doğru sıralanmasıyla elde edilir. Bu sıralar sayı ile ifade edileceği gibi bazı sıfatlarla da ifade edilebilirler; pekiyi-iyi-orta-geçer-kalır, en uzun-uzun-kısa gibi. Bu tür ölçeklerde öğrencilerin tüm grup içindeki yeri belirlenmektedir.
- Sıralama ölçeğinde, sınıflamadan fazla olarak sıralar arasındaki büyüklük küçüklük ilişkisi vardır.
- Bu ölçekte belli bir boyutta sıralar arasındaki büyüklük, küçüklük anlamlıdır. Buna rağmen, iki sıra arasındaki farkın miktarını söylemenin bir anlamı yoktur. Başarı sıralamasına göre veya boy uzunluğu sıralamasına göre, ikinci öğrencinin dördüncü öğrenciden iki birim daha üstün olduğu söylenemez. Her bir ardışık sıra numarası alan öğrenciler arasındaki fark bir derece de olsa da bu farkın aynı miktarı ifade ettiği söylenemez. Sınıftaki en başarılı ilk beş öğrencinin belirlenmesi.
3. Eşit Aralıklı Ölçekler: Bireyler ya da objelerin ölçme konusu olan özellikleri reel sayılar kümesinin elemanlarıyla bire bir olarak eşlenirler. Bir çok nesne ya da bireyin belirlenmiş bir başlangıç (izafi 0 noktası) noktasına göre ve belli bir özelliğe göre sahip oluş düzeylerine göre eşit aralıklarla sıralanması durumudur. Mutlak Sıfır (0): 0 kg, 0 cm gibi. Đzafi 0 ise; öğrencinin sınavda 0 alması. Bir öğrenci sınavdan 0 alıyorsa bu onun hiçbir şey bilmediği anlamına gelmez. Saatimizin 00:00 göstermesi ya da termometrenin 0 dereceyi göstermesi ortamda hala sıcaklığın olduğuna işarettir. Özellikleri:
- Nesnelerin belirli bir başlangıç noktasına göre ve belli bir özelliğe sahip oluş derecesi bakımından eşit aralıklarla sıralanmasıdır.
- Başlangıç noktası (0 noktası) tanımlanmıştır. 0 noktası keyfidir ve eşit aralıklarla bölümlenmiştir.
- Termometre, takvim, saat, sınavlar.
- Aritmetik ortalama ve standart sapma bulunur.
- Türkçe dersinin sınavında 90 alan bir öğrencinin zekası 45 alan bir öğrencinin zekasından tamiki kat fazladır anlamı çıkmaz.
- Hava sıcaklığının 18 derece olarak belirlenmesi.
- Bir öğrenciye uygulanan zeka testi sonucu.
- Bir öğrencinin falanca dersine tutumu.
- Matematik dersi 90 olan bir bireyin notu matematik dersi 45 olan bireyin notunun tam ikikatıdır anlamı çıkmaz. Çünkü 0 noktası görecelidir yani izafidir.
- Buraya kadar eğitimde uygulanabilir.
- Eşit aralık ölçeklerde ölçümler arasındaki farkın miktarı anlamlıdır zeka puanı 120 olan birininzeka puanı 60 olan birinden 60 daha fazla aldığını söyleyebiliriz. Yani iki ölçüm arasındaki
farkın miktarı anlam kazanmaktadır.
4. Oranlı Ölçek: En üst düzeydeki ölçektir. Aralık ölçeğinden ayrıldığı nokta “0” noktasıdır zaten
eğitimde de kullanılmamasının nedeni de budur. Oran ölçeğinde “0” gerçek (mutlak) “0”’dır. Oran ölçeğinde elde edilen ölçme sonuçları çarpım ve bölme yapılabildiğinden matematiksel 4 işlem ve bu işlemlere dayanan tüm istatistiksel işlemler yapılabilir ve bu da anlamlı olur. Özelliklerine bakarsak:
- Başlangıç noktası olan 0 noktası gerçek bir sıfır noktasıdır.
- 0 noktası ölçülen özelliğin hiçliğini, yokluğunu gösterir.
- Uzunluğun ya da ağırlığın ölçülmesidir.
- Her türlü istatistik işlemi yapılır.
- Sınıftaki öğrenci sayısının belirlenmesi.
- Basketbol takımına girecek öğrenciler için boy uzunluğu sınırı belirleme.
- Boyu 90 cm olan bireyin boyu 45 cm olan başka bir bireyin boyunun tam 2 katıdır anlamı
çıkar.
2
ÖLÇME TÜRLERĐ
1. Doğrudan (Temel) Ölçme: Ölçülen özellikle kullanılan ölçme aracının niteliği benzerdir
(aynıdır). Ölçülecek değişken dolaysız (doğrudan) ölçülür. Özellik kendisine ilişkin ölçme aracı ile ölçülür. Geçerliği ve güvenirliği yüksek bir ölçme elde edilir. Ağırlığı başka bir ağırlık ölçüsü ile ölçmek, uzunluğu bir başka uzunluk ölçüsü ile ölçmek.
- Bir masanın boyunun cetvel ile ölçülmesi.
- Bir paketin kefeli terazi ile ölçülmesi.
- Bir sınıftaki öğrenci sayısının belirlenmesi.
- Öğrencilerin boy uzunluklarının belirlenmesi.
- Bir öğrencinin sahip olduğu kitap sayısının belirlenmesi.
- Ahmet’in kaç kardeşi olduğunun belirlenmesi.
- Sosyal Bilimler dersinde ölçme işlemi gerçekleştirmek zordur bunun nedeni ise, özelliklerinin doğrudan gözlenememesi.
2. Dolaylı Ölçme: Ölçülen özellik ile kullanılan ölçme aracının niteliği benzer değildir (farklıdır), ölçülecek değişkenin dolaysız (doğrudan) bir şekilde gözlenmediği durumlarda başvurulur. Özellik kendisine ait olmayan başka bir araçla ölçülür. Geçerlik ve güvenirlik düşüktür. Eğitimdeki ölçmeler tamamıyla dolaylı ölçmelerdir. Her türlü sınav dolaylı ölçmedir. Bir değişkenin (o değişkenin bir göstergesi olduğu kabul edilen) başka bir değişken ya da tanımlanan bir bağıntı yardımıyla ölçülmesidir.
- Bir öğrencinin bilgisinin sınav ile ölçülmesi. Resim öğretmenin öğrencinin yaptığı resme bakarak not vermesi.
- Öğrencinin zeka düzeyinin ölçülmesi.
- Öğrencilerin yeteneklerinin ve kişilik özelliklerinin ölçülmesi.
- Bir dersten geçme notunun belirlenmesi.
- Bir paketin yaylı terazi ile ölçülmesi.
- Bir odanın sıcaklığının termometre ile ölçülmesi.DEĞERLENĐRME
Değerlendirme, ölçme sonuçlarının aynı alana ait bir kriter ile kıyaslanarak bir değeryargısına ve oradan da bir karara ulaşma sürecidir .Öğretmen öğrencisine: “Bu dersten tekrara kaldın” demiştir. Öğretmenin bu ifadesi Karar’dır.. Ölçme ve değerlendirme etkinliklerinin eğitimin sürecindeki temel işlevi:
Davranışların kazanılma düzeyini belirleme.Öğrencilerin hazır bulunuşluk seviyelerini belirleme ve bilgi edinme.
Öğrenciyi motive etme.
Öğrencilerin geleceklerine yönelik karar alma.
Ölçme Sonucu (ölçüm) Kriter (ölçüt) Değer Yargısı KARAR
(Ali, 163 cm boyundadır.) (Polis okuluna ön kayıt (Ali’nin boyu kısadır.) (Ali polis okulunayapmak için 167 cm giremez.) boya sahip olmak
gerekmektedir.)Ölçüt: Ölçme sonuçlarını karşılaştırdığımız ya da kıyasladığımız sabit değere kriter (ölçüt) denir. Ölçüt olarak; programın hedefleri, öğrencinin yeteneği, grup başarısı, öğrenme eksiklikleri kullanılabilir. Öğretmenin öğrenciye ilişkim kanaati kullanılmaz. Bir öğretmen, dersinde 3 kez artı alana, sınavda 5 puan fazla vermektedir. 3 kez artı alma ölçüttür.
Kullanılan Ölçüte Göre
1. Norm Dayanıklı (Bağıl): Bireyin başarısının içinde bulunduğu gruba göre değerlendirmedir.
Çan eğrisi buna örnektir. Grup olarak ele alınır. Türkçe dersinde öğrencilerin dönem sonunda alacakları notu belirlenen sınıfın aritmetik ortalamasını dikkate alma. Đngilizce bilgisi en iyi olan ilk 5 öğrenciyi belirleme. Bağıl değerlendirmede, sınıftaki diğer öğrencilerin başarısı, öğrencinin yeteneği, ülke çapındaki normlar, erişi düzeyi ölçüt olarak kullanabiliriz. Matematik olimpiyatlarına katılacak öğrencilere uygulanan bir testin sonucuna bağlı olarak en iyi üç
3
öğrenciyi seçmek. Sınıfın öğrenme düzeyine göre geri kalan öğrencileri belirleme. Aritmetik
ortalamanın altında kalan öğrencileri başarısız sayma.
2. Kriter Dayanıklı (Mutlak): Bireyin başarısını daha önceden konulmuş bir kuralı yerine getirip
getirmediğine bakılır. Bireyin başarısı tamamıyla kendi çabasıyla alakalı. Matematik dersinde öğrencilerin öğrenme eksikliklerini belirleme. Beden dersinde 100 metreyi 12 sn. de koşan öğrencileri başarılı kabul etme. Matematik dersinde başarılı olmak için en az 60 puan almak gerekmektedir. Bu ifadede yer alan “60” puan mutlak ölçüttür. Đçerikte yer alan konuların en az %80’nini öğrencilere kazandırma. Hedef – davranışların %70’sine ulaşamayan öğrencilere ek öğretim faaliyetlerini düzenleme.
Kullanılma Amaçlarına Göre
- Biçimlendirici/Đzlemeye Değerlendirme (Formatif): Eğitim – öğretim sürecinde devametmekte yapılan sınavların hepsi bu değerlendirmeye girer. Her konu sonu testleri, deneme sınavları. Üniteler arasındaki aşamalılığı ve geçişi sağlar, öğrenme yetersizlikleri belirlenir ve önlem alınır. ünitedeki öğrenme eksikleri belirlenir. Ünitenin hedef – davranışlarında gerçekleşme düzeyi belirlenir. Öğrencilere ara sınav yapılarak not verilir. Öğrencilerin öğrenme süreci takip edilir.
- Düzey Belirleyici (Summatif): Eğitim –öğretim sonunda yapılır. Hedeflere ne derecede ulaşıldığını gösterir. Vizeler (biçimlendirici), final sınavları ise (düzey) belirleyicidir. KPSS sınavı. Öğretme – öğrenme etkinliklerinin sonunda öğrencilerin son durumlarını belirlemek amacıyla yapılan düzey belirleyici değerlendirmede ölçme araçları olarak: Başarı sınavı, bitirme sınavı (final), yeterlilik sınavı, uzmanlık sınavı, erişi testi.
Öğretim programının hedeflerine ulaşma düzeyi, öğrenme düzeyi ve öğrencileri başarı düzeyini belirlemek için yapılır.
3. Tanıma – Yerleştirmeye göre Değerlendirme:
- Öğrenme sürecinin başında ya da bir dersin giriş bölümünde yapılan değerlendirmedir.
- Öğrencilerin belli bir kurs, ders ya da ünitenin ön koşulu niteliğindeki giriş davranışlarına sahipoluş derecelerini belirlemek.
- Öğrencileri düzeylerine göre gruplama.
- Öğrencilerin giriş davranışlarını belirleme.
- Öğrencileri bir programa yerleştirme.
- Öğrencilerin hazır bulunuşluk düzeylerini belirleme.
- Üniversiteye yeni başlayan öğrencilere Đngilizce dersinde yapılan bir testin sonucuna dayalıolarak öğrencilerin %30’u dersten muaf sayılmışlardır. Bu değerlendirmenin amacı tanıma
yerleştirmeye yönelik değerlendirmedir.
Dip Not: Dershanelerin sene öncesinde yapılan sınavlar tanımlayıcı değerlendirme türleridir.Bir Ölçme Aracında Bulunması Gereken Nitelikler
1. Güvenirlik:
- Ölçme araçlarının kararlılığı, tutarlılığı (aynı ve benzer sonuçları vermesi) ve duyarlılığı(hatalardan arınıklığı) dır.
- Ölçme aracının hatalardan arınık olma.
- Bir ölçme aracının birden fazla uygulandığında benzer ya da yakın sonuçların alınması(tutarlığı) güvenilir olduğunu gösterir.
- Bir ölçme işlemi ne kadar az hata yaparsa (duyarlılık) güvenirliği o kadar yüksek olur.
- Ölçme aracı gerçeği yansıtma derecesidir.
- Bir testin güvenirliğini doğrudan artıran faktör “cevap anahtarı” hazırlamadır.
2. Geçerlik:
- Ölçme aracının kullanılış amacına hizmet etme derecesidir.
- Ölçme aracının neyi ölçmek istiyorsa onu başka özelliklerle karıştırmadan ölçmesidir.
- Bir ölçme aracının geçerli olabilmesi için önce güvenilir olması ön koşuldur.
3. Kullanabilirlik:
Ölçme aracının emek, maliyet, zaman, hazırlanışı ve uygulama koşulları gibi yönlerden uygun
olmasıdır.
4
Dip Not: Bir ölçme aracında güvenirlik, geçerlik eşit öneme sahiptir. Bir ölçme aracı geçerliyse mutlaka güvenirlidir. Ancak güvenilir olan her ölçme aracı geçerli olmayabilir. Bir ölçme aracı önce güvenilir ve geçerli arkasında da kullanışlı olmalıdır. Ölçme ve değerlendirme sürecine karışan hata kaynakları: Ölçmeyi yapan kişi, ölçmede kullanılan araçlar, ölçülen özellikler, ölçmenin yapıldığı ortam.
GÜVENĐRLĐK
Bir ölçme aracının ölçümlerine birçok kaynaktan hata karışabilir. Güvenirlik ölçme aracının
hatalardan arınıklık düzeyidir. Yani ölçme sonuçlarına hata karıştırmadan ölçme yapabilmesidir. Ölçme sonucundaki hata miktarı düştükçe güvenirlik artar. Bir ölçme işleminde hata miktarı arttıkça güvenirlik de düşer.
Güvenirlik ölçme aracının kararlılığı ve tutarlılığı ile ilgilidir. Ölçme aracının birkaç kez uygulandığında benzer (birbirine yakın) sonuçları vermesi düzeyidir. Teknik anlamda ise güvenirlik gerçek puanlar ile gözlenen puanlar arasındaki korelasyonun karesidir. Ölçme hatası: Gerçek ölçme sonucu ile yapılan ölçme sonuçları arasında meydana çıkan farktır.
1. Sabit Hata: Hata miktarı ölçümden ölçüme değişmez. Hata miktarı her ölçme işleminde aynı orandadır. Daha çok ölçmenin güvenirliği ile ilgilidir. Sınav aracı, yanlış cevap anahtarı, soruların sınavda yoklanacak hedef davranışları uygun örneklendirmemesi durumlarında ortaya çıkar.
- Terazinin her ölçtüğü nesneyi 10 gr. fazla ölçmesi.
- Bir öğretmenin okuduğu her sınav kağıdına 10 puan fazla vermesi.
- Dikkat edilirse hata işlemi hep aynı nesnelere veriliyor.
2. Sistematik Hata: Hata miktarı ölçümden ölçüme belli oranda artar ya da azalır. Ölçme aracı
belirli şartlar gerçekleştiği zaman hata yaparsa. Öğretmenin (ölçmeyi yapanın) yanlılığından kaynaklanır. Ölçülen büyüklüğe, ölçmeciye ve ölçme koşullarına bağlı olarak miktarı değişen hatadır. Puanlayıcının subjektif olduğu (taraflı – yanlı) hatalardır. Daha çok ölçmenin geçerliği ile ilgilidir. Bir testin sistematik hatalardan arınıklılığının artması testin geçerliğini artırır. Diğer hata türleriyle birlikte ele alındığında geçerliği düşürür.
- Öğretmenin sadece erkek öğrencilere 10 puan fazla vermesi.
- Yazısı güzel olan öğrencilere 5 puan fazla verilmesi.
- Terazinin 2 kg. ve üstü ağırlık ölçümlerinde 10 gr. eksik tartması.
- Öğretmenin 50 puanlık sınav kağıdına 5, 60 puanlığa 10, 70 puanlığa 15 puan fazla vermesi.
- Terazinin 1kg’lık nesneyi 100 gr, 2 kg’lık nesneyi 200 gr, 3 kg’lık nesneyi 300 gr eksikgöstermesi.
3. Rasgele (Random) Hata: Hata miktarı kuralsız olarak artar ya da azalır. Hatanın kaynağı
bilinmez. Daha çok ölçmenin güvenirliği ile ilgilidir. Kaynağı bilinmeyen ve ölçme sonuçlarına gelişi güzel karışan hatalardır. Örneğin; öğrencinin sınav günü hasta olması, sınav salonuna güneş vurması, şans başarısı, kopya çeken öğrencinin aldığı puan.
- Terazinin bir nesneyi 100 gr. eksik, başka bir nesneyi 50 gr. fazla, başka bir nesneyi 15 gr. eksik tartması.
- Öğretmenin bir sınav kağıdına 10 puan eksik, başka bir kağıda 15 puan fazla, bir diğer kağıda 20 puan eksik vermesi.
- Cevap kağıdına kodlama yapılırken kaydırma yapılması.
- Birkaç öğrencinin sınav sonuçlarının fazla gelmesi.
- Bir öğretmenin sınav kağıtlarını okurken zaman zaman açık olan TV’den gelen sesler dikkatiniçekmiş ve bazı kağıtları puanlamada hatalar yapmıştır bu hata tesadüfi hatadır.
Dip Not: Sabit ve sistematik hatalar düzeltilebilir. Tesadüfi hatalar nerden geldiği bilinmediği için düzeltilemez. En çok tesadüfi (Random) hata güvenirliği düşürüyor. Eğitimde kullanılan ölçme araçlarında her zaman bir miktar hata payı vardır. Bunun olası nedeni ise, ölçülen özelliklerin dolaylı olarak ölçülmesinden kaynaklanır.
Ölçmeciden kaynaklanan hatalar | Ölçmecinin taraflı davranması – dikkatsiz davranması. Kız öğrencilere ya da yazısı güzel öğrencilere 5 puan |
5
fazla not vermek. | |
Ölçme aracından kaynaklanan hatalar | Soruların anlaşılamaması, ölçme aracının birden fazla davranışı karmaşık ölçmesi, soruların iyi düzenlenmemiş olması, soruların okunamıyor olması gibi hatalar. |
Ölçmenin yapıldığı ortamdan kaynaklanan hatalar | Sınav yerinin ısı, ışık ve havalandırmasının yetersiz olması, ses ve gürültünün rahatsız edici olması. |
Ölçülen kişiden kaynaklanan hatalar | Öğrencinin derse ve sınava tutumu, sorumluluğu, kişiliği, yorgunluğu, isteksizliği. |
Ölçme aracının çeşidinden kaynaklanan hatalar | Sözlü sınav yerine, yazılı sınavın kullanılması. |
Bir Ölçme Aracının Güvenirliğini Hesaplama Yöntemleri
Bir ölçme aracının güvenirliğini belirlemek için güvenirlik katsayısı (r) bulunur. Güvenirlik
katsayısı gerçek ölçümlerin sonucunun (varyansının) gözlenen puanların sonucuna (varyansına) oranıdır. Güvenirlik katsayısı 0.00 ile +1.00 arasında değişir. Katsayı 1.00’a yaklaştıkça güvenirlik artar, 0.00’a yaklaştıkça güvenirlik düşer.
1. Test – Tekrar Test Yöntemi: Standart bir test, bu test bir öğrenci grubuna uygulanır belli bir
süre geçtikten sonra aynı test aynı şartlarda aynı gruba uygulanır sonuç aynıysa test güvenilirdir. Bir testin (aynı testi) aynı gruba aralıklı olarak (değişik zamanlarda) iki defa uygulanışı sonucu elde edilen sonuçların korelasyonu (güvenirlik katsayısı) bulunur. Test – tekrar test yöntemi ile elde edilen güvenirlik katsayısı, 1.00’a yakınsa ölçme aracının hatalardan arınıklığının, kararlığının ve tutarlığının yüksek olduğu söylenebilir. Bir ölçme aracı birden fazla uygulandığında benzer sonuçlar vermesi tutarlı olduğunu kanıtlar. Bu yönteme en uygun zeka testleridir.
Korelasyon: Đki değişkenin arasındaki ilişkiye korelasyon bu ilişkinin miktarına ise korelasyon miktarı denir. 3 tip korelasyon söz konusu.
-1 0 +1
(negatif) (ilişki yok) (pozitif)
+1: Đki değişkeninde aynı anda artması lazım. Düzenli ders çalışma ile sınavda başarılı olma pozitif korelasyon var. Korelasyon katsayısı (r) ile gösterilir.
-1: Biri artarken diğeri azalıyorsa aralarında negatif korelasyon vardır. Sigara içme ile sağlıklı olma.
0: Đki değişken arasında hiçbir bağlantı ilişkisi yok. Cinsiyetle zeka arasındaki ilişki gibi.
-1 0 +1
a) 0.06 b) 0.17 c) 0 d) -0.08 e) -0.32 ilişki en üst seviyede olan şık e) şıkkıdır.
- Paralel (Eşdeğer) Formlar Yöntemi: Bir testin iki eş değer formunun aynı zamanda aynıgruba uygulanması ile elde edilen sonuçların korelasyonu bulunur. Eşdeğer form, iki testin maddelerinin kapsamı, sayısı, güçlüğü ve niteliği bakımından denk olmaları anlamına gelir. Paralel testler yöntemi ile elde edilen güvenirlik katsayısı, 1.00’a yakınsa ölçme aracının hatalardan arınıklığının ve tutarlığının yüksek olduğu söylenebilir. Eğitimde hiçbir test korelasyon katsayısı 0 altında çıkmamalı.
- Đki Yarı (Eşdeğer Yarılar) Yöntemi: Oluşturulan test aynı konuya ait olmalı. Test ortadan ikiye bölünür. Ayrılan bölümler eşit olmalı yani birinci bölümde 15 soru var ise ikince bölümde de 15 soru olmalı. 1. soru hangi hedef-davranışı ölçüyorsa diğer bölümdeki testimizdeki birinci soruya karşılık gelen soruda aynı hedef-davranışı ölçmelisidir. Đki test arasındaki korelasyon yüksekse test güvenilir demektir.
- Đç Tutarlılık Güvenirliliği (KR – 20): Bir testi oluşturan maddelerin kendi aralarındaki tutarlılığın hesaplanmasıyla ortaya çıkan güvenilirliktir. Bir soru diğer soruların diğer cevabını içermemeli. Çelişen sorular, birbirinin cevabını içeren sorular olmamalı. KR – 20 (güvenirlik katsayısı) bir defada uygulanan bir ölçme aracının (tek form) iç tutarlığını veren bir katsayıdır.
6
KR – 20 güvenirlik katsayısı 0,81 olan bir test için kesin olarak, test maddeleri arasındaki
tutarlık yüksektir denilebilir.
Dip Not: Bir testin güvenirlik katsayısı 0 yaklaştıkça güvenirliği düşer. Eksi çıkan sonuçlar atılmalıdır. Mümkün olduğunca +1 yakın olmalıdır. Hazırlanan testlerin hiç biri +1 olamaz mutlaka ölçmeye hata karışır.
Güvenirliği Artırma Yöntemleri ve Dikkat Edilmesi Gerekenler
- Bir sınavda soru sayısı arttıkça güvenirlik artar. Soru sayısının artmasıyla öğrencilerin sallamaşansı azalacağı için güvenirliği artırır. Soru sayısı fazla olan çoktan seçmeli testlerin
güvenirliliği, soru sayısı az olan yazılı yoklamalardan daha yüksektir.
- Soruların öğrenciler tarafından açıkça anlaşılır olması ve kesin yanıtının olması güvenirliğiartırır. Bu durum öğrencilerin gelişi güzel cevaplarını engellediği için güvenirliği artırır.
- Öğrenciler sınava motive edilmeleri soruları dikkatli yanıtlamalarını sağlayacağındangüvenirliği artırır.
- Sınav için yeterli sürenin verilmesi güvenirliği artırır. Fazla süre verilmesi nedeniyle kopyaçekilmesi nedeniyle geçerlilik düşer.
- Ölçmede duyarlılığı yüksek olan araçların (daha küçük birimleri ölçebilen) kullanılmasıgüvenirliği artırır. Bir ölçme işleminde hata oranın az olması duyarlığı yüksek olduğunu
gösterir.
- Ölçme aracındaki soruların güçlüğü “orta düzey” olmalıdır. Soruların çok kolay ya da çok zorolması güvenirliği düşürür. Sorular, cevaplayacak öğrencilerin yaklaşık yarısı tarafından doğru cevaplandırılacak güçlükte olmalıdır. Soruların çok kolay veya çok zor olması bilenle bilmeyen öğrencilerin birbirinden ayrılmamasına neden olduğu için güvenirliği düşürür.
- Sınavın puanlanmasının nesnelliği güvenirliği artırır. Objektif puanlanabilen sınavların puanlanmasında hatalar az olacağı için güvenirlik yüksektir. Bir testin değişik kişilerce ya da aynı kişi tarafından farklı zamanlarda puanlanması ile elde edilen sonuca “Puanlama Güvenirliği” denir. Sınavın objektif puanlanması güvenirliği artırır. Objektif olma puanlama biçimiyle alakalıdır.
- Öğrencilerin sınavlar ile ilgili fikirleri ve ön yargıları da güvenirliği etkiler. Öğrencinin sınavı bir ölüm – kalım meselesi haline getirmesi güvenirliği düşürür.
- Bir ölçme aracının güvenilir olması öncelikle, test puanlarına karışan hata miktarının az olmasıyla gerçekleşmiş olur.Geçerlik
- Bir ölçme aracının neyi ölçmek amacıyla hazırlandıysa o amaca hizmet etmesine geçerlik denir.
- Bir ölçme aracının ölçmeyi amaçladığı özellikleri diğer özelliklerle karıştırmadan ölçebilmesi düzeyine geçerlik denir.
- Geçerlik ölçme aracının ölçmeyi amaçladığı değişkeni ne derece ölçebildiği düzeyidir. Geçerliliği düşüren etmenler:
- Bir ölçme aracından elde edilen puanlara ölçme aracının ölçmeyi hedeflediği özelliklerindışındaki özelliklerin karışması (yazı güzelliği, ifade biçimi, yanlılık vb.) o ölçme aracından
elde edilen puanların geçerliğini düşürür.
- Bir ölçme aracı ölçmek istediği bir özelliği eksik bir biçimde ölçerse geçerliği düşük olur.Örnek; pusula yönleri belirlemek için geliştirmiş bir ölçme aracıdır ve biz pusulayı saati göstermesi için kullanamayız. Pusula, ile yönleri belirlemenin dışında başka özellikleri ölçmeye kalkıştığınızda geçerli olmayan sonuçlarla karşı karşıya kalırız.
- Ölçme aracı, ölçmek istediği özellikleri diğer özelliklerle karıştırmamalıdır. Bir sınav ile öğrencinin belirli bir alandaki bilgi düzeyini ölçmeyi hedeflediğimizde, bunun dışındaki nitelikleri de ölçmeye kalktığımızda (sayfa düzeni, güzel yazı, ifade biçimi) geçerliği düşürürüz.Güvenirlik ve Geçerlik Arasındaki Đlişki
Bir ölçme aracının geçerli olması için güvenilir olması ön koşuldur. Yani bir ölçme aracınıngeçerli olması için önce güvenilir olmalıdır. Buna karşılık güvenilir olan bir ölçme aracı geçerli olmayabilir. Yani test tutarlı ölçme yapabilir ama ölçmek istediği özelliği ölçmüyor olabilir.
- Bir ölçme aracından elde edilen puanlara ölçme aracının ölçmeyi hedeflediği özelliklerindışındaki özelliklerin karışması (yazı güzelliği, ifade biçimi, yanlılık vb.) o ölçme aracından
7
Geçerlik Türleri
1. Kapsam Geçerliği:
- En önemli sayılabilecek geçerlilik türüdür.
- Bir ölçme aracının ölçme yapacağı hedef – davranışları (konuları) yeterli olarak ölçebilmederecesidir. Yani ölçme aracının ölçmek istediği davranışları ne derecede kapsadığı geçerliğini
gösterir.
- 30 soruluk program geliştirme testi hazırlanırken tüm sorular bilişsel hedeflere ayrılmışsa oölçme aracının kapsam geçerliliğinden söz etmek mümkün değildir.
- Kapsam geçerliliğini artırmak için belirtke tablosundan yararlanılır. Bir de uzman görüşünebaşvurulmalıdır.
- Ölçülmesi hedeflenen evreni (hedefler – konular) yeterli ve dengeli olarak örnekleyen vekapsadığı maddelerin (soruların) her birinin ölçmeyi hedeflediği, hedef – konuyu gerçekten
ölçebildiği bir test kapsam geçerliğine sahiptir.
- Örnek, bir derste toplam 10 ünite işlenmiş, sınavında ise 5soru sorulmuştur. Sorular 2. 5. 7. 8.9. ünitelerden sorulmuş olsun. Böyle bir sınavda kullanılan sorular işlenen tüm üniteleri yeteri kadar temsil edemediği için sınavın kapsam geçerliği düşüktür. Ya da testteki bir madde (soru) ilgili hedef – davranışı yeterince kapsamıyorsa kapsam geçerliği düşüktür.
- Eğer ölçme aracı (sınav) öğrencinin dersin hedeflerini gerçekleştirme derecesi yerine, kişiliği ya da görünümü gibi (ölçmek istediği özelliklerin dışındaki özellikler) faktörlere dayalı olarak yapılması durumunda yapılan ölçmenin geçerliği yoktur.
- Kapsam geçerliğinin aşamaları: ölçülecek nitelik ile ilgili davranışların belirlenmesi, ölçme aracını oluşturan davranışların (örneklemin) belirlenmesi, ölçme aracını oluşturan davranışlar örnekleminin evreni temsil etme düzeyinin belirlenmesi , ölçme aracındaki soruların ilgili olduğu davranışı ölçmeye uygun olup olmadığının kontrol edilmesi.
2. Ölçüt Geçerliği: 120 soruluk bir test hazırlanır gruba uygulanır, çıkan sonuçlar daha önceden güvenirliliği denetlenmiş bir sınav (KPSS 2004) ile karşılaştırılır sonuçlar benzerse hazırladığımız sınavın geçerliğinden söz edebiliriz. Ölçüt geçerliği; geçerliği çalışılan bir ölçme aracı ile geçerli olduğu kabul edilen başka bir ölçme aracının aynı bireylere uygulanarak elde edilen ölçümler arasındaki korelasyondur.
- Yordama Geçerliği: Yordama tahmin etmek demektir. Mevcut verilerden faydalanarak gelecek ile ilgili kestirimlerde (tahminlerde) bulunmaktır. ÖSS sınavında ilk 100 giren bir öğrencinin üniversite öğreniminde de başarılı olacağını tahmin etmek yorumlamak yordam geçerliğine girmektedir. Özetle ileriye yönelik bir tahmin söz konusudur. Öğrencilerin lise birinci sınıftaki notlarına bakarak, alan ve bölüm seçmelerini sağlama.
- Uygunluk Geçerliği: Bu sefer tahminimizi, yorumumuzu geriye dönük yaparsak bu geçerliliğin alanına girmiş olur. Örnek, ÖSS sınavında ilk 100 giren bir öğrencinin lise öğrenimin de başarılıdır demek bu geçerlik alanına girmektedir.
- Yapı Geçerliği: Bir testin, veya ölçme işleminin teorik bir yapıyı ölçüp ölçmediğinin belirlenmesidir. Başka bir ifadeyle bir ölçme aracının teorik olarak ölçmek istediği yapıyı ölçmeye uygun olup olmadığına dair kanıt toplama çalışmasıdır. Yapı geçerliği çalışmalarında bir grubun ve grupta yer alan bireylerin sahip olduğu teorik yapıyı (kişilik, yaratıcılık, ilgi, zeka, tutum) belirlemeye çalışılır. Yapı geçerliğinin temel mantığı; ölçülmesi planlanan teorik yapıya yüksek derecede sahip olan bir grupla düşük derecede sahip olan bir gruba testi uygulayıp, testin bu grupları ne derece uygun olarak ayırıp, ayırmadığına bakmaktır.
- Görünüş Geçerliği: Bir ölçme aracının, ölçmek istediği değişkeni ne derece ölçebilir göründüğüdür. Genelde ölçme aracının görünüş geçerliği uzman incelemesiyle belirlenir. Testin bütünü için gerekli olan görünüş geçerliği her bir soru içinde geçerlidir. Testteki her bir soru ölçmek istediği özelliği ölçüyor görülmelidir. Test kitapçığının üzerinde ne yazıyorsa testte de o alanla ilgili sorular yer almalıdır.Geçerliği Artırma Yolları
1. Güvenirliği artırmak için alınan tüm tedbirler geçerlilik için de geçerli.
8
- Teste alınacak her sorunun, ölçülecek kapsamdan bir davranış ölçmesine dikkat göstermek geçerliği artırır. Soruların dersin içeriğine göre orta zorlukta olmalıdır.
- Sınavda kullanılacak soruların; kopya, ipuçlarından yararlanma, tahminle doğru yanıtlanabilmesi gibi geçerli olmayan davranışların kullanılması geçerliği düşürür.
- Soruların hem konuları kapsayıcı hem de dengeli olarak teste alınması geçerliği artırır.
- Aynın sorunun her yıl tekrar sorulması, sınavdan önce soruların verilmesi kopya çekilmesigeçerliği düşürür.
- Đyi bir sınav planı hazırlanmalıdır.
- Dersin hedef – davranışları ile ilgili soru hazırlanmalıdır.Kullanışlık
Bir ölçme aracı ekonomik olması gerekir. Maliyetinin ucuz olması ve tekrar tekrar
uygulanması gibi. Hazırlama ve uygulama süresinin uygun olması gerekir. Çoktan seçmeli testler en zor; yazılı yoklamalar en kolaydır. Sözlü yoklamalar, en kolay olmaz çünkü her öğrenciye farklı soru hazırlanacağından. Dış görünüşün okunabiliyor olması gerekir. Soruların aynı puntoda yazılması gibi saklanması da kolay olmalıdır.
Sınav Planı
1. Sınavın amacını belirleme.
- Öğrenciler arasında seçme yapmak için.
- Öğrencileri tanıma ve bir programa – alana yerleştirmek, öğrenme düzeyini ve öğrenmeeksikliklerini belirlemek için.
- Öğrencilerin öğrenmelerine ilişkin sonuç belirlemek için yapılıyor olabilir.
- Ölçülecek davranışların belirlenmesi.
- Belirtke tablosunun hazırlanması.
- Dersin içeriğinin (işlenecek konuların) hangi hedef – davranış alanlarına göregerçekleştirilebileceğine bakılarak uygun soru geliştirilir.
- Sorulacak soruların evrenini temsil gücü yüksek ve geçerli sorular belirlenir.
4. Soru sayısını belirleme.
- Sınavın süresi.
- Soru tipi.
- Soruların güçlük derecesi.
- Öğrencilerin düzeyi.
- Sınavın amacı.
5. Soru tipini belirleme.
Kullanılacak soru tipi belirlemede ölçülmesi istenilen hedef davranışların alanı (bilişsel,
psikomotor, duyuşsal) ve konunun özelliği dikkate alınır.
6. Sınavın güçlük derecesini belirleme.
Öğrenme düzeyini ve başarıyı ölçmeyi amaçlayan bir sınavın güçlük derecesi “orta düzey”
(0,50) olmalıdır. Yani sınav ne çok zor, ne de çok kolay olmalıdır.
7. Sınavın süresini belirleme.
Bir sınavın amacı, soru sayısı, zorluk düzeyi, soru tipi öncelikle ve sınava giren öğrencilerden
en zayıf olan öğrencinin durumu dikkate alınarak bir düzenleme yapılır.
- Soruların yazımı.
- Puanlamanın nasıl olacağını belirleme.
Her sorunun önem düzeyine göre ağırlığının belirlenmesi ve puanlama güvenirliğinin nasıl
sağlanacağının (hatalar arındırılması) belirlenmesidir.
Test planı yapılırken dikkate alınması gereken öğeler; ölçülecek davranışla ilgili içerik,
testin güçlük derecesi, testin puanlama biçimi, kullanılacak soru tipi. Testlerin Sınıflandırılması
- Öğretmen Yapımı Testler: Öğretmenin kendi hazırladığı ve kendi öğrencilerine uyguladığı testlerdir. Geçerlik ve güvenirlik düşüktür. Yazılı yoklamalar.
- Standart (Yapılandırılmış) Testler: Bir grup uzman tarafından standart koşullarda ve normlara göre hazırlanmış ve kitapçık haline getirilmiş testlerdir. Örneğin; ÖSS, LES, KPSS,
9
OKS. Bu testler, güvenirliği, geçerliği ve objektifliği istatistiki yöntemlerle belirlenerek
uygulanır ve objektif sonuçlar verir.
- Kağıt – Kalem Testleri: Sınava giren öğrencilerin yazılı durumdaki soruların cevaplarınıyazılı olarak ifade ettiği testlerdir. Örneğin; yazılı yoklama, kağıt kalem testlerinin geçerliği,
güvenirliği, puanlama güvenirliği düşük testlerdir.
- Seçmeli Testler: Öğrencinin verilen bir grup seçenekten doğru olanı seçtiği ve işaretlediğitestlerdir. Bu tür testler geçerliği, güvenirliği ve objektifliği yüksek olan testlerdir. D – Y
testleri, kısa cevaplı testler, eşleştirmeler dahil.
- Hız Testleri: Belli bir süre içerisinde öğrencinin kaç tane doğru cevabı vereceği ölçülentestlerdir. Bu tür testlerde hiçbir öğrenci soruların tamamını cevaplayamaz. Sallama hariç.
- Güç Testleri: Öğrenciye yeterli zaman verilerek belli güçlük düzeyine sahip sorular sorularakperformansının ölçüldüğü testlerdir. KPSS, dershane sınavları.
- Objektif Testler: Puanlanmasının, puanlayıcıya göre değişmediği, puanlayıcının görüş veduygularının puanlamayı etkilemediği testlerdir. Birden fazla puanlayıcı testi puanladığında
aynı ya da benzer sonucun alınmasıdır. Çoktan seçmeli testler, doğru yanlış testleri.
- Sübjektif Testler: Puanlamasının, puanlayıcıya göre değiştiği, puanlayıcının görüş veduygularının puanlamaya etkilediği testlerdir. Yazılı yoklama, sözlü yoklama. Portfolyo (Tümel) Değerlendirme Yöntemi Kullanım Amacı ve Temel Đlkeleri
- Öğrencilerin gelişim sürecini izlemek.
- Öğrencileri ilgi ve alanlarına ve yetenekleri açısından tanımak.
- En avantajı ise, öğretmenin öğrencilerini çok yönlü tanıması ve yeteneklerini ortayaçıkarmasıdır.
- Öğrencinin öğretim programı dışındaki faaliyetlerini de kapsayan çok yönlü gelişimi hakkındabilgi verir.
- Öğrencilerin sınıf içi etkinliklerine katılma düzeyi.
- Öğrencilerin yıl içerisindeki gelişim düzeyinin izlenmesi.
- Öğrencilerin inceleme, araştırma ve sorumluluk gibi kişisel özelliklerinin belirlenmesi.
- Öğrenciyi ilgi ve yetenek alanlarına göre yönlendirme.
- Öğrencinin öğrenme sürecindeki performansını gösterir.
- Öğrenciyi öğrenme sürecinde aktif kılmak ve özgüvenini artırmak.
- Öğrencinin yaratıcı özelliklerini ve üst düzey zihinsel becerilerini geliştirir.
- Öğrencilerin bilişsel, psikomotor ve duyusal davranışların birlikte gelişmesini sağlar.
- Öğretimi öğrenci merkezli duruma getirir. Öğrencide sorumluluk geliştirir.
- Öğrencilerin ekiple çalışma yeteneklerini geliştirmek.
- Öğrencinin gerçek öğrenme düzeyini belirlemek.
Sınırlığı ise:
Öğrencilerin aralarındaki rekabeti kaldırdığı için birbirlerinin çalışmalarını kopya ettiklerigörülebilir. Ayrıca portfolyode objektif değerlendirmenin yapılmasındaki zorluklarportfolyonun diğer bir sınırlığıdır.
Dip Not: Klasik değerlendirmeden farklı olarak sonuca değil öğrenme sürecine dönük bir değerlendirmedir. Yazılı, sözlü testler söz konusu değil. Her öğrenciye ait izleme dosyaları mevcuttur.
Klasik Değerlendirme Yöntemleri (sonuç önemli)
Değerlendirme sürecinde yalnızca öğretmen aktiftir.
Ürün (sonuç) odaklı.
Ezbere dayalıdır.
Kağıt – kalem ya da standart testler kullanılır.
Geri bildirim ve sonuç net olarak verilir.
Ölçüt önceden konmuştur ve rekabet söz konusudur.
Özetleyici ve yargılayıcıdır (summatif).
Çağdaş Değerlendirme Yöntemleri (performans önemli)
Değerlendirme sürecinde öğretmen ve öğrenci birlikte aktiftir. Aile de katılabilir.
10
- Süreç odaklıdır. Eğitim sürecinin kendisi önemlidir.
- Düşünme ve değerlendirmeye dayalıdır. Öğrenci merkezli eğitim uygulamaları değerlendirilir.
- Geri bildirim süreç içersinde öğrenciye ulaştırılır. Geliştirici (formatif) ve teşhis edicidir.
- Puanlama, belirli betimsel değerlere göre verilmektedir. (Rubrik puanlama)
- Ölçüt, öğrencilerle belirlenir ve grubun başarısını bireyin başarısını da etkiler.
- Çok boyutlu ve değişik tipte ödev ürün ya da performans örnekleri kullanılır (Portfolyo).
- Üst düzey zihinsel becerilerin kullanılma düzeyi değerlendirilir.Soru Hazırlarken Dikkat Edilecek Noktalar
- Sorular net, açık ve anlaşılır olmalıdır. Soruda kullanılan dil basit ve dolaysız olmalı, gereksizkelimelerin kullanılmaması dikkat edilmeli. Bu sayede önce güvenirlik, sonrada geçerlik artar.
- Soru hazırlamada belirtke tablosu kullanılmalıdır. Hangi hedef davranışların ölçüleceğibelirlenmelidir. Böylece içerik yada her hedef davranışı temsil edecek kadar ve uygun sorular
belirlenir. Böylece kapsam geçerliği artırılır.
- Bir maddeyle (soruyla) birden fazla bilgi yoklanmamalıdır. Özellikle objektifliği yüksek olançoktan seçmeli test, eşleştirmeli test, doğru – yanlış gibi testlerde bir madde bir bilgi alanını
yoklamalıdır.
- Madde (soru) cümlesi bir kaynaktan olduğu gibi (kitaptan ya da derste anlatıldığı gibi)alınmamalıdır. Maddeler her sınavda değiştirmeli, aynı sorular sorulmamalıdır. Sınavdan önce öğrencilere soru verilmemelidir. Böylece bilmediği halde istenmeyen değişkenler sınava katıldığı için geçerlik düşer.
- Maddelerde ipucu olmamalı. Soru neyi ölçmeyi amaçlıyorsa bu özelliği bilen öğrenciyle bilmeyen öğrenciyi iyi ayırt etmelidir. Ayrıca bir soruyla ilgili doğru cevap ya da çeldirici diğer soruları aydınlatıcı olmamalıdır. Bu durumda önce geçerlik sonra da güvenirlik düşer.Eğitimde Kullanılan Ölçme Araçları
1. Yazılı Yoklamalar: Hazırlanmasının kolay olması, uzun zaman almaması ve öğretmenlerce iyi
biliniyor olmasından dolayı sık tercih edilen bir sınavdır. Yazılı yoklamaların en önemli tarafı (avantajı) bilgi düzeyinin üstündeki üst düzey zihinsel işlemler (uygulama, analiz, sentez, değerlendirme, organize etme, bilgileri değişik durumlarda uygulama, orijinal görüş ve ürünler ortaya koyabilme) gerektiren türdeki hedefleri ölçebilmesidir.
Özellikleri:
Az sayıda soru sorulur. Bu nedenle geçerlik ve güvenirlik düşük. Öğrenciye cevap özgürlüğü tanınır.
Hazırlanması kolay, puanlanması güç olması ve zaman alır.
Şans başarısı düşüktür.
Puanlanması subjektiftir. Puanlayıcı yanlılığını katabilir.
Üst düzey zihinsel hedef alanlarını ölçebilir.
Hangi Durumlarda Kullanılmalı:
- Sınava girecek öğrenci sayısının az ise kullanılmalı.
- Öğrencilerin gelecekleri ile ilgili kritik kararlar güvenilir sınavlara dayandırılmalıdır. Sorusayısının az, puanlama güvenirliğinin düşük olması nedeni ile yazılı yoklama bu amaç için
kullanılmamalıdır.
- Öğrencinin yazılı ifade gücü, noktalama işaretlerini doğru kullanabilme, dilbilgisi gibiözelliklerini ölçmede kullanılabilir.
- Sentez ve değerlendirmede gibi üst düzey zihinsel davranışları ölçmede kullanılabilir. Dikkat Edilecek Noktalar:
- Uzun cevap gerektiren az sayıdaki sorular yerine (geçerliği ve güvenirliği düşürdüğü için) kısacevaplı çok sayıda soru kullanılmalıdır.
- Sorular açık, net ve anlaşılır olmalıdır.
Puanlanması:
Cevap anahtarı kullanılmamalıdır.
Sınav kağıdı birden fazla puanlayıcı tarafından okunmalı (puanlama güvenirliği). Sınav kağıtlarındaki sorular sırayla okunmalıdır.
11
Öğretmen isimlere bakmamalı, puanlamaya yazı güzelliği, anlatım gücü, sayfa düzeni, gibi ölçülmesi amaçlanmayan etkenler olmamalıdır.
2. Sözlü Yoklamalar: Düşünme, ifade etme gibi becerileri ölçebilmekteyiz.
- Uygulaması çok zaman alır.
- Her öğrenciye farklı sorular hazırlanmalıdır.
- Her sorunun güçlük düzeyi farklı olabilir. Ama sorular kolaydan zora doğru sıralanmalıdır.
- Öğretmenin yaklaşımından, soruların güçlük düzeyinden ve sınavın yapıldığı ortamdan(öğrencilerin huzurunda) kaynaklanan nedenlerden dolayı psikolojik faktörler etkili olabilir.
- Puanlama güvenirliği düşüktür.
- Kapsam geçerliği düşük, şans başarısı da düşüktür.
- Öğrencilerin kişilik özellikleri puanı etkiler.
- Sözlü ifade yeteneği, etkili konuşabilme gibi özellikler öğretmeni etkileyebilir.
- Puanlamaya hata karıştığı için güvenirliği ve geçerliği düşüktür. Hangi Durumlarda Kullanılmalı:
Đngilizce, Türkçe gibi sözlü ifade becerisini geliştirmeyi ve ölçmeyi amaçlayan derslerde
kullanılır.
3. Kısa Cevaplı Testler (Boşluk Doldurma): Yazılı yoklamanın alternatifi olan bir sınav
türüdür. Özelikle alt düzey hedeflerin ölçülmesinde kullanılır. Bu testler bilgi düzeyinde kısmen de kavrama düzeyindeki davranışlar ölçülür. Bu kısa cevaplı testlerin en önemli sınırlığıdır. Cevap bir kelime, rakam veya en çok bir cümle ile verilebilen sınavlardır. Kısa cevaplı bir test maddesi direkt soru cümlesi olarak ya da eksik cümleli (doldurmalı test) olarak sorulabilir. Daha çok ilköğretimin ilk sınıflarında kullanılır.
- Su, iki hidrojen ve …….. oluşur. Cevaplar 1 cümleyi geçmemeli.
- Boşluk sorunun başında yer almamalı.
- Sorunun cevabı kesin ve net olmalıdır. Atatürk …. doğdu. Cevap 1881’de, Selanik’te olabilir.Salt bu yüzden yanlış diyebiliriz.
- Kısa zamanda çok soru sorabiliriz. Kapsam geçerliği fevkalade.
- Sorular açık ve net ise o zaman puanlanması kolay ve objektiftir.
- Şans başarısı düşük. Cevaplayan kişi istediğini yazabilir.
- Hazırlaması kolaydır. Kalıp bir cümle alınır ve kelime çıkartılır.
4. Doğru Yanlış Testleri: Öğrencilerin belli konularındaki yanlış ve doğruları seçme gücünü
ölçen test türüdür. Testteki maddeler doğru ve yanlış önermelerden oluşur.
- En kolay sınav türüdür. Şans başarısı en yüksek sınav türüdür.
- Đlköğretim için ideal. Çünkü öğrencilerin seviyelerine uygun.
- Güvenilir değildir. Şans başarısı yüksek olduğu için geçerliği yüksektir kısa zamanda çok sorusorulabilir.
- Puanlanması kolay ve objektiftir.
- Hazırlanması ve cevaplanması kolaydır.Hangi Durumlarda Kullanılmalı:
Đlkelerin ve genellemelerin yoklanması ve belli bir konuda seçme yapılması istenildiğinde. 5. Çoktan Seçmeli Testler:
- Değerlendirmede objektiflik.
- Geçerliği ve güvenirliği en yüksek olan sınav türüdür.
- Hazırlanması uzun zaman alır, puanlanması az zaman alır, kolaydır.
- Şans başarısı vardır. Konuyu hiç bilmeyen öğrenci sırf şansla cevabı bulabilir.
- Đlköğretimin 1,2,3,4. sınıflarında test hazırlanırken seçenekler 3, 5,6,7,8. sınıflarda ise seçeneksayısı 4 olmalıdır.
- Yanlış yanıtlanan sorular doğruları götürmesine düzeltilmiş puan denir.
- Elde edilen puanlar üzerinde istatistiki işlemler ve madde analizi yapılabilir.
- Sorunun tümü madde kökü denir. Bütün şıklara ise seçenekler denir. Doğru olmayan şıklaraise, çeldiriciler denir.
12
- Çeldiriciler, bilmeyen öğrenciye ipucu vermemelidir. Çeldiriciler konuyu bilenleri bilmeyenleri yanıltmalıdır. Çeldiriciler madde kökündeki konuyla ilgisiz olmamalıdır. Çeldiricilerin doğru cevaba yakınlığı arttıkça madde zor bir soru olur ve bilenle bilmeyeni ayırt etme gücü artar.
- Olumsuz özellikler ile ilgili çeldirici bulmakta zorlandığında, madde kökü olumsuz cümle formatı kullanılmalıdır.
- Aşağıdakilerin hangisi daha doğrudur gibi bir soru olursa eğer, seçeneklerin hepside doğru olmalı ama cevap en doğru olmalıdır.Hangi Durumlarda Kullanılmalı:
- Bilgi, kavrama, uygulama ve analiz düzeyindeki davranışları ve kısmen değerlendirmedüzeyindeki davranışları ölçmede etkilidir. Sentez düzeyindeki davranışları ölçebilmesi için
çok iyi hazırlanması gerekmektedir.
- Yapılacak sınavın sonuçları öğrenci için çok önemli kararları gerektiriyorsa kullanılmalı.Bunun nedeni ise, geçerliğin, güvenirliğin ve puanlama güvenirliğinin yüksek olmasıdır.
- Sınavla geniş öğrenme konuları ölçmek isteniyorsa kullanılır. Çok sayıda soru sorularak,konuları temsil gücü sağlanır – kapsam geçerliği sağlanır.
6. Eşleştirmeli Testler: Eşleştirmeli testler, çoktan seçmeli testlerin farklı bir biçimidir. Đki
bölümde verilen bilgiler, kelimeler, numaralar, semboller eşleştirilir. Öğrencilerin bilgiler,
nesnesel, olaylar hakkında ilişki kurma güçleri ölçülür.
- Đlköğretim seviyesinde sıkça kullanılır.
- Sorular cevaplarla eşleştirilir.
- Soru sayısı güvenirlik artar. Şans başarısı düştüğü için.
7. Đş- Performans Testleri: Özellikle psiko – motor düzeyindeki hedeflerin (becerileri)
ölçülmesinde kullanılan bir test türüdür. Performans testleri öğrencilerin becerilerinin çeşitliliği bakımından ne derece yeterli olduklarının ölçülmesi, beceri eksikliklerini belirleme ve düzeltme, güçlü ve zayıf yönlerini analiz etme ve ölçme işlemini çalışma ya da öğretim (uygulama) sırasında doğrudan yapma gibi olanaklara sahiptir. Öğrencilerin ürün ya da performans ortaya koyabilme güçleri, değişik formatlara göre geliştirilen bu tür testlerle ölçülebilir. Ölçme işlemi doğrudan yapılır. Öğrencilere yeni yetenek alanları gibi bir özelliği yoktur.
Sonuçlar:
1. Ölçme testlerinin geçerlik ve güvenirlik bakımından sıralanması:
Çoktan seçmeli test, Doğru – yanlış testi, Yazılı yoklama, Sözlü yoklama
2. Diğer şartlar eşitlendiğini düşünürsek (şans başarısı eşit) yazılı yoklama genellikle daha az
güvenirliğe sahiptir.
Test ve Madde Đstatistikleri
Merkezi Eğilim Ölçüleri
Bir frekans dağılımında puanlar, dağılımın ortasında yığılma eğilimi gösterirler. Frekans
dağılımının bu genel özelliğine merkezi eğilim ölçüleri denir. Merkezi eğilim ölçüleri ham puanları (ölçme sonuçlarını) anlamlı hala getirmede kullanılan yöntemlerden birisidir. Elde edilen puanların grup içinde nerede toplandığını ortaya çıkarmada kullanılan merkezi puanların grup içinde nerede toplandığını ortaya çıkarmada kullanılan merkezi eğilim ölçülerinin başlıcaları:
1. Mod (Tepe Değer):
- Bir puan dağılımında en çok tekrarlanan, frekansı en yüksek olan puanlara mod denir. Örneğin:1, 2, 2, 5, 5, 7, 7, 7, 7, 7, 9, 9, 9, 9 bu puanlarda 7 notu en çok tekrarlanan olduğu için moduna 7
diyebiliriz.
- Not dağılımı şöyle de olabilirdi: 1, 2, 2, 5, 5, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9 bu notlara dikkat edilirse7 ve 9 notu en çok tekrar edilen nottur. O zaman moda 7 ve 9 diyebiliriz. Mod 0’da olabilir. Bir
puan dağılımında birden çok mod bulunabilir. Bu tür dağılımlara çok modlu dağılımlar denir.
- Mod, puan dağılımındaki uç değerlerden etkilenmez.
- Mod bir puan dizisi hakkında bilgi veren ölçü birimi olmadığından hassas ve güvenilir bir ölçübirimi olarak kabul edilmez.
10 | 1 |
Notlar | Frekans |
13
35 | 3 |
50 | 5 |
60 | 6 |
75 | 4 |
90 | 1 |
95 | 2 |
10 notunu 1 öğrenci almış.
En fazla 60 puanı alınmış o zaman mod 60 diyebiliriz.
2. Medyan (Ortanca):
- Büyükten küçüğe doğru sıralanmış bir puan dizisini ortadan tam ikiye bölen değere medyandenir. Puan dizisinin yarısını bir tarafa yarısını da diğer tarafa ayırdığından “orta değer” adını
alır.
- Örneğin; “60, 40, 30, 50, 50, 100, 80” notları 7 öğrencinin herhangi dersteki notları olsun.Öncelikle bu notlar büyükten küçüğe ya da küçükten büyüğe sıralanır.
30, 40, 50, 50, 60, 80, 100 ortadaki not yani “50” notu bize medyanı verecektir.
Notların sayısı çift olsaydı yani; 30, 40, 50, 50, 60, 80, 100, 100 o zaman tam ortadaki iki notun
aritmetik ortalamasını alacağız. 50+60/2=55 medyanımız 55 olacaktır.
Frekans toplamı bize öğrenci sayısını vermektedir. Bu grafikte öğrenci sayısı 25 kişidir. 25 yarısını alırız ikiye böleriz yani 13 frekans aralığında 13. kişiyi buluruz karşı gelen not bize medyanı verir. Frekansları yukarında aşağıya doğru 13’e gelecek kadar sayarız karşı gelen not 5’tir buda bize medyanı verir.
3. Aritmetik Ortalama:
- En çok kullanılan merkezi eğilim ölçülerinden birisidir. Ölçme sonuçlarının normal dağılımgösterdiği ya da ona yakın olduğu durumlarda kullanılabilecek en uygun merkezi eğilim
ölçüsüdür.
- Bir dizi ölçme sonuçlarının (puanlarının) toplamının diziyi meydana getiren ölçüm sayısınabölünmesiyle bulunur.
- Bir dağılımda aritmetik ortalamanın büyük olması durumunda ortalama öğrenme düzeyi ya dagrubun (mutlak) başarı düzeyi yüksektir açıklaması yapılır.
- Ortalama öğrenme düzeyi denirse o zaman aritmetik ortalama aklımıza gelmeli.Notlar karşılarına gelen frekansla çarpılır bulunan sayılar frekans toplamına yani öğrenci sayısına bölünmesiyle aritmetik ortalama bulunur.
Elde edilen ölçümlerin (puanların) tam ağırlık merkezidir. Hesaplanması kolaydır. Ve diğer istatistiksel ölçülere en anlamlı biçimde karşılaştırılabilir. Bu nedenle çoğu durumlarda en iyi yığılma ölçüsüdür.
Merkezi Değişim Ölçüleri
1. Ranj (Dizi Genişliği):
- Bir dağılımdaki en yüksek puan ile en küçük puan arasındaki farktır. Örneğin 100 soruluk birtestte en yüksek puan 96, en küçük 25 ise ranj: 96 – 25 = 71’dir.
- Sınıftaki öğrenme eksikliklerini yüzeyselde olsa da bilgi verir.
Not | Frekans |
1 | 1 |
2 | 4 |
3 | 5 |
5 | 4 |
7 | 9 |
10 | 2 |
Not | Frekans |
10 | 1 |
9 | 3 |
7 | 4 |
6 | 10 |
5 | 6 |
4 | 2 |
2 | 1 |
14
2. Standart Sapma (Standart Kayma) SX:
- Dağılma ölçüleri içerisinde en yaygın ve en güvenilir olanı standart sapmadır. Standart kaymabir puan dizisindeki puanların aritmetik ortalamadan ne derece uzaklara yayıldıklarını gösterir.
- Standart sapma bireyin ya da grubun notlarının aritmetik ortalamaya olan farkını gösterensayısal değerdir.
- Bir dağılımda standart sapma küçük ise öğrencilerin öğrenme düzeyinin birbirine yakın ya daöğrencilerin arasındaki farklılaşmanın az olduğu (homojen), standart sapma büyük ise öğrencilerin öğrenme düzeyinin birbirine uzak ya da öğrenciler arasındaki farklılaşmanın fazla (heterojen) olduğu açıklaması yapılır.
- Aritmetik ortalama ile standart sapmanın arası büyürse; heterojen yapı oluşur ve başarı düşer.
- Aritmetik ortalama ile standart sapmanın arası küçükse; homojen yapı oluşur ve başarı artar.
- Puan dağılımdaki dizi genişliği artıkça standart sapma büyür, dizi genişliği azaldıkça standartkayma küçülür. Öğrenciler arasındaki farklılaşmanın derecesini gösterir.
Notlar: 10, 7, 5, 4, 4, 2, 3 bu notların toplamı 35 öğrenci sayısı da 7 olduğuna göre aritmetik ortalama 5 olur. Aritmetik ortalamayı notlardan tek tek çıkarıp karelerini alırız bulunan farkların kareleri toplanır. Farkların kareleri toplamı öğrenci sayısına bölünür.
3. Ranj VX: Standart sapmanın SX karesidir. Örnek 1:
- Hangi derste ortalama öğrenme düzeyi en yüksektir: Aritmetik ortalamaya bakılır en yüksek olan aritmetik ortalama; öğrenme düzeyi hakkında bize cevabı verir. Biyoloji dersinin aritmetik ortalaması en yüksek olduğu için cevap Biyolojidir.
- Hangi derste ortalama öğrenme düzeyi en düşüktür: Yine aynı şekilde aritmetik ortalamaya bakılır bu sefer iki dersin de aritmetik ortalaması aynı o zaman standart sapmaya bakılır Sx fazla olan heterojen olduğu için daha başarısız sayılır. Yani cevap Coğrafya.Örnek 2:
En çok tekrarlanan not yani mod (tepe değer) 60 notudur 15 kişi tarafından alınmış.
Medyan ise, sınava giren öğrenci sayısı frekans toplamıdır. 65 kişi sınava giren öğrenci sayısı. 65/2=32,5 33. kişiyi alırız. 33. kişi tam ortadaki kişidir. Frekansın yukarıdan aşağıya doğru saymaya başlarsak 33. kişi bize bu grafiğin meydanını verecektir. Yani 60 olur. Aritmetik ortalamayı bulmak için ise notları tek tek frekansla çarpılır çıkan sonuç sınıf mevcuduna yani frekans toplamına bölünür.
4. Bağıl Değişkenlik Katsayısı (V): Birden çok derste puanların ne kadar farklılık gösterdiğini belirtir. V = Sx/X.100 yani standart sapma ile aritmetik ortalamaya böleriz ve 100 ile çarpılır.
Örnek: 35 öğrencinin girmiş olduğu 32 maddelik bir Türkçe testindeki ortalama 18 ve standart sapmada 5,4 bulunmuştur. Aynı sınıftaki öğrencilerin 55 maddelik bir Coğrafya testindeki ortalama 36, standart sapma 7,2 olduğuna göre hangi derste puanlar daha fazla değişkenlik gösterir.
V Türkçe = 5,4/18 . 100 = 30 V Coğrafya = 7,2/36 . 100 = 20 V Türkçe > V Coğrafya Türkçe dersinde farklılaşma daha çok.
Örnek:
Ders | Aritmetik Ortalama (X) | Standart Sapma (Sx) |
Felsefe | 67 | 2 |
Tarih | 69 | 4 |
Coğrafya | 67 | 4 |
Biyoloji | 75 | 5 |
Matematik | 70 | 4 |
Not | Frekans |
20 | 5 |
40 | 10 |
50 | 10 |
60 | 15 |
70 | 10 |
80 | 10 |
100 | 5 |
Türkçe | 70 | 3 |
Ders | (X) | (Sx) |
15
Matematik | 71 | 4 |
Coğrafya | 70 | 4 |
Fizik | 80 | 5 |
Kimya | 75 | 4 |
1. Hangi derste ortalama öğrenme düzeyi en yüksektir ya da grubun başarı düzeyi en yüksektir.
Ortalama öğrenme düzeyinin ve grup başarısının yüksek olmasını gösteren en önemli etken aritmetik ortalamadır. Eğer aritmetik ortalama eşitse standart sapmanın en düşük olduğu derse
bakmalıyız. Görüldüğü gibi Fizik dersinin Aritmetik ortalaması en yüksek olduğu için ortalama
öğrenme düzeyi ve grubun başarı düzeyi en yüksektir denebilir.
2. Hangi derste ortalama öğrenme düzeyi en düşüktür ya da grubun başarı düzeyi en düşüktür. Bunun için aritmetik ortalamaya bakılır aritmetik ortalaması düşük olan ortalama öğrenme
düzeyi en düşük diyebiliriz. Bununla birlikte eğer aritmetik ortalamalar eşit ise standart sapmanın en büyük olduğu derste ortalama öğrenme düzeyi ve grubun başarı düzeyi en düşüktür. Tabloda Türkçe ve Coğrafya derslerinin aritmetik ortalamaları eşittir. Coğrafya dersinin standart sapması daha büyük olduğu için ortalama öğrenme düzeyi ve grubun başarı düzeyi en düşüktür.
3. Hangi derste grup en başarılıdır ya da grup başarısı en yüksektir.
Grup başarısının ya da en başarılı grubu gösteren en önemli gösterge standart sapmanın en
düşük olmasıdır. Bununla birlikte, standart sapmalar eşitse aritmetik ortalamanın en yüksek olduğu derste grup başarısı yüksektir ya da en başarılı gruptur. Tabloda standart sapmanın en düşük olduğu ders Türkçe’dir. Standart sapmalar eşit değilse aritmetik ortalama ne olursa olsun standart sapmanın en düşük olan ders alınmalıdır.
4. Hangi derste grup başarısızdır ya da grup başarısı en düşüktür.
Grup başarısızlığını ya da en başarısız grubu gösteren en önemli gösterge standart sapmanın en
büyük olmasıdır. Bununla birlikte, standart sapmalar eşit ise, bu sefer de aritmetik ortalamanın en düşük olduğu derse bakılır. Standart sapmalar eşit değilse; aritmetik ortalama ne olursa olsun standart sapmanın en büyüğü olan ders alınmalıdır.
Çarpıklık
- Simetriklik (Normal Dağılım): Aritmetik ortalama = Medyan (Ortanca) = Mod (Tepe değer)
- Sağa Çarpık Dağılım (Pozitif Kayışlı): Mod < Ortanca < Aritmetik ortalama, böyle bir durumda test zor diyebiliriz. Yapabildiğimiz yorumlar %100 doğru değildir. Başarıda düşük diyebiliriz. Sorular ve test zordur.
- Sola Çarpık Dağılım (Negatif Kayışlı): Aritmetik ortalama < Ortanca < Mod, başarı yüksek diyebiliriz. Sorular ve test kolaydır.Ham Puanların Standart Puanlara Dönüştürülmesi
- Bir öğrenci birden çok teste girmişse aldığı puana göre hangi testte daha başarılıdır.
- Birkaç öğrencinin hangisi testlerden aldıkları puan göre daha başarılıdır.
- Birkaç öğrencinin testlerden aldıkları puanlara göre başarı sırası nedir.
Z Puanı: Xi – X/Sx Xi: Bir öğrencinin o sınavdan aldığı not. X aritmetik ortalamadır.
T Puanı: 10 . Z + 50
Örnek: 100 maddeden oluşan bir test, 20 kişilik bir öğrenci grubuna uygulanmış ve puan dağılımının aritmetik ortalaması 40 ve standart sapması 8 olarak hesaplanmıştır.
Bu sınavdan 50 puan alan bir öğrencinin Z puanı kaçtır?
Z=Xi–X/Sx =50–40/8=1,25
Bu sınavdan 70 puan alan bir öğrencinin T puanı kaçtır? T = 10 . Z + 50 dır. Z = 70 – 40/8 = 3,75
T = 10 . 3,75 + 50 = 87,5 çıkar.
Madde Đstatistikleri
1. Madde Güçlük Đndeksi: (p)
- Bir sorunun ne oranda zor olduğunu gösterir.
- 0,00 + 1,00 ideal güçlük indeksi 0,50 dir. 0’a yaklaştıkça sorunun zor olduğusöylenebilir. 1 yaklaştıkça sorunun kolay olduğu çok sayıda öğrencinin yanıtladığı için söylenebilir.
16
Doğru cevabı veren üst grup öğrenci sayısı + Doğru cevabı veren alt grup öğrenci sayısı/Toplam öğrenci sayısı
- P=1’e yaklaştıkça maddeyi doğru cevaplayanların sayısı fazla ve madde kolay, P=0’ayaklaştıkça maddeyi yanlış cevaplayanların sayısı fazla ve madde zorlaşmakta açıklaması
yapılır. P=0,50 olması maddenin orta güçlükte olduğunu gösterir.
- Bir maddeye ait p değeri 1 ise maddeyi herkesin doğru yanıtladığını gösterir. Yani bu maddeninbilenle bilmeyeni grupta ayırt edemediği söylenebilir.
- Eğer p değeri 0 ise hiç kimsenin bu soruyu bilemediğini ve bilenle bilmeyeni ayırt edemediğinigösterir. Bir testte bu tür sorulardan kaçınılır. Soru öyle bir güçlük derecesinde olmalıdır ki
bilenler soruyu doğru cevaplasın, bilmeyenlerde soruyu yanlış cevaplandırsın P=0,50 olmalıdır.
2. Madde Ayırıcılık Đndeksi: rjx
- Bir sorunun bilen öğrenciyle bilmeyen öğrenciyi birbirinden ayırt edebilme yeteneğini gösterir.
- – 1,00 0 + 1,00 ideal olan 0,30’dan büyük olması gerekir. Mümkün olduğuncabire (+1) yaklaşması istenilen durum.
- Madde ayırıcılığını yükseltmek için çeldiriciler doğru cevap olan anlama yaklaştırılmasıgerekir.
- Madde yeteri kadar ayırt edici ise, test puanı yüksek olanların maddeyi doğru cevaplamaları,test puanı düşük olanların ise maddeyi yanlış cevaplamaları beklenir.
- Maddenin, test puanı yüksek olan öğrenciler ile test puanı düşük olan öğrencileri birbirindenayırma özelliği düştükçe madde ayırıcılık gücü indeksi 0’a yaklaşır. Test puanı düşük olan öğrenciler maddeyi doğru cevaplamaları durumunda maddenin ayırıcılığı ters yönde yükselir ve madde ayırıcılık gücü indeksi – 1’e yaklaşır.
Doğru cevabı veren üst grup öğrenci sayısı – Doğru cevabı veren alt grup öğrenci sayısı/Üst ya da alt grup öğrenci sayısı
Örnek:Üst Grup, Alt Grup: Bu gruplar sınavdaki notlar yüksekten düşüğe doğru sıralanır. Sınava 100 öğrenci girmişse ilk 33 kişi üst grupta yer alır. Son 33 kişi de alt grupta yer alır. Ortadaki 33 kişiyi almıyoruz. Yukarıdaki tabloda B şıkkı doğru yanıttır.
Madde güçlük indeksi: 50 + 10/240 = 0,25Madde ayırıcılık indeksi: 50 – 10/120 = 0,33
Soru No: 48 | A | B* | C | D | E |
Üst Grup | 20 | 50 | 20 | 10 | 20 |
Alt Grup | 30 | 10 | 30 | 30 | 20 |
Örnek:
1. Hangi derste dağılım normaldir.
Aritmetik ortalama, mod ve medyanın eşit olduğu dağılımlar normaldir yani simetrikliktir.
Tarih dersi’nde dağılım normaldir yani simetriktir.
Dersler | Aritmetik | Mod | Medyan | Standart sapma | Ali’nin notu |
Türkçe | 68 | 75 | 70 | 5 | 55 |
Matematik | 70 | 65 | 60 | 10 | 60 |
Tarih | 80 | 80 | 80 | 7 | 73 |
Fizik | 65 | 75 | 70 | 4 | 72 |
Coğrafya | 60 | 70 | 65 | 3 | 69 |
17
2. Hangi derste grup homojendir ya da farklılaşma en düşük ya da öğrencilerin öğrenme düzeyi birbirine ne yakındır.
Bir dağılımda grubun homojen olmasını ve farklılaşma düzeyinin en düşük olmasını ve öğrencilerin öğrenme düzeyinin birbirine en yakın olmasını gösteren en önemli gösterge, standart sapmanın en küçük olmasıdır. Tablomuzda Coğrafya dersinin standart sapması en küçük derstir. Grubun homojendir, öğrenciler arasındaki farklılaşma en düşüktür ve öğrencilerin öğrenme düzeyi birbirine en yakındır yorumları yapılabilir.
3. Hangi derste grup heterojendir ya da farklılaşma en yüksek ya da öğrencilerin öğrenme düzeyi birbirine en uzaktır.
Bir dağılımda grubun homojen olmasını ve farklılaşma düzeyinin en düşük olmasını ve öğrencilerin öğrenme düzeyinin birbirine en yakın olmasını gösteren en önemli gösterge, standart sapmanın en büyük olmasıdır. Tablomuzda standart sapmanın en büyük olduğu ders Matematik dersidir. Bu ders için; öğrenciler arasındaki farklılaşma en yüksektir ve öğrencilerin öğrenme düzeyi birbirine en uzaktır yorumları yapılabilir.
4. Grup olarak en başarılı olunan ders.
Standart sapmanın en küçük olduğu derse bakılmalıdır. Böylece aritmetik ortamla ile
standart sapma bölgeleri arasındaki puanların en yakın olduğu Coğrafya dersidir.
5. Grup olarak en başarısız olunan ders.
Standart sapmanın en büyük olduğu derse bakılmalıdır. Böylece aritmetik ortamla ile
standart sapma bölgeleri arasındaki puanların en uzak olduğu Matematik dersidir.
6. Ortalama öğrenme düzeyi ya da grup başarı düzeyi en yüksek ve en düşük olan dersler.
- Aritmetik ortalamanın en yüksek olduğu ders, ortalama öğrenme düzeyi en yüksek olan dersiverir. Tarih dersi (80), grup başarı düzeyi ve ortalama öğrenme düzeyi en yüksek olan derstir.
- Aritmetik ortalamanın en düşük olduğu ders bizlere ortalama öğrenme düzeyinin en düşükolduğu dersi verir. Coğrafya (60), grup başarı düzeyi ve ortalama öğrenme düzeyi en düşük
olan derstir.
7. Ali’nin en başarılı ve en başarısız olduğu dersler.
- Z formülünden yararlanılmaktadır. Z=Xi – X/ Sx
- Tek tek bütün dersler için Z puanı bulunduğu zaman en başarılı ders Coğrafya; en başarısız dersise, Türkçe’dir. Z Coğrafya= 69 – 60/3=3 çıkar.
18
Örnek:
Bireyler | Test 1 | Test 2 | Test 3 | Test 4 | Toplam Ham Puan |
A | 45 | 40 | 55 | 30 | 160 |
B | 30 | 55 | 40 | 34 | 159 |
C | 28 | 65 | 35 | 25 | 153 |
D | 30 | 70 | 20 | 20 | 150 |
X | 25 | 55 | 40 | 25 | |
Sx | 7 | 5 | 10 | 9 |
1. A öğrencisi hangi derste daha başarılıdır.
- Tek tek testlerin Z puanlarını buluruz hangi dersin Z puanı daha çok ise o dersten daha başarılıdiyebiliriz. Z1=45 – 25 /7=2,85; Z2=40 – 55/5=- 3; Z3=55 – 40/10=1,5; Z4=30 – 25/9=0,5
O halde 1. Test en başarılı olduğu testtir.
- Test 2’deki en başarılı öğrenci kimdir.
- ZA=40 – 55/5=-3; ZB=55 – 55/5=0; ZC=65 – 55/5=2; ZD=70 – 55/5=3 çıkar. En başarılı öğrenci
D olur. Örnek:
Soru | Pjx | rjx |
1 | 0,20 | -0,30 |
2 | 0,25 | 0,70 |
3 | 0,80 | 0,30 |
4 | 0,20 | 0,15 |
5 | 0,85 | 0,50 |
1. Bu sorulardan hangileri testten çıkarılmalı.
Rjx, yani madde ayırıcılık indeksi – 1,00 0 + 1,00
arasında değer alır. Đdeal olan 0,30’dur. Eksiye yaklaştıkça soru
testten çıkarılmalıdır.
2. Öğretmenin hedefi zor ve seçmeye dayalı bir sınav yapmaksa
soruların çoğu güçlük ve ayırt edicilik bakımından hangi soruya
benzer olmalıdır.
2. soru zor Pjx’i 0,25 ve rjx’i de 0,70. Sorunun güçlük indeksi 1’e yaklaştıkça kolaylaşır.
Uzaklaştıkça zorlaşır.
ads
[wp_ad_camp_2]
İlk yorum yapan olun