Eğitimde Ölçme Ve Değerlendirme

Bilge Gökçen

Yeni Üye
Üye
Eğitimde Ölçme Ve Değerlendirme
madde güçlük indeksi hesaplama ranj hesaplama ranj nasıl hesaplanır ağırlık uzunluk zaman sıvı ölçme araçlarının tanımı ağırlık uzunluk zaman sıvı ölçme araçlarının tanıtılması
Nesnelerin belli bir özelliğe sahip olup olmadığını, sahip ise; sahip oluş derecesini gözleyip, gözlem sonuçlarını daha çok da sayısal sembollerle ifade etmeye ölçme denir.
Ölçme konusu olan belli bir özelliktir. Varlıkların birden çok özelliği vardır. Örneğin bir kitabın; boyutu, sayfa sayısı, kağıt kalitesi, içeriği, türü.. birer özelliktir. Ölçme kitabın tümüyle değil, tek bir özelliği ile örneğin sayfa sayısı ile ilgilidir.

Aynı tür varlıklardan-ismi aynı olan varlıkların tüm özellikleri aynı olsaydı; ölçme ihtiyacı olmayacaktı. Yediğimiz elmaların tadı, rengi, ağırlığı, fiyatı... aynı olsaydı manav elmayı tartmadan standart fiyatıyla pazarlardı. Oysa pazarda tadı, rengi, ağırlığı, fiyatı farklı elmalar var. Bizim aradığımız özellik hangisinde vardır diye gözlem-ölçme yaparız. Sonuç olarak ölçmenin yapılış gerekçesini aynı varlıkların farklı derecelerde özelliklere sahip olmasıyla açıklayabiliriz.

Ağırlık ve uzunluk özelliklerini; kilogram ve metre ile hiçbir aracıya ihtiyaç duymadan doğrudan ölçebiliriz. Oysa, kişilik, bilgi, zeka gibi özellikleri doğrudan değil, bireyin veriği tepkiler aracılığı ile ancak dolaylı ölçmek olanaklıdır.
(M.) ve (Kg), araçlar evrensel düzeyde kabul gören standart araçlardır. Kişilik ve başarı testleri, kulaç, adım gibi ölçme araçları standart olmayan araçlardır.
Standart ölçme aracı kullanılarak doğrudan yapılan ölçmeler gerçeğe çok yakın sonuçlar verir.

Ölçek,farklı anlamları olmakla birlikte daha çok ölçme araçları üzerindeki bölmeleri ya da bir başlangıç noktasından itibaren değişmez bir birimle bölümlenmiş ölçme araçlarını anlatmak için kullanılan terimdir. Dört tür ölçek vardır:

Nesneler arasındaki benzerlik ve ayrılıkları kaba bir biçimde saptamaya yarayan ölçeklere sınıflandırma(nominal) ölçekler denir. Öğretmenler- mühendisler diye insanları iki gruba ayırdığımızda sınıflama ölçeğini kullanmış oluruz. Her grupta kaç eleman olduğunu(Frekansı), grup üyelerinin toplam içindeki yüzdesini hesaplayabiliriz.
Bir özelliğe sahip oluş derecesi yönünden nesneleri sıraya koymaya yarayan ölçeklere sıralama (dereceleme) ölçekleri denir. Temmuz ayı sıcaklık ortalaması en yüksek iller: l. Urfa, 2. G.Antep, 3. D.Bakır derken sıralama ölçeği kullanılmış olur. Bu ölçekle hangi nesnenin-elemanın diğerinden aranan nitelik açısından daha ileride ya da geride olduğuna bakılabilir. Ölçeğin aralıkları eşit değildir. Ölçek sonuçları üzerinde; yüzdelik ve medyan (ortanca) hesaplaması yapılabilir.

Sabit bir başlangıç noktası ve aralıkların eşit olduğu termometre, eğitimdeki notlandırma sistemi gibi ölçeklere eşit aralıklı ölçek denir. Nesneler arasındaki derece farkı bu ölçekle gösterilebilir, ancak farklar “ katıdır, yarısıdır” biçiminde değer taşımaz. 80 puan ile 40 puan arasında 40 puan fark vardır, ancak 80 puan alan öğrenci 40 puan alan öğrencinin iki katı kadar bilgili değildir. Bu öçlekle elde edilen sonuçlar üzerinde öncekilere ek olarak; aritmetik ortalama, standart kayma ve pearson çarpım momentleri korelasyonu katsayısı hesaplanabilir.

Başlangıç olarak alınan gerçek bir sıfır noktasıyla başlayıp eşit aralılara bölünmüş ölçeğe eşit oranlı (oranlı) ölçek denir. Metre ve kilogramda kullanılan ölçek, eşit oranlı ölçektir. Bu ölçek sonuçları üzerinde bütün istatistik işlemler yapılabilir.

Ölçme, bir gözlem işidir. Belli niteliklerin var olup olmadığı, var iseler ne kadar oldukları ile ilgili bir gözlemdir. Bu haliyle ölçme sonuçları anlamlı değildir. O sonuçların yorumlanması gerekir. Yorum için ölçme sonuçlarını kıyaslayabileceğimiz insanların çoğunluğunca kabul göre ortak değerlere-ölçütlere ihtiyaç bulunmaktadır. Ölçme sonuçları ile ölçüt karşılaştırılarak o sonuçların iyi mi-kötü mü, yeterli mi yetersiz mi, az mı çok mu... olduğuna karar verilir. Bu son işlemi değerlendirme olarak kabul ederiz. Değerlendirmenin başarısı: (a) Ölçme sonuçlarının gerçeğe uygunluk derecesine, (b) ölçütün ne ölçüde kabul gördüğüne ve (c) kıyaslamada akıl yürütme hatası yapılmamış olmasına bağlıdır.

Eğitimde değişik ölçütler kullanılabilir😕ınıf başarısı, öğretmenin bilgisi ya da kitabın yazdıkları, standart ölçütler(10’luk, 100’lük not düzenleri),öğrencinin yeteneği, program hedefleri, öğrencinin programa başladığındaki düzeyi...(M.E. Bakanlığı şu sıralar daha çok program hedeflerini ölçüt olarak almaktadır.) Değerlendirilecek grup dikkate alınmadan hazırlanan ölçütlere mutlak, ölçme işlemi bittikten sonra grup gözönüne alınarak hazırlanan ölçütlere ise bağıl ölçüt denir.
Değerlendirmeyi; tanıma ve yerleştirmeye, biçimlendirme ve yetiştirmeye, değer biçmeye yönelik değerlendirme olarak sınıflandırmak olanaklıdır.

Ölçme Araçlarında Bulunması Gereken Nitelikler

Ölçme ve değerlendirme, karar vermek için yapılır. Kararların beklentileri karşılaması bu iki sürecin iyi işlemesine bağlıdır. Ama, ölçmenin yapıldığı ortam, ölçülen niteliğin (değişkenliği,somutluk derecesi) durumu, ölçme yapan kişinin aracı kullanmadaki becerisi, hepsinden de önemlisi ölçme aracının nitelikleri ölçme sonuçlarının doğruluğunu ve güvenirliğini etkiler. O halde iyi bir karar için ölçme araçları şu nitelikleri taşıyor olmalıdır:

A.Geçerlik: Ölçme aracının niteliği tam ve doğru, eksiksiz-fazlasız olarak ölçmesidir. Sadece hedeflediği özelliği dikkate almasıdır. Özelliği ölçmeye uygun araç olmasıdır.50 puanlık Türkçe bilgisi olan öğrenciyi 60 puan veren test geçerli değildir. Türkçe testi içinde Tarih dersine ilişkin bilgileri yoklayan test, geçerli değildir. Başarıyı ölçmek için hazırlanan test, kişiliği ölçmek için geçerli değildir.
Bir ölçme aracı,ölçülecek niteliklerin tamamını ölçüyorsa ya da iyi bir örneklem üzerinde ölçme yapmışsa; kapsadığı her madde geçerli ölçüm yapıyorsa kapsam geçerliği var demektir.

Bir testten elde edilen puanlarla, o puanı alan öğrencinin sonraki zamanlarda gösterdiği başarı birbirine uyuyorsa yordama geçerliğinin varlığı söylenebilir.
“Yapı,birbirleriyle ilgili olan öğelerin ya da öğeler arasındaki ilişkilerin oluşturduğu bir örüntüdür”Yapı geçerliği ise, testin bir niteliği hem genel hem de öğeleriyle bir bütün olması ve niteliği doğru bir biçimde ölçme özelliği taşımasıdır.
Hazırlanırken bir test hangi alanla ilgili olduğu belirtilmişse; o alanla ilgili maddeleri içermesidir. Örneğin, bir Fizik testi Matematik bilgisini ölçme hedefli sorular (maddeler) içermemelidir. Testin bu özelliğine görünüş geçerliği denir.
B. Güvenirlik:Bir ölçme aracının aynı niteliği arka arkaya yapılan ölçmelerde yaklaşık olarak aynı sayısal sonuçlarla ölçmesine güvenirlik denir. Bir kğ’lık bir ağırlığı aynı terazi ilk defasında 1 kğ, ikinci defa 1,2 kğ ,üçücü defa 1,1 kğ ölçüyorsa o terazinin güvenilir olmadığını söyleriz. Ancak, daha önce belirtilen çeşitli hata faktörleri sonraki ölçümlerin farklı çıkmasına neden olabilir.

Kimi ölçme araçları sürekli olarak aynı miktarda hatalar yapar. Bu araçların yaptığı hata, sabit hatadır. Bazı araçlar sadece belli koşullarda hata yaparlar. Örneğin öğretmenler güzel yazılmış kağıtlara daha çok puan verirler. Bu tür hatalara sistemli hata denir. Kimi hatalar da şansla ortaya çıkar, ne yönde etki ettiği tahmin edilmez. Bu hatalara da rasgele hata denir.
İki değişken arasındaki ilişki (korelasyon) (+1.00) ile (-1.00) arasında değişir. Güvenirlik katsayısı ise (0.00) ile (+1.00) arasında değerler alır. Hata azaldıkça güvenirlik katsayısı (+1.00) a yaklaşır.

Bir testin güvenirliğini anlamada dört yoldan biri kullanılır: (1) Bir test aralıklı olarak iki kez kullnılır. (2) Eşdeğer iki test hazırlanır ve ard arda uygulanır. (3) Yarılama yöntemi adı verilen test türünde sorular iki eşit gruba ayrılır (tek ve çift sorular) testin bir yarısından alınan puan diğer yarısından alınan puana yakınsa test güvenilirdir.(4)KR-20 ve 21 formülü ile testin her bir maddesinin testin tümüyle uyumluluk derecesi saptanmaya çalışılır. Bu dört yöntemde de güvenirlik katsayısının (+1.00)’ a yakın olması güvenirliğin yüksek olduğunu gösterir.

Testteki soru sayısı arttıkça, doğru cevabı tahminle bulma olasılığı azaldıkça güvenirlik artar. Testin yönergesi varsa, sorular açık ve anlaşılır ise güvenirlik artar.Bir testin ölçtüğü davranışlar homojenlik gösteriyorsa, soruların, uygulama ve puanlama güvenirliği bulunuyorsa o test güvenilirdir. Tetsin uygulanışında öğrenciler açısından farklılıklar olmamalıdır.

C. Kullanışlılık:Testin hazırlanmasının, uygulanmasının, puanlanmasının kolay olması; az zaman, az emek, az masraf gerektirmesidir.
Ayırtedicilik:Bir testin başarılı olanla olmayanı birbirinden ayırtedecek biçimde sonuçlar vemesidir. Ölçme aracının aranan nitelikler arasınaki farkı ortaya koyabilme becerisidir.
Puanlama Güvenirliği-Objektifliği😛uanlayanlar değişse de verilen puanların değişmemesidir.

Geçerlik, bir testin en temel özelliğidir. Bir test güvenilir ama geçerli olmayabilir.
 
Ce: Eğitimde Ölçme Ve Değerlendirme

TESTLER VE SINIFLANDIRILMASI
Birey hakkında verilen kararların geçerliği; elde edilen verilerin kapsamlı, doğru ve sayısal olmasına bağlıdır. Kişilerle ilgili kararlarımız daha çok onları nasıl anlayabileceğimiz noktasına yoğunlaşır. Bireyleri tanıyabilmek için:
  • Vak’a kayıtlar, kontrol listeleri, dereceleme ölçekleri, otobiyografi-biyografi gibi bilgi toplama teknikleri kullanılabilir.
  • Bireyler, yeri ve zamanı belli test durumlarına sokulabilir.
Eğiti-öğretim dışında deneme, deney, kontrol, yoklama gibi anlamlarda kullanılan test;
“bireylerin kimi özelliklerini ölçmek üzere kullanılan ölçme aracıdır.” (( Test sözcüğü yanlış olarak; çoktan seçmeli testler yerine ya da sınav sözcüğü anlamında kullanılmaktadır).
Testleri farklı ölçütlere göre; farklı biçimlerde sınıflandırmak olanaklıdır. Yine da eğiti-öğretim alanında testleri aşağıdaki biçimde sınıflamak daha doğrudur.
Maksimum Yeterlik Testleri

A. Yetenek Testleri
1. Genel Yetenek Testleri
2. Özel Yetenek Testleri
B. Başarı Testleri
1.Standart Testler
2.Öğretmen Yapımı Testler


a. Grup ve bireysel testler.
b. Hız ve güç testleri
c. Objektif testleri
d. Dile dayalı olan ve dile dayalı olmayan testler.

Maksimum yeterlik testi, kişinin belli bir durumda, belli bir işi ne denli doğru yapabildiğini belirlemek amacıyla geliştirilen testtir.
Yetenek testleri, doğuştan getirilen, çevrece geliştirilen zihin ve beden gücünü ölçen testtir.
Zeka testi, zeka tanımına-anlayışına uygun testlerdir. Kimi bilgiye, kimi mantığa, kimi yaratıcılığa ağırlık verir.
Standart testler, ülke çapında, giderek evrensel düzeyde uygulanan,eğitim programlarını esas alan, objektif soru türlerini kullanan, uzmanların hazırladığı, geçerlik ve güvenirliği yüksek testlerdir.
Öğretmen yapısı testler, standart testlerin olumlu özelliklerinden bir çoğundan yoksundur. Bu araçların niteliği büyük ölçüde öğretmenlerin bilgi ve becerisine bağlıdır.

TEST PLANI
Geçerli ve güvenilir ölçme sonuçları; testlerin geliştirilmesi, uygulanması ve puanlanmasının açık ve ayrıntılı biçimde planlanmasına bağlıdır. Bir test planında aşağıda belirtilen soru başlıklarının karşılıkları verilmiş olmalıdır.
1. Sınavın amacı belirtilmelidir. Bu amaç: Başarı durumunun tesbiti, eleme, yordama,öğrenme eksikliklerini görme olabilir.
2. Hangi hedef ve davranışların yoklanacağı ortaya konulmalıdır.
3. Nasıl bir ölçme aracı kullanılacağına (sözlü, klasik yazılı, uygulama...) karar verilmelidir.
4. Konuların-hedef davranışların toplam öğrenilenler içindeki payı belirlenmelidir. Bunun için yüzdelik ya da o konuların kaynaktaki sayfa sayısı dikkate alınabilir.
5. Toplam kaç soru sorulacağı, soruların davranışlara nasıl dağıtılacağı kararlaştırılmalıdır.
6. Bir soru 100 kişilik öğrenci grubunda kaç öğrenci tarafından doğru olarak yapılacaktır/yapılmalıdır. Testin bu özelliğine güçlük derecesi denir. Başarı testlerindeki bir sorunun güçlük derecesi 0,50 olmalıdır. Ancak, eleme amaçlı testlerde bu oran 0,10-0,05 gibi aralıklara düşürülmelidir. Güçlük sorunun yokladığı davranış öğrenilmesindeki karmaşıklıkla ilgili olmalıdır. Bazen de sorudaki ifadenin anlaşılmazlığı, yönerge eksikliği gibi nedenler de soruların güçlük derecesini artırabilir. Bir testte sorular kolay sorulardan başlanarak sıralanmalıdır.
7. Puanlama biçimi(her soruya verilecek puan) ve puanlamanın nasıl yapılacağına (öğretmen tarafından, komisyon eliyle, optik okuyucu ile) karar verilmelidir.
8. Yanlış ya da eksik cevaplar için bir düzeltme yapılacak mıdır? (Seçenekli sorularda, seçenek sayısından bir eksik yanlış cevap için bir doğru cevap düşürülür). Sorusuna karşılık verilmeli ve bu durum yönergeye yazılmalıdır.
9. Test nerede uygulanacak, kimler uygulayacak, ne kadar süre verilecektir, evrakın taşınması,dağıtılması toplanması nasıl olacaktır? Soruların yanıtları verilmelidir.

MAKSİMUM YETERLİK TESTLERİ
Klasik Yazılılar( essey, kompozisyon tip yazılılar): Yanıtının uzunca yazmayı gerekli olduğu, analiz, sentez ve değerlendirme düzeylerindeki bilgileri yoklamaya elverişli teste klasik yazılı denir.
Cevabı düşünüp bulma, sentez yapma, özgürce ifade etme olanağı veren bir araçtır. Düşünme, organize etme, yaratıcılığını kullanma, kendini yazılı olarak anlatabilme olanaklarını veren test türüdür.
Öğretmen için hazırlaması ve uygulaması kolaydır.
Ancak öğrencilerin cevaplaması uzun zaman alır, kapsam geçerliği azdır. Puanlama objektifliği yoktur. Geçerlik ve güvenirliği düşüktür.
Sakıncalarını azaltmak için açık kitap yazılıları ile seçimlik sorulu yazılıları gerekli olmadıkça kullanmaktan kaçınmalıdır. Sorular önceden cevap anahtarı hazırlanarak, soru soru okunmalıdır.

Sözlüler:Başarıyı ölçmede kullanılan en eski araçtır. Eski önemini yitirmekle birlikte başta Türkçe, Y. Dil, Müzik, B. Eğitimi dersleri olmak üzere bir çok derste tercih edilmeye devam etmektedir.
Derinlemesine (analiz, sentez, değerlendirme düzeylerinde) bilgi yoklama olanağı vardır. Öğrenci kişiliğinin tanınmasına yardım eder, hazırlanması kolaydır ve ekonomik bir araçtır.
Ancak, her öğrenciye farklı sorular sorulur, çok zaman alır, soru sayısı azdır(kapsam geçerliği yoktur) puanlaması objektif değildir.
Sözlü sınavlar ya dönem boyunca, ya da bir defada yapılır. Hangi durumda yapılırsa yapılsın; yoklanacak davranışların bir listesi çıkarılmalıdır. Sorular ve puanlama önceden belirlenmelidir.

Kısa Cevaplı Testler: Cevabı bir sözcük, tarih ya da cümle olan; yazmayı gerektiren testlerdir. Soru cümlesi ya da eksik cümle biçimlerinde olabilir.
Kapsam geçerliği ve puanlama objektifliği olan araçlardır. Hazırlanması kolaydır. Tahmin ederek doğru cevaplar bulunamaz.
Bu testlerde yazı yazma; D-Y ve çoktan seçmeli testlere göre daha çok zaman alır. Hatırlama-bilgi düzeyindeki davranışlar yoklanır.
Testin etkili olabilmesi için: Her madde bir tek davranışı yoklamalı, doldurmalı biçiminde boşluklar eşit mesafede olmalı, farklı anlamlara gelebilecek ifadelerden kaçınılmalıdır.

Eşleştirmeli Maddeler: İki grup halinde verilen ve birbirleriyle ilgili olan öğelerin, belli bir açıklamaya göre; örneğin, terimlerle- anlamlarının, yazarlarla –eserlerinin eşleştirilmesi biçiminde kullanılan başarıyı ölçme aracıdır.
Genellikle yüzeysel bilgileri yoklayan bu testteki bir madde ile birkaç çoktan seçmeli test sorusunun yaptığı iş aynı düzeyde sayılabilir. Eşleştirmeli maddelerde; soru kökünün bulunduğu bölüm “öncüller”, yanıtların bulunduğu bölüm ise “seçenekler”dir.
Bu tür testlerin etkili olabilmesi için: öncül ve seçenekler homojen olmalı, madde sayısı 6-15 arasında bulunmalı, rakamlar ve harfler alfabetik sıraya göre yazılmalı, seçeneklerdeki madde sayısı öncüllerden daha çok olmalıdır. Eşleştirmeli soru tipini tek başına değil, D-Y , çoktan seçmeli, kısa cevaplı testlerle birlikte kullanmalıdır. Testin kapsam geçerliği ve puanlama objektifliği olduğu söylenebilir.

Doğru-Yanlış Testler:Cevaplayıcının verilen cümleyi doğru ya da yanlış olarak sınıflaması biçiminde hazırlanıp uygulanan başarı testidir.
Bu test türünde bilmeden doğru cevabı bulma oranı % 50’dir. Öğrencinin yanlışın neden yanlış olduğunu bilmesine gerek yoktur. Yanlış cümlelerin biliçaltında doğru gibi yerleşmesi olasılığı vardır. İleri düzeyde bilgi ölçmeye elverişli değildir.
Belirtilen eksikliklerine karşılık D-Y testlerinin; cevaplaması kolaydır ve az zaman alır. Puanlaması kolay ve objektiftir.
Bu tür sorularda “daima, asla, bütün, hiçbir,yalnız” gibi sözcükler kullanılmamalıdır Cümleler yalın olmalı, doğru ve yanlış cümlelerin sayısı eşit olmalı, puanlamada düzeltmeye yer verilmelidir.

Çoktan Seçmeli Testler:Madde kökü ve seçeneklerden ( doğru cevap ve çeldiriciler) oluşan başarıyı ölçme aracıdır.
Çok sayıda soru sorma olanağı vardır, bu nedenle kapsam geçerliği yüksektir. Hazırlanması zordur, uzmanlık gerektirir. Ancak, cevaplaması ve puanlaması kolaydır. Optik okuyucular puanlamada kullanılabilmektedir. Uzmanlar görev aldığında bilginin her düzeyinde soru hazırlamak olanaklıdır.
Bu test biçiminin yetersizlikleri: Yaratıcılık, sentez, değerlendirme, kompoze etme, ...özelliklerini ölçememesi, tahminle doğru cevabın bulunması sayılabilir.
 
Ce: Eğitimde Ölçme Ve Değerlendirme

HEDEFLERİN AŞAMALI SINIFLAMASI VE BU SINIFLAMAYA UYGUN TEST YAZMA
Madde, bir davranışın varolup olmadığını, varsa derecesini yoklamadır. Yoklanan davranış önemli ve gözlenebilir olmalıdır. Ve o davranışa uygun ölçme aracı seçilmelidir.
Bloom ve arkadaşları eğitim yoluyla öğrencilere kazandırılabilecek davranışları üçe ayırmıştır. Bunlar bilişsel, duyuşsal ve psikomotor davranışlardır. Onlar bir davranışın hangi alana ait olduğunun ölçütlerini belirlemekle kalmamıştır. O alan içinde ne kadar ağırlıklı olduğu, derinliği de yapılan sıralama ile ortaya konulmuştur.

Farklı alanlara ait davranışların kazandırılması için farklı yöntemlerin kullanılması, farklı biçimlerde değerlendirmelerin yapılması gerekir. Yine bir alandaki farklı düzeydeki davranışların kazandırılması ve ölçülmesi de doğal olarak farklı olacaktır.

Bilişsel Davranışlar: Bilgi ve bilgiden doğan zihinsel yeteneklerle becerileri kapsar. Bu alanın alt basamakları: Bilgi, kavrama, uygulama, analiz, sentez ve değerlendirmedir. Öğretmenler, bilgi düzeyinden değerlendirme düzeyine gidildikçe öğrenme derecesinin arttığını ve her bir aşama ile ilgili madde tipinin nasıl olması gerektiğini bilmelidir. Birer örnek vererek bu düzeylerde hazırlanan soruları örneklendirelim:

“Öğrencilerin bilgisini ölçmeye yarayan araca ne ad verilir?” -( Bilgi düzeyi).
“Güvenirlik; geçerlik için gerekli ama yeterli değildir. ifadesinin anlamı nedir?”-(Kavrama düzeyi).
“1:200 000 ölçekli haritada 10 cm’lik uzaklık gerçekte kaç kilometredir”- (Uygulama düzeyi).

“...metninin ana fikrini, olaylarını, kişilerini, alt düşüncelerini söyleyiniz”- (Analiz düzeyi).

“Karışık olarak verilen 10 anahtar sözcük yardımıyla anlamlı bir yazı yazınız.” (Sentez düzeyi)

“İnsanın sanatçı ruhunun oluşmasında tiyatro mu, sinema mı daha etkilidir?”- (Değerlendirme düzeyi).

Duyuşsal Alan: İlgi, tutum ve değer vermeyle ilgili davranışları kapsar. Örnek soru:”Mimar Sinan’ın Osmanlı Sanat ve Kültürüne olan katkısını anlatınız.”

Psikomotor Alan:Beyin ve organların koordinasyonu ile yapılan davranışları kapsar. Örnek:” Uygun malzemeleri kullanarak 10 dakikada 4 kişilik omlet yapınız”


TEST VE MADDE ANALİZİ
Bir testte yer alacak maddeleri seçme işine; madde analizi denir. Madde analizinde yapılacak ilk işlemlerden biri ön denemedir. Bu yolla: Kolay-zor maddeler, amaca uygun güçlükteki maddeler, maddeleri ayırtetme gücü, testte kullanılacak madde sayısı,verilecek zaman, yönergenin şekillenmesi... sağlanabilir.

Test Puanının Analizi:Testin uygulama sonuçlarına bakarak şu konularda yargılara varılabilir: (1) Puanların; ranjı, standart kayması, dağılımın çarpıklık öçlüsü, (2) Testin ortalama puanı, (3) Testte boş bırakılan ya da erişilemeyen maddeler.
Ranj: Dizideki en büyük puan ile en küçük puan arasındaki farktır. Ranj arttıkça testin ayırt ediciliği artar, dolayısıyla güvenirlik yükselir. Standart kayma büyüdükçe güvenirlik artar. Ranj/ Standart Kayma= 4-6 olmalıdır.
Çarpıklık Değeri: Bu değer 3(A.Ortalama- Medyan)/Standart Kayma formülüyle bulunur. Çıkan sonuç; negatif ise test kolay, pozitif ise zor, 0,10< ise hafif zor, 0,10-0,25 arası ise orta derecede zor, 0,25> ise çok zordur.

Madde Güçlük Derecesi: Bu değer maddeye doğru cevap verenlerin sayısının toplam öğrenci sayısına bölünmesiyle bulunur. Madde güçlük indeksi, 0 ile 41 arasında değişir. Değer 0’ a yaklaştıkça madde zor, + 1’ e yaklaştıkça kolaydır. Başarı testlerinde 0,50 güçlük değerinde maddeler kullanılması önerilmektedir.
Başarının 0,50’nin altında olması ;bilinen nedenlerin yanında1) yönergenin iyi hazırlanmamasına, (2) madde kökünün açık olmamasına, (3) şıklar arasında doğru cevabın bulunmamasına bağlanabilir.

Madde Ayırt Edicilik Gücü: Bu değerin hesaplanmasında %27 lik en üst grup ile %27’lik en alt grup dikkate alınır. Üst gruptaki doğru cevap veren öğrenci sayısından alt grupta doğru cevap veren öğrenci sayısı çıkarılıp; toplam öğrenci sayısına bölündüğünde madde güçlük gücü bulunmuş olur. Bu değer de –1 ile + 1 arasında değişir. 0,40 ayrtediciliği oldukça iyi maddeyi anlatır. 0,30-0,39 iyi, 0,20-0,29 düzeltilmesi gereken soru, < 0,19 kullanılmaz soru anlamındadır.

Madde Analizi: Maddeler işe yarar mıdır? İşe yaramıyorsa niçin yaramamıştır? Maddede ne tür düzeltmeler yapılabilir? Gibi soruların cevaplarının alınması madde analizidir. Madde analizi, onun kullanılış amacıyla da ilgilidir. Deneme grubu ile testin uygulanacağı grubun benzerliği madde analizinde önemli bir önkoşuldur. Her bir maddenin analiz yoluyla: güçlük derecesi, ayırt ediciliği, çeldiricilerinin iyi çalışıp çalışmadığı, köklerinin iyi anlaşılıp anlaşılmadığı sorgulanır. Madde analizi; bir grubu iki denk kümeye ayırarak karşılaştırmalarla geliştirilebilir.


TEST PUANLARI ÜZERİNDE İSTATİSTİKSEL İŞLEMLER
Değerlendirmeye esas olan veriler ya ölçme yoluyla ya da gözlem yoluyla elde edilir. “Ruken, sınıfın en çalışkanıdır” ifadesi gözleme dayalı bir değerlendirmedir. “Ruken, 100 puan üzerinden 98 aldı, o çalışkandır” ifadesi ise ölçmeye dayalı(sayısal) bir değerlendirmedir. Ölçmeye dayalı veriler güvenilir olduğu kadar üzerinde istatistik işlemler yapmaya da elverişlidir. Ölçme verileri istatistiksel yollardan incelenirken sırayla kimi işlemler yapılır. Bu işlemler:

1.Verilerin büyükten küçüğe doğru sıralanması, çok sayıda veri varsa gruplamaya gidilmesi: Karışık olarak sıralanan verilerden bir anlam çıkarmak mümkün değildir. Sıraya dizilen( dağılım halinde gösterilen) puanlara bakarak en iyilerin en yetersizlerin kimler olduğu hemen anlaşılabilir. Veri sayısı çoksa art arda gelen veriler bir grupta toplanabilir. Bunun için öncelikle grup sayısı,10-20 arasında olmalıdır ama 9-11-13-15 gibi tek sayılı bir rakam olması istatistik işlemler için daha uygundur. Grup aralığının da tek rakamlı(5,7,9 gibi) olması çalışmaları kolaylaştırır. Dağılımın ranjı bulunur, kararlaştırılan grup sayısına bölünerek grup aralığı hesaplanır. Örnek,dağılımın en yüksek puanı 91, en küçük puanı 20 olsun. Ranj: 91-20=71 ve grup sayısının 15 olmasını istiyorsak; 71:15=4,7 den düz hesap 5,grup aralığıdır.

2.Frekans Dağılımını Çıkarmak ve Dağılımı Grafikle Göstermek😀ağılımdaki her puanın kaç kez tekrar ettiğini gösteren sayı, frekanstır. Örneğin Y.Dil dersinden 75 puanını 3, 70 puanını 4 kişi almış derken; 3 ve 4 sayıları frekans değeridir. Ham puanlardan doğrudan frekanslara gidilmez. Öncelikle / ( çetele)işareti kullanılarak toplam tekrar sayıları bulunur. Frekans dağılımına bakarak genel dağılım; sütün ya da çizgi grafiği ile özetlenir. Frekanslar x, puanlar y ekseninde gösterilir.Grafikler ölçme sonucunu kestirmeden anlamaya ve anlatmaya hizmet eder.

Dizinin altından başlanarak üste doğru frekansların toplanmasıyla oluşan frekanslara yığmalı frekans denir. Yığmalı frekans, yüzdelik hesaplamada bulunması gereken bir değerdir.
3.Merkezi Eğilim Ölçüleri (ortalama) ile Yüzdelikleri Hesaplama:Bir dizideki puanların tümünü temsil eden tipik sayılabilecek değer veya ölçülerdir.
Mod🙁Tepedeğer) Bir dizinin mod’u en yüksek olan puan değeridir. Dizi hakkında hemen bir fikir edinme olanağını verir. Bir dizide birden çok mod değeri olabilir.

Medyan🙁 ortanca) Bir diziyi ikiye bölen noktaya isabet eden değerdir. Dizide ortalamayı etkileyecek uç değerler bulunması halinde medyan, en güvenilir ortalama ölçüsüdür. Eldeki puanlar tekse; ortadaki puan medyandır. Eğer puanlar çift ise, ortadaki iki puanın ortalaması kabaca medyanı verir. Örneğin, yaşları 6, 10, 25, 30, 45, 55 ve 70 olan bir ailenin oluşturduğu dizinin medyanı, ortadaki 30 puanıdır. Diziye 80 yaş eklenmiş olsaydı medyan 38 olurdu.( Medyan dizide bulunmayan bir puan olabilir.)

Aritmetik Ortalama (mean): Daha çok homojen gruplarda kullanılan ölçüdür. Puanlar toplamı, puan sayısına bölünerek bulunur. Frekans değerleri bulunmuş dizilerde kısaca frekans değerleriyle puanlar çarpılıp toplam, frekans toplamına bölünür. Dizideki her puanın ortalamaya yansımasını istediğimiz hallerde aritmetik ortalamaya başvurulur. Gruplanmış dizilerde aralık değeri frekansla çarpılır, toplamlar frekans sayısına bölünerek aritmetik ortalama bulunur.

Ağırlıklı Ortalama: Puanlara farklı ağırlıklar verilmesi durumunda aritmetik ortalama yerine ağırlıklı ortalama kullanılır. Örneğin vizenin ağırlığı %30, finalinki %70 olsun. Öğrencinin vize notu 60, final notu 50 ise; ağırlıklı ortalama =( 30x60)+(70x50)/30+70’tir.
Yüzdelikler:Bir dağılımın belirli bir yüzdesini altında bırakan noktadır. “Yüzde” terimi ile karıştırmamak gerekir. Yüzde, belirli bir miktarı ya da alanı; yüzdelik ise, altında ya da üstünde belli oranlarda ölçümler bırakan bir noktanın değerini belirtir. Örneğin 10. Yüzdelik(Y10): ölçümlerin 0,10 unu altında, 0,90 ını üstünde bırakan değeri anlatır. ÖSS’de bir puanın hangi yüzdelik içinde olduğu belirtilerek öğrencilere puanlarından daha anlamlı bir değer verilmektedir. Yüzdeliklerde çeyrek, medyan ve üçüncü çeyrek yüzdelikler grubun anlaşılmasına hizmet etmektedir.
Yüzdeliğin hesaplanmasında şu formül uygulanır: Yüzdelik=Puanın karşısındaki yığmalı frekans/ toplam frekans x 100.

4. Dağılım (Yayılma) Ölçüleri: İki ayrı puan dizisinin aritmetik ortalamaları aynı olabilir ama dağılımlar birbirine benzemeyebilir. Örneğin 1. Grup puanlar:5,6,6,7 ve 2. Grup puanlar 2,3,6,9,10 olsun. Her iki grubun A.Ortalaması:6’dır. Ama grupların ilk bakıştan birbirinden farklı olduğu görülmektedir.

Ranj(dizi genişliği): Bir dağılımdaki puanların en büyüğü ile en küçüğü arasındaki farktır. Dağılımın homojen puanlardan oluşup oluşmadığını gösterir. Yukarıda verilen 1. Grubun ranjı:7-5=2, diğer grubun ranjı ise10-2=8 dir.
Çeyrek Kayma: Bir dağılımdaki %75. Nokta ile %25 .nokta arasındaki genişliğin yarısına çeyrek kayma denir. Dizideki %50. Nokta, medyandır. Çeyrek kayma, medyan etrafındaki iki çeyrek nokta arasındaki ortalama açıklığı temsil eder. Çeyrek kayma, dağılımın belirgin biçimde sağa ya da sola eğilimli olması halinde kullanılan bir dağılım ölçüsüdür. Yüzdelik hesaplama formülünü kullanarak 1. ve 3. Çeyrekler bulunduğunda; çeyrek kayma iki değer arasındaki farkın yarısı olarak elde edilebilir.

Standart Kayma:Yayılma ölçüleri arasında en güvenilir olanı ve en yaygın kullanılanı standart kaymadır. Ortalama ölçüsü olarak aritmetik ortalamanın kullanıldığı dağılımlar için standart kayma kullanılır. Hesaplanması: Dağılımın aritmetik ortalamasından, puanlar farkının, karelerinin, toplamının, karekökünün bulunması ile yapılır. Örneğin 2,4,6,8,10,12 dağılımını A.Ortl.=7’dir. Puanların A.Ortalamadan kaymaları:-5,-3,-1,1,3, ve 5’tir. Kaymaların karesi:25,9,1,1,9, ve 25’tir.Bunların toplamı 70 ve aritmetik ortalaması 70/6 (puan sayısı)=11,6’dır. 11,6’nın karekökü olan 3,4’ise standart kaymadır.

Standart kaymanın yorumlanmasında normal dağılım eğrisinden yararlanılabilir. Normal dağılımda bütün ortalama ölçüleri (mod, medyan, aritmetik ortalama) aynı nokta (0 ) üzerine düşer. Ortalama noktası dağılımı ikiye böler. Dağılım alanı “-3,-2,-1,0,+1,+2, ve+3” biçiminde 6 standart kayma (sigma) ile bölünür. Puanların 2/3’ü (%68’i) ortadaki –1 ve +1 standart kaymaları arasında bulunur.

KAYNAKLAR:

Tekin, Halil (1996) Eğitimde Ölçme ve Değerlendirme, 9. Baskı, Yargı Yayınları, Ankara.
Yıldırım, Cemal (1983) Eğitimde Ölçme ve Değerlendirme-Öğretmenler İçin el Kitabı,ÖSYM Yayınları, Ankara
 
Geri
Üst