Eğitimde Ölçme Ve Değerlendirme
madde güçlük indeksi hesaplama ranj hesaplama ranj nasıl hesaplanır ağırlık uzunluk zaman sıvı ölçme araçlarının tanımı ağırlık uzunluk zaman sıvı ölçme araçlarının tanıtılması
Nesnelerin belli bir özelliğe sahip olup olmadığını, sahip ise; sahip oluş derecesini gözleyip, gözlem sonuçlarını daha çok da sayısal sembollerle ifade etmeye ölçme denir.
Ölçme konusu olan belli bir özelliktir. Varlıkların birden çok özelliği vardır. Örneğin bir kitabın; boyutu, sayfa sayısı, kağıt kalitesi, içeriği, türü.. birer özelliktir. Ölçme kitabın tümüyle değil, tek bir özelliği ile örneğin sayfa sayısı ile ilgilidir.
Aynı tür varlıklardan-ismi aynı olan varlıkların tüm özellikleri aynı olsaydı; ölçme ihtiyacı olmayacaktı. Yediğimiz elmaların tadı, rengi, ağırlığı, fiyatı... aynı olsaydı manav elmayı tartmadan standart fiyatıyla pazarlardı. Oysa pazarda tadı, rengi, ağırlığı, fiyatı farklı elmalar var. Bizim aradığımız özellik hangisinde vardır diye gözlem-ölçme yaparız. Sonuç olarak ölçmenin yapılış gerekçesini aynı varlıkların farklı derecelerde özelliklere sahip olmasıyla açıklayabiliriz.
Ağırlık ve uzunluk özelliklerini; kilogram ve metre ile hiçbir aracıya ihtiyaç duymadan doğrudan ölçebiliriz. Oysa, kişilik, bilgi, zeka gibi özellikleri doğrudan değil, bireyin veriği tepkiler aracılığı ile ancak dolaylı ölçmek olanaklıdır.
(M.) ve (Kg), araçlar evrensel düzeyde kabul gören standart araçlardır. Kişilik ve başarı testleri, kulaç, adım gibi ölçme araçları standart olmayan araçlardır.
Standart ölçme aracı kullanılarak doğrudan yapılan ölçmeler gerçeğe çok yakın sonuçlar verir.
Ölçek,farklı anlamları olmakla birlikte daha çok ölçme araçları üzerindeki bölmeleri ya da bir başlangıç noktasından itibaren değişmez bir birimle bölümlenmiş ölçme araçlarını anlatmak için kullanılan terimdir. Dört tür ölçek vardır:
Nesneler arasındaki benzerlik ve ayrılıkları kaba bir biçimde saptamaya yarayan ölçeklere sınıflandırma(nominal) ölçekler denir. Öğretmenler- mühendisler diye insanları iki gruba ayırdığımızda sınıflama ölçeğini kullanmış oluruz. Her grupta kaç eleman olduğunu(Frekansı), grup üyelerinin toplam içindeki yüzdesini hesaplayabiliriz.
Bir özelliğe sahip oluş derecesi yönünden nesneleri sıraya koymaya yarayan ölçeklere sıralama (dereceleme) ölçekleri denir. Temmuz ayı sıcaklık ortalaması en yüksek iller: l. Urfa, 2. G.Antep, 3. D.Bakır derken sıralama ölçeği kullanılmış olur. Bu ölçekle hangi nesnenin-elemanın diğerinden aranan nitelik açısından daha ileride ya da geride olduğuna bakılabilir. Ölçeğin aralıkları eşit değildir. Ölçek sonuçları üzerinde; yüzdelik ve medyan (ortanca) hesaplaması yapılabilir.
Sabit bir başlangıç noktası ve aralıkların eşit olduğu termometre, eğitimdeki notlandırma sistemi gibi ölçeklere eşit aralıklı ölçek denir. Nesneler arasındaki derece farkı bu ölçekle gösterilebilir, ancak farklar “ katıdır, yarısıdır” biçiminde değer taşımaz. 80 puan ile 40 puan arasında 40 puan fark vardır, ancak 80 puan alan öğrenci 40 puan alan öğrencinin iki katı kadar bilgili değildir. Bu öçlekle elde edilen sonuçlar üzerinde öncekilere ek olarak; aritmetik ortalama, standart kayma ve pearson çarpım momentleri korelasyonu katsayısı hesaplanabilir.
Başlangıç olarak alınan gerçek bir sıfır noktasıyla başlayıp eşit aralılara bölünmüş ölçeğe eşit oranlı (oranlı) ölçek denir. Metre ve kilogramda kullanılan ölçek, eşit oranlı ölçektir. Bu ölçek sonuçları üzerinde bütün istatistik işlemler yapılabilir.
Ölçme, bir gözlem işidir. Belli niteliklerin var olup olmadığı, var iseler ne kadar oldukları ile ilgili bir gözlemdir. Bu haliyle ölçme sonuçları anlamlı değildir. O sonuçların yorumlanması gerekir. Yorum için ölçme sonuçlarını kıyaslayabileceğimiz insanların çoğunluğunca kabul göre ortak değerlere-ölçütlere ihtiyaç bulunmaktadır. Ölçme sonuçları ile ölçüt karşılaştırılarak o sonuçların iyi mi-kötü mü, yeterli mi yetersiz mi, az mı çok mu... olduğuna karar verilir. Bu son işlemi değerlendirme olarak kabul ederiz. Değerlendirmenin başarısı: (a) Ölçme sonuçlarının gerçeğe uygunluk derecesine, (b) ölçütün ne ölçüde kabul gördüğüne ve (c) kıyaslamada akıl yürütme hatası yapılmamış olmasına bağlıdır.
Eğitimde değişik ölçütler kullanılabilir😕ınıf başarısı, öğretmenin bilgisi ya da kitabın yazdıkları, standart ölçütler(10’luk, 100’lük not düzenleri),öğrencinin yeteneği, program hedefleri, öğrencinin programa başladığındaki düzeyi...(M.E. Bakanlığı şu sıralar daha çok program hedeflerini ölçüt olarak almaktadır.) Değerlendirilecek grup dikkate alınmadan hazırlanan ölçütlere mutlak, ölçme işlemi bittikten sonra grup gözönüne alınarak hazırlanan ölçütlere ise bağıl ölçüt denir.
Değerlendirmeyi; tanıma ve yerleştirmeye, biçimlendirme ve yetiştirmeye, değer biçmeye yönelik değerlendirme olarak sınıflandırmak olanaklıdır.
Ölçme Araçlarında Bulunması Gereken Nitelikler
Ölçme ve değerlendirme, karar vermek için yapılır. Kararların beklentileri karşılaması bu iki sürecin iyi işlemesine bağlıdır. Ama, ölçmenin yapıldığı ortam, ölçülen niteliğin (değişkenliği,somutluk derecesi) durumu, ölçme yapan kişinin aracı kullanmadaki becerisi, hepsinden de önemlisi ölçme aracının nitelikleri ölçme sonuçlarının doğruluğunu ve güvenirliğini etkiler. O halde iyi bir karar için ölçme araçları şu nitelikleri taşıyor olmalıdır:
A.Geçerlik: Ölçme aracının niteliği tam ve doğru, eksiksiz-fazlasız olarak ölçmesidir. Sadece hedeflediği özelliği dikkate almasıdır. Özelliği ölçmeye uygun araç olmasıdır.50 puanlık Türkçe bilgisi olan öğrenciyi 60 puan veren test geçerli değildir. Türkçe testi içinde Tarih dersine ilişkin bilgileri yoklayan test, geçerli değildir. Başarıyı ölçmek için hazırlanan test, kişiliği ölçmek için geçerli değildir.
Bir ölçme aracı,ölçülecek niteliklerin tamamını ölçüyorsa ya da iyi bir örneklem üzerinde ölçme yapmışsa; kapsadığı her madde geçerli ölçüm yapıyorsa kapsam geçerliği var demektir.
Bir testten elde edilen puanlarla, o puanı alan öğrencinin sonraki zamanlarda gösterdiği başarı birbirine uyuyorsa yordama geçerliğinin varlığı söylenebilir.
“Yapı,birbirleriyle ilgili olan öğelerin ya da öğeler arasındaki ilişkilerin oluşturduğu bir örüntüdür”Yapı geçerliği ise, testin bir niteliği hem genel hem de öğeleriyle bir bütün olması ve niteliği doğru bir biçimde ölçme özelliği taşımasıdır.
Hazırlanırken bir test hangi alanla ilgili olduğu belirtilmişse; o alanla ilgili maddeleri içermesidir. Örneğin, bir Fizik testi Matematik bilgisini ölçme hedefli sorular (maddeler) içermemelidir. Testin bu özelliğine görünüş geçerliği denir.
B. Güvenirlik:Bir ölçme aracının aynı niteliği arka arkaya yapılan ölçmelerde yaklaşık olarak aynı sayısal sonuçlarla ölçmesine güvenirlik denir. Bir kğ’lık bir ağırlığı aynı terazi ilk defasında 1 kğ, ikinci defa 1,2 kğ ,üçücü defa 1,1 kğ ölçüyorsa o terazinin güvenilir olmadığını söyleriz. Ancak, daha önce belirtilen çeşitli hata faktörleri sonraki ölçümlerin farklı çıkmasına neden olabilir.
Kimi ölçme araçları sürekli olarak aynı miktarda hatalar yapar. Bu araçların yaptığı hata, sabit hatadır. Bazı araçlar sadece belli koşullarda hata yaparlar. Örneğin öğretmenler güzel yazılmış kağıtlara daha çok puan verirler. Bu tür hatalara sistemli hata denir. Kimi hatalar da şansla ortaya çıkar, ne yönde etki ettiği tahmin edilmez. Bu hatalara da rasgele hata denir.
İki değişken arasındaki ilişki (korelasyon) (+1.00) ile (-1.00) arasında değişir. Güvenirlik katsayısı ise (0.00) ile (+1.00) arasında değerler alır. Hata azaldıkça güvenirlik katsayısı (+1.00) a yaklaşır.
Bir testin güvenirliğini anlamada dört yoldan biri kullanılır: (1) Bir test aralıklı olarak iki kez kullnılır. (2) Eşdeğer iki test hazırlanır ve ard arda uygulanır. (3) Yarılama yöntemi adı verilen test türünde sorular iki eşit gruba ayrılır (tek ve çift sorular) testin bir yarısından alınan puan diğer yarısından alınan puana yakınsa test güvenilirdir.(4)KR-20 ve 21 formülü ile testin her bir maddesinin testin tümüyle uyumluluk derecesi saptanmaya çalışılır. Bu dört yöntemde de güvenirlik katsayısının (+1.00)’ a yakın olması güvenirliğin yüksek olduğunu gösterir.
Testteki soru sayısı arttıkça, doğru cevabı tahminle bulma olasılığı azaldıkça güvenirlik artar. Testin yönergesi varsa, sorular açık ve anlaşılır ise güvenirlik artar.Bir testin ölçtüğü davranışlar homojenlik gösteriyorsa, soruların, uygulama ve puanlama güvenirliği bulunuyorsa o test güvenilirdir. Tetsin uygulanışında öğrenciler açısından farklılıklar olmamalıdır.
C. Kullanışlılık:Testin hazırlanmasının, uygulanmasının, puanlanmasının kolay olması; az zaman, az emek, az masraf gerektirmesidir.
Ayırtedicilik:Bir testin başarılı olanla olmayanı birbirinden ayırtedecek biçimde sonuçlar vemesidir. Ölçme aracının aranan nitelikler arasınaki farkı ortaya koyabilme becerisidir.
Puanlama Güvenirliği-Objektifliği😛uanlayanlar değişse de verilen puanların değişmemesidir.
Geçerlik, bir testin en temel özelliğidir. Bir test güvenilir ama geçerli olmayabilir.
Nesnelerin belli bir özelliğe sahip olup olmadığını, sahip ise; sahip oluş derecesini gözleyip, gözlem sonuçlarını daha çok da sayısal sembollerle ifade etmeye ölçme denir.
Ölçme konusu olan belli bir özelliktir. Varlıkların birden çok özelliği vardır. Örneğin bir kitabın; boyutu, sayfa sayısı, kağıt kalitesi, içeriği, türü.. birer özelliktir. Ölçme kitabın tümüyle değil, tek bir özelliği ile örneğin sayfa sayısı ile ilgilidir.
Aynı tür varlıklardan-ismi aynı olan varlıkların tüm özellikleri aynı olsaydı; ölçme ihtiyacı olmayacaktı. Yediğimiz elmaların tadı, rengi, ağırlığı, fiyatı... aynı olsaydı manav elmayı tartmadan standart fiyatıyla pazarlardı. Oysa pazarda tadı, rengi, ağırlığı, fiyatı farklı elmalar var. Bizim aradığımız özellik hangisinde vardır diye gözlem-ölçme yaparız. Sonuç olarak ölçmenin yapılış gerekçesini aynı varlıkların farklı derecelerde özelliklere sahip olmasıyla açıklayabiliriz.
Ağırlık ve uzunluk özelliklerini; kilogram ve metre ile hiçbir aracıya ihtiyaç duymadan doğrudan ölçebiliriz. Oysa, kişilik, bilgi, zeka gibi özellikleri doğrudan değil, bireyin veriği tepkiler aracılığı ile ancak dolaylı ölçmek olanaklıdır.
(M.) ve (Kg), araçlar evrensel düzeyde kabul gören standart araçlardır. Kişilik ve başarı testleri, kulaç, adım gibi ölçme araçları standart olmayan araçlardır.
Standart ölçme aracı kullanılarak doğrudan yapılan ölçmeler gerçeğe çok yakın sonuçlar verir.
Ölçek,farklı anlamları olmakla birlikte daha çok ölçme araçları üzerindeki bölmeleri ya da bir başlangıç noktasından itibaren değişmez bir birimle bölümlenmiş ölçme araçlarını anlatmak için kullanılan terimdir. Dört tür ölçek vardır:
Nesneler arasındaki benzerlik ve ayrılıkları kaba bir biçimde saptamaya yarayan ölçeklere sınıflandırma(nominal) ölçekler denir. Öğretmenler- mühendisler diye insanları iki gruba ayırdığımızda sınıflama ölçeğini kullanmış oluruz. Her grupta kaç eleman olduğunu(Frekansı), grup üyelerinin toplam içindeki yüzdesini hesaplayabiliriz.
Bir özelliğe sahip oluş derecesi yönünden nesneleri sıraya koymaya yarayan ölçeklere sıralama (dereceleme) ölçekleri denir. Temmuz ayı sıcaklık ortalaması en yüksek iller: l. Urfa, 2. G.Antep, 3. D.Bakır derken sıralama ölçeği kullanılmış olur. Bu ölçekle hangi nesnenin-elemanın diğerinden aranan nitelik açısından daha ileride ya da geride olduğuna bakılabilir. Ölçeğin aralıkları eşit değildir. Ölçek sonuçları üzerinde; yüzdelik ve medyan (ortanca) hesaplaması yapılabilir.
Sabit bir başlangıç noktası ve aralıkların eşit olduğu termometre, eğitimdeki notlandırma sistemi gibi ölçeklere eşit aralıklı ölçek denir. Nesneler arasındaki derece farkı bu ölçekle gösterilebilir, ancak farklar “ katıdır, yarısıdır” biçiminde değer taşımaz. 80 puan ile 40 puan arasında 40 puan fark vardır, ancak 80 puan alan öğrenci 40 puan alan öğrencinin iki katı kadar bilgili değildir. Bu öçlekle elde edilen sonuçlar üzerinde öncekilere ek olarak; aritmetik ortalama, standart kayma ve pearson çarpım momentleri korelasyonu katsayısı hesaplanabilir.
Başlangıç olarak alınan gerçek bir sıfır noktasıyla başlayıp eşit aralılara bölünmüş ölçeğe eşit oranlı (oranlı) ölçek denir. Metre ve kilogramda kullanılan ölçek, eşit oranlı ölçektir. Bu ölçek sonuçları üzerinde bütün istatistik işlemler yapılabilir.
Ölçme, bir gözlem işidir. Belli niteliklerin var olup olmadığı, var iseler ne kadar oldukları ile ilgili bir gözlemdir. Bu haliyle ölçme sonuçları anlamlı değildir. O sonuçların yorumlanması gerekir. Yorum için ölçme sonuçlarını kıyaslayabileceğimiz insanların çoğunluğunca kabul göre ortak değerlere-ölçütlere ihtiyaç bulunmaktadır. Ölçme sonuçları ile ölçüt karşılaştırılarak o sonuçların iyi mi-kötü mü, yeterli mi yetersiz mi, az mı çok mu... olduğuna karar verilir. Bu son işlemi değerlendirme olarak kabul ederiz. Değerlendirmenin başarısı: (a) Ölçme sonuçlarının gerçeğe uygunluk derecesine, (b) ölçütün ne ölçüde kabul gördüğüne ve (c) kıyaslamada akıl yürütme hatası yapılmamış olmasına bağlıdır.
Eğitimde değişik ölçütler kullanılabilir😕ınıf başarısı, öğretmenin bilgisi ya da kitabın yazdıkları, standart ölçütler(10’luk, 100’lük not düzenleri),öğrencinin yeteneği, program hedefleri, öğrencinin programa başladığındaki düzeyi...(M.E. Bakanlığı şu sıralar daha çok program hedeflerini ölçüt olarak almaktadır.) Değerlendirilecek grup dikkate alınmadan hazırlanan ölçütlere mutlak, ölçme işlemi bittikten sonra grup gözönüne alınarak hazırlanan ölçütlere ise bağıl ölçüt denir.
Değerlendirmeyi; tanıma ve yerleştirmeye, biçimlendirme ve yetiştirmeye, değer biçmeye yönelik değerlendirme olarak sınıflandırmak olanaklıdır.
Ölçme Araçlarında Bulunması Gereken Nitelikler
Ölçme ve değerlendirme, karar vermek için yapılır. Kararların beklentileri karşılaması bu iki sürecin iyi işlemesine bağlıdır. Ama, ölçmenin yapıldığı ortam, ölçülen niteliğin (değişkenliği,somutluk derecesi) durumu, ölçme yapan kişinin aracı kullanmadaki becerisi, hepsinden de önemlisi ölçme aracının nitelikleri ölçme sonuçlarının doğruluğunu ve güvenirliğini etkiler. O halde iyi bir karar için ölçme araçları şu nitelikleri taşıyor olmalıdır:
A.Geçerlik: Ölçme aracının niteliği tam ve doğru, eksiksiz-fazlasız olarak ölçmesidir. Sadece hedeflediği özelliği dikkate almasıdır. Özelliği ölçmeye uygun araç olmasıdır.50 puanlık Türkçe bilgisi olan öğrenciyi 60 puan veren test geçerli değildir. Türkçe testi içinde Tarih dersine ilişkin bilgileri yoklayan test, geçerli değildir. Başarıyı ölçmek için hazırlanan test, kişiliği ölçmek için geçerli değildir.
Bir ölçme aracı,ölçülecek niteliklerin tamamını ölçüyorsa ya da iyi bir örneklem üzerinde ölçme yapmışsa; kapsadığı her madde geçerli ölçüm yapıyorsa kapsam geçerliği var demektir.
Bir testten elde edilen puanlarla, o puanı alan öğrencinin sonraki zamanlarda gösterdiği başarı birbirine uyuyorsa yordama geçerliğinin varlığı söylenebilir.
“Yapı,birbirleriyle ilgili olan öğelerin ya da öğeler arasındaki ilişkilerin oluşturduğu bir örüntüdür”Yapı geçerliği ise, testin bir niteliği hem genel hem de öğeleriyle bir bütün olması ve niteliği doğru bir biçimde ölçme özelliği taşımasıdır.
Hazırlanırken bir test hangi alanla ilgili olduğu belirtilmişse; o alanla ilgili maddeleri içermesidir. Örneğin, bir Fizik testi Matematik bilgisini ölçme hedefli sorular (maddeler) içermemelidir. Testin bu özelliğine görünüş geçerliği denir.
B. Güvenirlik:Bir ölçme aracının aynı niteliği arka arkaya yapılan ölçmelerde yaklaşık olarak aynı sayısal sonuçlarla ölçmesine güvenirlik denir. Bir kğ’lık bir ağırlığı aynı terazi ilk defasında 1 kğ, ikinci defa 1,2 kğ ,üçücü defa 1,1 kğ ölçüyorsa o terazinin güvenilir olmadığını söyleriz. Ancak, daha önce belirtilen çeşitli hata faktörleri sonraki ölçümlerin farklı çıkmasına neden olabilir.
Kimi ölçme araçları sürekli olarak aynı miktarda hatalar yapar. Bu araçların yaptığı hata, sabit hatadır. Bazı araçlar sadece belli koşullarda hata yaparlar. Örneğin öğretmenler güzel yazılmış kağıtlara daha çok puan verirler. Bu tür hatalara sistemli hata denir. Kimi hatalar da şansla ortaya çıkar, ne yönde etki ettiği tahmin edilmez. Bu hatalara da rasgele hata denir.
İki değişken arasındaki ilişki (korelasyon) (+1.00) ile (-1.00) arasında değişir. Güvenirlik katsayısı ise (0.00) ile (+1.00) arasında değerler alır. Hata azaldıkça güvenirlik katsayısı (+1.00) a yaklaşır.
Bir testin güvenirliğini anlamada dört yoldan biri kullanılır: (1) Bir test aralıklı olarak iki kez kullnılır. (2) Eşdeğer iki test hazırlanır ve ard arda uygulanır. (3) Yarılama yöntemi adı verilen test türünde sorular iki eşit gruba ayrılır (tek ve çift sorular) testin bir yarısından alınan puan diğer yarısından alınan puana yakınsa test güvenilirdir.(4)KR-20 ve 21 formülü ile testin her bir maddesinin testin tümüyle uyumluluk derecesi saptanmaya çalışılır. Bu dört yöntemde de güvenirlik katsayısının (+1.00)’ a yakın olması güvenirliğin yüksek olduğunu gösterir.
Testteki soru sayısı arttıkça, doğru cevabı tahminle bulma olasılığı azaldıkça güvenirlik artar. Testin yönergesi varsa, sorular açık ve anlaşılır ise güvenirlik artar.Bir testin ölçtüğü davranışlar homojenlik gösteriyorsa, soruların, uygulama ve puanlama güvenirliği bulunuyorsa o test güvenilirdir. Tetsin uygulanışında öğrenciler açısından farklılıklar olmamalıdır.
C. Kullanışlılık:Testin hazırlanmasının, uygulanmasının, puanlanmasının kolay olması; az zaman, az emek, az masraf gerektirmesidir.
Ayırtedicilik:Bir testin başarılı olanla olmayanı birbirinden ayırtedecek biçimde sonuçlar vemesidir. Ölçme aracının aranan nitelikler arasınaki farkı ortaya koyabilme becerisidir.
Puanlama Güvenirliği-Objektifliği😛uanlayanlar değişse de verilen puanların değişmemesidir.
Geçerlik, bir testin en temel özelliğidir. Bir test güvenilir ama geçerli olmayabilir.