mutlak başarı düzeyi / Değerlendirme Türleri | Kpss Ölçme ve Değerlendirme Konu Anlatımı

Mutlak Başarı Düzeyi

mutlak başarı düzeyi

Değerlendirme Türleri

kpss değerlendirme türleri

Değerlendirme türleri kpss eğitim bilimleri ölçme ve değerlendirme konuları içinde yer almaktadır. Değerlendirme, ölçme sonuçlarının ölçütle karşılaştırılarak nitelik hakkında karar verilmesidir. Ölçüt ise, ölçme sonuçlarının karşılaştırılarak yorumlanmasına dayanak sağlayan kurallardır. Bu bağlamda işleyeceğimiz değerlendirme türleri, ölçüte göre değerlendirme ve amaca göre değerlendirme olarak ikiye ayrılmaktadır.

Değerlendirme Türleri

Kpss ölçme ve değerlendirme içinde yer alan değerlendirme türleri, ölçüte göre ve amaca göre değerlendirme olarak 2 başlıkta incelenmektedir.

1) Ölçüte Göre Değerlendirme

Ölçüte göre değerlendirme de kendi içinde mutla değerlendirme ve bağıl değerlendirme olarak 2’ye ayrılmaktadır.

a) Mutlak Değerlendirme: Süreç içerisinde belirlenmiş ölçek mutlak ise, değerlendirme mutlak değerlendirme olur. Yani ölçme sonuçlarının mutlak bir ölçütle karşılaştırıldığı değerlendirme türüdür.

Matematik dersinden geçmek için 65 ve üzeri almak gereklidir. Kerem 75 almıştır ver dersi geçmiştir.

Mutlak başarı yüzdesi

Birey için:\frac{{{\rm{Bireyin ald\imath g\imath puan}}}}{{{\rm{Al\imath nabilecek en yuksek puan}}}}X100

Grup için:\frac{{{\rm{Grubun aritmetik ortalamas\imath }}}}{{{\rm{Al\imath nabilecek en yuksek puan}}}}X100

 

b) Bağıl Değerlendirme: Bağıl kriterlere göre yapılan değerlendirmedir. Ölçüt sınıfın başarı düzeyidir. Diğer bir tanımla bağıl değerlendirme, ölçme sonuçlarının karşılaştırıldığı ölçütün bağıl olduğu değerlendirme türüdür.

Bir sınavda başarı sıralamasında ilk %20’lik kısım sınavı geçmiştir.

Sınavda ilk 5 kişi arasına giren Ahmet sınavı geçmiştir.

2) Amaca Göre Değerlendirme

a) Tanıma Yerleştirme

  • Temel amaç, önkoşul eksikliklerinin belirlenmesi ve giderilmesidir.

Tam öğrenme desteklidir.

  • Eğitim sürecinin başında, süreç öncesinde hazırbulunuşlukların belirlenmesini hedefler.
  • Genelde öğrencilerin bir okula, kursa vs. seçilmesi için kullanılır.
  • Her türlü seçme ve seçme testi tanıma yerleştirme değerlendirmesidir.

b) Düzey Belirleyici Değerlendirme (Summative – Özetleyici)

  • Öğrencinin öğrenme düzeyinin belirlenmesinde kullanılır.
  • Karar verilir.

Geçti, kaldı, başarılı, başarısız…

  • Finaller, erişi testleri (ön test ile son test arasındaki fark) yer alır.
  • Dersteki kritik davranışları ölçen sorulardan oluşan başarı testleri kullanılır.
  • Hedefe ne kadar ulaşıldığına ve ders başarısının belirlenmesine yardımcı olur.

c) Biçimlendirici Değerlendirme (Formative – Geliştirici)

  • Öğrenme eksikliklerinin belirlenmesi amacıyla yapılmaktadır.
  • Eksikliklerin kaynağının belirlenmesi, giderilmesi ve öğrenmelerin tamamlanmasına çalışılır.

İzleme testleri, ünite testleri, formative testler, quizler, vizeler vs.

  • Testler öğrencilere not vermek amacıyla kullanılmaz.
  • Kpss ölçme ve değerlendirme dersindeki değerlendirme türleri içinde yer alan biçimlendirici değerlendirmenin iki amacı vardır. Birincisi öğrencilerin öğrenme kesikliklerini belirlemek, ikincisi de öğretimin gidişatını değerlendirmektir.

Diğer Değerlendirme Türleri

  • Eğitim Programlarının Değerlendirilmesi:  Eğitim programındaki hedeflerin ve davranışların ulaşılabilir olup olmadığı, tutarlılıkları, programın içerik, eğitim durumları, ölçme ve değerlendirme öğeleri değerlendirme içinde yer alır.

Erişi testi bu değerlendirmede kullanılır.

  • Rehberlik Amacıyla Yapılan Değerlendirme: Öğrencileri ilgi, tutum ve yetenek gibi özellikleri açısından tanımak amacıyla yapılır

Tutum ölçekleri, yetenek testleri, problem çözme testleri, ilgi envanterleri vs testler bu amaçla kullanılır.

Kpss eğitim bilimleriölçme ve değerlendirme dersine ait Değerlendirme Türleri konusu tamamlanmıştır. Bir sonraki kpss ölçme ve değerlendirme konusu Alternatif Değerlendirme Yöntemleri olacaktır.

bağıl değerlendirme, formative, mutlak değerlendirme, summative, tanıma yerleştirme

Öğrenci - Bağıl Değerlendirme Sistemi

BAĞIL DEĞERLENDİRME BİLGİLENDİRME DOKÜMANI

Üniversitemizde tüm ön lisans ve lisans programlarımızda başarı notlarının hesaplanmasında birçok üniversitede kullanılan bağıl değerlendirme sistemi kullanılmaktadır. Bağıl değerlendirme sistemi, bir öğrencinin başarısının, dersteki diğer öğrencilerin başarı düzeylerine göre değerlendirilmesidir. Bu yöntemin kullanılmasındaki temel amaç, belirli bir dersi alan öğrencileri 100 puan üzerinden aldıkları mutlak notlara göre değil, o dersi alan grup içinde gösterdikleri performansa göre değerlendirmektir. Bir öğrencinin sınıf ortalamasına göre nerede konumlandığının hesabı istatistiksel yöntemler kullanılarak yapılmaktadır.

Bu sistemi sizlere anlatabilmek için öncelikle ham başarı notunun anlatılması gerekir;

Ham Başarı Notu (HBN): 100 puan üzerinden öğrencinin bir dersten yarıyıl içi faaliyetleri ve yarıyıl sonu sınav notlarından hesaplanan ağırlıklı nottur. Daha detaylı anlatacak olursak;

Öğretim elemanının yapılan sınavlara verdiği ağırlık oranlarına göre alınmış olunan vize, ödev, quiz vb. notlar ile final notları ortalamasının toplamıdır. Örneğin ağırlığı %40 olan ara sınav ve ağırlığı %60 olan final sınavları için bir derse ait notlar sözgelimi vize için 70 ve final için 80 olsun. Bu durumda HBN, 70’in %40’ı olan 28 ile final notu olan 80’in %60’ı olan 48 toplanarak elde edilen 76 olarak hesaplanır.  

Burada dikkat edilmesi gereken diğer bir hususta bağıl değerlendirmeye katılma limitidir. Ham başarı puanı 35 altı olan veya final notu 35 altında olan öğrencilere doğrudan FF notu verilir. Bu durumdaki öğrenciler ve devamsızlıktan kalan öğrenciler bağıl değerlendirmeye katılmazlar. Bu sayede türdeş bir grup üzerinden hesaplama yapılması sağlanır. Bir sınıfta dersi alan öğrencilerden bağıl değerlendirmeye katılan öğrenci sayısı 8 ve altında ise ham başarı puanı mutlak değerlendirme tablosuna göre harf notuna dönüştürülür.

Bir derste Bağıl Değerlendirmeye katılan öğrenci sayısı 9 ve üzerinde ise; bağıl değerlendirmeye katılan öğrencilerin ham başarı notları, sınıfın başarı düzeyine göre yeni aralıklar belirlenerek harf notuna dönüştürme işlemi uygulanır. Örneğin ham başarı notu 90-100 arasında olan hiçbir öğrenci olmasa bile bu sistem ilgili dersteki en yüksek aralığa göre AA notunu tayin edecektir.  

Bağıl değerlendirmenin avantajını bir örnekle açıklayacak olursak;

Bir bölümde A dersi okutuluyor olsun. Örneğin A dersindeki en başarılı öğrencinin ham başarı notu 70 olsun. Mutlak değerlendirme yapılacak olsa bu öğrencinin notunun harf notu karşılığı CC olur. Dolayısıyla daha düşük not alan öğrencilerden sözgelimi 69 alan bir öğrencinin harf notu da DC olacaktır. Yani sınıfın geri kalanı CC den düşük notlar alacaktır. Görüldüğü gibi mutlak değerlendirme yapıldığında sınıftaki en başarılı öğrenci dahi CC gibi ortalama bir notla dersi geçebilmektedir. Bağıl değerlendirme sisteminde ise bu sınıfın başarı düzeyine göre yeni bir tablo oluşturmak suretiyle en uygun dağılımı yaparak adil bir puanlama yapılmaktadır. Bu şekildeki bir sınıfın dağılımında mutlak tablosuna göre kalan bir öğrenci bağıl değerlendirmede geçebilecektir.

Tabii bu durumda öğrencilerin aklına şu soru gelebilir, ya sınıf ortalaması çok yüksek olur da geçer not alacağım dersten kalır duruma gelirsem? Bu kısım çok önemli; Öğrencinin bağıl değerlendirme uygulanarak alacağı not, mutlak değerlendirme ile alabileceği nottan düşük olamaz. Örneklendirecek olursak ham başarı notu 70 olan bir öğrenci, sınıf ortalaması çok yüksek dahi olsa CC notundan düşük bir harf notu alamaz. Bu uygulama ile öğrencilerimizin herhangi bir mağduriyet yaşamaları da engellenmiş olmaktadır.

Daha detaylı bilgi almak isteyen öğrencilerimiz Üsküdar Üniversitesi Bağıl Değerlendirme Yönergesini inceleyebilirler.

Mutlak DeğerlendirmeTablosu

100 Üzerinden Eşdeğer PuanıHarf NotuAğırlık Katsayısı
90-100AA4.00
85-89BA3.50
80-84BB3.00
75-79CB2.50
70-74CC2.00
65-69DC1.50
60-64DD1.00
50-59FD0.50
0-49FF0.00
  • Yüksek Lisans
  • Doktora
  • Staj
  • Diploma Eki
  • Mezuniyet-Diploma İşlemleri
  • Akademik Takvim
  • Diş Hekimliği Fakültesi Akademik Takvimi
  • Tıp Fakültesi Akademik Takvimi
  • Başvuru ve Kayıt Koşulları
  • Kontenjanlar & Puanlar
  • Burslar ve Öğrenim Ücretleri
  • Kayıt Dondurma
  • Ek Kontenjanlar
  • Yatay Geçiş
  • Dikey Geçiş
  • Çift Anadal & Yandal
  • Bağıl Değerlendirme Sistemi
  • Pedagojik Formasyon Eğitimi
  • Yabancı Uyruklu Öğrenci
  •         

    I- TEMEL KAVRAMLAR

    1.1 Ölçmenin Temelleri

    Ölçme ve değerlendirme konusuna nereden başlanacağına, “neden ölçme yaparız?” sorusuna cevap vererek ulaşabiliriz. Çünkü amacımızın ya da ölçme işlemimizin gerekçesi ölçmeyi nasıl yaptığımızdan da önemlidir. En azından ilk önce yanıtlanması gereken soru budur.

    Yukarıdaki soruya birçok yanıt vermek mümkün olmakla birlikte temel yanıtlardan birisi çevremizdeki çoğu şeyin değişmesi olacaktır. Yani değişme olmasaydı ya da her şey sabit olsaydı ölçme yapmaya ihtiyacımız olmazdı. En azından sürekli olarak ölçme yapmazdık. Bir kez ölçme yaptıktan sonra bu işlemi başka zaman veya yerde tekrarlamamıza gerek kalmazdı. Çünkü değişme olmadığı için ölçme sonucu aynı kalacaktır. Değişme olmaması ölçme işlemini gereksiz kılacaktı.

    Açıklamalar ışığına ölçme değişmeleri ortaya koyma veya değişkenlerin değişen değerlerini belirlemek amacıyla yapılır diyebiliriz. Yani “niye ölçeriz?” sorusuna değişme olduğu için; “neyi ölçeriz?” sorusuna da değişkenleri cevabını vermek mümkündür. Bu durumda değişkenler üzerinde durulması, değişken kavramının tanımlanması gerekmektedir.

    Değişken: Birkaç tanım vermek mümkündür. En az iki değer alan veya bir durumdan diğerine farklılık gösteren, çeşitli değerler alabilen -insana, olaylara, eşyaya ait niteliklere-  özelliklere denir. Yani, durumdan duruma, yerden yere, zamandan zamana farklılaşan özelliklerin tümüne değişken adı verilebilir. Ör: Boy uzunluğu, ağırlık, hava sıcaklığı, matematik yeteneği vb.

    Çevremizdeki çoğu şeyin değişmesine rağmen sabit olan özelliklere de rastlamaktayız. Bir durumdan diğerine değişmeyen veya ikiden az değer alan özelliklere sabit denir. Ör. Maddenin özgül ağırlığı, pi sayısı vb.

    Bir özellik ya değişkendir ya da sabittir. Değişkenlik ya da sabitlik nesnelerin özellikleri ile ilgilidir. Örneğin soğuk ve nem oranı hava nesnesinin iki özelliğini; çalışkanlık ve boy uzunluğu insanın iki özelliğini göstermektedir. Değişkenler belli ölçütlere göre sınıflanabilirler. Bu sınıflamalardan bazıları tablo 1’de görünmektedir.

    Tablo 1’de görülen değişkenlerden nicel değişkenler sayılarla ifade edilebilirken nitel değişkenler, sıfatlarla veya sembollerle ifade edilir. Nitel değişkenler sayılarla gösterildiğinde sayılar işlemsel anlamını yitirir. Sembollere, simgelere dönüşür. Özelliklere sayıların karşı getirilmesi, matematiğin kural ve işlemlerinin uygulanması sayesinde, özelliklerin büyüklükleri ve aralarındaki ilişkileri görmeye imkân sağlar. Değişkenlerin nitel veya nicel olması onlara uygulanacak işlemlerle ilişkilidir ve bu işlemlerin sınırını belirler.

    Sürekli değişkenlerin ele alınacak iki değeri arasında her zaman yeni bir değer bulunabilir. Yani iki değeri arasında sonsuz sayıda değerler alabilir. Uzunluk, ağırlık bu tür değişkenlere örnek olarak verilebilir. Örneğin uzunluk santimetre, milimetre, mikron vb. daha küçük birimlere bölünerek ölçülebilir. Kesikli değişkenler ise iki değeri arasında birkaç değer alabilir ama sonsuz sayıda değer alamaz. Bu nedenle süreksizdir. Bu tür değişkenlere sıfatlar, semboller veya doğal sayılar karşılık getirilebilir. Sürekli değişkenin değerleri listelenemezken kesikli değişkenin değerleri listelenebilir. Liste sonlu sayıdadır.

    Tablo 1. Değişkenler bazı ölçütlere göre sınıflanması

    Ölçütler

    Değişken türü

    Tanım

    Örnekler

    Değişkenin alacağı değer

    1.Nicel Değişken

    Sayılarla ifade edilebilen özelliklerdir.

    Boy uzunluğu, ağırlık

    2.Nitel Değişken

    Sıfatlarla veya sembollerle ifade edilebilen özelliklerdir. Bu tür değişkenler sayılarla gösterildiğinde sayılar işlemsel anlamını yitirir. Sembollere simgelere dönüşür.

    Medeni durum, Mezun olunan okul türü

    3. Sürekli Değişken

    Matematiksel olarak herhangi iki değeri arasında bir başka değeri bulunabilen değişkenlere sürekli değişken denir. Başka bir deyişle sürekli değişkenin iki değeri arası sürekli bölünebilir.

    Uzunluk, ağırlık, reel sayılar sistemi

    4. Süreksiz Değişken (Kesikli Değişken)

    Değişken, farklı iki değeri arasında başka bir veya birkaç değer dışında değer alamıyorsa, süreksizdir. Bu tür değişkenlere sıfatlar, semboller veya doğal sayılar karşılık getirilebilir.

    Cinsiyet (Kadın-Erkek), diploma derecesi (pekiyi, iyi, orta, zayıf) vb. Tavla zarında gelebilecek sayılar kesiklidir.

    Araştırmanın amacı

    5. Bağımsız Değişken (Etkileyen değişken)

                   

    Aldığı veya alacağı değerler başka değişken(ler)e bağlı olmadan değerler alabilen değişkenlerdir.

    Örnekler:

    1-Derse karşı Tutum

    2-Şişmanlık

                                      

    6.Bağımlı Değişken (Etkilenen Değişken)

    Başka bir değişkene bağlı olarak değerler alabilen değişkenlerdir.

    1-Başarı

    2-Elbise beden numarası

    7.Ara Değişken (Katalizör)

    Bağımsız değişkenlerin bağımlı değişkenler üzerindeki etkilerini artıran veya azaltan değişkenlerdir.

    Tutum-Başarı değişkenleri arasındaki ilişkide öğretmen davranışlarının niteliği ara değişken olabilir.

    Değişkenler araştırmanın amacına göre bağımlı ya da bağımsız değişkenler olarak sınıflanabilir. Doğası gereği kendi başına bağımlı ya da bağımsız bir değişken yoktur. Yani araştırmacının amacına bağlı olarak bir araştırmada bağımlı değişken olan bir özellik başka bir araştırmada bağımsız değişken ya da ara değişken olabilir. Örneğin, bir araştırmacı tarih dersine karşı tutumun tarih başarısını etkileyip etkilemediğini araştırdığında bağımlı değişkenimiz tarih başarısı iken, bağımsız değişkenimiz tarih dersine karşı tutumdur. Ancak aynı araştırmacı tarih dersine çalışmak için ayrılan sürenin tarih başarısını etkileyip etkilemediğini araştırırken, tarih dersine karşı tutumu derse çalışılan süreyi artıran ve azaltan bir ara değişken olarak düşünebilir. Veya yine aynı araştırmacı bir başa çalışmasında tarih öğretmeninin öğrencileri ile sürdürdüğü iletişim biçiminin, öğrencilerin tarih dersine karşı tutumu nasıl etkilediğini araştırabilir. Görüldüğü gibi tutum, birinci araştırmada tutum bağımsız; ikinci araştırmada ara ve üçüncü araştırmada bağımlı değişken olarak işleme alınmaktadır. Bu nedenle değişkenleri bağımlı, bağımsız ve ara değişken olarak sınıflamak istediğimizde araştırmacının amacını dikkate almak zorunluluğumuz vardır.

    1.2 Eğitim ve Ölçme-Değerlendirmeye İlişkin Temel Tanımlar

    Aslında her eğitim felsefesine göre farklı eğitim tanımları vermek mümkündür. Eğitimin “Bireyin davranışında kendi yaşantıları yoluyla ve kasıtlı olarak istendik değişim meydana getirme süreci” tanımı yaygın kabul gören bir tanımdır.

    Buradaki kavramları biraz açacak olursak, kendi yaşantısı kavramı yaparak yaşayarak öğrenmeye; kasıtlı kavramı öğrenme ortamını öğretilecek davranışa göre ayarlamaya (öğretim durumlarına); istendik değişim kavramı önceden belirlenmiş hedef ve davranışlara işaret etmektedir.

                Ölçmenin Önemi

    Ölçme ve değerlendirmenin eğitimdeki önemi günlük yaşamda ve genel olarak bilimlerdeki öneminin bir yansımasıdır. Örneğin hava durumunu belirlemek için bilgi toplamaz isek günlük yaşamda nasıl giyineceğimize karar veremez, sık sık hava durumu konusunda yanılarak hasta olurduk. Bilimler içinde en duyarlı, en hatasız ölçme yapan bilimlere daha fazla güven vardır. Bilimler gelişmişliğini ölçme ve değerlendirme yöntemlerindeki gelişmişlik derecesine borçludurlar. Bu açıklamalar ışığında sosyal bilimlerdeki ölçme ile fizik bilimlerindeki ölçmeler arasında, ölçtükleri niteliklerden ve ölçme ve değerlendirmede kullandıkları araç ve yöntemlerden kaynaklanan farklılıklar bulunmaktadır.


                           

                            DEĞERLENDİRME (DÖNÜT-DÜZELTME)

                                      

    Şekil 1. Sistem Yaklaşımında Ölçme ve Değerlendirmenin Yeri

                Şekil 1’den de anlaşılacağı üzere değerlendirme sistemin her basamağında kullanılmaktadır. Ayrıca değerlendirmenin değerlendirmesinden de söz etmek gerekir. Tabii ki değerlendirme yapabilme için ölçme yapmak gereklidir. Değerlendirmede kullanılan ölçütler ve değerlendirme yöntemleri ile değerlendirmeye konu olan bilgiyi toplama amacıyla kullanılan ölçme araçları ve yöntemlerinin de değerlendirilmesi gerekmektedir.

                Şemalardan anlaşılacağı üzere eğitim sistemini nasıl bir şema ile gösterirsek gösterelim o şemada ölçme ve değerlendirmeye mutlaka yer verme zorunluluğu vardır. Çünkü ölçme ve değerlendirme eğitim sisteminin temel ve vazgeçilmez öğelerinden biridir.

    Ölçmenin Tanımı: “Nitelikleri nicelemek; gözlem sonuçlarını sayısallaştırmak; bir niceliğin gözlenip, gözlem sonuçlarını sayı veya semboller ile gösterilmesi” tanımlarından herhangi birisi kullanılabilir. Ölçme bir gözlemdir. Bir betimleme işidir. Bu tanımlar dışında tanımlar da yapmak mümkündür. “Özellikler kümesiyle sayı veya semboller kümesini eşleme işidir” veya “ampirik küme ile formal küme arasında bir bağıntıdır” gibi tanımlar örnek verilebilir.


                                                      f


    Şekil 2. Ölçmenin kuramsal tanımı

    Ampirik küme ölçülecek niteliklerin kümesini, formal küme ölçülen nitelikleri göstermek amacıyla kullanılan sayı veya sembol kümesini gösterir.

                Özellikler Kümesi                  İşlemler Kümesi

                (Tanım Kümesi)                     (Değer Kümesi)

    Örnek  Ulaşılacak davranışlar            Ulaşılan Davranışlar

                (Sınav Başarısı)                      (Sınav Notu)

    Ölçüm: Özelliklerle ilgili değerlerin her birine, tek tek gözlem sonuçlarına ölçüm denir.

    Ölçmenin Özel Anlamı: Bireyler hakkında bilgi toplamaktır.

                Ölçme Türleri

    1)Doğrudan (Temel/Dolaysız) Ölçme: Herhangi bir niteliği başka nitelikle ilişkilendirmeden gözlemek doğrudan ölçme olarak adlandırılır. (Boy sırasına koyma, Terazi ile tartma, metre ile ölçme)

    2)Dolaylı (Göstergeyle) Ölçme: Herhangi bir değişkene ait niteliği başka değişkenler veya araçların niteliğinden faydalanarak ölçmektir.(termometre ile ısı ölçme veya yaylı kantarla ağırlık ölçme: birinci durumda civanın genleşmesi yardımıyla ısı hakkında fikir sahibi olurken, ikinci durumda yayın uzamasına bağlı olarak ağırlık hakkında bir şeyler söyleyebiliriz.)

    3)Türetilmiş Ölçme: İki ayrı ölçülen nitelik üzerinde yapılan işlemler yardımıyla yeni bir ölçme sonucuna ulaşmadır. (Örneğin Hız=km/saat (yol / zaman) veya Yoğunluk = Kütle/hacim gibi)

    Ölçmede birimler

    Ölçme işleminde doğal ve yapay (tanımlanmış) birimlerin olduğundan söz edilebilir. Örneğin, bir işyerinde çalışan işçilerin sayısını bulmak için birim olarak işyerinde çalışan tek bir işçiyi almak doğru olacaktır ve bu ölçmenin doğal birimi olduğu söylenebilir. Ancak, uzunluk, ağırlık, zaman gibi bazı değişkenlerle ilgili birimler tanımlanmış (yapay) birimlerdir. Örneğin, metre ve kilogram üzerinde anlaşılmış veya tanımlanmış birimlerdendir. Birimlerin tanımlanmış olmasının bir sakıncası yoktur ve birçok doğal birimden daha güvenilir ölçme sonuçları elde edilebilir. Zaten birçok birimi tanımlama gereği de üzerinde anlaşmaya varılamayan veya tartışmalara neden olan doğal birimler nedeniyle ortaya çıkmıştır.

    Birimlerde aranan üç özellik vardır. Bunlar; eşitlik (ölçeğin her bölmesinin –metredeki her santimetrelerin- birbirine eşit olmasıdır), genellik (birimlerin herkes tarafından aynı anlamda kullanılması veya birimlerin çoğunluk tarafından kabul edilmesidir) ve amaca uygunluk (ölçülecek özelliği ölçmeye uygunluk veya bu özelliği en iyi şekilde yansıtabilmektir) olarak ifade edilebilir.

    Ölçmede Araçların Rolü

    1-Ölçme sonuçlarının duyarlığını ve güvenirliğini dolayısıyla kesinliğini artırır. Ölçme sonuçlarına karışan hata miktarının azalmasını sağlar.,

    2-Duyu organlarımızla ölçme yapamadığımız durumları gözlememizi kolaylaştırır. Böylece duyu organlarını kullanamadığımız durumlarda da ölçme yapma imkanı buluruz.

    3-Herkesin kabul ettiği, üzerinde anlaştığı standart ölçme sonuçları elde etmemize olanak sağlar.

    Ölçek: Ölçme aracı, ölçme birimi veya ölçme sonuçlarının formal nitelikleri olarak tanımlanmaktadır.

    Ölçekleme: Eğitim ve psikolojide ölçek veya ölçme aracı geliştirme olarak tanımlanabilir.

    Ölçmede Kullanılan Ölçek Türleri

    1)Adlandırma (Sınıflama) Ölçeği: Farklı ve benzer tarafların gözlendiğinde kullanılan ölçek türüdür. Adlandırma = kodlama; öğrencilere numara verme, illere plaka numarası verme, futbolculara sırt numarası verme vb. gibi yapılan işlemlere verilen addır. Sınıflama = bir özelliği dikkate alma; bir özelliğe sahip olanlar, sahip olmayanlar veya bir dereceye kadar sahip olanları belirlerken kullanılabilir. Bu ölçeklere sözde ölçek de denir. Bazı ölçmecilerce birimleri ve başlangıç noktaları değişir dense de birimleri ve başlangıç noktaları yoktur. Çünkü birimdeki değişme birim de aranan niteliklere uymamaktadır. Farklılıkları birim cinsinden belirleyemeyiz. Ölçmenin basit, ilkel bir türüdür. Ölçme sonuçları sembol, sayı veya sıfatlara dönüştürülür. Matematiksel işlem yapılmaz. İstatistiksel olarak frekans tablosu yapılabilir ve mod (tepe değer =en çok tekrar eden ölçüm) bulunabilir. İlk olarak bu ölçeklerin yansıma özelliği vardır: yani farklı iki objeye “a” kodu verilmişse a=a’dır. İkinci olarak bu ölçeklerin simetri özelliği vardır: yani aynı kümede bir objeye “a” diğerine “b” kodu verilmişse ve a=b ise b=a’dır. Üçüncü olarak bu ölçeklerin geçişme özelliği vardır: yani a=b ve b=c ise a=c’dir.

    2)Sıralama Ölçeği: Belirli bir nitelik bakımından büyükten küçüğe ya da küçükten büyüğe sıraya koyma işidir. Bu sıraya uygun sayı veya sembol kullanılırsa sıralama ölçümleri yapılabilir. Kullanılan sayılar sıra sayılarıdır. Bu ölçekler büyüklük küçüklük bağıntısı ve bu bağıntının özelliklerini sağlar. Sıralama ölçeklerinin de birim ve başlangıç noktası olmadığı söylenebilir. Yani büyüklükler hakkında farklılığın ne kadar olduğu yönünde bilgi sahibi olamayız. Öğrencilerin elde ettiği test ham puanları sıralama ölçeğindedir. Bu ölçeklerin birinci özelliği ters simetridir: yani a<b ise b>a’dır ya da b<a değildir. İkinci özellik geçişmedir: yani a<b ve b<c ise a<c’dir. Bu ölçeklerle adlandırma, sınıflama ve büyüklük küçüklük karşılaştırması yapılabilir. Ancak büyüklükteki farklara ilişkin işlemler yapılamaz. İstatistiksel olarak frekans tablosu, mod, medyan (ortanca) ve yüzdelikler hesaplanabilir. İlişki ölçülerinden sıra farkları korelasyonu bulunabilir.

    3)Eşit Aralık Ölçeği: Birimi ve izafi (tanımlı, yapay, göreceli, göreli) bir sıfır noktası vardır. Gerçekte “ noktası matematikte yokluk anlamındadır. Yani bir ölçüm sonucunda 0 değeri elde etmek ölçtüğümüz değişkenin hiç olmadığı noktadır. Uzunluk 0 dediğimizde uzunluk yoktur. Aralık ölçeğinde ise başlangıç noktası ölçme yapan kişiye, bir araçtan diğerine veya bir uygulamadan diğerine değişir. Eşit aralık ölçeklerinde “ noktası görelidir. Örneğin sıcaklık ölçeğinden oC ve Fahreheit bu tür ölçeklerdendir. Bunların sıfır noktaları görece (bağıl) sıfırdır. Yani aslında bu ölçeklerdeki “ noktaları ölçülen özellik olarak sıcaklığın olmadığı bir miktarı göstermez. Yapay bir başlangıç noktasına işaret ederler. Ancak birimler arasındaki miktar eşittir. Sıralama ölçeğimde birimler arasındaki miktarı belirleyemezken aralık ölçeğinde belirleyebiliriz. Bu nedenle eşit aralık ölçeği adı da verilmektedir. Öğrencilerin testlerden aldıkları standart test puanları aralık ölçeğindedir. Eğitim ve psikolojideki ölçme araçları ve genelde sosyal bilimlerdeki ölçme araçlarının büyük çoğunluğu aralık ölçeğinde ölçeklerdir. Eşit aralık ölçeklerinde doğrusal dönüştürme yapılabilir. Yani gözlem sonuçları matematiksel işlemlerle yine eşit aralıklı fakat başlangıç noktası farklı ölçme sonuçlarına dönüştürülebilir. T ve z puanları bu yolla elde edilir. T= a+bx denklemi ile gösterilebilir. Burada “a” başlangıç (sıfır noktası) “b” ise birimdir (standart kaymadır). Z puanı= (X-Xortalama)/standart sapma denlemiyle; t puanı = z.10+50 denklemiyle elde edilebilir. Bu ölçeklerde ortalama, standart sapma, korelasyon vb istatistik işlemler yapılabilir. Farkların miktarı belirlenebilir. Sadece çarpma, bölme diğer bir deyişle oran işlemleri yapılamaz.

    4)Oran Ölçeği: Başlangıç noktası gerçek (mutlak) sıfırdır. Eşit bir birimi vardır. Bu ölçeklerle elde edilen verilerde her türlü matematiksel ve istatistiksel işlemler yapılabilir.

    Gerçek (mutlak) ve yapay (bağıl-görece) sıfır için örnek

    1. Durum

                X                                                        Y

                                                              

                                                                          

    Yukarıdaki şekillerde birinci (küçük) doğruya X, ikinci (büyük) doğruya Y dersek Y=2X olur.

    2. Durum

                       X                                                                        Y


                                                                                          

    1. Durumdaki uzunlukların başlangıç noktalarını 50 cm’ye çekersek Y=2X işlemi geçerliğini yitirir. Yani ikinci şekilde, tanımlı sıfır noktasının gerçek sıfırı göstermemesi nedeniyle Y=2X işlemi artık kullanılmaz olur. Bu nedenle ikinci durumda Y≠2X’tir. Buna benzer olarak üst (nitelikli) ölçeklerden alt (niteliği düşük) ölçeklere geçiş yapıldığı her seferinde üst ölçekteki bilgi ve işlem zenginliği kaybedilerek, alt ölçekteki işlem ve bilgilerle yetinmek zorunda kalınır.

    Tablo 2 kullanılan ölçek türüne göre elde edilen gözlem sonuçlarının anlamlarını, gözlem sonuçları üzerinde yapılabilecek işlemleri ve dolaylı olarak da nasıl yorumlanacaklarını görmemize yardımcı olabilir.

    Tablo 3’te ölçme işleminde kullanılan ölçeklerle ilgili özet bilgiler yer almaktadır. Tablo 3 ile ilgili açıklanması gereken iki önemli nokta vardır. Bunlar;

    Tablo 2. Ölçeklerle elde edilen bilgilerin anlamlılıkları

    Ölçeğin yapısal özellikleri

    Elde edilecek Olan ölçülerin anlamlılık dereceleri

    Ölçek tipi

    Başlangıç noktası

    Birimi (Aralığı)

    Nitelik gösterme gücü

    Nicelik gösterme gücü

    Sıra

    Fark

    Oran

    Sınıflama

    Yok

    Yok

    Var

    -

    -

    -

    Sıralama

    Değişken

    Değişken

    Var

    Var

    -

    -

    E. Aralıklı

    Keyfi

    Keyfi

    Var

    Var

    Var

    -

    Oranlı

    Mutlak

    Mutlak

    Var

    Var

    Var

    Var

    1.Ölçekler yukarıdan aşağıya en basitinden en karmaşığına bir sıra göstermektedir (Basitlik ve karmaşıklık, elde edilen ölçümlerin bize verdiği bilgi, bu bilgilerin güvenirliği ve ölçümler üzerinde yapılabilecek işlemlerin çokluğuna dayalı olarak belirlenmektedir).

    2.Karmaşık ölçekler basit ölçeklere dönüştürülebilirler. ( Aksi çoğu zaman -test standart puanlarını elde etme dışında- mümkün değildir.)

    Davranışların ölçülmesi, ya o davranışların ya da o davranışlar sonunda ortaya çıkan ürünün veya ikisinin birden gözlenmesi şeklinde gerçekleşir.

    Tablo 3. Ölçek türleri özet tablosu

    ÖLÇEKLER

    TEMEL İŞLEMLER

    ÖRNEKLER

    İST. TEKNİKLER

    SINIFLAMA (ADLANDIRMA)

    Farklılık ya da Benzerliği belirlemek

    -kişileri saç ve ten rengine göre sarışın esmer diye gruplama

    -evlere kapı numarası, sokaklara sokak adı verme

    -frekans

    -tepe değer (mod)

    -yüzde

    SIRALAMA

    Azı – çoğu veya küçüğü-büyüğü belirlemek

    -kitapları kalınlık sırasına göre dizme

    -öğrencileri boy veya başarı sırasına koyma

    -ortanca (medyan)

    -yüzdelik

    -sıra farkları korelasyon katsayısı

    (EŞİT) ARALIK

    Farkları belirlemek

    -termometreyle sıcaklık ölçme

    -kullanılan takvimler

    -standartlaştırılmış test puanları

    -ortalama

    -standart sapma

    -Pearson Moment Çarpımları korelasyon katsayısı

    ORAN ÖLÇEĞİ

    Oranları belirlemek

    -hacim, uzunluk, ağırlık vb. ölçüleri

    -matematiksel ve istatistiksel her türlü işlem.

    Amaç istendik davranışların ölçülmesi ise en geçerli ölçme o davranışların gerçek hayat şartlarında gözlenmesiyle olur. Ürüne bakılarak ölçme de ise gerçek koşullar altında ortaya çıkan ürünlere bakılarak yapılmalıdır. Ancak davranışların gerçek hayatta gözlenmesi çoğunlukla güçtür. Bu nedenle gerçek hayat durumuna mümkün olduğunca benzetilmiş ortamlar altında ölçme yapılmaktadır. Ölçme sonuçlarının ölçme yapılan ortamın gerçek hayat şartlarına benzerliği ölçüsünde geçerli olduğu söylenebilir.

    Diğer bir yol, gerçek hayat durumunu anlatarak böyle bir durumda kişiye ne yapacağını sormaktır. Bu sayıltıya göre okulda geliştirilecek ve ölçülecek davranışların çoğu bilgi, tutum ve duygulara dönüşür. O halde bazı davranışlar yerine onların dayandığı bilgi, beceri ve tutumları gözleyip ölçeriz. Bu işlemler sırasında gözlenen bilgi, beceri ve tutumların gerçek durumda davranışa dönüşeceği varsayılır.

    Hangi yaklaşımla veya varsayımlarla yapılırsa yapılsın ölçme şu üç aşamadan geçer; 1) Ölçülecek özelliğin kararlaştırılması ve tanımlanması 2) Ölçülecek özelliğin ortaya çıkarılmasını ve gözlenmesini sağlayacak işlemlerin belirtilmesi 3)Gözlem sonuçlarının derece veya miktar olarak ifade edilmesi.

    Değerlendirme: Ölçme sonuçlarını bir ölçüt veya ölçütlerle karşılaştırarak karara varma, ölçme sonuçlarını yargılama ya da karar verme olarak tanımlanabilir.

    Değerlendirmenin Özel Anlamı: Bireyler hakkında toplanan bilgiyi ölçütlerle karşılaştırarak bireyler hakkında karar verme, yargıda bulunma sürecidir.

    Test: Sınav, seçmeli testler, sınama, deneme, kontrol, yoklama anlamlarına gelir. Bu kelime kullanılırken hangi anlamda kullanıldığı açıklanmalıdır.

    Sınav: Birden çok testin kullanılabildiği (yetenek, tutum, başarı vb.) çeşitli özellikleri ölçme sürecini vurgular. Test ise belli özellikleri ölçmek için kullanılan ve onu alan herkes için aynı olan sorulardan ya da işlerden oluşan ölçme aracıdır. Sınavın kapsamı geniş, testin kapsamı dardır.

    Bölüm Testi

    1. Aşağıdakilerden hangisi ölçmenin eğitimde kullanılma amacıdır?

    A) Değerlendirmeye temel oluşturması*

    B) Kolay ve nesnel puanlamayı sağlamsı

    C) Maliyeti azaltarak kullanışlığı artırması

    D) Bireyleri başarıya göre sıralaması

    E) Davranışa sahip olanla olmayanı ayırması

    2. Ölçmede araç kullanmanın faydasını aşağıdakilerden hangisi en iyi açıklar?

    A) Puanlamayı kolaylaştırır.

          B) Kapsam geçerliğini artırır.

          C) Tesadüfî hataları kontrol eder.

          D) Yorumlamaya olanak verir.

          E) Gözlemi duyarlı hale getirir.*

    3. Aşağıdakilerden hangisi temel (doğrudan) ölçmedir?

          A) Bir daktilo yazısındaki hataları saymak*

          B) Başarı testi ile öğrenci başarısını ölçmek

          C) Yaylı kantar ile ağırlık ölçmek

          D) Bir zekâ testi ile zekâ yaşını hesaplamak

          E) Termometreyle havanın ısısını ölçmek

    4. Aşağıdakilerden hangisinde birimlerde bulunması gereken özellikler tam ve doğru olarak verilmiştir?

          A) Geçerlik, doğruluk, duyarlık

          B) Geçerlik, güvenirlik, tutarlık

          C) Hatasızlık, iç-tutarlık, yeterlik

          D) Eşitlik, genellik ve uygunluk*

          E) Genellik, kullanışlılık, niteliklilik

    ****

    “Daktilo kursuna giden Özge’nin yeterlik belgesi almaya hak kazanmak için 100 üzerinden en az 50 puan alması gerekiyordu. Özge 70 puan aldı ve yeterlik belgesini kazandı.”

    Aşağıdaki 3 soruyu yukarıdaki ifadeye göre cevaplandırınız.

    5. “50 puan” neyi gösterir?

          A) Güvenirlik       B) Ölçme        C) Değerlendirme       D) Ölçüt*                   E) Geçerlik

    6. “70 puan” neyi gösterir?

          A) Güvenirlik       B) Ölçme*      C) Değerlendirme       D) Ölçüt                     E) Geçerlik

    7. “Yeterlik belgesini kazanması” neyi gösterir?

          A) Güvenirlik       B) Ölçme        C) Değerlendirme*     D) Ölçüt                     E) Geçerlik

    ****

    8. Bir sınavda çıkan soruların tamamını doğru cevaplandıran bir öğrencinin tam puan alması ile ilgili olarak aşağıdakilerden hangisi kesinlikle söylenebilir?

          A) Öğrenci sınıfında üst sıralarda yer alabilir.*

          B) Öğrenci dersteki konuların hepsini bilmektedir.

          C) Sınavın güvenirliği çok düşük çıkacaktır.

          D) Sınıfın çoğunluğu bu sınavda başarılı olmuştır.

          E) Sınavın kapsam geçerliği düşüktür.

    9. Aşağıdaki ölçme sonuçlarının hangisinde doğal birim yoktur?

    A) Veli 5 çift ayakkabı aldı.

          B) Ceren’in boyu 1,68 metredir.*

          C) Fatma sorulardan 28’ini doğru cevapladı.

          D) Bu lokantada 7 garson var.

          E) Galeride satılmayan 3 araba kaldı.

    10. Aşağıdakilerden hangisi bir dolaylı ölçmedir?

          A) Giyimine bakarak kişinin sevdiği rengi belirlemek

          B) Öğrencilerin kitaplarından ciltlenmiş olanlarını seçmek.

          C) Ders kitabını sınıfa getirmeyen öğrencileri saymak

          D) Öğrencilerin akademik benlik tasarımlarını ölçmek *

          E) Sınıftaki esmer ve sarışın öğrencileri belirlemek.

    11. Bir üniversitenin Spor Bilimleri bölümüne öğrenci seçme sınavında öğrencilerin 10 saniyede kaç metre koştukları belirlenerek puan verilmektedir. Öğrencilere puan vermek için yapılan ölçme işlemi hangi ölçektedir?

          A)  Adlandırma    B) Sınıflama   C)  Sıralama    D) Eşit Aralıklı           E) Oranlı*

    12. Değişken kavramını aşağıdakilerden hangisi daha iyi açıklar?

    A)Gözlenen özellikler                              B)Etkisi araştırılan nitelikler

    C)Bir sonucu ulaştıran nitelik                  D)Etkilenme düzeyi araştırılan nitelikler

    A)Aldığı değerler farklılaşan nitelikler*

    13. Eğitimde hangi ölçek türünde ölçme yapılamaz?

    A)      Sıralama

    B)      Aralık

    C)     Oran*

    D)     Sınıflama

    E)      Adlandırma

      II- ÖLÇME ARACINDA

    ARANAN NİTELİKLER

    Ölçme aracında üç özelliğin yeterli düzeyde bulunması istenir. Bunlar kısaca aşağıda tanımlanmıştır.

    1-Güvenirlik: Ölçme aracının hatalardan arınık olma derecesi, ölçtüğü şeyi tutarlı ölçebilme derecesi.

    2-Geçerlik: Ölçme aracının kullanış amacına hizmet etme derecesi, Ölçtüğü şeyi, diğer değişkenleri karıştırmadan ölçebilme derecesi.

    3-Kullanışlılık: Ölçme aracının hazırlama, uygulama, puanlama ve tüm bu süreçlerde ekonomiklik derecesi olarak adlandırılabilir.

    Gerçek Puan Kuramı Temel Denklemi: X= T + E                (Denklem 1)

    X: Gözlenen puan      T: Gerçek Puan           E: Ölçemeye Karışan Hata Puanı

    Örnek bir öğrenci 20 soruluk bir testten 17 puan almış olsun. Bu 17 puanı gözlenen puandır. Ancak öğrencinin sahip olduğu bilgi düzeyi ile 14 puan alabileceğini varsayalım. Bu 14 puan gerçek puandır. Öğrencinin gerçek performansını ya da başarısını yansıtan puandır. Öğrenci geriye kalan 3 puanı da kopya çekerek ve şansla kazanmıştır. İşte bu 3 puana, ya da gözlenen puanla gerçek puan arasındaki farka hata puanı diyebiliriz. X bilinir, çünkü gözlenen puandır. T hipotetiktir (teoriktir), bilinemez. E eğer yönü ve miktarı belli ise bilinebilir. Ancak tesadüfî ise yönü ve miktarı bilinemez. Dolaylı yollardan hesaplanır.

    Hiçbir ölçme hatasız değildir. Hemen her ölçmeye milyarda bir oranında da olsa hata karışır. Hataların çeşitli kaynakları vardır. Hatalar: Ölçmeci, ölçme aracı, ölçme yöntemi, ölçme ortamı veya ölçülen kişiden gelebilir.

    2.1 Hata Türleri

    1-Sabit Hatalar: Her ölçme sonucuna aynı miktarda ve aynı yönde karışan; her ölçme sonucu için aynı yönde etkili olan ve her bir ölçmede miktarı değişmeyen hatalardır. (Ör: Her öğrenciye 10 puan fazla verilmesi veya bir soruyu bütün sınıfın doğru cevaplandırması sabit hatalardandır.)

    2-Sistematik Hatalar: Ölçme sonuçlarına belirli bir kurala göre karışan ve yönü ile miktarı tespit edilebilen hatalara sistematik hatalar denir. Çoğunlukla her bir ölçme için sabit olmayan, puanlayıcı yanlılığını yansıtan hatalardır. (Ör: Matematik ya da Fen dersinde öğrencilerin güzel yazı yazma, düzen vb.ne puan verme veya sadece erkek / kız öğrencilere fazladan puan verme sistematik hatalardandır.)

    3-Random (tesadüfî, gelişigüzel, rasgele) Hatalar: Kaynağı, yönü ve miktarı bilinmeyen, ölçme sonuçlarına tesadüfen karışan hatalardır. Bu tür hatalar ölçme sonuçlarına nerede, ne zaman, nasıl, ne kadar karıştı tespit edilemezler. (Ör: Sınav koşullarının öğrencilere etkisi, öğretmenin puanlama dikkatsizliği gibi etkenlerden ölçmelere karışan hatalar bu türdendir.) Ancak bu tür hataların ortalamasının sıfıra yaklaştığı ve normal dağıldığı kabul edilir.

    Ölçmede asıl ilgilenilen hata türü tesadüfî hatalardır. Sabit hatalar standart sapma ve varyansa etki etmezler. Sistematik ve sabit hatalar kontrol edilebilirler. Ölçme sonuçlarına hangi yönde ve hangi miktarda karıştığı tespit edilerek ölçme sonuçlarından çıkarılabilirler. Böylece de ölçme sonuçları hatalardan arındırılmış olur. Dolayısıyla sabit ve sistematik hataların ölçme sonuçlarının güvenirliğine etkileri azaltılabilir veya tamamen ortadan kaldırılabilir. Bu nedenle güvenirlik söz konusu olduğunda ölçmecileri asıl ilgilendiren hata türü olarak tesadüfî hatalara vurgu yapılır. Ancak random hataları kontrol etme imkânı yok gibidir. Bu nedenle yapılabilecek en doğru işlem random hataları azaltmak için gerekli önlemeleri alabilmektir.

    Ölçme aracının duyarlığı hataları azaltır. Ölçmecinin yeterli oluşu, ölçme aracının iyi kullanılması, puanlamanın objektifliği, ölçme yapılan ortamın amaca uygunluğu ve ölçülen kişinin performansını yansıtacak durumda olması hataları azaltır.

    2.2 Güvenirlik

    Genel anlamda tutarlık ve duyarlık demektir. İki veya daha fazla ölçümün birbirini tutması veya yapılan ölçümlerin duyarlı olmasıdır.  Pozitif bilimlerde aynı şartları sağlamak mümkün olabildiği için bu yöntem iyi sonuçlar verir. Eğitim ve psikolojide aynı şartları sağlamanın zorluğu farklı yöntemler geliştirilmesini zorunlu kılmıştır. Geçerlik ve güvenirliği belirleme tekniklerinde en çok kullanılan istatistik tekniklerden biri korelasyon katsayısıdır. Aşağıda, korelâsyonun alabileceği tipik değerlerle ilgili grafiklerden üçü verilemeye çalışılmıştır.

    Korelâsyon katsayısı –1 ile 1 arasında değerler alır. Değer 1’e yakınsa pozitif korelasyon vardır. Değişkenler aynı yönde değişiyor anlamına gelir. Yani değişken değerlerinden biri artarken diğeri de artıyorsa pozitif korelasyon olur. Bu durumda, değişkenlere ait değerler eksenlerin birleştiği köşeden karşı köşeye yönelen bir elips içinde gösterilebilir (1. gösterim örneğindeki gibi). Eğer değişkenlerin değerleri, eksenlerin birleştiği köşeden karşı köşeye yönelen düz bir doğru üzerinde gösterilirse bu durumda mükemmel olumlu ilişkiden söz edilir. Değer –1’e yaklaşıyorsa negatif korelasyon vardır. Değişken değerlerinden biri azalırken diğeri artıyorsa negatif ilişki vardır. Bu tür ilişkiye ters yönde ilişki de denir. Bu durumda değişkenlere ait değerler dikey eksenden yatay eksene doğru yönelen bir elips içinde gösterilebilir (2. gösterim örneğindeki gibi). Değişkenlere ait değerler dikey eksenden yatay eksene yönelen bir doğru üzerinde gösterilebilirse bu durumda mükemmel olumsuz ilişkiden söz edilir. Korelasyon değeri 0’a yakınsa iki değişken arasında ilişki olmadığı söylenir. Değişkenlerin değerleri bir daire, bir kare bazı zamanlar ise dikdörtgen içerisinde gösterilebilir. (3. gösterim örneğindeki gibi).

    Korelasyon grafiksel olarak gösterildiği gibi istenirse değer olarak da hesaplanabilir. Grafik teknik sayesinde korelasyonun yönü ve gücü hakkında fikir sahibi olsak da yorum yapmakta zorlanılacak durumlar da mümkündür. Denklem 2 korelasyon değerinin nasıl elde edildiğini göstermektedir. Bu formüle korelasyon için ham puan formülü adı da verilir. Eğer istenirse bu formül kullanarak korelasyon değeri elde edilir ve yorumlanır. Elde edilen korelasyonun gücü sorulduğunda mutlak değer 1’e yakınlığına bakılır. Özel olarak yön belirtilirse hesaplanan korelasyonun işaretine bakılır. Korelasyon Formülü 

    Korelasyon güvenirlik ve geçerlik katsayısı olarak kullanılırken pozitif ve bire yakın olmasına dikkat edilir. Yani pozitif ve bire yakın korelasyon varsa geçerlik ve güvenirlik olduğu söylenebilir. Güvenirlikte 0,70 üstü; geçerlikte ise 0,30 üstü korelasyon var ise kısmen de olsa geçerlikten ve güvenirlikten söz edilebilir.

    1. Test

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    X

    x

    x

    x

    X

    x

    x

    x

    2. Test

    1. Gösterim

    (Pozitif Yüksek Korelasyon)

    1. Test

    x

    x

    x

    X

    x

    X

    X

    x

    X

    x

    x

    X

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    2. Test

    2. Gösterim

    (Negatif Yüksek Korelasyon)

    1. Test

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    x

    X

    x

    x

    x

    x

    x

    x

    x

    x

    x

    3. Gösterim

    2. Test

    (Sıfıra Yakı Düşük Korelasyon)

     Güvenirlik bir korelasyon olmasına rağmen 0 ile 1 arasında değişir. Varyanslardan hareket ettiğinden – (negatif) değer almaz. Çok ender olarak 1’in üstünde veya negatif çıkar. Aynı şekilde herhangi bir ölçme sonuçlarının tam güvenilir ya da sıfır güvenirlikte olması beklenmez. Eğer ölçmelerimiz tam güvenilir olsaydı güvenirliğin tanımından ölçmelerimizde hata olmazdı, bu durumda güvenirliğin (korelasyonun) değeri 1 olurdu; eğer ölçmelerimiz sıfır güvenirlikte olsaydı, ölçümlerin hepsi hata ölçüsü anlamına gelirdi; bu durumda da güvenirliğin (korelasyonun) değeri 0 olurdu.

    Geçerlikte ise ölçülmek istenen değişkenle zıt yönlü bir değişken ölçülebilir. Örneğin bir dersten hoşlanmamak (olumsuz tutum) ile o dersteki başarı negatif yönlü korelasyon verebilir. Bu nedenle güvenirlik 0 ile 1 arasında değer almasına rağmen geçerlik -1 ile +1 arasında değerler alır. Geçerlik ve güvenirliğin alabileceği değerlerin sınırlarını aşağıdaki gibi göstermek kalıcılığı açısından yararlı olabilir.

    0 ≤ rxx ≤ +1     (Güvenirliğin sınırları)

    -1 ≤ rxy ≤ +1    (Geçerliğin sınırları)

    Güvenirliği Belirleme Yollarından Bazıları:

    1-Test Tekrar Test Güvenirliği: Aynı testi aynı gruba iki kez uygulama yoluyla elde edilen güvenirlik katsayısıdır. İki uygulamadan elde edilen puanlar arasındaki korelasyon katsayısıdır. İki uygulama arasından belirli bir zaman geçmelidir. Aradan geçen zaman cevaplayıcıların ölçülen özellik bakımından değişmeyecekleri, aynı zamanda ilk uygulamada verdikleri cevabı hatırlamayacakları bir süre olmalıdır. Bu güvenirlik katsayısına Kararlılık Katsayısı da denir.

    2-Paralel Test Güvenirliği: Test-tekrar test yönteminin dezavantajını gidermek amacındadır. En az iki eşdeğer form geliştirilir. İki test madde sayısı, niteliği ve ölçtükleri davranışlar bakımından denk olmalıdır. İki test aynı öğrenci grubuna uygulanır. İki testten elde edilen cevaplayıcı puanları arasında korelasyon katsayısı hesaplanır. Uygulama aynı öğrenci grubuna aynı zamanda yapılırsa hem karalılık anlamında güvenirlik hem de formların eşdeğerliği hakkında bilgi verir.

    3-İki Yarı Güvenirliği: Tek uygulama gerektirdiğinden çok kullanılır. Test iki eşdeğer yarıya bölünür (Yarısından veya tek-çift sorular). Öğrencilerin bu iki yarılardan elde ettikleri puanlar arasında korelasyon elde edilerek testin bir yarısı için güvenirlik bulunur. Bu korelasyon kullanılarak testin tümü için güvenirlik hesap edilir. Testin tümü için güvenirlik katsayısının formülü şöyledir.

                 (Denklem 3)

                Bu yöntemin kullanılmasında tek boyutlu; aynı niteliği ölçen maddelerden oluşan bir test olmasına özen gösterilir. Aksi durumda yorumlamada sıkıntı yaratacağından kullanılmaz.

    4-KR-20 Güvenirliği: Bu formül için madde güçlük indeksi (p) bilinmelidir. İkinci olarak testteki her bir maddenin aynı değişkeni ölçtüğü yani testin ölçmek istediği niteliği ölçtüğü sayıltısı vardır. Formül madde güçlüklerini ve madde sayısını dikkate alarak hesaplanan bir güvenirlik katsayısıdır.

     (Denklem 4)

    K: Madde sayısı

    p: Maddeyi doğru cevaplandıranların tüm cevaplayıcılara oranı

    q: Maddeyi yanlış cevaplandıranların tüm cevaplayıcılara oranı

    : Tüm testin varyansı

    5-KR-21 Güvenirliği: Testteki maddelerin eşit ya da yakın güçlükte olduğu varsayılıyorsa ve madde istatistikleri (güçlükleri veya varyansları = pq) bulunmamışsa test puanları ortalaması ve varyansı kullanılarak KR-21 güvenirlik katsayısı hesaplanabilir. Maddelerin eşit güçlükte varsayılmasından dolayı KR-21 genellikler KR-20’den küçük çıkar.

     (Denklem 5)

                Eğer maddeler güçlük bakımından oldukça farklı ise yani birbirine yakın veya eşit değilse bu formül güvenirliğin en alt sınırını verir. Bu durumda elde edilen güvenirlik katsayısı yeterli görülüyorsa (.75’in üstünde ise) testin güvenilir olduğunu söylemek mümkündür.

    KR-20 ve KR-21 formülleri sadece 1-0 puanlamasında kullanılır. Eğer puanlama farklı ise bu formül kullanılmaz. Cronbach alfa güvenirlik katsayısı kullanılır.

    6- Cronbach alfa: Maddeler (sorular) 1-0’dan farklı puanlandığı zaman veya bir testin alt testleri varsa bu tür testlerin güvenirliğini KR-20’nin özel bir hali olan Cronbach Alfa tekniği ile hesaplarız. KR-20’den farkı eğer testin alt testleri var ise madde varyansları toplamı yerine alt test varyansları toplamı alınır. 1-0’dan farklı puanlandığında KR-20’de olduğu gibi madde varyansları kullanılır.

     (Denklem 6)

    å : Madde varyansları toplamı veya alt test varyansları toplamı

    7-Puanlayıcı Güvenirliği: Cevap kâğıtlarına birden fazla puanlayıcının verdiği puanlar arsındaki korelasyondur. Puanlayıcıların yansızlığı ve uyumu hakkında bilgi verir. Daha çok yazılı sınavlar, sözlü sınavlar, performans testleri gibi durumlarda kullanılır.

    8-Puanlama Güvenirliği: Bir puanlayıcının bir sınav kağıdına farklı zamanlarda (en az iki kez) verdiği puanlar arasındaki korelasyondur. Puanlayıcının kararlılığı ve yansızlığı hakkında fikir verebilir. Daha çok yazılı sınavlarda, ödev-projelerde ve kısmen de kısa cevaplı testlerde kullanılabilir.

    Tablo 4. Güvenirlik Belirleme Tekniklerine İlişkin Özet Bilgiler

    Güvenirlik Katsayısı Tipi

    Anlamı

    Gereken form sayısı

    Uygu­lama sayısı

    Hata varyansı kaynağı

    KUDER-RICHARSON KR - 20 ve KR - 21

    İç tutarlık

    Bir

    Bir

    Kapsam örneklemi ve heterojenliği

    CRONBACH ALFA

    İç tutarlık

    Bir

    Bir

    Kapsam örneklemi ve heterojenliği

    İKİ YARI

    İç tutarlık

    Bir

    Bir

    Kapsam örneklemi

    TEST-TEKRAR TEST

    Kararlılık

    Bir

    İki

    Zaman örneklemi

    PARALEL FORMLAR

    Birlikte uygulama

    Tutarlık

    İki

    Bir

    Kapsam örneklemi

    PARALEL FORMLAR

    Aralıklı uygulama

    Tutarlık

    İki

    İki

    Zaman ve kapsam

    PUANLAYICI

    Tutarlık

    Bir

    Bir

    Puanlayıcılar

    PUANLAMA

    Kararlık

    Bir

    Bir

    Puanlama

    Açıklanan güvenirlik belirleme tekniklerine ilişkin özet bilgiler tablo 4’te verilmektedir. Tablo 4 güvenirliklerin hangi anlama geldiği, kullanılması gereken form sayısı, uygulama sayısı ve hesaplanan güvenirlik değerlerine karışan hata kaynaklarını göstermektedir.

    Güvenirliği Artırma Yolları

    1-Soru sayısını artırmak güvenirliği artırır. Güvenirlikle soru sayısı arasında matematiksel bir ilişki vardır. Soru sayısı arttıkça duyarlı ölçme yapılacağı için güvenirlik de artar. Ancak soru sayısını bir noktadan sonra artırmanın getirişi çok fazla değildir. Bu ilişki aşağıdaki şekilde görülebilir. Güvenirliği tam (1) yapabilmek için eklenecek soru sayısı sonsuzdur. Monoton artan bir fonksiyondur. Bir noktadan sonra eklenecek soru sayısı ile artacak güvenirlik miktarı önemsiz bir düzeye gelir. Bunu bir örnekle açıklayacak olursak madde sayısı 4 güvenirliği 10 olan bir teste sürekli soru ekleme durumunda güvenirlik artış miktarı şöyle olacaktır.

    Aşağıdaki şekilde örüldüğü gibi bir noktadan sonra meydana gelen güvenirlik artışı eklenen soru sayısı karşısında değmeyecek bir miktardır. Soru sayısı ile güvenirlik ilişkisi kapsamında ne kadar soru eklenince istenilen güvenirliği elde edeceğimizi gösteren formül vardır. Bu formül aşağıdaki gibidir.

    rn =         (Denklem 7)

    formülde geçen terimlerin açıklamaları şöyledir.

    rs=Soru eklenecek testin (eldeki testin) güvenirliği

    rn=Testin soru eklendikten sonra beklenen güvenirliği (istenen güvenirlik)

    n=Testin kaç kat uzatılacağı

                Örnek: Güvenirliği 0.75 olan 10 soruluk bir testin güvenirliğini .90'a çıkarmak için ne kadar soru ekleyeceğimizi bulmak için formülü uygularsak (bkz. Örnek çalışmalar) n @ 3 çıkar. Buradan n*k yoluyla; 3*10 = 30 bulunur. Bu durumda test 30 soru olduğunda güvenirliğin 0.90 olacağı anlaşılmaktadır. Yani güvenirliği 0.90’a çıkarmak için teste 20 soru daha eklemek gerekmektedir.

    Tablo 5. Madde sayısı ve Güvenirlik İlişkisi

     

    K

    Güvenirlik

    Artan Güvenirlik Artışı

    4

    0.10

    -

    8

    0.18-

    0.08

    16

    0.30

    0.12

    32

    0.46

    0.16

    64

    0.63

    0.17

    128

    0.77

    0.14

    256

    0.89

    0.12

    512

    0.94

    0.05

    1024

    0.97

    0.03

    1.00

    0.03

    Şekil 5. Madde sayısına göre güvenirlik

    2-Soruların açık, anlaşılır ve cevaplanabilir olması güvenirliği artırır. 3-Öğrencilerin güdülenmesi güvenirliği artırır.

    4-Sınav süresinin yeterli olması güvenirliği artırır.

    5 -Testin orta güçlükte olması (çok kolay veya çok zor olmaması) güvenirliği artırır.

    6-Testin objektif puanlanması güvenirliği artırır.

    7-Ölçme işleminin tüm basamaklarında gerekli titizlik ve dikkati göstermek güvenirliği artırır. 9-Duyarlığı yüksek araç ve yöntem kullanmak güvenirliği artırır.

    10-Ölçme sonuçlarının elde edilen duyarlıkta kaydedilmesi güvenirliği artırır.

    2.3 Ölçmenin Standart Hatası

    Ölçmelerin tutarlığı ile güvenirlikten sonraki ikinci yaklaşım hataların büyüklüğünü belirlemektir. Tek bir gözleme bakılarak hata konusunda bir şey söylenemez. Aynı kişiye ait birden fazla ölçme yapılmalıdır. Bu ölçmeler bir dağılım gösterir. Bu dağılımın ortalaması kişinin gerçek puanının tahminidir. Yani gerçek puana en yakın puandır. Bu dağılımın standart kayması ölçmenin standart hatası olarak adlandırılır.

    Ancak bireylerle ilgili tekrarlı ölçmeler yapmak zaman alıcıdır. Bu nedenle çok sayıda kişiye test uygulamak, bu testten elde edilen puanların standart kaymasını ve güvenirliğini kullanmak yoluyla bireylerin puanlarına karışan hata (ölçmenin standart hatası) hesaplanabilir. Bu yolla hesaplanan ölçmenin standart hatası formülü aşağıdaki gibidir:

         (Denklem 8)

    Sx=Testin standart sapması

    rxx’= Testin güvenirliği

                Standart hata grubun değişirliğinden az etkilenir. Güvenirlik ise grubun değişirliğine bağlıdır. Bu nedenle bazen güvenirlik yerine kullanılması önerilmiştir. Özellikle testteki puanların ve puanlar arasındaki farkların güvenirliği ile ilgili yargılar için çok kullanışlıdır. (Ör: Güvenirliği .64 olan ve standart kayması 5.03 olan testten bir öğrencinin 48 puan aldığını varsayalım. Geçme notu 50 olsun. Bu durumda öğrenci sınıfını geçmeli midir? Nasıl karar vereceğiz? Kararı, standart hatayı hesaplayıp öğrencinin puanına ekleme ve çıkarma yapma yoluyla öğrencinin puan aralığını bulduktan sonra vermek yararlıdır. Bu test için ölçmenin standart hatasını hesaplayacak olursak ilgili formülden 3,02 olarak elde edilir. Bu puanı öğrencinin puanına ekleyip çıkarınca öğrencinin puanı 44,98 – 51,02 arasında olacaktır. Öğrencinin puanı 50 geçme notunu kapsadığından geçer not vermek doğru olur.

    Güvenirlik İçin Örnek Çalışmalar:

    Tablo 6. Test-Tekrar Test Veya Paralel Test Güvenirliği İçin Veriler

     

    1.Uyg.(X)

    2.Uyg.(Y)

    X2

    Y2

    XY

    1

    30

    33

    900

    1089

    990

    2

    32

    32

    1024

    1024

    1024

    3

    33

    34

    1089

    1156

    1122

    4

    35

    36

    1225

    1296

    1260

    5

    37

    37

    1369

    1369

    1369

    6

    38

    42

    1444

    1764

    1596

    7

    40

    39

    1600

    1521

    1560

    8

    39

    44

    1521

    1936

    1716

    9

    44

    41

    1936

    1681

    1804

    10

    34

    36

    1156

    1296

    1224

    Toplam

    362

    374

    13264

    14132

    13665

    T2

    131044

    139876

    TX*TY

    135388

    r=

    0,83

    Testim güvenirliği

    kkök r

    0,91

    Maksimum geçerlik değeri

     

    Bu sonuçlara göre 10 soruluk testimizin orta güvenirlikte olduğu söylenebilir.

    Diğer güvenirlik hesapları da ilgili tekniğin gerekli işlemleri yerine getirilerek korelasyon formülünden faydalanılarak yapılmıştır.

     Aşağıda 10 soruya 10 kişinin verdiği cevaplara dayanarak elde edilen madde puanları matrisi görülmektedir. Bu matrisi kullanarak güvenirlik tekniklerinden uygun olanlar için güvenirlik değerleri ve bir ölçüte göre maksimum geçerlikleri hesaplanmıştır. Benzer örnekler üzerinde çalışılabilir.

    Tablo 7 Yarıya bölme, KR-20 ve KR-21 Güvenirlik Analizleri için 10 Maddeye İlişkin Veriler

    Kişiler

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    Puan

    A

    0

    1

    1

    0

    1

    1

    0

    0

    0

    1

    5

    B

    1

    1

    1

    0

    1

    1

    0

    1

    1

    0

    7

    C

    1

    1

    1

    1

    1

    1

    1

    1

    0

    0

    8

    D

    1

    1

    1

    0

    0

    0

    0

    0

    0

    1

    4

    E

    1

    1

    1

    1

    1

    1

    1

    1

    0

    1

    9

    F

    0

    1

    1

    0

    0

    0

    0

    0

    1

    0

    3

    G

    0

    1

    1

    0

    0

    1

    0

    1

    0

    0

    4

    H

    1

    1

    1

    1

    1

    1

    1

    1

    1

    1

    10

    I

    0

    0

    0

    0

    1

    0

    0

    0

    1

    1

    3

    J

    0

    1

    1

    1

    1

    0

    0

    1

    1

    0

    6

    DS

    5

    9

    9

    4

    7

    6

    3

    6

    5

    5

    59

    p

    0,50

    0,90

    0,90

    0,40

    0,70

    0,60

    0,30

    0,60

    0,50

    0,50

    q

    0,50

    0,10

    0,10

    0,60

    0,30

    0,40

    0,70

    0,40

    0,50

    0,50

    p*q

    0,25

    0,09

    0,09

    0,24

    0,21

    0,24

    0,21

    0,24

    0,25

    0,25

    2,07

    nest...

    batman iftar saati 2021 viranşehir kaç kilometre seferberlik ne demek namaz nasıl kılınır ve hangi dualar okunur özel jimer anlamlı bayram mesajı maxoak 50.000 mah powerbank cin tırnağı nedir