Bilimsel Önlemler: Güvenilirlik ve Geçerlilik
Güvenilirlik, bir ölçüm cihazının iç tutarlılığının ve kararlılığının bir ölçüsüdür.
Geçerlilik, ölçüm cihazının iddia ettiği şeyi ölçüp ölçmediğine dair bize bir gösterge verir.
İç tutarlılık, ölçüdeki madde veya soruların tutarlı bir şekilde aynı yapıyı değerlendirdiği derecedir. Her soru aynı şeyi ölçmeyi amaçlamalıdır. İç tutarlılık genellikle Cronbach Alpha kullanılarak ölçülür - ölçekteki tüm öğelerin süper korelasyonu. Puan 0,70 veya daha yüksekse, ölçüm kabul edilebilir. Ancak .80 veya üstü tercih edilir. İç tutarlılığı yansıtan puanı değerlendirirken bağlamı da dikkate almak önemlidir.
Kararlılık genellikle test / yeniden test güvenilirliği ile ölçülür. Aynı kişi aynı sınava iki kez girer ve her testten alınan puanlar karşılaştırılır. İki test puanı arasındaki yüksek korelasyon, testin güvenilir olduğu anlamına gelir. Çoğu durumda en az 0,70'lik bir korelasyon kabul edilebilir olarak kabul edilir. Ancak, bu genel bir kılavuzdur ve istatistiksel bir test değildir.
Değerlendiriciler arası güvenilirlik, bazen güvenilirliği değerlendirmede kullanılan başka bir güvenilirlik katsayısıdır. Değerlendiriciler arası güvenilirlikle, farklı yargıçlar veya değerlendiriciler (iki veya daha fazla) gözlemler yapar, bulgularını kaydeder ve ardından gözlemlerini karşılaştırır. Değerlendiriciler güvenilirse, anlaşma yüzdesi yüksek olmalıdır.
Bir önlemin geçerli olup olmadığını sorarken, ne gerektiğini ölçüp ölçmediğini soruyoruz. Geçerlilik, istatistiksel bir test değil, toplanan verilere dayalı bir yargıdır. Geçerliliği belirlemenin iki ana yolu vardır: mevcut ölçüler ve bilinen grup farklılıkları.
Mevcut ölçümler testi, yeni önlemin mevcut ilgili geçerli ölçümlerle ilişkili olup olmadığını belirler. Yeni önlem, halihazırda oluşturulmuş geçerli ölçüm cihazları ile kaydedilmiş ölçülere benzer olmalıdır.
Bilinen grup farklılıkları, yeni önlemin bilinen grup farklılıklarını ayırt edip etmediğini belirler. Bilinen grup farklılıklarının bir örneği, farklı gruplara aynı ölçü verildiğinde ve farklı puan almaları beklendiğinde görülür. Örnek olarak, Demokratlara ve Cumhuriyetçilere belirli siyasi görüşlerin gücünü değerlendiren bir test verecekseniz, onlardan farklı puan almalarını beklersiniz. Görüşleri birçok konuda büyük ölçüde farklıdır. Bu iki grup beklendiği gibi farklı puanlar aldıysa, ölçünün geçerliliği gösterdiğini söyleyebiliriz - ölçtüğünü iddia ettiği şeyin ölçüsü.
Yeni ölçüm cihazları tasarlarken, bunların güvenilirliğini ve geçerliliğini dikkate almak zorunludur. Bir önlem güvenilir olabilir ve geçerli olmayabilir. Ancak geçerli bir ölçü her zaman güvenilir bir ölçüdür.