Doğruluk ve kesinlik

Mühendislik, endüstri ve istatistikte, bir ölçüm sisteminin doğruluğu, bir niceliğin ölçüm değerinin asıl (gerçek) değerine olan yakınlık derecesidir. Bir ölçüm sisteminin kesinliği (tekrarlanabilirliği veya yinelenebilirliği de denir), aynı şartlardaki ölçümlerin aynı sonucu verme derecesidir.^[1] Gündelik dilde iki terim eş anlama gelebilmekteyse de bilimsel yöntemde ikisi özellikle ayrı ayrı kullanılımaktadır.

Bir ölçüm sistemi doğru olup kesin olmayabilir, kesin olup doğru olmayabilir, ikisi de olmayabilir veya her ikisi de olabilir. Mesela, bir deneyde sistematik hata varsa, örneklem büyüklüğünü artırmak genelde kesinliği artırır ama doğruluğu iyileştirmez. Sistematik hatayı yok etmek doğruluğu iyileştirir ama kesinliği artırmaz.

Bir ölçüm sistemi hem doğru hem de kesinse, ona geçerli denir. Yanlılık, (bağımsız değişken ile ilintisiz bir unsur veya unsurların neden olduğu rassal olmayan ve yönlü etkilerdir. Bir diğer ilgili terim olan hata ise rassal değişkenlik olarak tanımlanır.

Doğruluk ve kesinlik terimleri dolaylı ölçümlere de uygulanır, yani gözlemlenen verilerden hesaplanan değerler için de.

Bu iki terime ek olarak, ölçümlerde ölçüm çözünürlüğünden de bahsedilebilir, bu, ölçümde bir farklılık yaratan, ölçülen cisimdeki en küçük değişikliktir. Bunun kesinliği düşük olabilir.

Doğruluk ve kesinlik; hedef benzetmesi

Doğruluk ve kesinlik arasındaki farkı anlatmak için bir hedef benzetmesi yapılabilir. Bu benzetmede, tekrar edilen ölçümler bir hedefe atılan oklar olarak düşünülmektedir. Doğruluk, okların hedefin merkezine olan yakınlığına karşılık gelir, merkeze yakın saplanan oklar daha "doğru" sayılır. Bir ölçme sistemiyle elde edilen değerler kabul edilen değere ne kadar yakınsa bu sistemin o kadar doğrudur.

Benzetmeye devam edersek, eğer çok sayıda ok atılırsa, saplanmış oklar kümesinin genişliği kesinliktir (tek bir ok atılması söz konusuysa, bu işlemi pek çok kere tekrar edilirse elde edilecek kümenin genişliği kesinliğe karşılık gelir). Eğer tüm oklar sıkıca bir arada yer alıyorsa bu grup "kesin"dir, çünkü hepsi aynı noktaya yakın saplanmışlardır, bu nokta hedefin merkezi olmasa dahi. Ölçümler kesindir ama doğru olmayabilir.

Ancak, kesinlik olmadan doğruluk elde etmek mümkün değildir. Eğer oklar birbirine yakın bir öbek oluşturmamışsa hepsi birden hedef merkezine yakın olamaz. Ortalama pozisyonları hedef ortasının doğru bir kestirimi olabilir ama oklar teker teker hatalıdır. Kesinlik kavramın balistik biliminde uygulaması için dairesel hata olasılığı maddesine bakınız.

Doğruluk ve kesinliğin nicelenmesi

İdealde bir ölçüm aracı hem kesin hem doğrudur, ölçümlerin hepsi bilinen değere yakın ve onun etrafında sıkıca toplanmıştır. Bir ölçümün doğruluk ve kesinliği, kaynağı bilinen bir referans standardının tekrarlı olarak ölçümüyle belirlenir. Bu tür standartlar genelde Uluslararası Birimler Sistemi ile tanımlıdır ve Türk Standardları Enstitüsü gibi millî standart kuruluşları tarafından korunur.

Ölçümler tekrarlanıp ortalamaları alındığında, "standart hata" teriminin kullanımı uygundur: ortalamanın kesinliği, işlemin bilinen standart sapması bölü, ortalaması alınan ölçümlerin sayısının kareköküdür. Merkezsel limit teoremine göre, ölçümlerin ortalamalarının olasılık dağılımı, bireysel ölçümlerin dağılımdan daha çok bir normal dağılıma benzediğini ifade eder.

Doğrulukla ilgili olarak, iki kavramı ayırt etmek gerekir:

Ölçümlerin ortalaması ile referans değer arasındaki fark, yanlılıktır. Kalibrasyon yapabilmek için yanlılık ölçülmeli ve düzeltilmelidir.
Yanlılık ile kesinliliğin birleşik etkisi

Bilim ve mühendislikte yaygın bir konvansiyon, doruluk ve/veya kesinliği anlamlı rakamlar kullanarak örtük şekilde ifade etmektir. Burada, eğer kesinlik, belirtik (net) bir şekilde ifade edilmemişse, hata payı son anlamlı basamağın yarısı olarak anlaşılır. Örneğin, 843,6 m veya 843,0 m veya 800,0 m olarak kaydedilmiş bir ölçüm, 0.05 m'lik bir hata payı olduğunu ima eder (son anlamlı basamak onda birler basamağıdır), buna karşın 8.436 m olarak kaydedilen bir ölçümde hata payı 0.5 m'dir, çğnkü son anlamlı basamak bir basamağıdır.

8,000 m olarak kaydedilmiş bir ölçüm, sonunda sıfırlar varsa ama ondalık ayracı yoksa, belirsizdir; sondaki sıfırlar anlamlı basamaklar olarak belirtilmiş olabilir veya olmayabilir. Bu belirsizlikten kaçınmak için ölçüm bilimsel notasyon ile gösterilebilir: 8.0 × 10³ m ilk sıfırın anlamlı olduğunu (dolayıyla 50 m'lik bir hata payı vardır), buna karşın 8.000 × 10³ m her üç sıfırın da anlamlı olduğunu belli eder ve hata payı dolayısıyla 0.5 m olur. Benzer şekilde, temel birimin bir katı kullanılabilir: 8.0 km, 8.0 × 10³ m'ye karşılık gelir ve 0.05 km (50 m)'lik bir hata payı olduğu anlaşılır. Ancak bu konvansiyona güvenmek sahte kesinlik hatalarına yol açabilir, eğer bu konvansiyonu kullanmayan kaynaklardan veri elde ediliyorsa.

Bu konuya başka bir şekilde bakarsak, 8 değeri, bu ölçümün 1'lik bir kesinlikle yapıldığı anlamına gelir (ölçüm cihazı sadece 1'ler basamağına kadar ölçebilmiştir), buna karşın 8,0'lık bir değer (matematiksel olarak 8'e eşit olsa dahi), ilk ondalık basamağın da ölçüldüğü ve değerinin sıfır olduğu anlamını taşır. İkinci değer daha kesindir. Bu değerlerin ikisi de doğru olmayabilir (gerçek değer 9,5 olabilir ve her iki seferinde de 8 olarak ölçülmüş olabilir). Yani, doğruluk, ölçümün gerçeğe yakınlığına karşılık gelir, kesinlik ise küşük farklılıkları ayrıştırabilme gücünü ifade eder.

Kesinlik bazen ikiye ayrıştırılır:

Tekrarlanabilirlik — aynı araç ve aynı ölçücü kişiyi muhafaza edip kısa bir zaman aralığında ölçümleri tekrar edilmesine rağmen meydana gelen varyasyonlar.
Yinelenebilirlik — farklı araçlar ve ölçen kişiler kullanılınca ve ölçümle ruzun zaman aralıkları içinde yapılınca meydana gelen varyasyonlar.

İkili sınıflandırmada doğruluk ve kesinlik

Doğruluk ayrıca, ikili bir sınıflandırma yönteminin bir şartı doğru olarak tanımladığı ve dışladığını gösteren bir istatistik değerdir.

		Şart (örn., hastalık) Altın standarda göre belirlenmiş
		Doğru	Yanlış
Test Sonucu	Positif	Gerçek positif	Yanlış positif	→ Positif yordama değer
Test Sonucu	Negatif	Sahte negatif	Gerçek negatif	→ Negatif yordama değeri
		↓ Duyarlılık	↓ Özgüllük	Doğruluk

Yani, doğruluk, doğru sonuçların (hem doğru pozitifler ve doğru negatifleri) genel popülasyona oranıdır. Testin bir parametresidir.

{\text{dogruluk}}={\frac {{\text{gercek pozitiflerin sayısı}}+{\text{gercek negatiflerin sayısı}}}{{\text{gercek pozitiflerin sayisi}}+{\text{sahte pozitifler}}+{\text{sahte negatifler}}+{\text{gercek negatifler}}}}

Buna karşın, kesinlik, gerçek pozitiflerin tüm pozitif sonuçlara (hem gerçek pozitif hem sahte pozitifler) oranı olarak tanımlanır.

{\text{presisyon}}={\frac {\text{gercek pozitiflerin sayisi}}{{\text{gercek pozitifler sayisi}}+{\text{sahte pozitifler}}}}

%100'lük bir kesinlik, ölçülen değerlerin gerçek değerlerin tam aynısı olduğu anlamına gelir.

Ayrıca bakınız duyarlılık ve özgüllük

Eğer prevalans (yaygınlık) biliniyorsa kesinliği hesaplamak için duyarlılık ve özgüllük kullanılabilir, şu denklem ile:

{\text{kesinlik}}=({\text{duyarlılık}})({\text{yaygınlık}})+({\text{özgüllük}})(1-{\text{yaygınlık}})

yordama çözümleme (predictive analytics) için doğruluk paradoksu, belli bir doğruluk seviyesine sahip yordama modellerinin yordama gücü (prediktif gücü), daha yüksek doğruluğa sahip modellerinkinden daha yüksek olabilir. Doğruluk ölçütünden kaçınıp, kesinlik ve geriçağırım gibi başka ölçütler kullanılması daha avantajlı olabilir.

Psikometi ve psikofizikde doğruluk ve kesinlik

Psikometri ve psikofizikte, kesinlik terimi ile geçerlilik ve sabit hata terimleri birbiri yerine kullanılır. Kesinlik ise güvenilirlik ve değişken hata ile eşanlamlıdır. Bir ölçme aracının veya bir psikolojik testin geçerliliği deney veya davranışlarla bağıntı yoluyla belirlenir. Güvenilirlik, çeşitli istatistiksel yöntemlele (klasik Cronbach'in alfa testi gibi dahili tutarlılık testi aracılıyla), ilişkili soruların cevaplarının da ilişkili olduğunu göstererek kanıtlanır, sonra referans ve hedef topluluklar karşılaştırılır.

Mantıksal benzetmede doğruluk ve kesinlik

Mantık benzetiminde (simülasyonunda), doğru modellerin değerlendirilmesinde sık yapılan bir hata, bir mantık benzetim modelini bir transistör devre benzetim modeli ile karşılaştırmaktır. Oysa bu bir kesinlik değil, doğruluk karşılaştırmasıdır. Kesinlik, ayrıntılara göre ölçülür, doğruluk ise gerçeğe göre ölçülür.^[2]^[3]

Ayrıca bakınız

Kaynakça

^ John Robert Taylor (1999). An Introduction to Error Analysis: The Study of Uncertainties in Physical Measurements. University Science Books. ss. 128-129. ISBN 093570275X. 7 Ocak 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 3 Haziran 2010.
^ John M. Acken, Encyclopedia of Computer Science and Technology, Vol 36, 1997, page 281-306
^ 1990 Workshop on Logic-Level Modelling for ASICS, Mark Glasser, Rob Mathews, and John M. Acken, SIGDA Newsletter, Vol 20. Number 1, June 1990

Dış bağlantılar

BIPM - Guides in metrology 10 Ekim 2008 tarihinde Wayback Machine sitesinde arşivlendi. - Ölçme belirsizliğini belirtme kılavuzu ve uluslararası metroloji dağarcığı (İngilizce)
Üç psikofizik yöntemde doğruluk ve kesinlik 11 Haziran 2009 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce)
NIST ölçüm sonuçlarında belirsizliğin belirlenmesi ve ifadesi. Ek D.1: Terminoloji 30 Eylül 2009 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce)
Doğruluk ve kesinlik 26 Kasım 2009 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce)

[Taylor-1] John Robert Taylor (1999). An Introduction to Error Analysis: The Study of Uncertainties in Physical Measurements. University Science Books. ss. 128-129. ISBN 093570275X. 7 Ocak 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 3 Haziran 2010.

[2] John M. Acken, Encyclopedia of Computer Science and Technology, Vol 36, 1997, page 281-306

[3] 1990 Workshop on Logic-Level Modelling for ASICS, Mark Glasser, Rob Mathews, and John M. Acken, SIGDA Newsletter, Vol 20. Number 1, June 1990

[1]

[2]

[3]