Verilerinin güvenirliklerinin incelenmesinde en
fazla kullanılan iki terim, "kesinlik" ve "doğruluktur"
tur.
Kesinlik: Kesinlik, sonuçların
üretilebilirliğini tarif eder; yani, "tam olarak aynı şekilde"
yapılan iki veya daha çok sayıdaki ölçmelerin sayısal değerleri arasındaki
uyumdur. Bir seri verinin duyarlığını tarif etmek için birkaç yöntem vardır.
Bunlardan biri, değerin ortalamadan (veya aritmetik ortalamadan) olan
sapmasıdır. Tekrarlanan n tane ölçmenin ortalaması x, her ölçme için
alınan verilerin toplamının n ye bölünmesiyle bulunur. Tek bir xi
verisinin ortalamadan mutlak sapması (xi - x) olur.
Ortalamadan rölatif sapma ise mutlak sapma ve ortalamanın oranına eşittir;
yani, (xi - x) / x . Bu ifade % ile veya ppt (binde
kısım) olarak verilir.
Bir seri verinin "yayılması" veya
"aralığı" (w), en yüksek ve en düşük sonuçlar arasındaki sayısal
farktır ve duyarlığın ölçülerinden biridir. Kesinliğin en önemli ve yararlı
ölçüleri, verilerin "standart sapması" ve "tutarsızlığı"
dır. Bu terimler daha sonraki kısımlarda açıklanmıştır.
Doğruluk: Doğruluk, bir ölçüm değerinin, gerçek
veya kabul edilmiş olan xt
değerine olan yakınlığıdır. Ölçülen değerdeki "Mutlak hata" xi
, (xi - xt) ile verilir. Ortalamadan ve hatadan sapmada
(+) elde edilmesi, ölçülen değerin referans değerden büyük olduğunu gösterir.
Bir sonucun relatif hatası (xi –xt)/xt eşitliği ile verilir.
Bir ölçümün doğruluğu, şüphesiz, onun
güvenirliliğinin tek doğru kriteridir. Ne yazık ki, doğruluk hiçbir zaman kesin
olarak saptanamaz, çünkü böyle bir tayin için tam doğru değerlere gereksinim
vardır. Bu nedenle, verilerin doğruluğu sadece tahmin edilebilir; bu tahmin,
geçmişteki tecrübelere, standart örneklerin analizlerine, bilimsel literatüre,
ve genel algılamalara dayanır.
Bir ölçümün duyarlığı çoğu kez, onun
doğruluğunun güvenilir bir ölçüsü olamaz, çünkü birden daha çok sayıda hata tip
bulunur.
Ölçüm kararsızlıkları iki geniş gruba girer:
"kesin (determinant)" veya "sistematik hatalar" ve
"belirsiz (indeterminant)" veya "rasgele hatalar". Bazı
durumlarda bir hatanın hangi sınıfa girdiğine karar vermek zor veya
olanaksızdır; yine de bu kavram yararlıdır.
Kesin
Sistematik Hatalar: Kesin hatalar, belirli bir değeri olan ve tayin
edilebilen bir nedendir; temelde (fakat pratikte daima yapılamaz), denemeci bu
hataları ölçebilir, hesaplayabilir, ve düzeltebilir. Kesin kararsızlıkların
önemli bir kaynağı "enstrümental hatalar" dır. Örneğin, bataryayla
çalışan güç kaynaklarında voltaj düşmesi, elektrik bağlantılarının
oksitlenmesiyle devre dirençlerindeki yükselmeler, dedektörlerde sıcaklığın
etkileri, gösterge konumlarındaki titreşimler, ve 110 V'luk güç hatlarından
elektronik cihazlarda tesirle oluşan akımlar, gibi. Bu hatalar çoğu zaman
saptanabilir ve kalibrasyonla düzeltilebilir.
"Yöntem hataları", bir analizin
reaktifleri ve reaksiyonlarının ideal olmayan kimyasal ve fiziksel
davranışlarından ileri gelir. Olası kaynaklar, kimyasal reaksiyonların
yavaşlatılması, reaktiflerin kararsızlıkları ve safsızlıkları, ve kimyasal
girişimlerdir. Yöntem hatalarını saptamak ve düzeltmek, enstrümental hatalardan
daha zordur.
Bir ölçümdeki "personel hataları",
ölçmeyi yapan kişiden kaynaklanır. Bir metre ibresinin konumunu tam olarak
belirleyememe, verileri kaydederken sayıları karıştırma, dikkatsizlik ve peşin
hükümlülük, bu tip hatalara bazı örneklerdir. Bunlardan peşin hükümlülük pek
çok kişide görülen bir hata kaynağıdır.
Enstrümantal
Ölçümlerdeki Belirsiz (Rasgele) Hatalar: Adından da anlaşıldığı gibi belirsiz hatalar, deneyi yapan
tarafından bilinmeyen ve kontrol edilemeyen kaynakların bir ölçümde neden
olduğu kararsızlıklardan çıkar. Belirsiz
hatalar daha çok, cihazların okuma aletinde küçük, rasgele dalgalanmalar
(gürültü) şeklinde görülür. Bu küçük fakat saptanabilir değişiklikler, cihazın
ve çalışılan sistemin çeşitli kısımlarında çok sayıda kararsızlıkların
toplandığını gösterir. Bu kararsızlıklar tek tek belirlenemezler, bunların
sadece toplam etkileri gürültü olarak tanımlanabilir.
Belirsiz hataların karakteristik bir etkisi
rasgele oluşudur. Bazı hallerde kararsızlıkların her biri, tesadüfen, pozitif
bir yönde olabilir; bu durumda net etki okuma aletinde normalden daha büyük
pozitif bir sapmaya yol açar. Bazı hallerde ise sinyaller büyük negatif
değerler verebilir; böyle bir durumda ortalama net sinyalden daha küçük bir
sinyal alınır. En büyük olasılık, yine de, negatif ve pozitif gürültü
sinyallerinin sayı ve büyüklük olarak birbirine yakın olmasıdır, böylece
ortalama değere yaklaşan bir okuma elde edilir. Belirsiz hataların rasgele
davranışı, etkilerinin istatistik yöntemlerle incelenmesini gerektirir.
Çok sayıda tekrarlanan gözlemler için
toplanan kararsızlıklar rasgele gürültüyü oluşturarak, Şekil-1’de görüldüğü
gibi, sonuçların simetrik olarak dağılmasına neden olurlar. Bu dağılma eğrisine
"Gaussian" veya "normal" eğri denir ve ortalamadan sapmaya
olan sıklığı gösterir.
xi = her bir ölçmenin değeri, m = sonsuz sayıdaki ölçmelerin aritmetik ortalaması, (xi -m) = ortalamadan sapma, y = her bir (xi -m) değerinin oluşma sıklığı (frekansı), e = tabii logaritma tabanı, s = standart sapma (herhangi bir seri veri için sabittir)
Normal hata eğrisinin "genişliği"
bir ölçmenin hassasiyeti azaldıkça artar ve s
ile doğrudan ilişkilidir. Bu nedenle s,
cihazların duyarlığını tarif etmekte kullanılır.
Denklemdeki eksponensiyal terim z
değişkeniyle basitleştirilir; bu eşitlik, standart sapma birimleriyle
ortalamadan sapmayı verir.
z
= xi m / s
Standart Sapma: Yukarıdaki eşitlik, her bir standart
sapma değeri için tek bir dağılım eğrisi olduğunu gösterir. s’nın
büyüklüğüne bağlı olmaksızın, eğrinin altındaki alanın sadece % 68.3’ünün
standart sapması (±1s) içine düşer (Şekil-1’deki gölgeli bölge).
Yani, tekrarlanan ölçmelerden alınan sonuçların % 68,3’ünün bu sınırlar içinde
olması beklenir. Tüm değerlerin yaklaşık %95.5’ğu ±2s, %99.7
si ±3s
içinde olmalıdır. ±1s, ±2s, ve ±3s’ya göre hesaplanan (xi - m) değerleri, Şekil-1’de noktalı dik çizgilerle gösterilmiştir.
Bir normal hata eğrisinin bu özellikleri
faydalıdır, çünkü "ölçüm yönteminin standart hatası biliniyorsa"
herhangi bir ölçmedeki belirsiz hatanın olası büyüklüğü hakkında yorum
yapılabilir. Buna göre, eğer s
bilinirse, herhangi bir ölçümün belirsiz hatasının ±1s'dan küçük olma şansı %68.3, ±2s’dan küçük olma %95.5, v.s., ‘dir. Bir ölçüm yöntemi için
standart sapma, belirsiz hataların olası büyüklüğünü tahmin etmek ve kaydetmek
bakımından önemli bir değerdir.
Sonsuz sayıdaki veriler için standart sapma
aşağıdaki eşitlikle tarif edilir.
Burada, ortalamadan olan her bir sapmanın (xİ -m) kareleri toplamı, toplam ölçüm sayısına (N) bölünmüştür. Kare kök içinin çözümü s’yı verir.
İstatistikçilerin çok kullandığı diğer bir
kesinlik terimi de "tutarsızlık (değişme) veya varyans"dır ve s2’'ye eşittir. Deneysel çalışma
yapan bilim adamları s2
yerine s’yı kullanmayı tercih ederler, çünkü standart sapmanın birimi
ölçülen miktarın birimi ile aynıdır. Diğer taraftan tutarsızlığın, toplanabilir
özellikte olması gibi bir avantajı vardır, yani, bir sistemde bağımsız birkaç
tutarsızlık nedeni varsa toplam tutarsızlık, s2T,
her bir tutarsızlığın toplamına eşittir.
Şekil-1: Bir normal veya Gaussian
dağılım eğrisi
Ortalamanın Standart Sapması: Daha önce de belirtildiği gibi standart
sapma herhangi bir tek gözlemin gerçek ortalamaya göre hangi aralıklarda
bulunabileceği konusunda bilgi verir. Bir kaç gözlemin ortalamasıyla, tek bir
gözlemde olduğundan daha güvenilir bir ortalama elde edilir; bu demektir ki,
bir ortalamanın standart sapması tek bir gözlemin standart sapmasından daha
küçüktür. Bir ortalamanın standart sapması "standart hata" dır; n
gözlemin standart sapması, sm,
Az Sayıdaki Veriler İçin Standart Sapma:
Denklemlerine
dayanan klasik istatistiklerin az sayıda tekrarlanan ölçümlere doğrudan
uygulanmasının, belirsiz hatanın olası büyüklüğünü saptamada yanlışlıklara
neden olduğu görülmüştür. Ancak bağıntılar geliştirilerek iki veya üç değer
gibi çok az sayıdaki değerde karşılaşılan rasgele hata hakkında yorumlar
yapılabilmektedir.
Bir ölçümün gerçek ortalama değeri (m) bir sabittir ve daima bilinmeyen bir değerdir.
İstatistik teorinin yardımıyla, deneysel olarak saptanan ortalama (x)
dolayında, belirtilen bir olasılıkla gerçek ortalamanın bulunabileceği sınırlar
konulabilir; bu şekilde elde edilen sınırlara "güvenilirlik
sınırları", bu sınırların belirlediği aralığa da "güvenilirlik
aralığı" denir. Güvenilirlik aralığının bazı özellikleri çok önemlidir.
Verilen bir seri veri için, aralığın büyüklüğü, kısmen, istenilen düzeltmenin
lehine olacak şekilde saptanır. Önceden tam doğruyu bulmak için ortalamadan, xi’nin
alabileceği tüm değerleri içerecek kadar geniş bir aralık seçilir. Böyle bir
aralık, şüphesiz, gerçek bir değer değildir. Diğer taraftan, eğer %99 olasılık
kabul edilecekse aralığın bu kadar geniş olmasına gerek yoktur; hatta %95’lik
olasılığın kabul edilmesi durumunda daha da küçük olabilir. Kısacası, önceden
tam doğru tahminin çok da önemli olmadığı durumlarda, güvenilirlik seviyesinin
belirlediği aralık daha küçük olur.
Ölçümün yapıldığı yöntem için olan standart
sapmadan (s) güvenilirlik aralığı bulunur; Büyüklüğü, s'nin kararlılığına
bağlıdır; s'nin deneysel sonuçlarının, s'nın
yaklaştırması olduğun görülmüştür. Diğer durumlarda ise s'de önemli derecede
kararsızlık bulunabilir. Böyle koşullarda güvenilirlik aralığı çok genişler.
İyi
Bir s Yaklaştırması İçin Yöntemler: Hesaplanan s değerlerindeki dalgalanmalar,
eşitliğindeki ölçüm sayısı N arttıkça azalır;
gerçekte, N>20 olduğunda, tüm pratik uygulamalarda s ve s'nın aynı olduğu kabul edilebilir. Böyle bir
durumda, ölçüm yönteminin çok zaman alıcı bir yöntem olmaması ve yeterli
miktarda örnek bulunması halinde s'nın
iyi bir yaklaştırması elde edilebilir. Örneğin, bir çalışmada çok sayıda
çözeltinin pH'ı ölçülsün; bir seri ön denemelerle s bulunabilir. Bu özel
ölçümler basittir, sadece test çözeltisine daldırılan yıkanmış ve kurutulmuş
bir çift elektrota gereksinim vardır; elektrotlar arasındaki potansiyel pH'ın
bir göstergesi dir. s'yi tayin etmek için, yöntemin tüm kademeleri tam olarak
uygulanarak, pH'ı sabit bir tampon çözeltinin 20-30 kısmında ölçme yapılır.
Normal olarak, bu testteki belirsiz hata peşpeşe yapılan ölçmelerdeki ile
aynıdır ve eşitlikle hesaplanan s, teorik s
değerinin doğru olarak bulunmasını sağlar.
Zaman-alıcı analizler için bu yöntem pratik
değildir. Böyle bir analizde de bir seri örnekten toplanan hassasiyet verileri,
s'nin hesaplanması için biriktirilir, böylece hesaplanan s değeri tek bir
analizden bulunandan daha sağlıklıdır. Bunun için örnekler arasındaki belirsiz
hata kaynaklarının aynı olduğu kabul edilmelidir. Bu varsayım, örneklerin aynı
konsantrasyonlarda olması ve analizde aynı yöntem ve yolun izlenmesi durumunda
geçerlidir. "Grubun" s değerini hesaplayabilmek için biriktirilen her
bir değerin ortalama değerden farkı saptanır ve karesi alınır; bu kareler
toplanarak uygun bir serbestlik derecesine bölünür. İşlemin yapılmasıyla grup s
elde edilir. Her analiz takımı (yani her bir örnek) için serbestlik derecesi
tekrarlanan ölçüm sayısının 1 eksiğidir. Bu durumda grup s için serbestlik
derecesi sayısı tüm örnekler için elde edilen toplam ölçüm sayısından örnek
sayısı çıkarılarak bulunur.
s Bilinmediğinde Güvenilirlik Sınırları: Zamanın veya örnek miktarının s‘yı doğru olarak saptamada yetersiz olduğu
durumlarda bir kimyacının, çoğu kez, alışılmamış yöntemlere başvurması gerekir.
Bu gibi hallerde, tekrarlanan tek bir ölçüm serisi sadece ortalama değerin
değil, aynı zamanda duyarlığın bulunmasında da kullanılır. Daha önce
belirtildiği gibi, az sayıdaki veriden hesaplanan s kararsız olabilir; bu
nedenle, güvenilirlik sınırları genişletilmelidir.
s'nin potansiyel değişkenliği nedeniyle bir t
parametresi kullanılır; tekrarlanan n ölçümün ortalaması x için
güvenilirlik sınırı:
5. Ölçüm Kararsızlıklarının Çoğalması
Tipik bir enstrümantal analiz yöntemi ile
yapılan birkaç deneysel ölçümün herbiri alınan sonucu etkileyen belirsiz hata
ile karşı karşıyadır. Bu tip belirsiz hataların bir analizin sonucunu nasıl
etkilediğini göstermek için analiz sonucunu x ile ve bağlı olduğu değişkenleri
de p, q, r,..., ile gösterelim; p, q, r,...., rasgele ve bağımsız olarak
dalgalanan değerlerdir. x p, q, r,..., ‘nın bir fonksiyonudur,
x = f (p, q, r,...)
x’ in i'nci ölçümündeki kararsızlık dxi (bu, ortalamadan sapmadır) p, q, r,..., ‘deki
dpi , dqi , dri ,..., kararsızlıklarının
büyüklüğüne ve işaretine bağlıdır. Yani,
dxi = f (dpi , dqi , dri
,...) = f (xi - m)
yazılabilir. p, q, r, ..., deki
kararsızlıkların bir fonksiyonu olarak dx’deki değişiklik,
x = f (p, q, r,...) eşitliğinin diferensiyali alınarak bulunur.
dp, dq, ve dr bağımsız ve rasgele
kararsızlıklarsa çapraz bazı terimler negatif, bazıları pozitiftir. Bu nedenle
özellikle N büyük olduğu zaman, "bu terimlerin tümünün toplamı sıfıra
yaklaşır".
Sonuçların standart sapmalarının bulunmasında
aşağıdaki eşitlik kullanılır.
Analitik yöntemlerin çoğu, bilinen
konsantrasyonlarda analit içeren bir seri standarttan elde edilen kalibrasyon
verilerine dayanır. Verilerle, Şekil-2'de görüldüğü gibi, bir kalibrasyon
eğrisi çizilir. Böyle tipik grafikler düz bir doğruya çok yakın olur; nadiren
de olsa, ölçme işlemindeki belirsiz
hatalar nedeniyle verilerin tümünün tam doğru üzerine düştüğü de görülür. Bu
nedenle araştırmacı, noktalar arasından en iyi doğruyu geçirmeye çalışmalıdır.
İstatistikte böyle bir doğrunun elde edilmesi ve aynı zamanda kararsızlıkların
saptanması yöntemleri vardır. İstatistikçiler bu tekniğe "gerileme (geri
çekilme) analizi derler. Burada sadece en basit gerileme işlemi olan ve
"en küçük kareler yöntemi" ile yapılan "doğrusal gerileme"
anlatılacaktır.
Kabuller
(Varsayımlar): Bir kalibrasyon eğrisinin çıkarılması için en küçük kareler
yönteminin uygulanmasında iki kabul yapılır. Birincisi, analit konsantrasyonu
ile ölçülen değişken arasında doğrusal bir ilişki olmasıdır. İkinci kabul,
standartların bileşiminde önemli derecede hatalar yoktur, yani standartların
konsantrasyonlarının tam olarak bilindiği kabul edilir.
Bu durumda, Şekil-2'de noktaların doğru
çizgiden sapması, tamamıyla y ‘deki belirsiz hatadan ileri gelir (y
kromatografik piklerin alanıdır). Bu kabullerin her ikisi de pek çok analitik
kalibrasyona uygundur.
Şekil-2: Hidrokarbon karışımları
içinde izo-oktan tayini için kalibrasyon eğrisi (pik alanı istenilen
birimde olabilir)
En Küçük-Kareler
Doğrusunun Çıkarılması: Ölçülen veya bağımlı değişken y ile bağımsız
değişken analit konsantrasyonu x arasındaki kabul edilen doğrusal ilişki
aşağıdaki eşitlikle tanımlanır:
y = m x + b
b, x = 0 olduğunda y’nin değeri (y eksenini
kesen değer) doğrunun eğimidir. En küçük
kareler yöntemi b ve m'nin değerlerindeki standart sapmaların bulunmasına
olanak verdiği gibi bu değerlerin saptanmasını da sağlar.
En küçük kareler yöntemi, her bir noktanın
doğru çizgiden saptanmasının (y ekseninde) kareleri Qi'nin en küçük olduğu
haldeki doğru hattı bulma yöntemidir. Qi,
Qi = (yi
- y)2 = (yi – m xi - b)2
eşitliği ile tarif edilir. i çeşitli nokta
çiftlerini gösterir. Şekil-2'deki sapma (kalıntı), deneysel verilerin en
küçük-kareler hattından olan "dikey" kaymaları (yer değiştirmeleri)
gösterir.
Bir en küçük-kareler analizi için gerekli
matematik denklemler çıkarılabilir, ancak bu konudaki literatürlerden gerekli
denklemleri bulup uygulamak daha kolay ve tercih edilen bir yoldur.
Kolaylık bakımından üç miktarı tarif
edebiliriz, bunlar Sxx, Syy, ve Sxy dir.
Sxx = S (xi
- x)2 = S xi2 - (S xi)2/n
Syy = S (yi
- y)2 = S yi2 - (S yi)2 /n
Sxy = S (xi
- x) (yi -y) = S xi yi - S xi
yi /n
Burada xi ve yi, en
küçük-kareler hattını tarif eden x ve y veri çiftlerini gösterir. n,
Kalibrasyon eğrisinin çizilmesinde kullanılan veri çifteri sayısı, x ve y
de sapmaların ortalama değerleridir.
Yani,
S xi S yi
x = ¾¾ y = ¾¾
n n
Sxx ve Syy, her bir x
ve y için olan ortalamadan sapmaların kareleri toplamıdır. Hesaplamalar, eşitliklerin sağ tarafındaki ifadeler
kullanılarak basitleştirilir.
Sxx ve Syy ve Sxy’den
bu kalibrasyon eğrisine dayanan bir analiz için beş tane yararlı miktar
çıkarılır; bunlar:
b = kesişim, m = eğim, sm; = m
'deki standart sapma, sr; = regresyon standart sapma, sc.
= standart sapma,
regresyon standart sapma, sr, sapmaların y'nin ortalamasından değil de doğru hattan ölçüldüğü zaman y deki sapmadır. Yani,