Prof. Dr. Bilsen Beşergil: Ölçmelerde Kararsızlıklar

Fiziksel ölçmelerden elde edilen veriler daima bazı kararsızlıklar veya hatalar içerir. Deneysel sonuçların bir anlam taşıması bu kararsızlıkların büyüklüğünün yaklaşık olarak bilinmesine bağlıdır. Verilerin kalitesini değerlendirme çalışmaları, çoğu kez, elde edilmelerinde uygulanan yöntemlere benzer. Uzman, bir ölçmenin olası doğruluğuna sadece "karar" verebilir; tecrübeye dayanan bu tip kararlar fazla duyar olamaz.

1. Kesinlik ve Doğruluk

Verilerinin güvenirliklerinin incelenmesinde en fazla kullanılan iki terim, "kesinlik" ve "doğruluktur" tur.

Kesinlik: Kesinlik, sonuçların üretilebilirliğini tarif eder; yani, "tam olarak aynı şekilde" yapılan iki veya daha çok sayıdaki ölçmelerin sayısal değerleri arasındaki uyumdur. Bir seri verinin duyarlığını tarif etmek için birkaç yöntem vardır. Bunlardan biri, değerin ortalamadan (veya aritmetik ortalamadan) olan sapmasıdır. Tekrarlanan n tane ölçmenin ortalaması x, her ölçme için alınan verilerin toplamının n ye bölünmesiyle bulunur. Tek bir x_i verisinin ortalamadan mutlak sapması (x_i - x) olur. Ortalamadan rölatif sapma ise mutlak sapma ve ortalamanın oranına eşittir; yani, (x_i - x) / x . Bu ifade % ile veya ppt (binde kısım) olarak verilir.

Bir seri verinin "yayılması" veya "aralığı" (w), en yüksek ve en düşük sonuçlar arasındaki sayısal farktır ve duyarlığın ölçülerinden biridir. Kesinliğin en önemli ve yararlı ölçüleri, verilerin "standart sapması" ve "tutarsızlığı" dır. Bu terimler daha sonraki kısımlarda açıklanmıştır.

Doğruluk: Doğruluk, bir ölçüm değerinin, gerçek veya kabul edilmiş olan x_t değerine olan yakınlığıdır. Ölçülen değerdeki "Mutlak hata" x_i , (x_i - x_t) ile verilir. Ortalamadan ve hatadan sapmada (+) elde edilmesi, ölçülen değerin referans değerden büyük olduğunu gösterir. Bir sonucun relatif hatası (x_i –x_t)/x_t eşitliği ile verilir.

Bir ölçümün doğruluğu, şüphesiz, onun güvenirliliğinin tek doğru kriteridir. Ne yazık ki, doğruluk hiçbir zaman kesin olarak saptanamaz, çünkü böyle bir tayin için tam doğru değerlere gereksinim vardır. Bu nedenle, verilerin doğruluğu sadece tahmin edilebilir; bu tahmin, geçmişteki tecrübelere, standart örneklerin analizlerine, bilimsel literatüre, ve genel algılamalara dayanır.

Bir ölçümün duyarlığı çoğu kez, onun doğruluğunun güvenilir bir ölçüsü olamaz, çünkü birden daha çok sayıda hata tip bulunur.

2. Hata Tipleri

Ölçüm kararsızlıkları iki geniş gruba girer: "kesin (determinant)" veya "sistematik hatalar" ve "belirsiz (indeterminant)" veya "rasgele hatalar". Bazı durumlarda bir hatanın hangi sınıfa girdiğine karar vermek zor veya olanaksızdır; yine de bu kavram yararlıdır.

Kesin Sistematik Hatalar: Kesin hatalar, belirli bir değeri olan ve tayin edilebilen bir nedendir; temelde (fakat pratikte daima yapılamaz), denemeci bu hataları ölçebilir, hesaplayabilir, ve düzeltebilir. Kesin kararsızlıkların önemli bir kaynağı "enstrümental hatalar" dır. Örneğin, bataryayla çalışan güç kaynaklarında voltaj düşmesi, elektrik bağlantılarının oksitlenmesiyle devre dirençlerindeki yükselmeler, dedektörlerde sıcaklığın etkileri, gösterge konumlarındaki titreşimler, ve 110 V'luk güç hatlarından elektronik cihazlarda tesirle oluşan akımlar, gibi. Bu hatalar çoğu zaman saptanabilir ve kalibrasyonla düzeltilebilir.

"Yöntem hataları", bir analizin reaktifleri ve reaksiyonlarının ideal olmayan kimyasal ve fiziksel davranışlarından ileri gelir. Olası kaynaklar, kimyasal reaksiyonların yavaşlatılması, reaktiflerin kararsızlıkları ve safsızlıkları, ve kimyasal girişimlerdir. Yöntem hatalarını saptamak ve düzeltmek, enstrümental hatalardan daha zordur.

Bir ölçümdeki "personel hataları", ölçmeyi yapan kişiden kaynaklanır. Bir metre ibresinin konumunu tam olarak belirleyememe, verileri kaydederken sayıları karıştırma, dikkatsizlik ve peşin hükümlülük, bu tip hatalara bazı örneklerdir. Bunlardan peşin hükümlülük pek çok kişide görülen bir hata kaynağıdır.

Enstrümantal Ölçümlerdeki Belirsiz (Rasgele) Hatalar: Adından da anlaşıldığı gibi belirsiz hatalar, deneyi yapan tarafından bilinmeyen ve kontrol edilemeyen kaynakların bir ölçümde neden olduğu kararsızlıklardan çıkar. Belirsiz hatalar daha çok, cihazların okuma aletinde küçük, rasgele dalgalanmalar (gürültü) şeklinde görülür. Bu küçük fakat saptanabilir değişiklikler, cihazın ve çalışılan sistemin çeşitli kısımlarında çok sayıda kararsızlıkların toplandığını gösterir. Bu kararsızlıklar tek tek belirlenemezler, bunların sadece toplam etkileri gürültü olarak tanımlanabilir.

Belirsiz hataların karakteristik bir etkisi rasgele oluşudur. Bazı hallerde kararsızlıkların her biri, tesadüfen, pozitif bir yönde olabilir; bu durumda net etki okuma aletinde normalden daha büyük pozitif bir sapmaya yol açar. Bazı hallerde ise sinyaller büyük negatif değerler verebilir; böyle bir durumda ortalama net sinyalden daha küçük bir sinyal alınır. En büyük olasılık, yine de, negatif ve pozitif gürültü sinyallerinin sayı ve büyüklük olarak birbirine yakın olmasıdır, böylece ortalama değere yaklaşan bir okuma elde edilir. Belirsiz hataların rasgele davranışı, etkilerinin istatistik yöntemlerle incelenmesini gerektirir.

3. Belirsiz Hataların Dağılımı

Çok sayıda tekrarlanan gözlemler için toplanan kararsızlıklar rasgele gürültüyü oluşturarak, Şekil-1’de görüldüğü gibi, sonuçların simetrik olarak dağılmasına neden olurlar. Bu dağılma eğrisine "Gaussian" veya "normal" eğri denir ve ortalamadan sapmaya olan sıklığı gösterir.

x_i = her bir ölçmenin değeri, m = sonsuz sayıdaki ölçmelerin aritmetik ortalaması, (x_i -m) = ortalamadan sapma, y = her bir (x_i -m) değerinin oluşma sıklığı (frekansı), e = tabii logaritma tabanı, s = standart sapma (herhangi bir seri veri için sabittir)

Normal hata eğrisinin "genişliği" bir ölçmenin hassasiyeti azaldıkça artar ve s ile doğrudan ilişkilidir. Bu nedenle s, cihazların duyarlığını tarif etmekte kullanılır.

Denklemdeki eksponensiyal terim z değişkeniyle basitleştirilir; bu eşitlik, standart sapma birimleriyle ortalamadan sapmayı verir.

z = x_i m / s

Standart Sapma: Yukarıdaki eşitlik, her bir standart sapma değeri için tek bir dağılım eğrisi olduğunu gösterir. s’nın büyüklüğüne bağlı olmaksızın, eğrinin altındaki alanın sadece % 68.3’ünün standart sapması (±1s) içine düşer (Şekil-1’deki gölgeli bölge). Yani, tekrarlanan ölçmelerden alınan sonuçların % 68,3’ünün bu sınırlar içinde olması beklenir. Tüm değerlerin yaklaşık %95.5’ğu ±2s, %99.7 si ±3s içinde olmalıdır. ±1s, ±2s, ve ±3s’ya göre hesaplanan (x_i - m) değerleri, Şekil-1’de noktalı dik çizgilerle gösterilmiştir.

Bir normal hata eğrisinin bu özellikleri faydalıdır, çünkü "ölçüm yönteminin standart hatası biliniyorsa" herhangi bir ölçmedeki belirsiz hatanın olası büyüklüğü hakkında yorum yapılabilir. Buna göre, eğer s bilinirse, herhangi bir ölçümün belirsiz hatasının ±1s'dan küçük olma şansı %68.3, ±2s’dan küçük olma %95.5, v.s., ‘dir. Bir ölçüm yöntemi için standart sapma, belirsiz hataların olası büyüklüğünü tahmin etmek ve kaydetmek bakımından önemli bir değerdir.

Sonsuz sayıdaki veriler için standart sapma aşağıdaki eşitlikle tarif edilir.

Burada, ortalamadan olan her bir sapmanın (x_İ -m) kareleri toplamı, toplam ölçüm sayısına (N) bölünmüştür. Kare kök içinin çözümü s’yı verir.

İstatistikçilerin çok kullandığı diğer bir kesinlik terimi de "tutarsızlık (değişme) veya varyans"dır ve s²’'ye eşittir. Deneysel çalışma yapan bilim adamları s² yerine s’yı kullanmayı tercih ederler, çünkü standart sapmanın birimi ölçülen miktarın birimi ile aynıdır. Diğer taraftan tutarsızlığın, toplanabilir özellikte olması gibi bir avantajı vardır, yani, bir sistemde bağımsız birkaç tutarsızlık nedeni varsa toplam tutarsızlık, s²_T, her bir tutarsızlığın toplamına eşittir.

Şekil-1: Bir normal veya Gaussian dağılım eğrisi

Ortalamanın Standart Sapması: Daha önce de belirtildiği gibi standart sapma herhangi bir tek gözlemin gerçek ortalamaya göre hangi aralıklarda bulunabileceği konusunda bilgi verir. Bir kaç gözlemin ortalamasıyla, tek bir gözlemde olduğundan daha güvenilir bir ortalama elde edilir; bu demektir ki, bir ortalamanın standart sapması tek bir gözlemin standart sapmasından daha küçüktür. Bir ortalamanın standart sapması "standart hata" dır; n gözlemin standart sapması, s_m,

Az Sayıdaki Veriler İçin Standart Sapma:

Denklemlerine dayanan klasik istatistiklerin az sayıda tekrarlanan ölçümlere doğrudan uygulanmasının, belirsiz hatanın olası büyüklüğünü saptamada yanlışlıklara neden olduğu görülmüştür. Ancak bağıntılar geliştirilerek iki veya üç değer gibi çok az sayıdaki değerde karşılaşılan rasgele hata hakkında yorumlar yapılabilmektedir.

4. Güvenilirlik Aralıkları

Bir ölçümün gerçek ortalama değeri (m) bir sabittir ve daima bilinmeyen bir değerdir. İstatistik teorinin yardımıyla, deneysel olarak saptanan ortalama (x) dolayında, belirtilen bir olasılıkla gerçek ortalamanın bulunabileceği sınırlar konulabilir; bu şekilde elde edilen sınırlara "güvenilirlik sınırları", bu sınırların belirlediği aralığa da "güvenilirlik aralığı" denir. Güvenilirlik aralığının bazı özellikleri çok önemlidir. Verilen bir seri veri için, aralığın büyüklüğü, kısmen, istenilen düzeltmenin lehine olacak şekilde saptanır. Önceden tam doğruyu bulmak için ortalamadan, x_i’nin alabileceği tüm değerleri içerecek kadar geniş bir aralık seçilir. Böyle bir aralık, şüphesiz, gerçek bir değer değildir. Diğer taraftan, eğer %99 olasılık kabul edilecekse aralığın bu kadar geniş olmasına gerek yoktur; hatta %95’lik olasılığın kabul edilmesi durumunda daha da küçük olabilir. Kısacası, önceden tam doğru tahminin çok da önemli olmadığı durumlarda, güvenilirlik seviyesinin belirlediği aralık daha küçük olur.

Ölçümün yapıldığı yöntem için olan standart sapmadan (s) güvenilirlik aralığı bulunur; Büyüklüğü, s'nin kararlılığına bağlıdır; s'nin deneysel sonuçlarının, s'nın yaklaştırması olduğun görülmüştür. Diğer durumlarda ise s'de önemli derecede kararsızlık bulunabilir. Böyle koşullarda güvenilirlik aralığı çok genişler.

İyi Bir s Yaklaştırması İçin Yöntemler: Hesaplanan s değerlerindeki dalgalanmalar,

eşitliğindeki ölçüm sayısı N arttıkça azalır; gerçekte, N>20 olduğunda, tüm pratik uygulamalarda s ve s'nın aynı olduğu kabul edilebilir. Böyle bir durumda, ölçüm yönteminin çok zaman alıcı bir yöntem olmaması ve yeterli miktarda örnek bulunması halinde s'nın iyi bir yaklaştırması elde edilebilir. Örneğin, bir çalışmada çok sayıda çözeltinin pH'ı ölçülsün; bir seri ön denemelerle s bulunabilir. Bu özel ölçümler basittir, sadece test çözeltisine daldırılan yıkanmış ve kurutulmuş bir çift elektrota gereksinim vardır; elektrotlar arasındaki potansiyel pH'ın bir göstergesi dir. s'yi tayin etmek için, yöntemin tüm kademeleri tam olarak uygulanarak, pH'ı sabit bir tampon çözeltinin 20-30 kısmında ölçme yapılır. Normal olarak, bu testteki belirsiz hata peşpeşe yapılan ölçmelerdeki ile aynıdır ve eşitlikle hesaplanan s, teorik s değerinin doğru olarak bulunmasını sağlar.

Zaman-alıcı analizler için bu yöntem pratik değildir. Böyle bir analizde de bir seri örnekten toplanan hassasiyet verileri, s'nin hesaplanması için biriktirilir, böylece hesaplanan s değeri tek bir analizden bulunandan daha sağlıklıdır. Bunun için örnekler arasındaki belirsiz hata kaynaklarının aynı olduğu kabul edilmelidir. Bu varsayım, örneklerin aynı konsantrasyonlarda olması ve analizde aynı yöntem ve yolun izlenmesi durumunda geçerlidir. "Grubun" s değerini hesaplayabilmek için biriktirilen her bir değerin ortalama değerden farkı saptanır ve karesi alınır; bu kareler toplanarak uygun bir serbestlik derecesine bölünür. İşlemin yapılmasıyla grup s elde edilir. Her analiz takımı (yani her bir örnek) için serbestlik derecesi tekrarlanan ölçüm sayısının 1 eksiğidir. Bu durumda grup s için serbestlik derecesi sayısı tüm örnekler için elde edilen toplam ölçüm sayısından örnek sayısı çıkarılarak bulunur.

s Bilinmediğinde Güvenilirlik Sınırları: Zamanın veya örnek miktarının s‘yı doğru olarak saptamada yetersiz olduğu durumlarda bir kimyacının, çoğu kez, alışılmamış yöntemlere başvurması gerekir. Bu gibi hallerde, tekrarlanan tek bir ölçüm serisi sadece ortalama değerin değil, aynı zamanda duyarlığın bulunmasında da kullanılır. Daha önce belirtildiği gibi, az sayıdaki veriden hesaplanan s kararsız olabilir; bu nedenle, güvenilirlik sınırları genişletilmelidir.

s'nin potansiyel değişkenliği nedeniyle bir t parametresi kullanılır; tekrarlanan n ölçümün ortalaması x için güvenilirlik sınırı:

5. Ölçüm Kararsızlıklarının Çoğalması

Tipik bir enstrümantal analiz yöntemi ile yapılan birkaç deneysel ölçümün herbiri alınan sonucu etkileyen belirsiz hata ile karşı karşıyadır. Bu tip belirsiz hataların bir analizin sonucunu nasıl etkilediğini göstermek için analiz sonucunu x ile ve bağlı olduğu değişkenleri de p, q, r,..., ile gösterelim; p, q, r,...., rasgele ve bağımsız olarak dalgalanan değerlerdir. x p, q, r,..., ‘nın bir fonksiyonudur,

x = f (p, q, r,...)

x’ in i'nci ölçümündeki kararsızlık dx_i (bu, ortalamadan sapmadır) p, q, r,..., ‘deki dp_i , dq_i , dr_i ,..., kararsızlıklarının büyüklüğüne ve işaretine bağlıdır. Yani,

dx_i = f (dp_i , dq_i , dr_i ,...) = f (x_i - m)

yazılabilir. p, q, r, ..., deki kararsızlıkların bir fonksiyonu olarak dx’deki değişiklik,

x = f (p, q, r,...) eşitliğinin diferensiyali alınarak bulunur.

dp, dq, ve dr bağımsız ve rasgele kararsızlıklarsa çapraz bazı terimler negatif, bazıları pozitiftir. Bu nedenle özellikle N büyük olduğu zaman, "bu terimlerin tümünün toplamı sıfıra yaklaşır".

Sonuçların standart sapmalarının bulunmasında aşağıdaki eşitlik kullanılır.

6. Kalibrasyon Eğrilerindeki Kararsızlıklar

Analitik yöntemlerin çoğu, bilinen konsantrasyonlarda analit içeren bir seri standarttan elde edilen kalibrasyon verilerine dayanır. Verilerle, Şekil-2'de görüldüğü gibi, bir kalibrasyon eğrisi çizilir. Böyle tipik grafikler düz bir doğruya çok yakın olur; nadiren de olsa, ölçme işlemindeki belirsiz hatalar nedeniyle verilerin tümünün tam doğru üzerine düştüğü de görülür. Bu nedenle araştırmacı, noktalar arasından en iyi doğruyu geçirmeye çalışmalıdır. İstatistikte böyle bir doğrunun elde edilmesi ve aynı zamanda kararsızlıkların saptanması yöntemleri vardır. İstatistikçiler bu tekniğe "gerileme (geri çekilme) analizi derler. Burada sadece en basit gerileme işlemi olan ve "en küçük kareler yöntemi" ile yapılan "doğrusal gerileme" anlatılacaktır.

Kabuller (Varsayımlar): Bir kalibrasyon eğrisinin çıkarılması için en küçük kareler yönteminin uygulanmasında iki kabul yapılır. Birincisi, analit konsantrasyonu ile ölçülen değişken arasında doğrusal bir ilişki olmasıdır. İkinci kabul, standartların bileşiminde önemli derecede hatalar yoktur, yani standartların konsantrasyonlarının tam olarak bilindiği kabul edilir.

Bu durumda, Şekil-2'de noktaların doğru çizgiden sapması, tamamıyla y ‘deki belirsiz hatadan ileri gelir (y kromatografik piklerin alanıdır). Bu kabullerin her ikisi de pek çok analitik kalibrasyona uygundur.

Şekil-2: Hidrokarbon karışımları içinde izo-oktan tayini için kalibrasyon eğrisi (pik alanı istenilen birimde olabilir)

En Küçük-Kareler Doğrusunun Çıkarılması: Ölçülen veya bağımlı değişken y ile bağımsız değişken analit konsantrasyonu x arasındaki kabul edilen doğrusal ilişki aşağıdaki eşitlikle tanımlanır:

y = m x + b

b, x = 0 olduğunda y’nin değeri (y eksenini kesen değer) doğrunun eğimidir. En küçük kareler yöntemi b ve m'nin değerlerindeki standart sapmaların bulunmasına olanak verdiği gibi bu değerlerin saptanmasını da sağlar.

En küçük kareler yöntemi, her bir noktanın doğru çizgiden saptanmasının (y ekseninde) kareleri Qi'nin en küçük olduğu haldeki doğru hattı bulma yöntemidir. Q_i,

Q_i = (y_i - y)² = (y_i – m x_i - b)²

eşitliği ile tarif edilir. i çeşitli nokta çiftlerini gösterir. Şekil-2'deki sapma (kalıntı), deneysel verilerin en küçük-kareler hattından olan "dikey" kaymaları (yer değiştirmeleri) gösterir.

Bir en küçük-kareler analizi için gerekli matematik denklemler çıkarılabilir, ancak bu konudaki literatürlerden gerekli denklemleri bulup uygulamak daha kolay ve tercih edilen bir yoldur.

Kolaylık bakımından üç miktarı tarif edebiliriz, bunlar S_xx, S_yy, ve S_xy dir.

S_xx = S (x_i - x)² = S x_i² - (S x_i)²/n

S_yy = S (y_i - y)² = S y_i² - (S y_i)² /n

S_xy = S (x_i - x) (y_i -y) = S x_i y_i - S x_i y_i /n

Burada x_i ve y_i, en küçük-kareler hattını tarif eden x ve y veri çiftlerini gösterir. n, Kalibrasyon eğrisinin çizilmesinde kullanılan veri çifteri sayısı, x ve y de sapmaların ortalama değerleridir. Yani,

S x_i S y_i

x = ¾¾ y = ¾¾

n n

S_xx ve S_yy, her bir x ve y için olan ortalamadan sapmaların kareleri toplamıdır. Hesaplamalar, eşitliklerin sağ tarafındaki ifadeler kullanılarak basitleştirilir.

S_xx ve S_yy ve S_xy’den bu kalibrasyon eğrisine dayanan bir analiz için beş tane yararlı miktar çıkarılır; bunlar:

b = kesişim, m = eğim, s_m; = m 'deki standart sapma, s_r; = regresyon standart sapma, s_c. = standart sapma,

regresyon standart sapma, s_r, sapmaların y'nin ortalamasından değil de doğru hattan ölçüldüğü zaman y deki sapmadır. Yani,

GERİ