Jeoistatistik, jeolojik verilerin analizinde ve yorumlanmasında kullanılan istatistiksel yöntemler bütünüdür. Bu yöntemler arasında, kategorik verilerin analizinde önemli bir rol oynayan Ki-Kare (χ²) testi de yer alır.
Ki-Kare (χ²) Testi Nedir?
Ki-Kare testi, istatistikte iki veya daha fazla kategorik değişken arasındaki ilişkinin bağımsız olup olmadığını test etmek için kullanılan bir yöntemdir. Test, gözlemlenen veriler ile beklenen veriler arasındaki farkı karşılaştırarak çalışır.
Ki-Kare Testinin Temel Prensibi
Ki-Kare testi, kategorik verilerle çalışan ve iki veya daha fazla değişken arasındaki ilişkinin bağımsız olup olmadığını test eden bir istatistiksel yöntemdir. Testin temel prensibi, gözlemlenen veriler ile beklenen veriler arasındaki farkı analiz etmeye dayanır.
Ki-Kare (χ²) Değeri
Ki-Kare testi, χ² (ki kare) sembolü ile gösterilen bir istatistiksel değeri kullanır. Bu değer, gözlemlenen ve beklenen veriler arasındaki farkın karelerinin toplamını hesaplayarak bulunur. Hesaplama formülü şu şekildedir:
χ² = Σ (O - E)² / E
- Σ: Toplam işareti
- O: Gözlemlenen veri
- E: Beklenen veri
χ² Dağılımı
Elde edilen χ² değeri, bir χ² dağılımı ile karşılaştırılır. Bu dağılım, serbestlik derecesi (df) parametresine bağlıdır. df değeri, kategorik değişkenlerin sayısı ve gözlem sayısı ile belirlenir.
Serbestlik Derecesi (df)
df, χ² dağılımının şeklini belirleyen parametredir. df değeri, aşağıdaki formül ile hesaplanır:
df = (satır sayısı - 1) * (sütun sayısı - 1)
p-Değeri
χ² değeri ve df parametresi kullanılarak p-değeri hesaplanır. p-değeri, H0 hipotezini reddetme olasılığını gösterir. p-değeri anlamlılık düzeyinden (genellikle 0.05) küçükse H0 reddedilir ve H1 kabul edilir. Bu, kategorik değişkenler arasında bağımlı bir ilişki olduğunu gösterir.
Ki-Kare Testinin Varsayımları
Ki-Kare testinin doğru bir şekilde uygulanabilmesi için bazı varsayımların sağlanması gerekir:
- Verilerin kategorik olması: Veriler, sayısal değil, kategorik (sınıfsal) olmalıdır.
- Beklenen değerlerin en az 5 olması: Her kategoride beklenen veri miktarı en az 5 olmalıdır.
- Verilerin bağımsız olması: Gözlemler birbiriyle bağımsız olmalıdır.
Ki-Kare Testinin Jeoistatistikte Kullanım Alanları
Ki-Kare testi, jeoistatistikte kategorik verilerin analizinde oldukça yaygın olarak kullanılan bir yöntemdir. Jeolojik verilerin analizinde ve yorumlanmasında önemli bir rol oynar.
Farklı Jeolojik Birimlerin Mineral Bileşimlerinin Karşılaştırılması
Farklı kayaç türlerinin veya jeolojik formasyonların mineral bileşimleri arasında anlamlı bir fark olup olmadığını test etmek için Ki-Kare testi kullanılabilir. Bu amaçla, her bir jeolojik birim için mineral türlerinin yüzdeleri kategorik veri olarak kabul edilir. Gözlemlenen veriler, jeolojik örneklerden elde edilen mineral bileşimleridir. Beklenen veriler ise, her bir mineral türü için H0 hipotezi (mineral bileşimleri arasında fark yok) varsayımı altında hesaplanır. Ki-Kare testi sonucunda p-değeri anlamlılık düzeyinden küçükse, H0 reddedilir ve jeolojik birimler arasında mineral bileşimi bakımından anlamlı bir fark olduğu sonucuna varılır.
Jeolojik Olayların Zamansal veya Mekansal Dağılımının Analizi
Depremler veya volkanik patlamalar gibi jeolojik olayların zaman içinde veya belirli bir bölgede nasıl dağıldığını analiz etmek için Ki-Kare testi kullanılabilir. Bu amaçla, jeolojik olayların zaman aralıkları veya mekansal konumları kategorik veri olarak kabul edilir. Gözlemlenen veriler, belirli bir zaman diliminde veya bölgede meydana gelen jeolojik olayların sayısıdır. Beklenen veriler ise, H0 hipotezi (jeolojik olayların dağılımı rastgeledir) varsayımı altında hesaplanır. Ki-Kare testi sonucunda p-değeri anlamlılık düzeyinden küçükse, H0 reddedilir ve jeolojik olayların zamansal veya mekansal dağılımında anlamlı bir patern olduğu sonucuna varılır.
Jeolojik Haritaların Doğruluğunun Değerlendirilmesi
Jeolojik haritalarda gösterilen birimlerin gerçekte arazide nasıl dağıldığı ile karşılaştırılması için Ki-Kare testi kullanılabilir. Bu amaçla, jeolojik haritadaki her bir birim kategorik veri olarak kabul edilir. Gözlemlenen veriler, arazide gözlemlenen jeolojik birimlerin dağılımıdır. Beklenen veriler ise, jeolojik harita üzerindeki her bir birim için alan oranları kullanılarak hesaplanır. Ki-Kare testi sonucunda p-değeri anlamlılık düzeyinden küçükse, H0 reddedilir ve jeolojik haritanın doğruluğunun sorgulanması gerektiği sonucuna varılır.
Uzaktan Algılama Verilerinin Yorumlanması
Uydu görüntüleri veya havadan fotoğraflar gibi uzaktan algılama verilerinden elde edilen kategorik verilerin analizinde Ki-Kare testi kullanılabilir. Örneğin, bir uydu görüntüsünden elde edilen arazi örtüsü sınıfları kategorik veri olarak kabul edilebilir. Gözlemlenen veriler, görüntünün her bir pikseli için arazi örtüsü sınıfıdır. Beklenen veriler ise, H0 hipotezi (arazi örtüsü sınıflarının dağılımı rastgeledir) varsayımı altında hesaplanır. Ki-Kare testi sonucunda p-değeri anlamlılık düzeyinden küçükse, H0 reddedilir ve uzaktan algılama verilerinde anlamlı bir örüntü olduğu sonucuna varılır.
Ki-Kare Testinin Uygulanması
İki veya daha fazla kategorik değişken arasındaki ilişkinin bağımsız olup olmadığını test etmek için kullanılan bir istatistiksel yöntemdir. Testin uygulanması için aşağıdaki adımlar detaylı bir şekilde açıklanmıştır:
Hipotezlerin Oluşturulması
- Boş Hipotez (H0): İki veya daha fazla kategorik değişken arasında bağımsız bir ilişki vardır. Bu hipotez, gözlemlenen verilerin rastgele olduğunu ve kategorik değişkenler arasında bir ilişki olmadığını varsayar.
- Alternatif Hipotez (H1): İki veya daha fazla kategorik değişken arasında bağımlı bir ilişki vardır. Bu hipotez, gözlemlenen verilerin rastgele olmadığını ve kategorik değişkenler arasında bir ilişki olduğunu varsayar.
Gözlem Tablosu Oluşturma
Gözlemlenen ve beklenen verileri gösteren bir tablo oluşturulur. Tabloda satırlar bir kategorik değişkeni, sütunlar ise diğer kategorik değişkeni temsil eder. Tablonun her bir hücresi, her iki kategorik değişken için de gözlemlenen veya beklenen veri sayısını gösterir.
- Gözlemlenen veriler: Gerçekte gözlemlenen veya ölçülen değerlerdir.
- Beklenen veriler: H0 hipotezi doğruysa her kategoride beklenen veri miktarıdır. Beklenen değerler, her kategorideki veri oranını kullanarak hesaplanır.
Ki-Kare Değeri Hesaplama
Gözlemlenen ve beklenen veriler arasındaki farklar kullanılarak Ki-Kare değeri hesaplanır. Hesaplama formülü şu şekildedir:
χ² = Σ (O - E)² / E
- Σ: Toplam işareti
- O: Gözlemlenen veri
- E: Beklenen veri
Özgürlük Derecesi Belirleme
Ki-Kare dağılımının serbestlik derecesi (df), kategorik değişkenlerin sayısı ve gözlem sayısı ile belirlenir. Hesaplama formülü şu şekildedir:
df = (satır sayısı - 1) * (sütun sayısı - 1)
p-Değeri Hesaplama
Ki-Kare değeri ve serbestlik derecesi kullanılarak p-değeri hesaplanır. p-değeri, H0 hipotezini reddetme olasılığını gösterir. p-değeri, bir Ki-Kare dağılımı tablosu veya istatistiksel yazılım kullanılarak hesaplanabilir.
Sonuçların Yorumlanması
- p-değeri anlamlılık düzeyinden (genellikle 0.05) küçükse: H0 reddedilir ve H1 kabul edilir. Bu, kategorik değişkenler arasında bağımlı bir ilişki olduğunu gösterir.
- p-değeri anlamlılık düzeyinden büyükse: H0 reddedilemez. Bu, kategorik değişkenler arasında bağımsız bir ilişki olduğunu gösterir.
Ki-Kare Testi Örneği
Farklı jeolojik birimlerin mineral bileşimlerini karşılaştıran bir çalışmada, aşağıdaki gözlem tablosu elde edilmiştir:
Jeolojik Birim | Kuvars | Feldspat | Mika | Toplam |
---|---|---|---|---|
Birim 1 | 20 | 30 | 10 | 60 |
Birim 2 | 15 | 25 | 20 | 60 |
Ki-Kare testi kullanılarak, jeolojik birimlerin mineral bileşimleri arasında anlamlı bir fark olup olmadığını test etmek için p-değeri hesaplanır. Hesaplanan p-değeri 0.01’den küçükse, jeolojik birimlerin mineral bileşimleri arasında anlamlı bir fark olduğu sonucuna varılabilir.