İstatistik

Uç Değer Nedir ?

uç değer

UÇ DEĞER

En genel tanımıyla uç değer,evren ya da tanımlanmaktadır[3].Başka bir tanımda ise grubun uç değerleri, örneklemin diğer üyelerinin değerlerinden oldukça uzaklaşmış değerler olarak tanımlamaktadır[5].

 Elashoffve Elashoff, uç değerleri bazı özelliklerden diğer gözlemlere zarar veren gözlemler olarak tanımlamaktadırlar[4]. Kıralve Billor ’a göre uç değerler, veri dizisinde gözlemlerin birçoğu tarafından önerilen model ile uyuşmayan gözlemlere uç değer denir[6]. Barnett ve Lewis ’e göre uçdeğerler, veri dizisinde bulunan diğer gözlemlere göre aykırı olan gözlemlerdir[2].

Veri setinde bulunan değerlere bakıldığı zaman, veri setine uygun olmadığı düşünülen değerlere “uç değerler” adı verilmektedir. Uç değerlerin en eski istatistiksel değerlerden biri olduğu bilinmektedir. Uç değer teriminin ilk kez 1709 yılının başlarında Nicolas Bernouille tarafından tartışıldığı ifade edilmektedir.

Bir uç değer;

 a) veri dizisi üzerinde bulunan aşırı bir değer sonucunda veya   

b) veri dizileri ve model oluşturma çıktılarının yorumlanmasında oldukça etkili bir etkiye neden olan, çeşitli değişkenlerin olağandışı kombinasyonları şeklinde olabilir[7].

Barnett ve Lewis, örneklem içerisindeki uç değerlerin üç farklı nedenle ortaya çıktığını söylemektedir:

  1. Ölçme Hatası: Uç değerler; okuma hatası, kaydetme hatası veya hesaplama hatasından kaynaklanıyor olabilir.
  2. Uygulama(Örnekleme) Hatası: İncelenen evrenin içinde olmayanbireylerin örneklemde bulunması uç değerlere neden olabilir.
  3.  DoğalÇeşitlilik: Uç değerler elde bulunan modelden kaynaklı olarak verilerindoğal çeşitliliğini gösteriyor olabilir. Bu şekildeki uç değerler çok az gözlenirve kabul edilebilir değerlerdir[2].

Tüm uç değerler hatalı veriler değildir. Tüm hatalı veriler de uç değeri göstermez[2].Bu nedenle, veri setindeki uç değerlerin neden kaynaklandığ ını anlamak oldukça önem verilmesi gereken bir konudur. Uç değere neden olan durumlardan bir kısmının bile nedeni anlaşılırsa, ne yapılması gerektiğine karar vermek oldukça kolaylaşacaktır.  Veri dizisindeki olası uç değerler saptandıktan sonra yapılacak ilk işlem, uç değerlerle nasıl baş edileceği gerektiğine karar vermektir.

Belirlenen uç değerler:

  1. silinebilir,
  2. bu değerlere hiç dokunulmayabilir,
  3. veri dönüşümleri uygulanabilir.

Bu yüzden üç durumun da denenmesi ve yapıyı en iyi ortaya koyan durumun kabul edilmesi gerektiğini belirten kaynaklar bulunmaktadır[7].

Uç eğerle ilgili “bir veri seti üzerindeki aşırı bir değertek değişkenli uç değer olarak nitelendirilir.  “Çeşitli değişkenlerin olağan dışı kombinasyonları” ise, çok değişkenli uç değerden söz edilmektedir.

Tek Değişkenli Uç Değer:Aşağıdaki uç değer belirleme yöntemleri ile tespit edilen aşırı ve uç veri noktalarıdır[7]:

TEK DEĞİŞKENLİ UÇ DEĞER BELİRLEME YÖNTEMLERİ
BETİMSEL UÇ DEĞER BELİRLEME YÖNTEMLERİ
GRAFİKSEL UÇ DEĞER BELİRLEME YÖNTEMLERİ

Çok Değişkenli Uç Değer: Değişkenlerin kombinasyonları ile tespit edilen aşırı ve uç veri noktalarıdır.

ÇOK DEĞİŞKENLİ UÇ DEĞER BELİRLEME YÖNTEMLERİ
MAHALANOBİS UZAKLIĞI
COOK UZAKLIĞI
KALDIRAÇ NOKTASI

Uç değerler hatalı değerler olabileceği gibi aynı zamanda gerçeği yansıtan değerler de olabilir. Bu nedenle uç değerler için hata ayıklaması yapılmalı ve doğruluğu kontrol edilmelidir.

Örnek 1

Bir kadının boyunun 1.95 cm olması bir uç değerdir. Ancak bazı kadınların boyları bu kadar uzun olabilir.

Uç değerlerin doğru olduğuna karar verildiği zaman bu değerler saklanmalıdır,fakat bu değerler yanlış ise silinmelidir. Uç değerlerin fazla olması istatistikleri etkileyebilir.

Değerler kümesindeki en büyük ve en küçük değerlerdir.

Üst uç değer; verilerin en büyük olanıdır.

Alt uç değer; verilerinen küçük olanıdır.

uç değer

Uç Değer

Örnek 2

79, 18, 4, 4, 5, 6, 6, 79 verilerinin üst ve alt uç değeri nedir?

Verileri sıraladığımız zaman;

4, 4, 5, 6, 6, 18, 79, 79

Üst uç değer 79, alt uç değer ise 4’ tür.

KAYNAKÇA

  • Aktürk, Z. ve Acemoğlu, H. (2010). Sağlık çalışanları için araştırma ve pratik istatistik.İstanbul: Anadolu Matbaası.
  • Barnett, V. ve Lewis, T. (1994). Outliers in statistical data. New York: Wiley.
  • Dixon, W. J. (1950). Analysis of extreme values. The annals of mathematical statistics.
  • Elashoff,J. D. ve Elashoff, R. M. (1970). A Modelfor Quadratic Outliers in Lineer Regression. Stanford Center for Research and Development in Teaching.
  • Grubb, F. E. (1963). Sample Criteria for Testing Outlying Observations. The  Annals of Mathematical Statistics.
  • Kıral,G. ve Billor, N. (2001). Bacon temel bileşenler analizi ile sapan değerlerin    belirlenmesi 5. Ulusal Ekonometri ve İstatistik Sempozyumu. Adana.
  • Raykov, T. ve Marcoulides, G. A. (2008). An ıntroduction to applied multivariate analysis (first edition). NY: Taylor & Francis Group.

Comment here