Regresyon Analizi

Herkese merhaba,

İstatistik dersi aldıysanız ya da ilgilendiğiniz bir alansa regresyon analizini duymuş olabilirsiniz. Regresyon analizi, istatistik biliminin temel ilgi alanlarından birisidir. Peki ne anlama gelir? Kısaca açıklayacak olursam; bir rastgele değişken var ve bu değişken davranışlarının model kullanarak tahminlenmesi işlemine “regresyon analizi” adı verilir. Değişkenler arasında belli bir ilişki vardır, aynı zamanda bu ilişkiyi de inceleyerek ölçüm yapar. Tek değişkenli de olsa çok değişkenli de olsa her şekilde regresyon analizi yapılabilir.

Çok değişkenli durumlarda bağımlı değişkene etki eden diğer değişkenler sabit kabul edilir ve hesaplama bu şekilde yapılır. Tabi bu durumda karşımıza yeni bir kavram çıkar; regresyon katsayısı. Sabit değişkenlerin bağımlı değişkeni nasıl etkilediği regresyon katsayısı ile belirlenir. Yani bağımsız değişkendeki bir birimlik değişimin bağımlı değişkende ortaya çıkardığı ortalama değişimi gösterir.

Bir örnekle devam edelim. Bir hastanede hastalar üzerinde yapılan bir araştırmalar sonucunda yaş ve kolesterol arasındaki ilişkinin bulunması isteniyor. Bu iki değişken arasındaki korelasyondan yola çıkarak bir regresyon modeli kurmaya çalışırsak;

Yaş değişkeni = x ve kolesterol değişkeni = y olsun.

Denklemimiz de y = 3,20 + 0,206x olur. Bu model, yaşta meydana gelen bir birimlik artışın kolesterol değerinde 0,206 birimlik bir artışa neden olacağını belirtir. Buna göre, yeni doğan bir bebeğin(yani x=0 iken) kolesterol değerinin 0,206 olacağı görülür. Peki 45 yaşında bir hastanın kolesterol değeri ne olur?

x = 45 için; y = 3,20 + 0,206x denkleminden

y = 3,20 + 0,206*(45) = 12,47 olur.

Basit Regresyon Modeli

Adrien Marie Legendre tarafından ortaya atılmıştır. Ama birkaç yıl sonra Gauss da aynı Regresyon yönteminin en ilkel modeli en küçük kareler yöntemidir. Parisli matematikçi yöntemi açıklamıştır ve yıllardır o yöntemi kullandığını, yeni bir teori olarak ortaya atmadığını söylemiştir. Yöntemin amacı hatayı minimum hale getirebilecek tahmin doğrusunu bulmaktır. Gelelim yöntemin kullanım alanlarına. Regresyon çalışmalarında sıkça başvurulan yöntemlerden bir tanesidir. Ayrıca mühendislik, tıp, finans gibi bilim dallarında da değişkenler arasındaki ilişkileri belirlemek için kullanılır.

Bağımsız Değişken: Genellikle x ile gösterilir. Başka bir değişken tarafından etkilenmez ama y’yi etkilediği düşünülür.

Bağımlı Değişken: Genellikle y ile gösterilir. X değişkenine bağlı olarak değişir.

Bağımlı değişken sayısı her zaman tek olur. Ama bağımsız değişken sayısı birden fazla olabilir. tek bağımsız değişkenin olduğu regresyona “basit doğrusal regresyon”, birden fazla bağımsız değişken varsa “çoklu doğrusal regresyon” adı verilir.

Regresyon çözümlemesinde ;

           Yi = ß0 + ß1Xi  ifadesi kullanılır. Xi bağımsız değer ve Yi bağımlı değerdir.  Amaç Y değerine en yakın sonuçlar üretecek ß0 ve ß1 katsayı değerlerini üretir. Y değeri burada tahmin edilen değişken olarak karşımıza çıkar.

Piyasarehberi adlı siteden aldığım grafiğe göre basit bir regresyon grafiği şu şekildedir:

Şimdi bu grafiği yorumlayalım. Aylara göre yapılan reklam harcamaları y ekseninde, satışlar ise x ekseni üzerinde yer almaktadır. Bizden istenen olay ise yapılan harcamalar ile satışlar arasındaki ilişkiyi incelemek. Reklam harcamaları bağımsız değişkeni, yapılan satışlar bağımlı değişkeni ifade eder. Korelasyon değeri her zaman 1 ile -1 arasında değer alır. Eğer iki değişken arasındaki bağ güçlü ise korelasyon değeri 1’e yakın olur. Sıfıra yakın değerler zayıf bağ olarak adlandırılırken -1’e yakın değerler ters bağ olduğunu bizlere gösterir.

Hata değerini belirten r ifadesini minimize etmek için birkaç yöntem uygulanır.

  1. Hata toplamları
  2. Mutlak hatalar
  3. Hata kareler toplamı minimize edilerek r hata değeri minimize edilebilir.

Peki bu değerler her zaman regresyon analizinin doğru çıkmasını sağlar mı? Hayır sağlamaz. Her zaman uygun bir çözüm bulunamayabilir. Regresyon analizinden daha verimli sonuç elde edebilmek için grafikler kullanılarak daha kolay ve kullanışlı hale getirilebilir.