Bir önceki dersimizde bahsettiğim data frame i uygulamalı göstermek istedim.R ortamında r script kısmında aşağıdaki kod bloğunu eklediğimiz zaman bir tablo sonucu alırız.  Kod bloğunu yazdığımız zaman ctrl+enter ile kodu çalıştırabilirsiniz. Çalıştırdığınız zaman script kısmının sağında data environment da oluşan tablo gözükür. onun üzerine iki kere tıklandığında ise tabloyu görme imkanına ulaşırsınız.

squares <- data.frame(
size = c("small", "big", "medium"),
edge = c("dotted", "striped", "normal"),
color = c("green", "yellow", "green"))

 

Oluşan tablo aşağıdaki gibidir;

R içinde hazır tanımlı bazı veri kümeleri vardır.” iris” bu veri kümelerinden biridir. verikümesi hakkındaki detaylı bilgiye R da “?iris” yazarak ulaşabilirsiniz. İlk dersimizde bazı fonksiyonlardan bahsetmiştik. Fonksiyonların çıktılarını inceleyelim.  iris verisini kullanarak fonksiyonları deneyeceğim.

?iris

#hiç bir tanımlama yapmanıza gerek yok.
#Şimdi veri setimizde kaç adet veri var .
#kaç farklı parametre var onu görelim

str(iris)
dim(iris)

# iris veri setinin ilk ve son verilerini görebiliriz
head(iris)
tail(iris)

# iris data setini özetle
summary(iris)

Sonuçlarını incelediğimizde veri hakkında epey bir bilgiye sahip oluyoruz.

str(iris)
‘data.frame’: 150 obs. of 5 variables:
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 …
$ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 …
$ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 …
$ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 …
$ Species : Factor w/ 3 levels “setosa”,”versicolor”,..: 1 1 1 1 1 1 1 1 1 1 …

Dolar işareti ile belirtilmiş kısımlar tablonun üst başlıklarıdır. Sepanl.length isminde sütunu var demektir. 150 adet veriden oluşan veri seti ve 5 farklı parametre bulunmaktadır. str fonksiyonu daha detaylı bilgi verir dim fonksiyonuna göre.

dim(iris)
[1] 150 5

> # iris veri setinin ilk ve son verilerini görebiliriz
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa

Bu kısımda veri setinin ilk bloğunu görebilirsiniz.

> tail(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
145 6.7 3.3 5.7 2.5 virginica
146 6.7 3.0 5.2 2.3 virginica
147 6.3 2.5 5.0 1.9 virginica
148 6.5 3.0 5.2 2.0 virginica
149 6.2 3.4 5.4 2.3 virginica
150 5.9 3.0 5.1 1.8 virginica

Bu kısımda da verinin son bloğunu görebilirsiniz.

> # iris data setini özetle
> summary(iris)
Sepal.Length  Sepal.Width    Petal.Length      Petal.Width
Min. :4.300      Min. :2.000      Min. :1.000    Min. :0.100
1st Qu.:5.100    1st Qu.:2.800 1st Qu.:1.600    1st Qu.:0.300
Median :5.800 Median :3.000 Median :4.350  Median :1.300
Mean :5.843    Mean :3.057       Mean :3.758    Mean :1.199
3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100  3rd Qu.:1.800
Max. :7.900    Max. :4.400         Max. :6.900      Max. :2.500

Species
setosa :50
versicolor:50
virginica :50

Bu kısımda da her bir değişkenin descriptive statistic dediğimiz tanımlayıcı istatistiksel verilerini görebilmekteyiz.

Saygılarımla,

Sonraki yazımda regresyon modelinden bahsedeceğim.