Veri setinin varyansı ve standart sapması istatistiksel analizde önemli kavramlardır ve veri dağılımının yayılma veya değişkenlik derecesini ölçmek için kullanılırlar. İlk olarak, veri setinin varyansı nedir ve nasıl hesaplanır bunu anlatarak başlayalım.
Varyans Nedir?
Varyans, bir veri setindeki değerlerin ortalama değerden ne kadar farklılık gösterdiğini ölçen bir terimdir. Bir veri setindeki her bir değerin ortalama değerden ne kadar uzak olduğunu ölçerek, veri setinin ne kadar değişken olduğunu belirler.
Bir veri setinin varyansı şu formülle hesaplanır:
Burada:
- , varyansı temsil eder.
- , veri setindeki her bir gözlemi ifade eder.
- , veri setinin aritmetik ortalamasıdır.
- , veri setindeki gözlem sayısını temsil eder.
Bu formülde, her bir gözlem değeri ile ortalama değer arasındaki farkın karesi alınır, tüm bu farkların toplamı alınır ve bu toplam gözlem sayısına bölünür.
Standart Sapma Nedir?
Standart sapma, bir veri setinin varyansının kareköküdür. Varyansın karekökü alınarak elde edilir ve veri setindeki değerlerin ortalama etrafındaki yayılımın ölçüsü olarak kullanılır. Standart sapma, varyansın aynı birim cinsinden ifade edilmesini sağlar.
Standart sapma formülü şu şekildedir:
Varyans ve Standart Sapma Hesaplama Adımları:
-
Veri Setinin Ortalamasını Hesaplayın: İlk adım, veri setinin aritmetik ortalamasını bulmaktır. Bu, tüm veri noktalarını toplamak ve veri noktalarının sayısına bölmek suretiyle yapılır.
-
Her Bir Değerin Ortalamadan Farkını Hesaplayın: Her bir veri noktasının ortalamadan farkını bulun. Bu, işlemiyle yapılır.
-
Her Bir Farkın Karesini Alın: Her bir değerin ortalamadan farkını alıp karesini alın. Bu, işlemiyle yapılır.
-
Karelerin Toplamını Hesaplayın: Her bir farkın karesini alın ve bunları toplayın.
-
Varyansı Hesaplayın: Karelerin toplamını veri noktalarının sayısına bölün.
-
Standart Sapmayı Hesaplayın: Varyansın karekökünü alarak standart sapmayı bulun.
Örnek Bir Hesaplama:
Elimizde 5 veri noktası olsun: 10, 12, 14, 16, 18.
-
Ortalama:
-
Her bir değerin ortalamadan farkı:
-
Her bir farkın karesi:
-
Karelerin Toplamı:
-
Varyans:
-
Standart Sapma:
Sonuç olarak, veri setinin varyansı ve standart sapması olarak hesaplanır. Bu değerler, veri setindeki değerlerin ortalama etrafındaki dağılımın ölçülerini sağlar.