Varyansı Hesaplamanın Yolları

Yazar: Robert Simon
Yaratılış Tarihi: 21 Haziran 2021
Güncelleme Tarihi: 1 Temmuz 2024
Anonim
Varyans
Video: Varyans

İçerik

Varyans, veri setinin dağılımını ölçer. İstatistiksel modeller oluşturmada çok kullanışlıdır: düşük varyans, verilerdeki temel ilişki yerine rastgele hata veya gürültüyü tanımladığınızın bir göstergesi olabilir. Bu makale ile wikiHow size varyansı nasıl hesaplayacağınızı öğretir.

Adımlar

Yöntem 1/2: Bir örneğin varyansını hesaplayın

  1. Örnek veri setinizi yazın. Çoğu durumda, istatistikçiler yalnızca inceledikleri nüfusun bir örneği veya alt kümesi hakkında bilgi sahibidir. Örneğin, bir istatistikçi "Almanya'daki her arabanın maliyetinin" genel bir analizini yapmak yerine, birkaç bin arabadan oluşan rastgele bir örneklemin maliyetini bulabilir. İstatistikçi, Almanya'daki otomobillerin maliyeti hakkında iyi bir tahmin elde etmek için bu örneği kullanabilir. Ancak, gerçek sayılarla tam olarak eşleşmemesi daha olasıdır.
    • Örneğin: Bir kafede günde satılan kek sayısını analiz ederken, rastgele altı günlük bir numune aldınız ve aşağıdaki sonuçları elde ettiniz: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. Bu bir örneklem, popülasyon değil, çünkü mağazanın açık olduğu her gün için veriniz yok.
    • Eğer her Ana birimdeki veri noktaları, lütfen aşağıdaki yönteme gidin.

  2. Örnek varyans formülünü yazın. Bir veri setinin varyansı, veri noktalarının dağılma derecesini gösterir. Varyans sıfıra ne kadar yakınsa, veri noktaları o kadar yakın gruplanır. Örnek veri kümeleriyle çalışırken, varyansı hesaplamak için aşağıdaki formülü kullanın:
    • = /(n - 1)
    • varyans. Varyans her zaman kare birimlerde hesaplanır.
    • veri kümenizdeki bir değeri temsil eder.
    • "Toplam" anlamına gelen ∑, her bir değer için aşağıdaki parametreleri hesaplamanızı ve ardından bunları birbirine eklemenizi söyler.
    • x̅, numunenin ortalamasıdır.
    • n, veri noktalarının sayısıdır.

  3. Numunenin ortalamasını hesaplayın. X̅ veya "x-yatay" sembolü, numunenin ortalamasını belirtmek için kullanılır. Herhangi bir ortalamayı yaptığınız gibi hesaplayın: tüm veri noktalarını toplayın ve nokta sayısına bölün.
    • Örneğin: Önce veri noktalarınızı toplayın: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Ardından, sonucu veri noktalarının sayısına bölün, bu durumda altı: 84 ÷ 6 = 14.
      Örnek ortalama = x̅ = 14.
    • Ortalamayı verilerin "merkez noktası" olarak düşünebilirsiniz. Veriler ortalamanın etrafında ortalanmışsa, varyans düşüktür. Ortalamadan uzağa dağılmışlarsa, varyans yüksektir.

  4. Her veri noktasından ortalamayı çıkarın. Şimdi hesaplama zamanı - x̅, burada veri kümenizdeki her nokta. Her sonuç, karşılık gelen her noktanın ortalamasından sapmayı veya basitçe ifade etmek gerekirse, ondan ortalamaya olan mesafeyi gösterecektir.
    • Örneğin:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7-14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • Hesaplamalarınızı kontrol etmek çok kolaydır, çünkü sonuçların toplamı sıfır olmalıdır. Bunun nedeni, ortalamanın tanımına göre negatif sonuçların (ortalamadan küçük sayılara pozitif sonuçlar (ortalamadan büyük sayılara olan mesafe) tamamen ortadan kaldırılır.
  5. Tüm sonuçları kareye alın. Yukarıda belirtildiği gibi, mevcut sapma listesinin (- x̅) toplamı sıfırdır, yani "ortalama sapma" da her zaman sıfır olacaktır ve verilerin dağılımı hakkında hiçbir şey söylenemez. Bu sorunu çözmek için her sapmanın karesini buluyoruz. Bu sayede hepsi pozitif sayılardır, negatif değerler ve pozitif değerler artık birbirini iptal etmez ve toplamı sıfır verir.
    • Örneğin:
      (- x̅)
      - x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Artık örnekteki her veri noktası için (- x̅) var.
  6. Karesi alınmış değerlerin toplamını bulun. Şimdi formülün tüm payını hesaplamanın zamanı geldi: ∑. Büyük siklo, ∑, her değer için aşağıdaki öğe değerini eklemenizi gerektirir. Örnekteki her bir değer için (- x̅) hesapladınız, bu nedenle tek yapmanız gereken sonuçları birbirine eklemektir.
    • Örneğin: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. N - 1'e bölün, burada n, veri noktalarının sayısıdır. Uzun zaman önce, örneklem varyansını hesaplarken, istatistikçiler sadece n'ye bölünürdü. Bu bölme size, o örneğin varyansıyla tam olarak eşleşen kare sapmanın ortalamasını verecektir. Ancak, örneklemin yalnızca daha büyük bir popülasyonun tahmini olduğunu unutmayın. Başka bir rastgele örnek alır ve aynı hesaplamayı yaparsanız, farklı bir sonuç alırsınız. Görünüşe göre, n yerine n -1 ile bölmek size daha büyük bir popülasyonun varyansının daha iyi bir tahminini verir - ki bunu gerçekten önemsersiniz. Bu düzeltme o kadar yaygındır ki artık örneklem varyansının kabul edilen tanımıdır.
    • Örneğin: Örnekte altı veri noktası vardır, yani n = 6.
      Örnek varyans = 33,2
  8. Varyansı ve standart sapmayı anlayın. Formülde güçler olduğu için varyansın orijinal verinin birimlerinin karesinde ölçüldüğüne dikkat edin. Bu görsel olarak kafa karıştırıcı. Bunun yerine, genellikle standart sapma oldukça kullanışlıdır. Ancak, standart sapma varyansın kareköküyle belirlendiğinden, çaba sarf etmenin bir anlamı yoktur. Bu yüzden örneklem varyansı terimlerle yazılır ve bir örneklemin standart sapmasıdır.
    • Örneğin, yukarıdaki örneğin standart sapması = s = √33,2 = 5,76.
    İlan

Yöntem 2/2: Bir popülasyonun varyansını hesaplayın

  1. Ana veri setinden başlayarak. "Popülasyon" terimi, ilgili tüm gözlemlere atıfta bulunmak için kullanılır. Örneğin, Hanoi sakinlerinin yaşını araştırıyorsanız, toplam nüfusunuz Hanoi'de yaşayan tüm bireylerin yaşlarını içerecektir. Genellikle bunun gibi büyük bir veri kümesi için bir elektronik tablo oluşturursunuz, ancak burada daha küçük bir örnek veri kümesi verilmiştir:
    • Örneğin: Bir akvaryum odasında tam olarak altı akvaryum vardır. Bu altı tankta aşağıdaki sayıda balık bulunur:





  2. Genel varyans için formülü yazın. Bir popülasyon, ihtiyacımız olan tüm verileri içerdiğinden, bu formül bize popülasyonun tam varyansını verir. İstatistikçiler bunu örnek varyansından (sadece bir tahmin olan) ayırmak için diğer değişkenleri kullanır:
    • σ = /n
    • σ = örnek varyans. Bu normalde kare şeklinde sosis. Varyans, kare birimlerle ölçülür.
    • veri kümenizdeki bir öğeyi temsil eder.
    • ∑ içindeki öğe her değer için hesaplanır ve ardından toplanır.
    • μ genel ortalamadır.
    • n, popülasyondaki veri noktalarının sayısıdır.
  3. Nüfusun ortalamasını bulun. Bir popülasyonu analiz ederken, μ ("mu") sembolü aritmetik ortalamayı temsil eder. Ortalamayı bulmak için, tüm veri noktalarını toplayın ve ardından nokta sayısına bölün.
    • Anlamın "ortalama" olduğunu düşünebilirsiniz, ancak dikkatli olun, çünkü kelimenin birçok matematiksel tanımı vardır.
    • Örneğin: ortalama değer = μ = = 10,5
  4. Her veri noktasından ortalamayı çıkarın. Ortalamaya daha yakın veri noktaları, sıfıra yakın bir farka sahiptir. Tüm veri noktaları için çıkarma problemini tekrarlayın ve muhtemelen verilerin dağılımını hissetmeye başlayacaksınız.
    • Örneğin:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Her işaretin karesini alın. Bu noktada önceki adımdan elde edilen bazı sonuçlar olumsuz, bazıları olumlu olacaktır.Veriler izometrik bir çizgi üzerinde görselleştirilecekse, bu iki öğe ortalamanın solundaki ve sağındaki sayıları temsil eder. Bu iki grup birbirini iptal edeceğinden, bunun varyans hesaplamasında hiçbir faydası olmayacaktır. Bunun yerine, hepsinin pozitif olması için hepsini kareleyin.
    • Örneğin:
      (- μ) her değeri için ben 1'den 6'ya kadar çalışır:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Sonuçlarınızın ortalamasını bulun. Artık her veri noktası için, bu veri noktasının ortalamadan ne kadar uzakta olduğu ile ilgili (doğrudan değil) bir değere sahipsiniz. Bunları bir araya toplayarak ve sahip olduğunuz değerlerin sayısına bölerek ortalama.
    • Örneğin:
      Genel varyans = 24,25
  7. İletişim tarifi. Bunun yöntemin başında belirtilen formüle nasıl uyduğundan emin değilseniz, tüm problemi elle yazın ve kısaltmayın:
    • Ortalama ve kareden farkı bulduktan sonra, (- μ), (- μ) ve benzerlerini elde edersiniz, ta ki (- μ), son veri noktası nerede. veri setinde.
    • Bu değerlerin ortalamasını bulmak için, onları toplayın ve n'ye bölün: ((- μ) + (- μ) + ... + (- μ)) / n
    • Payı sigmoid gösterimi ile yeniden yazdıktan sonra, /n, formül varyansı.
    İlan

Tavsiye

  • Varyansı yorumlamak zor olduğundan, bu değer genellikle standart sapmayı bulmak için başlangıç ​​noktası olarak hesaplanır.
  • Paydada "n" yerine "n-1" kullanılması, Bessel düzeltmesi adı verilen bir tekniktir. Örnek, yalnızca tam bir popülasyonun tahminidir ve örneklemin ortalaması, bu tahminle eşleşecek belirli bir önyargıya sahiptir. Bu düzeltme, yukarıdaki önyargıyı ortadan kaldırır. Bu, n - 1 veri noktasının numaralandırılmasının ardından, sonuncu noktanın n sabitti, çünkü varyans formülündeki örneklemin ortalamasını (x̅) hesaplamak için yalnızca belirli değerler kullanıldı.