Korelasyon katsayısını belirleyin

Yazar: Morris Wright
Yaratılış Tarihi: 28 Nisan 2021
Güncelleme Tarihi: 19 Haziran 2024
Anonim
9) Korelasyon Katsayısı ve Kovaryans  |  Korelasyon Analizi 1  |  İSTATİSTİK  |  XDERS
Video: 9) Korelasyon Katsayısı ve Kovaryans | Korelasyon Analizi 1 | İSTATİSTİK | XDERS

İçerik

R veya ρ olarak gösterilen korelasyon katsayısı, iki değişken arasındaki doğrusal korelasyonun (hem kuvvet hem de yöndeki ilişki) ölçüsüdür. Pozitif ve negatif korelasyonu temsil etmek için artı ve eksi işaretlerini kullanarak -1 ile +1 arasında değişir. Korelasyon katsayısı tam olarak -1 ise, iki değişken arasındaki ilişki tamamen negatiftir; korelasyon katsayısı tam olarak +1 ise, ilişki tamamen pozitiftir. İki değişkenin pozitif bir korelasyonu, negatif bir korelasyonu olabilir veya hiç korelasyonu olmayabilir. Korelasyonu elle, çevrimiçi olarak mevcut bazı ücretsiz korelasyon hesaplamalarını kullanarak veya iyi bir grafik hesaplayıcısının istatistiksel işlevlerini kullanarak hesaplayabilirsiniz.

Adım atmak

Yöntem 1/4: Korelasyon katsayısını elle hesaplayın

  1. Önce verilerinizi toplayın. Etkili bir korelasyonu hesaplamaya başlamak için önce veri çiftlerini inceleyin. Bunları hem dikey hem de yatay olarak bir masaya koymak faydalıdır. Her satırı veya sütunu x ve y olarak etiketleyin.
    • Örneğin, için dört veri çiftiniz olduğunu varsayalım. X ve y. Tablo daha sonra şöyle görünebilir:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Ortalamasını hesapla X. Ortalamayı hesaplamak için tüm değerlere ihtiyacınız var X ekleyin ve ardından değerlerin sayısına bölün.
    • Yukarıdaki örneği kullanarak, için dört değeriniz olduğuna dikkat edin. X. Ortalamayı hesaplamak için tüm değerleri toplarsınız X ve 4'e bölün. Hesaplama şuna benzer:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Ortalamasını bul y. Ortalamasına y Bulmak için, y'nin tüm değerlerini toplayarak ve ardından değerlerin sayısına bölerek aynı adımları izleyin.
      • Yukarıdaki örnekte, ayrıca için dört değeriniz var y. Tüm bu değerleri toplayın ve ardından bunları 4'e bölün. Hesaplamalar şöyle görünecektir:
      • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Standart sapmasını belirle X. Vasıtalarınızı elde ettiğinizde, standart sapmayı hesaplayabilirsiniz. Bunu yapmak için aşağıdaki formülü kullanın:
        • σX=1n1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Standart sapmasını hesaplayın y. Aynı temel adımları kullanarak, standart sapmayı bulun y. Y için veri noktalarını kullanarak aynı formülü kullanacaksınız.
          • Örnek verilerle hesaplamalarınız şöyle görünecektir:
          • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}Bir korelasyon katsayısını belirlemek için temel formülü gözden geçirin. Bir korelasyon katsayısının hesaplanması için formül, ortalamaları, standart sapmaları ve bir veri setindeki çiftlerin sayısını kullanır ( n). Korelasyon katsayısının kendisi küçük harf r veya Yunan harfi ρ (rho) ile temsil edilir. Bu makale için aşağıda gösterildiği gibi Pearson korelasyon katsayısı olarak bilinen formülü kullanacağız:
            • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = sol ({ frac {1} {n-1}} sağ) Sigma sol ({ frac {x- mu _ {x}} { sigma _ {x}} } sağ) * sol ({ frac {y- mu _ {y}} { sigma _ {y}}} sağ)}Korelasyon katsayısını belirleyin. Artık değişkenleriniz için araçlara ve standart sapmalara sahipsiniz, böylece korelasyon katsayısı formülüne geçebilirsiniz. Bunu hatırla n sahip olduğunuz değerlerin sayısını temsil eder. Yukarıdaki adımlarda diğer ilgili bilgileri zaten hesapladınız.
              • Örnek verileri kullanarak, verileri korelasyon katsayısı formülüne girebilir ve aşağıdaki gibi hesaplayabilirsiniz:
              • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = sol ({ frac {1} {n-1}} sağ) Sigma sol ({ frac {x- mu _ {x}} { sigma _ {x}} } sağ) * sol ({ frac {y- mu _ {y}} { sigma _ {y}}} sağ)}Sonucu yorumlayın. Bu veri seti için korelasyon katsayısı 0,988'dir. Bu sayı size veriler hakkında iki şey söyler. Numaranın işaretine ve numaranın büyüklüğüne bakın.
                • Korelasyon katsayısı pozitif olduğu için x verisi ile y verisi arasında pozitif bir korelasyon olduğunu söyleyebilirsiniz. Bu, x değerleri artarsa, y değerlerinin de artmasını beklediğiniz anlamına gelir.
                • Korelasyon katsayısı + 1'e çok yakın olduğundan, x verileri ve y verileri çok yakından ilişkilidir. Bu noktaların grafiğini çizecek olsaydınız, bunların düz bir çizgiye çok iyi bir yaklaşım olduğunu görürdünüz.

Yöntem 2/4: Çevrimiçi korelasyon hesaplayıcılarını kullanma

  1. Korelasyon hesaplayıcıları için çevrimiçi arama yapın. Korelasyonu ölçmek istatistikçiler için oldukça standart bir hesaplamadır. Hesaplama, elle yapılırsa büyük veri kümeleri için çok yorucu olabilir. Bu nedenle, birçok kaynak ortak korelasyon hesaplamalarını çevrimiçi olarak kullanıma sunmuştur. Herhangi bir arama motorunu kullanın ve "korelasyon hesaplayıcı" arama terimini girin.
  2. Verileri girin. Verileri doğru şekilde girebilmek için web sitesindeki talimatları dikkatlice okuyun. Veri çiftlerinin sırayla tutulması önemlidir, aksi takdirde yanlış bir korelasyon sonucu alırsınız. Farklı web siteleri, veri girmek için farklı formatlar kullanır.
    • Örneğin, http://ncalculators.com/statistics/correlation-coefficient-calculator.htm web sitesinde x değerlerini girmek için yatay bir kutu ve y değerlerini girmek için ikinci bir yatay kutu bulacaksınız. Yalnızca virgülle ayrılmış olarak terimleri girersiniz. Bu nedenle, bu makalenin önceki bölümlerinde hesaplanan x veri seti 1,2,4,5 olarak girilmelidir. Y veri seti 1,3,5,7 olarak girilir.
    • Başka bir sitede, http://www.alcula.com/calculators/statistics/correlation-coefficient/, veri noktalarını sıralı tuttuğunuz sürece verileri yatay veya dikey olarak girebilirsiniz.
  3. Sonuçları hesaplayın. Bu hesaplama siteleri popülerdir çünkü verileri girdikten sonra genellikle sadece "Hesapla" düğmesini tıklamanız gerekir - sonuç otomatik olarak görünecektir.

Yöntem 3/4: Grafik hesap makinesi kullanma

  1. Bilgilerinizi girin. Grafik hesap makinenizde istatistik işlevini etkinleştirin ve ardından "Düzenle" komutunu seçin.
    • Her hesap makinesinin biraz farklı tuş komutları vardır. Bu makale Texas Instruments TI-86 için özel talimatlar sağlar.
    • Stat işlevine erişmek için [2nd] -Stat ("+" tuşunun üstünde) ve ardından F2-Edit tuşuna basın.
  2. Tüm eski kayıtlı verileri silin. Çoğu hesap makinesi, istatistiksel verileri temizlenene kadar saklayacaktır. Eski verileri yeni verilerle karıştırmadığınızdan emin olmak için, önce önceden kaydedilmiş tüm bilgileri silmelisiniz.
    • "XStat" kategorisini vurgulamak üzere imleci hareket ettirmek için ok tuşlarını kullanın. Ardından "Temizle" ve "Enter" a basın. Bu xStat sütunundaki tüm değerleri temizlemelidir.
    • "YStat" kategorisini vurgulamak için ok tuşlarını kullanın. Söz konusu sütunun verilerini de temizlemek için "Temizle" ve "Enter" tuşlarına basın.
  3. Veri değerlerinizi girin. İmleci xStat başlığı altındaki ilk boşluğa taşımak için ok tuşlarını kullanın. İlk veri değerinizi yazın ve ardından Enter tuşuna basın. Değerinizin boş alanı doldurduğu "xStat (1) = __" ekranının altında boşluğu görmelisiniz. Enter tuşuna bastığınızda, veriler tabloyu dolduracak, imleç bir sonraki satıra geçecek ve ekranın altındaki satırda artık "xStat (2) = __" yazmalıdır.
    • Tüm x değerlerini girmeye devam edin.
    • X değerlerini girdiğinizde, yStat sütununa gitmek için ok tuşlarını kullanın ve y değerlerini girin.
    • Tüm veriler girildiğinde, ekranı temizlemek ve Stat menüsünden çıkmak için Exit'e basın.
  4. Doğrusal regresyon istatistiklerini hesaplayın. Korelasyon katsayısı, verilerin düz bir çizgiye ne kadar yakın olduğunun bir ölçüsüdür. İstatistiksel fonksiyonlara sahip bir grafik hesaplayıcı, en uygun çizgiyi ve korelasyon katsayısını çok hızlı bir şekilde hesaplayabilir.
    • Stat işlevini girin ve ardından Calc düğmesine basın. TI-86'da bu [2.] [Stat] [F1].
    • Doğrusal Regresyon Hesaplamalarını seçin. TI-86'da bu, "LinR" olarak etiketlenmiş [F3] 'dür. Grafik ekranı, yanıp sönen bir imleçle birlikte "LinR _" satırını görüntüleyecektir.
    • Şimdi hesaplamak istediğiniz iki değişkenin adlarını girmelisiniz. Bunlar xStat ve yStat.
      • TI-86'da, [2.] [Liste] [F3] tuşuna basarak ad listesini ("İsimler") seçin.
      • Ekranınızın alt satırında artık mevcut değişkenler gösterilmelidir. [XStat] 'ı seçin (bu muhtemelen F1 veya F2 düğmesidir), sonra virgül ve ardından [yStat] girin.
      • Verileri hesaplamak için Enter tuşuna basın
  5. Sonuçları yorumlayın. Enter tuşuna bastığınızda, hesap makinesi girdiğiniz veriler için aşağıdaki bilgileri hemen hesaplayacaktır:
    • y=a+bX{ displaystyle y = a + bx}Korelasyon kavramını anlayın. Korelasyon, iki miktar arasındaki istatistiksel ilişkiyi ifade eder. Korelasyon katsayısı, iki veri noktası kümesi için hesaplayabileceğiniz tek bir sayıdır. Sayı her zaman -1 ile +1 arasındadır ve iki veri kümesinin ne kadar yakın olduğunu gösterir.
      • Örneğin, yaklaşık 12 yaşına kadar olan çocukların boy ve yaşlarını ölçtüğünüzde, güçlü bir pozitif ilişki bulmayı beklersiniz. Çocuklar büyüdükçe, daha uzun olma eğilimindedirler.
      • Negatif bir korelasyon örneği, bir kişinin golf pratiği yapmak için harcadığı zamanı o kişinin golf puanıyla karşılaştırmaktır. Uygulama ilerledikçe puan düşmelidir.
      • Nihayetinde, örneğin bir kişinin ayakkabı numarası ile sınav notları arasında pozitif ya da negatif küçük bir korelasyon beklersiniz.
    • Ortalamayı hesaplayın. Bir veri kümesinin aritmetik ortalaması veya "ortalaması", verilerin tüm değerleri eklenerek ve ardından kümedeki değerlerin sayısına bölünerek hesaplanır. Verilerinizin korelasyon katsayısını belirlemek için, her veri kümesinin ortalamasını hesaplamanız gerekir.
      • Bir değişkenin ortalaması, üzerinde yatay bir çizgi bulunan değişkenle gösterilir. Bu, x ve y veri kümeleri için genellikle "x çubuğu" veya "y çubuğu" olarak adlandırılır. Alternatif olarak, ortalama Yunanca küçük harf μ (mu) ile gösterilebilir. Örneğin, x'in veri noktalarının ortalamasını belirtmek için μ kullanabilirsinizX veya μ (x).
      • Örneğin, bir x (1,2,5,6,9,10) kümeniz varsa, bu verilerin ortalaması şu şekilde hesaplanır:
        • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Standart sapmanın önemini bilin. İstatistiklerde standart sapma, sayıların ortalamadan dağılımını göstererek değişimi ölçer. Düşük standart sapmaya sahip bir grup sayı birbirine oldukça yakındır. Yüksek standart sapmaya sahip bir grup sayı daha dağınıktır.
          • Bir sembol olarak standart sapma, küçük harf s veya Yunan harfi σ (sigma) kullanılarak ifade edilir. Böylece x verisinin standart sapması şu şekilde yazılır: sX veya σX.
        • Toplama gösterimini tanıyın. Toplama operatörü, matematikteki en yaygın operatörlerden biridir ve bir değerlerin toplamını gösterir. Yunan büyük harfi sigma veya ∑ ile temsil edilir.
          • Örneğin, x (1,2,5,6,9,10) veri noktaları koleksiyonunuz varsa, ∑x şu anlama gelir:
            • 1+2+5+6+9+10 = 33

İpuçları

  • Korelasyon katsayısı bazen geliştiricisi Karl Pearson onuruna "Pearson ürün-moment korelasyon katsayısı" olarak anılır.
  • Genel olarak, 0.8'den (pozitif veya negatif) yüksek bir korelasyon katsayısı, güçlü bir korelasyonu temsil eder; 0.5'ten düşük bir korelasyon katsayısı (tekrar pozitif veya negatif), zayıf bir korelasyon katsayısını temsil eder.

Uyarılar

  • Korelasyon, iki veri setinin bir şekilde birbirine bağlı olduğunu gösterir. Ancak, bunu nedensel bir ilişki olarak yorumlamamaya dikkat edin. Örneğin, insanların ayakkabı bedenlerini ve boylarını karşılaştırırsanız, muhtemelen güçlü bir pozitif korelasyon bulacaksınız. Daha büyük insanların genellikle daha büyük ayakları vardır. Ancak bu, uzamanın ayaklarınızı büyüteceği veya büyük ayakların sizi uzatacağı anlamına gelmez. Sadece birlikte olurlar.