Emisyonlar nasıl hesaplanır

Yazar: Janice Evans
Yaratılış Tarihi: 23 Temmuz 2021
Güncelleme Tarihi: 1 Temmuz 2024
Anonim
Merak Edilenlerde Bu Hafta: KARBON | Karbon Emisyonu Nedir?
Video: Merak Edilenlerde Bu Hafta: KARBON | Karbon Emisyonu Nedir?

İçerik

İstatistikte aykırı değerler, toplanan veri kümesindeki diğer değerlerden keskin bir şekilde farklı olan değerlerdir. Bir aykırı değer, veri dağılımındaki anormallikleri veya ölçüm hatalarını gösterebilir, bu nedenle aykırı değerler genellikle veri kümesinden hariç tutulur. Aykırı değerleri veri setinden çıkararak beklenmedik veya daha doğru sonuçlara ulaşabilirsiniz. Bu nedenle, istatistiklerin doğru bir şekilde anlaşılmasını sağlamak için aykırı değerleri hesaplayabilmek ve tahmin edebilmek gerekir.

adımlar

  1. 1 Potansiyel aykırı değerleri tanımayı öğrenin. Potansiyel aykırı değerler, veri kümesinden aykırı değerler hariç tutulmadan önce tanımlanmalıdır. Aykırı değerler, veri kümesindeki değerlerin çoğundan çok farklı olan değerlerdir; başka bir deyişle, aykırı değerler çoğu değerin eğiliminin dışındadır. Bunu değer tablolarında veya (özellikle) grafiklerde bulmak kolaydır. Veri kümesindeki değerler çizilirse, aykırı değerler diğer çoğu değerden uzakta olacaktır. Örneğin, değerlerin çoğu düz bir çizgiye düşerse, aykırı değerler böyle bir düz çizginin her iki tarafında bulunur.
    • Örneğin, bir odadaki 12 farklı nesnenin sıcaklıklarını temsil eden bir veri kümesini düşünün. 11 nesne yaklaşık 70 derece ise ancak on ikinci nesne (muhtemelen bir fırın) 300 derece ise, değerlere hızlı bir bakış, fırının olası bir patlama olduğunu gösterebilir.
  2. 2 Verileri artan düzende sıralayın. Aykırı değerleri belirlemenin ilk adımı, veri kümesinin medyanını hesaplamaktır. Bu görev, veri kümesindeki değerler artan sırada (küçükten büyüğe) düzenlenirse büyük ölçüde basitleşir.
    • Yukarıdaki örnekle devam ederek, birden çok nesnenin sıcaklıklarını temsil eden aşağıdaki veri kümesini göz önünde bulundurun: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Bu set şu şekilde sıralanmalıdır: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Veri kümesinin medyanını hesaplayın. Bir veri kümesinin medyanı, veri kümesinin ortasındaki değerdir. Veri kümesi tek sayıda değer içeriyorsa, medyan, veri kümesinde aynı sayıda değerin bulunduğu önceki ve sonraki değerdir. Ancak veri kümesi çift sayıda değer içeriyorsa, o zaman iki ortalamanın aritmetik ortalamasını bulmanız gerekir. Aykırı değerleri hesaplarken, medyanın, daha sonra tanımlayacağımız alt ve üst çeyrekler olan Q1 ve Q3 arasında yer aldığı için genellikle Q2 olarak anıldığını unutmayın.
    • Çift sayıda değere sahip veri kümeleriyle çalışmaktan korkmayın - iki ortalamanın aritmetik ortalaması, veri kümesinde olmayan bir sayı olacaktır; bu normal. Ancak iki ortalama değer aynı sayı ise, aritmetik ortalama bu sayıya eşittir; bu da sıralıdır.
    • Yukarıdaki örnekte ortadaki 2 değer 70 ve 71'dir, yani medyan ((70 + 71) / 2) = 70.5'tir.
  4. 4 Alt çeyreği hesaplayın. Q1 olarak adlandırılan bu değer, veri seti değerlerinin %25'inin altında kaldığı değerdir. Yani ortancaya kadar olan değerlerin yarısıdır. Ortancadan önce veri kümesinden çift sayıda değer varsa, Q1'i hesaplamak için iki ortalamanın aritmetik ortalamasını bulmanız gerekir (bu, medyanın hesaplanmasına benzer).
    • Örneğimizde, medyandan sonra 6 değer ve ondan önce 6 değer bulunur. Bu, alt çeyreği hesaplamak için medyandan önce gelen altı değerin iki ortalamasının aritmetik ortalamasını bulmamız gerektiği anlamına gelir. Burada ortalama değerler 70 ve 70'tir. Böylece Q1 = ((70 + 70) / 2) = 70 olur.
  5. 5 Üst çeyreği hesaplayın. Q3 olarak adlandırılan bu değer, veri seti değerlerinin %25'inin üzerinde olduğu değerdir. Q3 hesaplama işlemi, Q1 hesaplama işlemine benzer, ancak burada medyandan sonraki değerler dikkate alınır.
    • Yukarıdaki örnekte, medyandan sonraki altının iki ortalaması 71 ve 72'dir. Yani Q3 = ((71 + 72) / 2) = 71.5.
  6. 6 Çeyrekler arası aralığı hesaplayın. Q1 ve Q3'ü hesapladıktan sonra bu değerler arasındaki mesafeyi bulmak gerekir. Bunu yapmak için Q1'i Q3'ten çıkarın. Çeyrekler arası aralığın değeri, aykırı olmayan değerlerin sınırlarını belirlemek için son derece önemlidir.
    • Örneğimizde Q1 = 70 ve Q3 = 71.5. Çeyrekler arası aralık 71,5 - 70 = 1,5'tir.
    • Bunun negatif Q1 ve Q3 değerleri için de geçerli olduğunu unutmayın. Örneğin, Q1 = -70 ise, çeyrekler arası aralık 71,5 - (-70) = 141.5'tir.
  7. 7 Veri kümesindeki değerlerin "iç sınırlarını" bulun. Aykırı değerler, "iç sınırlar" ve "dış sınırlar" olarak adlandırılan sınırlara girip girmedikleri, değerlerin analiz edilmesiyle belirlenir. “İç sınırlar” dışında kalan bir değer “küçük aykırı değer” olarak sınıflandırılırken “dış sınırlar” dışında kalan bir değer “önemli aykırı değer” olarak sınıflandırılır. İç sınırları bulmak için çeyrekler arası aralığı 1,5 ile çarpmanız gerekir; sonuç Q3'e eklenmeli ve Q1'den çıkarılmalıdır. Bulunan iki sayı, veri kümesinin iç sınırlarıdır.
    • Örneğimizde, çeyrekler arası aralık (71.5 - 70) = 1.5'tir. Ayrıca: 1.5 * 1.5 = 2.25. İç sınırları bulmak için bu sayı Q3'e eklenmeli ve Q1'den çıkarılmalıdır:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Böylece, iç sınırlar 67.75 ve 73.75'tir.
    • Örneğimizde, yalnızca fırın sıcaklığı - 300 derece - bu sınırların dışındadır ve önemsiz bir emisyon olarak kabul edilebilir. Ancak hemen sonuçlara varmayın - bu sıcaklığın önemli bir aykırı değer olup olmadığını belirlememiz gerekiyor.
  8. 8 Veri kümesinin "dış sınırlarını" bulun. Bu, çeyrekler arası aralığın 1,5 yerine 3 ile çarpılması dışında, iç sınırlarla aynı şekilde yapılır. Sonuç, Q3'e eklenmeli ve Q1'den çıkarılmalıdır. Bulunan iki sayı, veri kümesinin dış sınırlarıdır.
    • Örneğimizde, çeyrekler arası aralığı 3: 1.5 * 3 = 4.5 ile çarpın. Dış sınırları hesaplayın:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Yani dış sınırlar 65.5 ve 76'dır.
    • Dış sınırların dışında kalan herhangi bir değer, önemli emisyonlar olarak kabul edilir. Örneğimizde, 300 derecelik bir fırın sıcaklığı önemli bir patlama olarak kabul edilir.
  9. 9 Aykırı değerlerin veri kümesinden çıkarılması gerekip gerekmediğini belirlemek için nitel bir tahmin kullanın. Yukarıda açıklanan yöntem, bazı değerlerin aykırı (küçük veya önemli) olup olmadığını belirlemenizi sağlar. Yine de hata yapmayın - aykırı değer olarak sınıflandırılan bir değer, istisna için yalnızca bir "adaydır", yani onu hariç tutmanız gerekmez. Aykırı değerin nedeni, aykırı değeri dışlama kararını etkileyen ana faktördür. Kural olarak, hatalar (ölçümler, kayıtlar vb.) nedeniyle oluşan aykırı değerler hariç tutulur. Öte yandan, hatalarla değil, yeni bilgiler veya eğilimlerle ilişkili aykırı değerler genellikle veri kümesinde bırakılır.
    • Aykırı değerlerin veri setinin medyanı üzerindeki etkisini değerlendirmek de aynı derecede önemlidir (bunu çarpıtsınlar veya bozmasınlar). Bu, özellikle bir veri kümesinin medyanından sonuçlar çıkarırken önemlidir.
    • Örneğimizde, fırının 300 dereceye kadar ısınması pek olası değildir (doğal anormallikleri hesaba katmadıkça). Bu nedenle, (yüksek bir kesinlikle) böyle bir sıcaklığın veri setinden çıkarılması gereken bir ölçüm hatası olduğu sonucuna varılabilir. Ayrıca, aykırı değeri dışlamazsanız, veri kümesinin medyanı (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89.67 derece olacaktır, ancak aykırı değeri hariç tutarsanız, medyan (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70.55 derece olacaktır.
      • Aykırı değerler genellikle insan hatasının sonucudur, bu nedenle aykırı değerlerin veri kümelerinden çıkarılması gerekir.
  10. 10 Veri kümesinde kalan (bazen) aykırı değerlerin önemini anlayın. Hatalar ve teknik problemler nedeniyle bazı aykırı değerler veri setinden çıkarılmalıdır; diğer aykırı değerler veri kümesinde bırakılmalıdır. Örneğin, bir aykırı değer bir hatanın sonucu değilse ve/veya test edilen olgunun yeni bir anlayışını sağlıyorsa, veri setinde bırakılmalıdır. Bilimsel deneyler özellikle aykırı değerlere karşı hassastır - yanlışlıkla bir aykırı değeri ortadan kaldırırsanız, bazı yeni trendleri veya keşifleri kaçırıyor olabilirsiniz.
    • Örneğin, balıkçılıkta balık boyutunu artırmak için yeni bir ilaç geliştiriyoruz. Eski veri setini kullanacağız ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), ancak bu sefer her bir değer balığın ağırlığını (gram olarak) temsil edecektir. alımından sonra deneysel ilaç. Başka bir deyişle, ilk ilaç 71 g'a kadar balık ağırlığında, ikinci ilaç - 70 g'a kadar vb. Bu durumda 300 önemli bir aykırı değerdir, ancak bunu göz ardı etmemeliyiz; hiçbir ölçüm hatası olmadığını varsayarsak, böyle bir aykırı değer deneyde önemli bir başarıdır. Balığın ağırlığını 300 grama çıkaran ilaç, diğer ilaçlardan çok daha iyi etki gösteriyor; bu nedenle 300, veri kümesindeki en önemli değerdir.

İpuçları

  • Aykırı değerler bulunduğunda, bunları veri kümesinden çıkarmadan önce varlıklarını açıklamaya çalışın. Ölçüm hatalarını veya dağıtım anormalliklerini gösterebilirler.

Neye ihtiyacın var

  • Hesap makinesi