İstatistiksel önem: tanım, kavram, önem, regresyon denklemleri ve hipotez testi

İçindekiler:

İstatistiksel önem: tanım, kavram, önem, regresyon denklemleri ve hipotez testi
İstatistiksel önem: tanım, kavram, önem, regresyon denklemleri ve hipotez testi

Video: İstatistiksel önem: tanım, kavram, önem, regresyon denklemleri ve hipotez testi

Video: İstatistiksel önem: tanım, kavram, önem, regresyon denklemleri ve hipotez testi
Video: İstatistik : Hipotez Testi ve Amacı Nedir? (Hypothesis Testing) 2024, Kasım
Anonim

İstatistik uzun zamandır hayatın ayrılmaz bir parçası. İnsanlar her yerde bununla yüzleşiyor. İstatistiklere dayanarak, belirli bir bölgede veya nüfusun belirli bir bölümünde hangi hastalıkların yaygın olduğu, neyin daha fazla talep edildiği hakkında sonuçlar çıkarılır. Devlet kurumları için adayların siyasi programlarının oluşturulması bile istatistiksel verilere dayanmaktadır. Ayrıca perakende zincirleri tarafından mal satın alırken kullanılırlar ve üreticiler tekliflerinde bu veriler tarafından yönlendirilir.

İstatistik, toplumun yaşamında önemli bir rol oynar ve küçük şeylerde bile bireysel üyelerinin her birini etkiler. Örneğin, istatistiklere göre, belirli bir şehir veya bölgede çoğu insan giysilerde koyu renkleri tercih ediyorsa, yerel satış noktalarında çiçek desenli parlak sarı bir yağmurluk bulmak son derece zor olacaktır. Ama hangi miktarlarBu veriler böyle bir etkiye sahip mi? Örneğin, “istatistiksel olarak anlamlı” nedir? Bu tanımla tam olarak ne kastedilmektedir?

Bu nedir?

İstatistik bir bilim olarak farklı nicelik ve kavramların birleşiminden oluşur. Bunlardan biri de "istatistiksel önem" kavramıdır. Bu, değişkenlerin değerinin adıdır, ihmal edilebilir olan diğer göstergelerin ortaya çıkma olasılığı.

İstatistiksel göstergelerin hesaplanması
İstatistiksel göstergelerin hesaplanması

Örneğin, yağmurlu bir geceden sonra sonbahar ormanında mantar aramak için sabah yürüyüşünde her 10 kişiden 9'u ayaklarına lastik ayakkabı giyiyor. Bir noktada 8 tanesinin tuval üzerine mokasen giyme olasılığı ihmal edilebilir. Bu nedenle, bu özel örnekte 9 sayısı "istatistiksel anlamlılık" olarak adlandırılır.

Buna göre, verilen pratik örneği daha da geliştirirsek, ayakkabı mağazaları yaz sezonunun sonunda yılın diğer zamanlarından daha fazla miktarda lastik çizme alır. Böylece, istatistiksel değerin büyüklüğü sıradan yaşam üzerinde bir etkiye sahiptir.

Elbette, karmaşık hesaplamalarda, örneğin virüslerin yayılmasını tahmin ederken, çok sayıda değişken dikkate alınır. Ancak istatistiksel verilerin önemli bir göstergesini belirlemenin özü, hesaplamaların karmaşıklığına ve değişken değerlerin sayısına bakılmaksızın benzerdir.

Nasıl hesaplanır?

Denklemin "istatistiksel anlamlılık" göstergesinin değeri hesaplanırken kullanılır. Yani, bu durumda her şeye matematik tarafından karar verildiği söylenebilir. En basit hesaplama seçeneği, aşağıdaki parametrelerin dahil olduğu bir matematiksel işlemler zinciridir:

  • a ve b ile gösterilen satın alma miktarı gibi, anketlerden veya nesnel verilerin incelenmesinden elde edilen iki tür sonuç;
  • Her iki grup için örnek boyutu göstergesi – n;
  • birleştirilmiş örnek paylaşımın değeri - p;
  • standart hata - SE.

Bir sonraki adım, genel test puanını belirlemektir - t, değeri 1,96 sayısı ile karşılaştırılır. 1,96 ortalama değerdir ve Student'ın t-dağılım fonksiyonuna göre %95'lik bir aralık taşır.

Basit hesaplama formülü
Basit hesaplama formülü

N ve p değerleri arasındaki farkın ne olduğu sorusu sıklıkla ortaya çıkar. Bu nüansı bir örnekle netleştirmek kolaydır. Diyelim ki erkek ve kadınların herhangi bir ürün veya markasına bağlılığının istatistiksel önemi hesaplandı.

Bu durumda, harflerin ardından aşağıdakiler gelir:

  • n - yanıtlayanların sayısı;
  • p - üründen memnun olanların sayısı.

Bu durumda görüşülen kadın sayısı n1 olarak belirlenecektir. Buna göre erkekler - n2. Aynı değer, p sembolünün "1" ve "2" sayılarına sahip olacaktır.

Test puanının Öğrenci elektronik tablolarının ortalaması ile karşılaştırılması, "istatistiksel anlamlılık" olarak adlandırılan hale gelir.

Doğrulamanın anlamı nedir?

Herhangi bir matematiksel hesaplamanın sonuçları her zaman kontrol edilebilir, bu ilkokuldaki çocuklara öğretilir. varsaymak mantıklıistatistikler hesaplama zinciri kullanılarak belirlendiğinden, kontrol edilirler.

Ancak, istatistiksel anlamlılığı test etmek sadece matematik değildir. İstatistik, her zaman hesaplamaya uygun olmayan çok sayıda değişken ve çeşitli olasılıklarla ilgilenir. Yani, makalenin başındaki lastik ayakkabı örneğine dönersek, o zaman mağazalar için mal alıcılarının güveneceği istatistiksel verilerin mantıksal yapısı, sonbahar için tipik olmayan kuru ve sıcak hava nedeniyle bozulabilir.. Bu fenomenin bir sonucu olarak, lastik çizme satın alan kişi sayısı azalacak ve satış noktaları zarar görecektir. Elbette matematiksel bir formül bir hava anomalisini öngöremez. Bu anın adı “hata”dır.

İstatistiksel veri görselleştirme araçları
İstatistiksel veri görselleştirme araçları

Bu sadece bu tür hataların olasılığıdır ve hesaplanan önem düzeyinin kontrolünü hesaba katar. Hem hesaplanan göstergeleri hem de kabul edilen önem düzeylerini ve ayrıca geleneksel olarak hipotez olarak adlandırılan nicelikleri hesaba katar.

Önem düzeyi nedir?

"Seviye" kavramı, istatistiksel anlamlılık için ana kriterlere dahildir. Uygulamalı ve pratik istatistiklerde kullanılır. Bu, olası sapmaların veya hataların olasılığını hesaba katan bir tür değerdir.

Seviye, hazır örneklerdeki farklılıkların tanımlanmasına dayanır, onların önemini veya tersine rastgeleliklerini belirlemenize olanak tanır. Bu kavramın sadece dijital anlamları değil, kendine özgü yorumları da vardır. açıklıyorlardeğeri nasıl anlamanız gerekir ve seviyenin kendisi, sonucu ortalama endeksle karşılaştırarak belirlenir, bu, farklılıkların güvenilirlik derecesini ortaya çıkarır.

İstatistiklerin tartışılması
İstatistiklerin tartışılması

Böylece, bir seviye kavramını basitçe hayal edebiliriz - bu, elde edilen istatistiksel verilerden çıkarılan sonuçlarda kabul edilebilir, olası bir hata veya hatanın bir göstergesidir.

Hangi düzeyde anlamlılık kullanılır?

Uygulamada hata olasılığı katsayılarının istatistiksel önemi üç temel seviyeye dayanmaktadır.

İlk seviye, değerin %5 olduğu eşiktir. Yani, hata olasılığı %5'lik anlamlılık düzeyini aşmamaktadır. Bu, istatistiksel araştırma verilerine dayanarak yapılan sonuçların kusursuzluğuna ve yanılmazlığına olan güvenin %95 olduğu anlamına gelir.

İkinci seviye %1 eşiğidir. Buna göre bu rakam, istatistiksel hesaplamalar sırasında elde edilen verilerin %99 güvenle yönlendirilebileceği anlamına gelir.

Üçüncü seviye - %0,1. Bu değer ile hata olasılığı yüzdelik bir kesire eşittir, yani hatalar pratik olarak elimine edilir.

İstatistikte hipotez nedir?

Bir kavram olarak hatalar, sıfır hipotezinin kabulü veya reddi ile ilgili olarak iki alana ayrılır. Bir hipotez, tanıma göre, bir dizi anket sonucunun, diğer verilerin veya ifadelerin gizlendiği bir kavramdır. Yani, istatistiksel muhasebe konusuyla ilgili bir şeyin olasılık dağılımının açıklaması.

regresyonun istatistiksel önemi
regresyonun istatistiksel önemi

Basit hesaplamalarda iki hipotez vardır - sıfır ve alternatif. Aralarındaki fark, sıfır hipotezinin, istatistiksel anlamlılığın belirlenmesinde yer alan örnekler arasında temel farklılıklar olmadığı ve alternatifinin bunun tamamen tersi olduğu fikrine dayanmasıdır. Yani alternatif hipotez, bu örneklerde anlamlı bir farkın varlığına dayanmaktadır.

Hatalar nelerdir?

İstatistikte bir kavram olarak hatalar, şu veya bu hipotezin doğru olarak kabul edilmesiyle doğru orantılıdır. İki yöne veya türe ayrılabilirler:

  • ilk tür, yanlış olduğu ortaya çıkan boş hipotezin kabulünden kaynaklanmaktadır;
  • saniye - alternatifi takip etmekten kaynaklanır.
İstatistiksel Grafikleri Görüntüleme
İstatistiksel Grafikleri Görüntüleme

İlk hata türü yanlış pozitif olarak adlandırılır ve istatistiklerin kullanıldığı tüm alanlarda oldukça yaygındır. Buna göre, ikinci türdeki hataya yanlış negatif denir.

İstatistiklerde neden gerilemeye ihtiyacımız var?

Regresyonun istatistiksel önemi, onun yardımıyla, verilere dayanarak hesaplanan çeşitli bağımlılıklar modelinin gerçeğe ne kadar karşılık geldiğini belirlemenin mümkün olmasıdır; muhasebe ve sonuçlar için faktörlerin yeterliliğini veya eksikliğini belirlemenizi sağlar.

Regresyon değeri, sonuçların Fisher tablolarında listelenen verilerle karşılaştırılmasıyla belirlenir. Veya varyans analizini kullanarak. Regresyon göstergeleri şu durumlarda önemlidir:çok sayıda değişken, rastgele veri ve olası değişiklikleri içeren karmaşık istatistiksel çalışmalar ve hesaplamalar.

Önerilen: