ev - Castaneda Carlos
Bir aralık varyasyon serisi örneğinin oluşturulması. Varyasyon serisi kavramı. Varyasyon serisi türleri. Pearson korelasyon testi ne için kullanılır?
Çözüm

X için, matematiksel beklentisi M (X) ve varyans D (X). Çözüm... Rastgele bir değişkenin F (x) dağılım fonksiyonunu bulalım ... örnekleme hatası). hadi besteleyelim değişken sıra Açıklık Genişliği olacak: Her değer için bir dizi kaç tane hesaplayalım...

  • Çözüm: Ayrılabilir Denklem

    Çözüm

    Formda Özel bulmak için çözümler homojen olmayan denklem makyaj yapmak sistem Ortaya çıkan sistemi çözelim...; +47; +61; +10; -sekiz. Yapı Aralığı değişken sıra... Ortalamanın istatistiksel tahminlerini verin ...

  • Çözüm: Zincir ve temel mutlak artışları, büyüme oranlarını, büyüme oranlarını hesaplayalım. Elde edilen değerler tablo 1'de özetlenmiştir.

    Çözüm

    Üretim hacmi. Çözüm: Aralığın aritmetik ortalaması değişken bir dizi aşağıdaki gibi hesaplanır: ... için 0,954 (t = 2) olasılığı olan marjinal örnekleme hatası olacak: Δ w = t * μ = 2 * 0.0146 = 0.02927 Sınırları belirleyin ...

  • Çözüm. İşaret

    Çözüm

    Kimin iş tecrübesi ve yapılanörneklem. Bu çalışanların çalışma günlerinin örnek ortalama süresi ... ve yapılanörneklem. Örnek için ortalama süre ... 1.16, anlamlılık düzeyi α = 0.05'tir. Çözüm. varyasyonel sıra Bu numunenin formu şu şekildedir: 0.71 ...

  • 10-11. sınıflar için biyoloji çalışma müfredatı S. Polikarpova tarafından derlenmiştir.

    Çalışma Eğitim programı

    En basit geçiş şemaları "5 LR. " Çözüm temel genetik problemler "6 L. r. " Çözüm temel genetik problemler ”7 L. r. “..., 110, 115, 112, 110. Makyaj yapmak değişken sıra, Berabere değişken eğri, özelliğin ortalama değerini bulun ...

  • Bu bölümde uzmanlaşmanın bir sonucu olarak, öğrenci şunları yapmalıdır: bilmek

    • varyasyon göstergeleri ve ilişkileri;
    • özellik dağılımının temel yasaları;
    • rıza kriterlerinin özü; yapabilmek
    • varyasyon göstergelerini ve uyum iyiliği kriterlerini hesaplamak;
    • dağılımların özelliklerini tanımlar;
    • istatistiksel dağılım serilerinin temel sayısal özelliklerini değerlendirmek;

    sahip olmak

    • dağılım serilerinin istatistiksel analiz yöntemleri;
    • varyans analizinin temelleri;
    • temel dağıtım yasalarına uygunluk için istatistiksel dağıtım serilerini kontrol etme yöntemleri.

    Varyasyon göstergeleri

    saat istatistiksel araştırma Büyük ilgi çeken çeşitli istatistiksel toplamların özellikleri, popülasyonun bireysel istatistiksel birimlerinin özelliklerinin varyasyonunun yanı sıra bu özellik için birimlerin dağılımının doğasının incelenmesidir. Varyasyon - bunlar, incelenen popülasyonun birimlerindeki bir özelliğin bireysel değerlerindeki farklılıklardır. Varyasyon çalışması büyük pratik önem... Varyasyon derecesine göre, bir özelliğin varyasyon sınırlarını, bu özellik için popülasyonun homojenliğini, ortalamanın tipikliğini, varyasyonu belirleyen faktörlerin ilişkisini yargılayabilir. Varyasyon göstergeleri, istatistiksel popülasyonları karakterize etmek ve sıralamak için kullanılır.

    İstatistiksel dağılım serileri şeklinde hazırlanan istatistiksel gözlem materyallerinin özeti ve gruplandırılmasının sonuçları, çalışılan popülasyonun birimlerinin gruplama (değişen) özelliğine göre gruplara sıralı bir dağılımını temsil eder. Gruplama için nitel bir özellik temel alınırsa, böyle bir dağıtım serisine denir. nitelik(mesleğe göre dağılım, cinsiyet, renk vb.). Bir dağılım serisi nicel bir temelde oluşturulmuşsa, böyle bir seriye denir. değişken(boy, kilo, ücretlerin büyüklüğü vb. göre dağılım). Varyasyon serisi oluşturmak, özniteliğin değerlerine göre popülasyon birimlerinin nicel dağılımının sıralanması, popülasyon birimlerinin bu değerlerle (frekans) sayılması ve sonuçların bir tabloya yerleştirilmesi anlamına gelir.

    Varyantın frekansı yerine, frekans (göreceli frekans) olarak adlandırılan toplam gözlem hacmine olan ilişkisini uygulamak mümkündür.

    İki tür varyasyon serisi vardır: kesikli ve aralıklı. ayrık seri- süreksiz değişime sahip özelliklere (ayrık özellikler) dayanan bir varyasyon serisidir. İkincisi, işletmedeki çalışan sayısını, ücret düzeyini, ailedeki çocuk sayısını vb. Ayrık bir varyasyon serisi, iki grafikten oluşan bir tablodur. İlk sütun, özniteliğin belirli değerini ve ikincisi - özniteliğin belirli bir değerine sahip popülasyonun birimlerinin sayısını gösterir. Özniteliğin sürekli bir değişimi varsa (belirli sınırlar içinde herhangi bir değeri alabilen gelir miktarı, iş deneyimi, işletmenin sabit varlıklarının maliyeti vb.), o zaman bu özellik için inşa etmek mümkündür. aralıklı varyasyon serisi. Bir aralık varyasyon serisi oluştururken, tablonun ayrıca iki sütunu vardır. İlki, "-den"e (seçenekler) aralığındaki özelliğin değerini, ikincisi - aralığa dahil edilen birim sayısını (frekans) içerir. Frekans (tekrar oranı) - özellik değerlerinin ayrı bir varyantının tekrar sayısı. Aralıklar kapatılıp açılabilir. Kapalı aralıklar her iki tarafta da sınırlıdır, yani. hem alt ("from") hem de üst ("to") bir kenarlığa sahiptir. Açık aralıkların herhangi bir sınırı vardır: üst veya alt. Seçenekler artan veya azalan sırada düzenlenirse, satırlar denir. sıralanmış.

    Varyasyon serileri için iki tür frekans yanıtı seçeneği vardır: birikmiş frekans ve birikmiş frekans. Birikmiş frekans, özelliğin değerinin belirtilenden daha düşük değerlerde kaç gözlem aldığını gösterir. Birikmiş frekans, bu grup için özniteliğin frekans değerlerinin önceki grupların tüm frekansları ile toplanmasıyla belirlenir. Birikmiş frekans, özelliğin değerlerinin gün grubunun üst sınırını aşmadığı gözlem birimlerinin oranını karakterize eder. Böylece, kümülatif frekans, belirli bir değerden fazla olmayan bir değere sahip olan toplamdaki varyantın özgül ağırlığını gösterir. Frekans, frekans, mutlak ve bağıl yoğunluk, birikmiş frekans ve frekans, varyantın büyüklüğünün özellikleridir.

    Nüfusun istatistiksel birimlerinin niteliğindeki varyasyonlar ve dağılımın doğası, serinin ortalama seviyesini, ortalama doğrusal sapmayı, standart sapmayı, varyansı içeren varyasyon serisinin göstergeleri ve özellikleri kullanılarak incelenir. , salınım katsayıları, varyasyon, asimetri, basıklık, vb.

    Dağıtım merkezini karakterize etmek için ortalama değerler kullanılır. Ortalama, incelenen popülasyonun üyelerinin sahip olduğu özelliğin tipik düzeyinin nicelleştirildiği genelleştirici bir istatistiksel özelliktir. Bununla birlikte, dağılımın farklı bir doğası ile aritmetik ortalamaların çakışması durumları mümkündür, bu nedenle, varyasyon serisinin istatistiksel özellikleri olarak, sözde yapısal ortalamalar hesaplanır - mod, medyan ve dağılımı bölen nicelikler serileri eşit parçalara ayırın (çeyrekler, ondalıklar, yüzdelikler, vb.) ).

    Moda - bu, bir dağılım serisinde diğer değerlerden daha sık meydana gelen bir özelliğin değeridir. Ayrık seriler için bu, en yüksek frekansa sahip seçenektir. Aralık varyasyon serilerinde, modu belirlemek için, her şeyden önce, bulunduğu aralığı, sözde modal aralığı belirlemek gerekir. Eşit aralıklı bir varyasyon serisinde modal aralık, eşit olmayan aralıklı serilerde en yüksek frekans tarafından belirlenir - ancak en yüksek dağıtım yoğunluğu. Ardından, eşit aralıklarla satırlarda modu belirlemek için formülü kullanın.

    Mo, modun değeridir; x Mo, mod aralığının alt sınırıdır; H - mod aralığının genişliği; / Mo, mod aralığının frekansıdır; / Mo j, mod öncesi aralığın frekansıdır; / Mo + 1, post-modal aralığın frekansıdır ve bu hesaplama formülünde eşit olmayan aralıklara sahip bir dizi için frekanslar yerine / Mo, / Mo, / Mo, dağılım yoğunlukları kullanılmalıdır. Akıl 0 _| , Akıl 0> UM + "

    Tek bir mod varsa, rastgele değişkenin olasılık dağılımına tek modlu denir; birden fazla mod varsa, iki mod olması durumunda çok modlu (çok modlu, çok modlu) denir - iki modlu. Kural olarak, çok modluluk, incelenen dağılımın normal dağılım yasasına uymadığını gösterir. Homojen popülasyonlar için, kural olarak, tek modlu dağılımlar karakteristiktir. Çoklu köşe ayrıca çalışılan popülasyonun heterojenliğini gösterir. İki veya daha fazla tepe noktasının görünümü, daha homojen gruplar seçmek için verilerin yeniden gruplandırılmasını gerekli kılar.

    Bir aralık varyasyon serisinde mod, bir histogram kullanılarak grafiksel olarak belirlenebilir. Bunun için, histogramın en yüksek sütununun üst noktalarından bitişik iki sütunun üst noktalarına kadar kesişen iki çizgi çizilir. Daha sonra, kesişme noktalarından, apsis eksenine bir dik indirilir. Apsis eksenindeki özelliğin dikeye karşılık gelen değeri moddur. Çoğu durumda, popülasyonu karakterize ederken, moda, genelleştirilmiş bir gösterge olarak aritmetik ortalamaya tercih edilir.

    ortanca -özelliğin temel anlamı budur; sıralı dağıtım serisinin merkezi üyesi tarafından ele geçirilir. Kesikli serilerde medyanın değerini bulmak için önce sıra sayısı belirlenir. Bunu yapmak için, tek sayıda birim ile tüm frekansların toplamına bir eklenir, sayı ikiye bölünür. Birim sayısı çift ise dizide iki ortanca birim olacaktır, bu nedenle bu durumda ortanca, iki ortanca birimin değerlerinin ortalaması olarak belirlenir. Dolayısıyla, kesikli bir varyasyon serisindeki medyan, seriyi aynı sayıda seçeneği içeren iki parçaya bölen değerdir.

    Aralık serilerinde, ortancanın sıra sayısını belirledikten sonra, ortanca aralık, biriken frekanslar (parçalar) tarafından bulunur ve daha sonra, ortanca hesaplama formülü kullanılarak, ortancanın değeri belirlenir:

    burada Me medyan değerdir; x Ben - medyan aralığın alt sınırı; H - medyan aralığın genişliği; - dağıtım serisinin frekanslarının toplamı; / D - medyan öncesi aralığın birikmiş frekansı; / Me, medyan aralığın frekansıdır.

    Medyan, kümülat kullanılarak grafiksel olarak bulunabilir. Bunun için, medyanın sıra sayısına karşılık gelen noktadan kümülatların birikmiş frekansları (frekansları) ölçeğinde, kümülatı kesene kadar apsis eksenine paralel bir düz çizgi çizilir. Ayrıca, belirtilen düz çizginin kümülatif ile kesişme noktasından, apsis eksenine bir dik indirilir. Çizilen ordinata (dik) karşılık gelen apsis eksenindeki bir özelliğin değeri medyandır.

    Medyan, aşağıdaki özelliklerle karakterize edilir.

    • 1. Her iki tarafında bulunan özelliğin değerlerine bağlı değildir.
    • 2. Özniteliğin değerlerinin medyandan mutlak sapmalarının toplamının, özniteliğin değerlerinin medyandan sapmasına kıyasla minimum değer olduğu gerçeğinden oluşan minimallik özelliğine sahiptir. başka herhangi bir değer.
    • 3. İki dağılımı bilinen medyanlarla birleştirirken, yeni dağılımın medyanının değerini önceden tahmin etmek imkansızdır.

    Medyanın bu özellikleri, kamu hizmet noktalarının - okullar, klinikler, benzin istasyonları, su boruları vb. Yerlerinin tasarımında yaygın olarak kullanılmaktadır. Örneğin, şehrin belirli bir mahallesine poliklinik yapılması planlanıyorsa, mahallenin mahallenin uzunluğunu değil, sakin sayısını ikiye bölen bir noktaya yerleştirilmesi daha uygundur.

    Modun oranı, medyan ve aritmetik ortalama, özniteliğin toplamdaki dağılımının doğasını gösterir, dağılımın simetrisini değerlendirmenize olanak tanır. Eğer x Me o zaman satırın sağ taraflı bir asimetrisi var. Normal dağılım ile X - Hafıza.

    K. Pearson, çeşitli eğri tiplerini eşitleme temelinde, orta derecede asimetrik dağılımlar için aritmetik ortalama, medyan ve mod arasında aşağıdaki yaklaşık ilişkilerin geçerli olduğunu belirledi:

    burada Me medyan değerdir; Mo, modanın anlamıdır; x aritmi - aritmetik ortalamanın değeri.

    Varyasyon serisinin yapısını daha ayrıntılı incelemek gerekirse, medyana benzer şekilde özelliğin değerleri hesaplanır. Karakteristiklerin bu değerleri, tüm dağıtım birimlerini eşit sayılara böler, bunlara nicelik veya gradyan denir. Nicelikler çeyreklere, ondalıklara, yüzdeliklere vb. bölünür.

    Çeyrekler nüfusu dört eşit parçaya böler. İlk çeyrek, daha önce ilk çeyrek aralığını belirledikten sonra, ilk çeyreği hesaplamak için formül kullanılarak medyana benzer şekilde hesaplanır:

    burada Qi birinci çeyreğin değeridir; x S ^ - ilk çeyrek aralığın alt sınırı; H- ilk üç aylık aralığın genişliği; /, - aralık serisinin frekansları;

    İlk çeyrek aralığından önceki aralıkta birikmiş frekans; Jq (ilk çeyrek aralığın frekansıdır.

    İlk çeyrek, nüfus birimlerinin %25'inin değerinden daha az ve %75'inin - daha fazla olduğunu göstermektedir. İkinci çeyrek medyana eşittir, yani. S2 = Ben mi.

    Benzetme yoluyla, daha önce üçüncü üç aylık aralığı bulmuş olan üçüncü çeyrek hesaplanır:

    üçüncü çeyrek aralığının alt sınırı nerede; H- üçüncü çeyrek aralığın genişliği; /, - aralık serisinin frekansları; / X "-önceki aralıkta birikmiş frekans

    G

    üçüncü çeyrek aralığı; Jq, üçüncü çeyrek aralığının frekansıdır.

    Üçüncü çeyrek, nüfus birimlerinin %75'inin değerinden daha az ve %25'inin daha fazla olduğunu göstermektedir.

    Üçüncü ve birinci çeyrekler arasındaki fark, çeyrekler arası aralıktır:

    burada Aq, çeyrekler arası aralığın değeridir; S 3 -üçüncü çeyreğin değeri; Q, ilk çeyreğin değeridir.

    Ondalık, nüfusu 10'a böler eşit parçalar... Bir ondalık, bir dağılım serisindeki bir özelliğin popülasyon büyüklüğünün onda birine karşılık gelen böyle bir değeridir. Çeyreklerle benzetme yaparak, ilk ondalık nüfus birimlerinin %10'unun değerinden daha az ve %90 - daha fazla olduğunu ve dokuzuncu ondalık, nüfus birimlerinin %90'ının değerinden daha az olduğunu ve %10 - daha fazla. Dokuzuncu ve birinci ondalıkların oranı, yani. Ondalık katsayısı, en zengin %10'luk ve en yoksul %10'luk nüfusun gelir düzeylerinin oranını ölçmek için gelir farklılaşması çalışmasında yaygın olarak kullanılmaktadır. Yüzdelikler, sıralanan popülasyonu 100 eşit parçaya böler. Yüzdeliklerin hesaplanması, anlamı ve uygulanması ondalıklara benzer.

    Çeyrekler, ondalıklar ve diğer yapısal özellikler, kümülatlar kullanılarak medyanla analoji yapılarak grafiksel olarak belirlenebilir.

    Varyasyonun boyutunu ölçmek için aşağıdaki göstergeler kullanılır: varyasyon aralığı, ortalama doğrusal sapma, standart sapma, varyans. Varyasyon aralığının büyüklüğü tamamen serinin uç terimlerinin dağılımının rastgeleliğine bağlıdır. Bu gösterge, özniteliğin değerlerindeki dalgalanmaların genliğinin ne olduğunu bilmenin önemli olduğu durumlarda ilgi çekicidir:

    nerede R - varyasyon aralığının değeri; x max, özelliğin maksimum değeridir; x tt -özelliğin minimum değeri.

    Varyasyon aralığı hesaplanırken, serinin üyelerinin ezici çoğunluğunun değeri dikkate alınmazken, varyasyon, serinin üyesinin her bir değeri ile ilişkilendirilir. Bu dezavantaj, özelliğin bireysel değerlerinin kendi değerlerinden sapmalarından elde edilen ortalamalar olan göstergelerden yoksundur. ortalama boyut: ortalama doğrusal sapma ve standart sapma. Ortalamadan bireysel sapmalar ile belirli bir özelliğin değişkenliği arasında doğrudan bir ilişki vardır. Dalgalanma ne kadar güçlü olursa, ortalamadan sapmaların mutlak boyutu o kadar büyük olur.

    Ortalama doğrusal sapma, bireysel seçeneklerin ortalamalarından sapmalarının mutlak değerlerinin aritmetik ortalamasıdır.

    Gruplandırılmamış veriler için ortalama doğrusal sapma

    burada / pr, ortalama doğrusal sapmanın değeridir; x, - özelliğin değeridir; X - P - Popülasyondaki birim sayısı.

    Gruplandırılmış serilerin ortalama doğrusal sapması

    nerede / vz - ortalama doğrusal sapmanın değeri; x, özelliğin değeridir; X - incelenen popülasyon için özelliğin ortalama değeri; / ayrı bir gruptaki nüfus birimlerinin sayısıdır.

    Bu durumda, sapma işaretleri yok sayılır, aksi takdirde tüm sapmaların toplamı sıfıra eşit olacaktır. Analiz edilen verilerin gruplandırılmasına bağlı olarak ortalama doğrusal sapma, çeşitli formüller kullanılarak hesaplanır: gruplandırılmış ve toplanmamış veriler için. Gelenekselliği nedeniyle, diğer değişkenlik göstergelerinden ayrı olarak ortalama doğrusal sapma, uygulamada nispeten nadiren kullanılır (özellikle, teslimatın tekdüzeliği açısından sözleşme yükümlülüklerinin yerine getirilmesini karakterize etmek için; dış ticaret cirosunun analizinde, çalışanların kompozisyonu, üretimin ritmi, ürün kalitesi, üretimin teknolojik özelliklerinin dikkate alınması vb.).

    Standart sapma, incelenen özelliğin bireysel değerlerinin ortalama olarak popülasyon için ortalama değerden ne kadar saptığını karakterize eder ve incelenen özelliğin ölçüm birimlerinde ifade edilir. Ana varyasyon ölçütlerinden biri olan standart sapma, homojen bir popülasyondaki bir özelliğin varyasyon sınırlarının değerlendirilmesinde, normal dağılım eğrisinin koordinatlarının değerlerinin belirlenmesinde ve hesaplamalarda yaygın olarak kullanılır. numune gözlemini organize etmek ve numune özelliklerinin doğruluğunu belirlemekle ilgilidir. Kaba olmayan verilerin ortalama karekök sapması aşağıdaki algoritmaya göre hesaplanır: ortalamadan her sapmanın karesi alınır, tüm kareler toplanır, ardından karelerin toplamı üye sayısına bölünür. seri ve karekök bölümden çıkarılır:

    burada bir Iip, standart sapmanın değeridir; Xj -özelliğin değeri; x- incelenen popülasyon için özelliğin ortalama değeri; P - Popülasyondaki birim sayısı.

    Gruplandırılmış analiz edilen veriler için verilerin standart sapması, ağırlıklı formül kullanılarak hesaplanır.

    nerede - standart sapmanın değeri; Xj -özelliğin değeri; X - incelenen popülasyon için özelliğin ortalama değeri; fx - belirli bir gruptaki nüfus birimlerinin sayısı.

    Her iki durumda da kökün altındaki ifadeye varyans denir. Böylece varyans, öznitelik değerlerinin ortalamalarından sapmalarının ortalama karesi olarak hesaplanır. Karakteristiğin ağırlıksız (basit) değerleri için varyans şu şekilde belirlenir:

    Ağırlıklı karakteristik değerler için

    Varyansı hesaplamanın özel, basitleştirilmiş bir yolu da vardır: genel biçimde

    ağırlıksız (basit) karakteristik değerler için ağırlıklı karakteristik değerler için
    koşullu sıfır sayma yöntemini kullanarak

    burada a 2, varyansın değeridir; x, - özelliğin değeridir; X - bir özelliğin ortalama değeri, H - grup aralığı değeri, 1 - ağırlık (A =

    Dağılım istatistikte bağımsız bir ifadeye sahiptir ve varyasyonun en önemli göstergelerinden biridir. İncelenen özelliğin ölçü birimlerinin karesine karşılık gelen birimlerde ölçülür.

    Dispersiyon aşağıdaki özelliklere sahiptir.

    • 1. Sabitin varyansı sıfırdır.
    • 2. Bir özelliğin tüm değerlerinde aynı A değeri kadar azalma, varyansın büyüklüğünü değiştirmez. Bu, ortalama sapma karesinin, özniteliğin verilen değerleriyle değil, bazı sabit sayıdan sapmalarıyla hesaplanabileceği anlamına gelir.
    • 3. Özniteliğin tüm değerlerinde azalma k kez varyansı azaltır k 2 kez ve standart sapma - k kez, yani özniteliğin tüm değerleri bir sabit sayıya bölünebilir (örneğin, serinin aralığının değerine göre), standart sapmayı hesaplayın ve ardından sabit bir sayı ile çarpın.
    • 4. Herhangi bir değerden sapmaların ortalama karesini hesaplarsanız ve aritmetik ortalamadan bir dereceye kadar farklıysa, her zaman aritmetik ortalamadan hesaplanan ortalama sapma karesinden daha büyük olacaktır. Bu durumda, sapmaların ortalama karesi, oldukça kesin bir miktarda - ortalama ile bu geleneksel olarak alınan değer arasındaki farkın karesi kadar - daha büyük olacaktır.

    Alternatif bir özelliğin bir varyasyonu, popülasyon birimlerinde incelenen özelliğin varlığından veya yokluğundan oluşur. Nicel olarak, alternatif bir özelliğin varyasyonu iki değerle ifade edilir: bir birimde incelenen özelliğin varlığı bir birim (1) ile ve yokluğu sıfır (0) ile gösterilir. İncelenen özelliğe sahip birimlerin kesri P ile gösterilir ve bu özelliğe sahip olmayan birimlerin kesri ile gösterilir. G. Böylece, alternatif bir özelliğin varyansı, bu özelliğe sahip birimlerin kesrinin (P) bu özelliğe sahip olmayan birimlerin kesrine eşittir. (G). Populasyondaki en büyük varyasyon, populasyonun toplam hacminin %50'sini oluşturan bir kısmının bir özelliğe sahip olduğu ve yine popülasyonun %50'ye eşit olan diğer kısmının sahip olmadığı durumlarda elde edilir. bu özellik varyans maksimum 0,25 değerine ulaşırken yani .e. P = 0,5, G = 1 - P = 1 - 0,5 = 0,5 ve o 2 = 0,5 0,5 = 0,25. Bu göstergenin alt sınırı sıfırdır ve bu, toplam varyasyonun olmadığı bir duruma karşılık gelir. Alternatif bir özelliğin varyansının pratik uygulaması, güvenilirlik aralığı seçici gözlem yaparken.

    Varyans ve standart sapma ne kadar küçükse, popülasyon o kadar homojen ve ortalama o kadar tipik olacaktır. İstatistik uygulamasında, genellikle çeşitli özelliklerin varyasyonlarını karşılaştırmak gerekir. Örneğin, işçilerin yaşı ve nitelikleri, hizmet süreleri ve ücretleri, maliyet ve kâr, hizmet süresi ve işgücü verimliliği vb.'deki farklılıkları karşılaştırmak ilginçtir. Bu tür karşılaştırmalar için, özelliklerin mutlak değişkenliğinin göstergeleri uygun değildir: yıl cinsinden ifade edilen hizmet süresinin değişkenliğini, ruble cinsinden ifade edilen ücretlerdeki değişiklikle karşılaştırmak imkansızdır. Farklı aritmetik ortalamalara sahip birkaç popülasyonda aynı özelliğin dalgalanmalarının karşılaştırılmasının yanı sıra, bu tür karşılaştırmaları gerçekleştirmek için, varyasyon göstergeleri kullanılır - salınım katsayısı, doğrusal varyasyon katsayısı ve varyasyon katsayısı, ortalama etrafındaki aşırı değerlerdeki dalgalanmaların ölçüsü.

    salınım katsayısı:

    nerede VR - salınım katsayısının değeri; r- varyasyon aralığının değeri; X -

    Doğrusal varyasyon katsayısı ".

    nerede vj - lineer varyasyon katsayısının değeri; BEN - ortalama doğrusal sapmanın değeri; X - incelenen popülasyon için özelliğin ortalama değeri.

    varyasyon katsayısı:

    nerede V bir - varyasyon katsayısının değeri; a - standart sapmanın değeri; X - incelenen popülasyon için özelliğin ortalama değeri.

    Salınım katsayısı, çalışılan özelliğin ortalama değerine varyasyon aralığının yüzdesidir ve doğrusal varyasyon katsayısı, ortalama doğrusal sapmanın incelenen özelliğin ortalama değerine oranıdır ve yüzde olarak ifade edilir. Varyasyon katsayısı, çalışılan özelliğin ortalamasına standart sapmanın yüzdesidir. Yüzde olarak ifade edilen göreli bir değer olarak, varyasyon katsayısı, çeşitli özelliklerin varyasyon derecesini karşılaştırmak için kullanılır. Varyasyon katsayısı, istatistiksel popülasyonun homojenliğini tahmin etmek için kullanılır. Varyasyon katsayısı %33'ten küçükse, çalışılan popülasyon homojendir ve varyasyon zayıftır. Varyasyon katsayısı %33'ten fazlaysa, o zaman çalışılan popülasyon heterojendir, varyasyon güçlüdür ve ortalama değer atipiktir ve bu popülasyonun genelleştirici bir göstergesi olarak kullanılamaz. Ek olarak, farklı popülasyonlardaki bir özelliğin değişkenliğini karşılaştırmak için varyasyon katsayıları kullanılır. Örneğin, iki işletmede çalışanların hizmet sürelerindeki değişimi değerlendirmek için. Katsayının değeri ne kadar yüksekse, özelliğin varyasyonu o kadar anlamlıdır.

    Hesaplanan çeyreklere dayanarak, formülü kullanarak üç aylık değişimin nispi göstergesini hesaplamak da mümkündür.

    nerede Q 2 ve

    Çeyrekler arası aralık formülle belirlenir

    Uç değerleri kullanmanın dezavantajlarından kaçınmak için aralık yerine çeyrek sapması kullanılır:

    Eşit olmayan aralıklı varyasyon serileri için dağılım yoğunluğu da hesaplanır. Karşılık gelen frekansın veya frekansın, aralığın değerine bölünmesiyle elde edilen bölüm olarak tanımlanır. Eşit olmayan aralıklı serilerde mutlak ve bağıl dağılım yoğunlukları kullanılır. Dağılımın mutlak yoğunluğu, aralığın birim uzunluğu başına frekanstır. Göreceli dağılım yoğunluğu, aralığın birim uzunluğu başına frekanstır.

    Yukarıdakilerin tümü, dağılım yasası normal dağılım yasası tarafından iyi tanımlanmış veya ona yakın olan dağılım serileri için geçerlidir.

    İstatistiksel analizde özel bir yer, incelenen özelliğin veya olgunun ortalama seviyesinin tanımına aittir. Ortalama seviyeözellikler ortalama değerlerle ölçülür.

    Ortalama değer, çalışılan özelliğin genel nicel seviyesini karakterize eder ve istatistiksel popülasyonun bir grup özelliğidir. Bireysel gözlemlerin rastgele sapmalarını bir yönde veya başka bir yerde nötralize eder, zayıflatır ve ana olanı ön plana çıkarır, tipik mülk incelenen özellik.

    Ortalamalar yaygın olarak kullanılır:

    1. Nüfusun sağlık durumunu değerlendirmek: fiziksel gelişimin özellikleri (boy, kilo, göğüs çevresi vb.), çeşitli hastalıkların prevalansını ve süresini belirlemek, demografik göstergeleri analiz etmek (nüfusun doğal hareketi, ortalama yaşam beklentisi) , nüfusun yeniden üretimi, ortalama nüfus vb.).

    2. Sağlık kurumlarının, sağlık personelinin faaliyetlerini incelemek ve çalışmalarının kalitesini değerlendirmek, bölgedeki nüfusun ihtiyaçlarını planlamak ve belirlemek. farklı şekiller tıbbi bakım (yılda kişi başına ortalama ziyaret veya ziyaret sayısı, ortalama hastanede kalış süresi, ortalama hasta muayene süresi, ortalama doktor, yatak, vb. mevcudiyeti).

    3. Sıhhi ve epidemiyolojik durumu karakterize etmek (atölyedeki ortalama toz içeriği, kişi başına ortalama alan, ortalama protein, yağ ve karbonhidrat tüketimi vb.).

    4. Laboratuvar verilerini işlerken sağlık ve hastalıkta tıbbi ve fizyolojik parametreleri belirlemek, sosyal ve hijyenik, klinik, deneysel çalışmalarda örnek bir çalışmanın sonuçlarının güvenilirliğini sağlamak.

    Ortalama değerler, varyasyon serileri bazında hesaplanır. Varyasyon serisi Bireysel birimleri, incelenen özellik veya olgunun nicel farklılıklarını karakterize eden, niteliksel olarak homojen bir istatistiksel popülasyondur.

    Nicel varyasyon iki tipte olabilir: süreksiz (ayrık) ve sürekli.

    Süreksiz (ayrık) bir işaret yalnızca bir tamsayı olarak ifade edilir ve herhangi bir ara değere sahip olamaz (örneğin, ziyaret sayısı, sitenin nüfusu, ailedeki çocuk sayısı, puan cinsinden hastalığın şiddeti) , vb.).

    Sürekli bir işaret, kesirli olanlar da dahil olmak üzere belirli sınırlar içinde herhangi bir değeri alabilir ve yalnızca yaklaşık olarak ifade edilir (örneğin, ağırlık - yetişkinler için kendinizi kilogramla sınırlayabilirsiniz ve yenidoğanlar için - gram; boy, kan basıncı, harcanan zaman bir hastayı görmek vb.).



    Varyasyon serisine dahil edilen her bir özelliğin veya olgunun sayısal değeri, varyant olarak adlandırılır ve harf ile gösterilir. V ... Matematik literatüründe başka tanımlamalar da vardır, örneğin x veya y.

    Her seçeneğin bir kez belirtildiği varyasyon serisine basit denir. Bu tür seriler, bilgisayar veri işleme durumunda çoğu istatistiksel problemde kullanılır.

    Gözlem sayısındaki artışla birlikte, kural olarak, varyantın tekrarlanan değerleri vardır. Bu durumda, bir gruplandırılmış varyasyon serisi, tekrar sayısının belirtildiği yerde (sıklık, "harfi ile gösterilir" r »).

    Dereceli varyasyon serisi artan veya azalan düzende düzenlenmiş varyantlardan oluşur. Hem basit hem de gruplandırılmış seriler sıralanabilir.

    Aralık varyasyon serisiçok sayıda gözlem birimiyle (1000'den fazla) bilgisayar kullanılmadan gerçekleştirilen sonraki hesaplamaları basitleştirmek için derlenir.

    Sürekli varyasyon serisi herhangi bir değerle ifade edilebilen değişken değerleri içerir.

    Varyasyon serisinde, özelliğin (seçeneklerin) değerleri ayrı belirli sayılar şeklinde verilirse, böyle bir diziye denir. ayrık.

    Genel özellikleri Varyasyon serisine yansıyan özniteliğin değerleri ortalama değerlerdir. Bunlar arasında en çok kullanılanlar: aritmetik ortalama M, moda moe ve ortanca Ben mi. Bu özelliklerin her biri benzersizdir. Birbirlerinin yerine geçemezler ve yalnızca toplu olarak, oldukça tam ve sıkıştırılmış bir biçimde, varyasyon serilerinin özelliklerini temsil ederler.

    Moda (Ay) en yaygın seçeneklerin anlamını adlandırın.

    Medyan (Ben mi) Varyasyonun değeri, sıralanmış varyasyon serisini yarıya böler (medyanın her iki tarafında, varyasyonun yarısı vardır). Nadir durumlarda, simetrik bir varyasyon serisi olduğunda, mod ve medyan birbirine eşittir ve aritmetik ortalamanın değeri ile çakışır.

    Varyant değerlerinin en tipik özelliği, aritmetik ortalama miktar ( m ). Matematik literatüründe, .

    Aritmetik ortalama (M, ) Niteliksel olarak homojen bir istatistiksel popülasyon oluşturan incelenen fenomenlerin belirli bir özelliğinin genel nicel bir özelliğidir. Basit ve ağırlıklı aritmetik ortalamayı ayırt eder. Basit aritmetik ortalama, basit bir varyasyon serisi için tüm seçeneklerin toplanması ve bu toplamın verilen varyasyon serisindeki toplam seçenek sayısına bölünmesiyle hesaplanır. Hesaplamalar aşağıdaki formüle göre yapılır:

    nerede: m - basit aritmetik ortalama;

    Σ V - seçeneğin miktarı;

    n- gözlem sayısı.

    Gruplandırılmış varyasyon serilerinde ağırlıklı aritmetik ortalama belirlenir. Hesaplanması için formül:

    nerede: m - ağırlıklı aritmetik ortalama;

    Σ Vp - varyantın çalışmalarının frekanslarına göre toplamı;

    n- gözlem sayısı.

    Manuel hesaplamalar durumunda çok sayıda gözlem ile moment yöntemi kullanılabilir.

    Aritmetik ortalama aşağıdaki özelliklere sahiptir:

    Varyantın ortalamadan sapmalarının toplamı ( Σ D ) sıfıra eşittir (bkz. Tablo 15);

    · Tüm seçenekleri aynı çarpanla (bölen) çarparken (bölerken), aritmetik ortalama aynı çarpanla (bölen) çarpılır (bölünür);

    · Tüm seçeneklere aynı sayıyı eklerseniz (çıkarırsanız), aritmetik ortalama aynı sayı kadar artar (azalır).

    Hesaplandıkları serilerin değişkenliği dikkate alınmadan kendi başlarına alınan aritmetik ortalama değerleri, özellikle diğer ortalamalarla karşılaştırmanın gerekli olduğu durumlarda, varyasyon serilerinin özelliklerini tam olarak yansıtmayabilir. Değer olarak birbirine yakın ortalamalar, değişen derecelerde saçılmalara sahip serilerden elde edilebilir. Bireysel seçenekler nicel özellikleri açısından birbirine ne kadar yakınsa, o kadar az dağılım (salınım, değişkenlik) satır, ortalaması ne kadar tipikse.

    Özelliğin değişkenliğini değerlendirmemize izin veren ana parametreler şunlardır:

    · Tokatlamak;

    · Genlik;

    · Standart sapma;

    · Varyasyon katsayısı.

    Özelliğin yaklaşık değişkenliği, varyasyon serisinin aralığı ve genliği ile değerlendirilebilir. Salınım, satırdaki maksimum (V max) ve minimum (V min) seçeneklerini gösterir. Genlik (A m) bu seçenekler arasındaki farktır: A m = V maks - V min.

    Varyasyon serilerinin değişkenliğinin ana, genel olarak kabul edilen ölçüsü, dağılım (D ). Ancak en sık kullanılan, varyans - standart sapma () temelinde hesaplanan daha uygun bir parametredir. σ ). Sapma miktarını dikkate alır ( D ) aritmetik ortalamasından varyasyon serisinin her bir varyantı ( d = V - M ).

    Varyantın ortalamadan sapmaları pozitif ve negatif olabileceğinden, toplandığında "0" (S) değerini verirler. d = 0). Bunu önlemek için sapma değerleri ( D) ikinci güce yükseltilir ve ortalaması alınır. Böylece, varyasyon serisinin varyansı, varyantın aritmetik ortalamadan sapmalarının ortalama karesidir ve aşağıdaki formülle hesaplanır:

    Değişkenliğin en önemli özelliğidir ve birçok istatistiksel kriteri hesaplamak için kullanılır.

    Varyans, sapmanın karesi ile ifade edildiğinden, değeri aritmetik ortalama ile karşılaştırılarak kullanılamaz. Bu amaçlar için uygulanan standart sapma"Sigma" işaretiyle gösterilen ( σ ). Varyasyon serisinin tüm varyantlarının aritmetik ortalamadan ortalama sapmasını, ortalamanın kendisiyle aynı birimlerde karakterize eder, böylece birlikte kullanılabilirler.

    Standart sapma aşağıdaki formülle belirlenir:

    Belirtilen formül, gözlem sayısı ( n ) 30'dan büyüktür. Daha küçük bir sayı için n standart sapmanın değeri, matematiksel sapma ile ilişkili bir hataya sahip olacaktır ( n - bir). Bu konuda daha kesin sonuç standart sapmayı hesaplama formülünde böyle bir önyargı hesaba katılarak elde edilebilir:

    standart sapma (s ) Rastgele bir değişkenin standart sapması tahminidir x onunla ilgili matematiksel beklenti varyansının tarafsız bir tahminine dayanmaktadır.

    değerlerle n > 30 standart sapma ( σ ) ve standart sapma ( s ) aynı olacak ( σ = s ). Bu nedenle, çoğu pratik yardımlar bu kriterler belirsiz olarak kabul edilir. Excel'de standart sapmanın hesaplanması, = STDEV (aralık) işleviyle yapılabilir. Ve standart sapmayı hesaplamak için uygun bir formül oluşturmanız gerekir.

    Kök ortalama kare veya standart sapma, bir özelliğin değerlerinin ortalamadan ne kadar farklı olabileceğini belirlemenize olanak tanır. Yaz aylarında aynı ortalama gündüz sıcaklıklarına sahip iki şehir olduğunu varsayalım. Bu şehirlerden biri kıyıda, diğeri ise kıtada yer almaktadır. Kıyıda yer alan şehirlerde gündüz sıcaklık farklarının kıtanın iç kesimlerinde bulunan şehirlere göre daha az olduğu biliniyor. Bu nedenle, kıyı kenti için gündüz sıcaklıklarının standart sapması, ikinci kentinkinden daha az olacaktır. Pratikte bu, kıtada bulunan bir şehirde her belirli gün için ortalama hava sıcaklığının, kıyıdaki bir şehirdeki ortalama değerden daha fazla farklı olacağı anlamına gelir. Ek olarak, standart sapma, gerekli olasılık seviyesi ile ortalamadan sıcaklığın olası sapmalarını tahmin etmeyi mümkün kılar.

    Olasılık teorisine göre, normal dağılım yasasına uyan olaylarda, aritmetik ortalama, standart sapma ve seçenekler değerleri arasında sıkı bir ilişki vardır ( üç sigma kuralı). Örneğin, değişken özniteliğine ait değerlerin %68,3'ü M ± 1 aralığındadır. σ , %95,5 - M ± 2 dahilinde σ ve %99,7 - M ± 3 dahilinde σ .

    Standart sapmanın değeri, varyasyon serilerinin ve çalışılan grubun homojenliğinin doğasını yargılamamıza izin verir. Standart sapmanın değeri küçükse, bu, incelenen olgunun yeterince yüksek homojenliğini gösterir. Bu durumda, aritmetik ortalama, verilen varyasyon serisinin oldukça karakteristik özelliği olarak kabul edilmelidir. Ancak, çok düşük bir sigma değeri, yapay bir gözlem seçimi hakkında düşündürür. Çok büyük bir sigma ile, aritmetik ortalama, varyasyon serisini daha az ölçüde karakterize eder; bu, çalışılan özellik veya fenomenin önemli bir değişkenliğini veya çalışılan grubun heterojenliğini gösterir. Ancak standart sapma değerinin karşılaştırılması sadece aynı boyuttaki özellikler için mümkündür. Nitekim yeni doğanlar ve yetişkinler arasındaki ağırlık çeşitliliğini karşılaştırırsak, yetişkinlerde her zaman daha yüksek sigma değerleri elde ederiz.

    Farklı boyutlardaki özelliklerin değişkenliğinin karşılaştırılması kullanılarak yapılabilir. varyasyon katsayısı... Farklı özelliklerin karşılaştırılmasına izin veren ortalamanın yüzdesi olarak çeşitliliği ifade eder. Tıp literatüründeki varyasyon katsayısı, " işaretiyle belirtilir. İLE ", Ve matematiksel olarak" v"Ve şu formülle hesaplandı:

    % 10'dan düşük varyasyon katsayısının değerleri, aritmetik ortalama etrafında yaklaşık% 10 ila% 20 - ortalama yaklaşık,% 20'den fazla - küçük bir saçılımı gösterir.

    Aritmetik ortalama, kural olarak, örnek popülasyonun verilerine dayanarak hesaplanır. Tekrarlanan çalışmalarla, rastgele olayların etkisi altında aritmetik ortalama değişebilir. Bunun nedeni, kural olarak, olası gözlem birimlerinin yalnızca bir kısmının, yani örnek popülasyonun araştırılmasıdır. Çalışılan fenomeni temsil eden tüm olası birimler hakkında bilgi, her zaman mümkün olmayan tüm genel popülasyon incelenerek elde edilebilir. Aynı zamanda deneysel verilerin genellenebilmesi için genel popülasyondaki ortalamanın değeri ilgi çekicidir. Bu nedenle, incelenen olgu hakkında genel bir sonuca varmak için örneklem popülasyonu bazında elde edilen sonuçların istatistiksel yöntemlerle genel popülasyona aktarılması gerekir.

    Örnek çalışma ile genel popülasyon arasındaki çakışma derecesini belirlemek için örnek gözlemde kaçınılmaz olarak oluşan hatanın büyüklüğünü tahmin etmek gerekir. Bu hatanın adı “ Temsil hatası"Veya" Aritmetik ortalamanın ortalama hatası." Aslında, bir örneklemle elde edilen ortalamalar arasındaki farktır. istatistiksel gözlem, ve aynı nesnenin sürekli bir çalışmasında elde edilecek benzer değerler, yani. genel nüfusu incelerken. Örnek ortalaması rastgele bir değişken olduğundan, böyle bir tahmin, araştırmacı için kabul edilebilir bir olasılık düzeyinde gerçekleştirilir. Tıbbi araştırmalarda en az %95'tir.

    Temsil hatası, deneyde kullanılan uygun bir teknik ve araçlarla en aza indirilmesi gereken kayıt hataları veya dikkat hataları (büro hataları, yanlış hesaplamalar, yazım hataları vb.) ile karıştırılmamalıdır.

    Temsil hatasının büyüklüğü hem örneklem büyüklüğüne hem de özelliğin değişkenliğine bağlıdır. Gözlem sayısı ne kadar büyük olursa, örneklem genel popülasyona o kadar yakın olur ve hata o kadar küçük olur. Nitelik ne kadar uçucu olursa, istatistiksel hatanın büyüklüğü o kadar büyük olur.

    Uygulamada, varyasyon dizisindeki temsiliyet hatasını belirlemek için aşağıdaki formül kullanılır:

    nerede: m - temsil hatası;

    σ - standart sapma;

    n- örneklemdeki gözlem sayısı.

    Formülden, ortalama hatanın boyutunun standart sapma, yani incelenen özelliğin değişkenliği ile doğru orantılı olduğu ve gözlem sayısının karekökü ile ters orantılı olduğu görülebilir.

    Göreceli değerlerin hesaplanmasına dayalı istatistiksel analiz gerçekleştirirken, bir varyasyon serisinin oluşturulması isteğe bağlıdır. Bu durumda, göreceli göstergeler için ortalama hatanın belirlenmesi, basitleştirilmiş bir formül kullanılarak gerçekleştirilebilir:

    nerede: r- yüzde, ppm, vb. olarak ifade edilen ilgili göstergenin değeri;

    Q- P'nin tersi ve göstergenin hesaplandığı temele bağlı olarak (1-P), (100-P), (1000-P), vb. olarak ifade edilir;

    n- örneklemdeki gözlem sayısı.

    Bununla birlikte, göreceli değerler için temsililik hatasını hesaplamak için belirtilen formül, yalnızca gösterge değeri tabanından küçük olduğunda uygulanabilir. Yoğun göstergelerin hesaplanmasında bazı durumlarda böyle bir koşul karşılanmaz ve gösterge %100 veya %1000'den fazla bir sayı olarak ifade edilebilir. Böyle bir durumda, bir varyasyon serisi oluşturulur ve standart sapmaya dayalı ortalama değerler için formül kullanılarak temsililik hatası hesaplanır.

    Genel popülasyondaki aritmetik ortalamanın değerinin tahmini, minimum ve maksimum olmak üzere iki değerin gösterilmesi ile gerçekleştirilir. Genel popülasyonun aranan ortalama değerinin dalgalanabileceği olası sapmaların bu aşırı değerlerine " denir. Güven limitleri».

    Olasılık teorisinin varsayımları,% 99.7 olasılıkla bir özelliğin normal dağılımıyla, ortalamanın aşırı sapma değerlerinin, temsil hatasının üç katı değerini geçmeyeceğini kanıtladı ( m ± 3 m ); % 95,5 - ortalamanın iki katına çıkmış ortalama hatasından fazla değil ( m ± 2 m ); %68,3 - birden fazla ortalama hata ( m ± 1 m ) (şek. 9).

    Gruplama yöntemi ayrıca ölçmenizi sağlar varyasyon(değişkenlik, değişkenlik) işaretler. Nispeten az sayıda popülasyon birimiyle, varyasyon, popülasyonu oluşturan sıralanmış birimler serisine dayalı olarak ölçülür. satır denir sıralanmış, birimler, niteliğin artan (azalan) sırasına göre düzenlenmişse.

    Bununla birlikte, dereceli seriler gerektiğinde oldukça zayıf bir göstergedir. karşılaştırmalı özellikler varyasyonlar. Ek olarak, birçok durumda, belirli bir seri biçiminde temsil edilmesi pratik olarak zor olan çok sayıda birimden oluşan istatistiksel popülasyonlarla uğraşmak gerekir. Bu bağlamda, istatistiksel verilerle ilk genel bilgi için ve özellikle işaretlerin varyasyonunun incelenmesini kolaylaştırmak için, incelenen fenomenler ve süreçler genellikle gruplar halinde birleştirilir ve gruplamanın sonuçları grup tabloları şeklinde düzenlenir. .

    Grup tablosunda sadece iki sütun varsa - seçilen özelliğe (seçenekler) ve grup sayısına (frekans veya frekans) göre gruplar, buna denir. yakın dağıtım.

    Dağıtım serisi -Özniteliğin seçeneklerini ve sıklıklarını içeren iki sütunlu bir grup tablosunda görüntülenen, bir özniteliğe göre en basit yapısal gruplandırma türü. Çoğu durumda, böyle bir yapısal gruplandırma ile, yani. dağıtım serilerinin derlenmesiyle, ilk istatistiksel materyalin çalışması başlar.

    Bir dağılım serisi şeklindeki yapısal gruplandırma, seçilen gruplar yalnızca frekanslarla değil, aynı zamanda diğer istatistiksel göstergelerle de karakterize edilirse gerçek bir yapısal gruplamaya dönüştürülebilir. Dağılım serilerinin temel amacı, özelliklerin varyasyonunu incelemektir. Dağılım serisi teorisi, matematiksel istatistiklerle ayrıntılı olarak geliştirilmiştir.

    Dağıtım serisi şuna bölünür: nitelik(niteliksel özelliklere göre gruplandırma, örneğin, nüfusu cinsiyet, uyruk, medeni duruma göre bölme) ve değişken(nicel özelliklere göre gruplandırma).

    Varyasyon serisi iki sütun içeren bir grup tablosudur: birimlerin bir nicel özelliğe göre gruplandırılması ve her gruptaki birim sayısı. Varyasyon serilerindeki aralıklar genellikle eşit ve kapalıdır. varyasyon serisi kişi başına ortalama para geliri açısından Rusya nüfusunun bir sonraki gruplandırmasıdır (Tablo 3.10).

    Tablo 3.10

    2004-2009 yılları arasında Rusya nüfusunun ortalama kişi başına düşen gelire göre dağılımı

    Kişi başına ortalama para geliri, ruble / ay bazında nüfus grupları

    Gruptaki nüfus, toplamın %'si olarak

    8 000,1-10 000,0

    10 000,1-15 000,0

    15 000,1-25 000,0

    25,000.0'dan fazla

    tüm nüfus

    Varyasyon serileri sırasıyla kesikli ve aralıklı olarak alt bölümlere ayrılır. ayrık Varyasyon serileri, dar sınırlar içinde değişen ayrık özelliklerin çeşitlerini birleştirir. Ayrık varyasyon serisine bir örnek, dağılımdır. Rus aileleri mevcut çocuk sayısına göre.

    Aralık Varyasyon serileri, geniş bir aralıkta değişen sürekli özelliklerin veya ayrık özelliklerin çeşitlerini birleştirir. Varyasyon aralığı, Rusya nüfusunun kişi başına düşen ortalama para geliri cinsinden dağılımıdır.

    Kesikli varyasyon serileri pratikte çok sık kullanılmamaktadır. Bu arada, grupların bileşimi, çalışılan gruplama özelliklerinin gerçekte sahip olduğu belirli seçenekler tarafından belirlendiğinden, derlemeleri zor değildir.

    Aralıklı varyasyon serileri daha yaygındır. Bunları derlerken, grup sayısı ve kurulması gereken aralıkların boyutu hakkında zor bir soru ortaya çıkıyor.

    Bu sorunu çözme ilkeleri, istatistiksel gruplamalar oluşturmaya yönelik metodoloji hakkındaki bölümde özetlenmiştir (bkz. paragraf 3.3).

    Varyasyon serileri, çeşitli bilgileri kompakt bir forma sıkıştırmanın veya sıkıştırmanın bir yoludur, varyasyonun doğası hakkında oldukça net bir yargıda bulunmak, incelenen kümede yer alan fenomenlerin özelliklerindeki farklılıkları incelemek için kullanılabilirler. Ancak varyasyon serilerinin en önemli değeri, bunlara dayalı olarak varyasyonun özel genelleme özelliklerinin hesaplanmasıdır (bkz. Bölüm 7).

    Matematiksel istatistiklerle ilgili bir test çözme örneği

    1. sorun

    İlk veri : 30 kişilik belirli bir grubun öğrencileri "Bilişim" dersinde sınavı geçti. Öğrencilerin aldığı notlar aşağıdaki sayı dizisini oluşturur:

    I. Bir varyasyon serisi oluşturalım

    m x

    w x

    m x nak

    w x nak

    Toplam:

    II. İstatistiksel bilgilerin grafiksel sunumu.

    III. Numunenin sayısal özellikleri.

    1. Aritmetik ortalama

    2. Geometrik ortalama

    3. Moda

    4. Medyan

    222222333333333 | 3 34444444445555

    5. Örnek varyans

    7. Varyasyon katsayısı

    8. Asimetri

    9. Asimetri katsayısı

    10. Fazlalık

    11. Basıklık katsayısı

    Görev 2

    İlk veri : belirli bir grubun öğrencileri son testlerini yazdı. Grup 30 kişiden oluşmaktadır. Öğrenciler tarafından atılan puanlar aşağıdaki sayı dizisini oluşturur

    Çözüm

    I. Özellik birçok farklı değer aldığından, onun için bir aralık varyasyon serisi oluşturacağız. Bunu yapmak için önce aralığın değerini ayarlayın H... Stairger formülünü kullanacağız

    Bir aralık ölçeği oluşturalım. Bu durumda, ilk aralığın üst sınırı için formül tarafından belirlenen değeri alacağız:

    Sonraki aralıkların üst sınırları aşağıdaki özyinelemeli formülle belirlenir:

    , sonra

    Bir sonraki aralığın üst sınırı örneğin maksimum değerinden büyük veya ona eşit olduğundan, aralık ölçeğini oluşturmayı bitiriyoruz.
    .

    II. Aralık varyasyon serisinin grafiksel gösterimi

    III. Numunenin sayısal özellikleri

    Numunenin sayısal özelliklerini belirlemek için yardımcı bir tablo oluşturacağız.

    toplam:

    1. Aritmetik ortalama

    2. Geometrik ortalama

    3. Moda

    4. Medyan

    10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

    5. Örnek varyans

    6. Örnek standart sapma

    7. Varyasyon katsayısı

    8. Asimetri

    9. Asimetri katsayısı

    10. Fazlalık

    11. Basıklık katsayısı

    Sorun 3

    Şart : Ampermetrenin ölçek bölümü 0,1 A'dır. Okumalar en yakın tam bölüme yuvarlanır. 0,02 A'yı aşan bir hata olasılığını bulun.

    Çözüm.

    Yuvarlama hatası rastgele bir değer olarak kabul edilebilir. x, iki bitişik tamsayı bölümü arasındaki aralıkta eşit olarak dağıtılır. Düzgün dağılım yoğunluğu

    ,

    nerede
    - olası değerlerin dahil edildiği aralığın uzunluğu x; bu aralığın dışında
    Bu problemde olası değerleri içeren aralığın uzunluğu x, 0,1'e eşittir, bu nedenle

    Aralık (0.02; 0.08) içine alınırsa, sayım hatası 0.02'yi aşacaktır. O zamanlar

    Yanıt vermek: r=0,6

    4. sorun

    İlk veri: normal dağılmış bir özelliğin matematiksel beklentisi ve standart sapması x sırasıyla 10 ve 2. Test sonucunda olma olasılığını bulun. x(12, 14) aralığındaki değeri alacaktır.

    Çözüm.

    formülü kullanalım

    ve teorik frekanslar

    P%

    Pirinç. 9. Normal dağılımın olasılık yoğunluğu.

    Yukarıdaki ifadenin yalnızca normal Gauss dağılımına uyan bir özellik için geçerli olduğunu unutmayın.

    Tıp alanı da dahil olmak üzere çoğu deneysel araştırma, sonuçları belirli bir aralıkta hemen hemen her değeri alabilen ölçümlerle ilişkilidir, bu nedenle kural olarak sürekli rastgele değişkenler modeli ile tanımlanırlar. Bu bağlamda, çoğu istatistiksel yöntem sürekli dağılımları dikkate alır. Matematiksel istatistikte temel bir role sahip olan bu dağılımlardan biri, normal veya Gauss dağılımı.

    Bunun birkaç nedeni var.

    1. Her şeyden önce, normal dağılım kullanılarak birçok deneysel gözlem başarıyla tanımlanabilir. Normal dağılım gösterdiğinden, tam olarak normal olan ampirik verilerin hiçbir dağılımının olmadığı hemen not edilmelidir. rastgele değer ile arasında değişir ve pratikte asla gerçekleşmez. Ancak, normal dağılım genellikle iyi bir yaklaşımdır.

    İnsan vücudunun ağırlık, boy ve diğer fizyolojik parametrelerinin ölçümlerinin yapılıp yapılmadığı - her yerde sonuçlar çok etkilenir. Büyük sayı rastgele faktörler (doğal nedenler ve ölçüm hataları). Ayrıca, kural olarak, bu faktörlerin her birinin etkisi önemsizdir. Deneyimler, bu gibi durumlarda sonuçların yaklaşık olarak normal dağılacağını göstermektedir.

    2. Rastgele bir örnekle ilişkili birçok dağılım, ikincisinin boyutundaki artışla normale döner.

    3. Normal dağılım, diğer sürekli dağılımların (örneğin asimetrik) yaklaşık bir açıklaması olarak çok uygundur.

    4. Normal dağılım, büyük ölçüde bunu sağlayan bir takım uygun matematiksel özelliklere sahiptir. geniş uygulama istatistiklerde.

    Aynı zamanda tıbbi verilerde normal dağılım modeli ile tanımlanamayan birçok deneysel dağılım olduğu da unutulmamalıdır. Bunun için istatistikler genellikle "parametrik olmayan" olarak adlandırılan yöntemler geliştirmiştir.

    Belirli bir deneyin verilerinin işlenmesine uygun istatistiksel yöntemin seçimi, elde edilen verilerin normal dağılım yasasına ait olup olmadığına bağlı olarak yapılmalıdır. Özelliğin normal dağılım yasasına tabi olması için hipotezin test edilmesi, bir dizi istatistiksel kriterin yanı sıra frekans dağılımının (grafik) bir histogramı kullanılarak gerçekleştirilir. Onların arasında:

    asimetri kriteri ( B );

    Kurtosis kontrolü için kriter ( G );

    Shapiro - Wilkes kriteri ( W ) .

    Her parametre için veri dağılımının doğasının analizi (normal dağılım kontrolü olarak da adlandırılır) gerçekleştirilir. Parametre dağılımının normal yasaya uygunluğunu güvenle yargılamak için, yeterince fazla sayıda gözlem birimi (en az 30 değer) gereklidir.

    Normal dağılım için çarpıklık ve basıklık kriterleri 0 değerini alır. Dağılım sağa kaydırılırsa B > 0 (pozitif asimetri), için B < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона G = 0. saat G > 0, dağılım eğrisi daha keskin ise G < 0 пик более сглаженный, чем функция нормального распределения.

    Shapiro-Wilks testine göre normalliği kontrol etmek için, bu kriterin değerinin istatistiksel tablolar kullanılarak gerekli anlamlılık düzeyinde ve gözlem birimlerinin sayısına (serbestlik dereceleri) bağlı olarak bulunması gerekir. Ek 1. Normallik hipotezi, kural olarak, bu kriterin küçük değerlerinde reddedilir. w <0,8.

    Çeşitli örneklenmiş değerler çağrılacak seçenekler bir dizi değer ve şunu belirtir: x 1 , x 2,…. Her şeyden önce üreteceğiz değişen seçenekler, yani bunların artan veya azalan düzende düzenlenmesi. Her seçeneğin kendi ağırlığı vardır, yani. bu seçeneğin toplam nüfusa katkısını karakterize eden bir sayı. Ağırlıklar olarak frekanslar veya frekanslar kullanılır.

    Sıklık ben seçenek x ben dikkate alınan örnek popülasyonunda belirli bir seçeneğin kaç kez gerçekleştiğini gösteren bir sayıdır.

    Frekans veya bağıl frekans ben seçenek x ben Bir varyantın frekansının tüm varyantların frekanslarının toplamına oranına eşit bir sayı olarak adlandırılır. Sıklık, örnek popülasyonun hangi bölümünün belirli bir seçeneğe sahip olduğunu gösterir.

    Artan (veya azalan) sırada yazılan karşılık gelen ağırlıkları (frekanslar veya frekanslar) ile bir seçenekler dizisine denir. varyasyon serisi.

    Varyasyon serileri kesikli ve aralıklıdır.

    Kesikli bir varyasyon serisi için bir özelliğin nokta değerleri belirtilir, bir aralık serisi için özellik değerleri aralıklar olarak belirtilir. Varyasyon serileri, her bir seçenek için hangi değerin belirtildiğine bağlı olarak frekansların veya bağıl frekansların (frekanslar) dağılımını gösterebilir - frekans veya frekans.

    Frekans dağılımının ayrık varyasyon serisişuna benziyor:

    Frekanslar, i = 1, 2, ..., formülüyle bulunur. m.

    w 1 +w 2 + … + w m = 1.

    Örnek 4.1. Belirli bir sayı kümesi için

    4, 6, 6, 3, 4, 9, 6, 4, 6, 6

    frekans ve frekans dağılımının kesikli varyasyon serilerini oluşturmak.

    Çözüm . Nüfusun hacmi n= 10. Frekans dağılımının ayrık serisi şu şekildedir:

    Aralık serileri benzer bir gösterim biçimine sahiptir.

    Frekans dağılımının aralıklı varyasyon serisişöyle yazılır:

    Tüm frekansların toplamı, toplam gözlem sayısına eşittir, yani. nüfus hacmi: n = n 1 +n 2 + … + n m.

    Göreceli frekansların (frekanslar) dağılımının aralıklı varyasyon serisişuna benziyor:

    Frekans, i = 1, 2, ..., formülüyle bulunur. m.

    Tüm frekansların toplamı bire eşittir: w 1 +w 2 + … + w m = 1.

    Aralık serileri en çok pratikte kullanılır. Çok fazla istatistiksel örnek veri varsa ve bunların değerleri birbirinden keyfi olarak küçük bir miktarda farklıysa, bu veriler için ayrık seriler daha fazla araştırma için oldukça hantal ve elverişsiz olacaktır. Bu durumda, veri gruplaması kullanılır, yani. özelliğin tüm değerlerini içeren aralık birkaç kısmi aralığa bölünür ve her aralık için frekans hesaplandıktan sonra bir aralık serisi elde edilir. Kısmi aralıkların uzunluklarının aynı olacağını varsayarak, bir aralık dizisi oluşturma şemasını daha ayrıntılı olarak yazalım.

    2.2 Bir aralık serisi oluşturma

    Bir aralık serisi oluşturmak için şunlara ihtiyacınız vardır:

    Aralık sayısını belirleyin;

    Aralıkların uzunluğunu belirleyin;

    Eksen üzerindeki boşluğun konumunu belirleyin.

    belirlemek için aralık sayısı k Sturges formülü var, buna göre

    ,

    nerede n- tüm nüfusun hacmi.

    Örneğin, bir özelliğin (varyant) 100 değeri varsa, bir aralık serisi oluşturmak için aralık sayısını eşit aralıklarla almanız önerilir.

    Bununla birlikte, uygulamada çok sık olarak, bu sayının çok büyük olmaması gerektiği göz önüne alındığında, aralıkların sayısı araştırmacının kendisi tarafından seçilir, böylece seri hantal değildir, ancak çok küçük değil, böylece bazı özelliklerini kaybetmez. dağıtım.

    Aralık uzunluğu H aşağıdaki formülle belirlenir:

    ,

    nerede x maksimum ve x min, seçeneklerin sırasıyla en büyük ve en küçük değeridir.

    Değer arandı süpürmek sıra.

    Aralıkları kendileri oluşturmak için farklı şeyler yapın. En basit yollardan biri aşağıdaki gibidir. İlk aralığın başlangıcı değer olarak alınır
    ... Daha sonra aralıkların kalan sınırları formülle bulunur. Açıkçası, son aralığın sonu a m + 1 koşulu sağlamalıdır

    Aralıkların tüm sınırları bulunduktan sonra bu aralıkların frekansları (veya frekansları) belirlenir. Bu sorunu çözmek için tüm seçenekleri gözden geçirin ve bir veya daha fazla aralığa giren seçeneklerin sayısını belirleyin. Bir örnek kullanarak bir aralık serisinin tam yapısını ele alalım.

    Örnek 4.2. Artan düzende yazılan aşağıdaki istatistikler için, aralık sayısı 5'e eşit olan bir aralık serisi oluşturun:

    11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

    Çözüm. Toplam n= 50 seçenek değeri.

    Aralık sayısı problem ifadesinde belirtilir, yani. k=5.

    Aralıkların uzunluğu
    .

    Aralıkların sınırlarını tanımlayalım:

    a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

    a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

    a 7 = 87,5 +17 = 104,5.

    Aralıkların sıklığını belirlemek için bu aralığa giren varyantların sayısını sayarız. Örneğin, 2,5 ile 19,5 arasındaki ilk aralık 11, 12, 12, 14, 14, 15 seçeneklerini içerir. Bunların sayısı 6'dır, bu nedenle ilk aralığın sıklığı n 1 = 6. İlk aralığın frekansı ... 19.5'ten 36.5'e kadar olan ikinci aralık, sayısı 5 olan 21, 21, 22, 23, 25 varyantlarını içerir. Bu nedenle, ikinci aralığın frekansı n 2 = 5 ve frekans ... Benzer şekilde tüm aralıklar için frekansları ve frekansları bulduktan sonra aşağıdaki aralık serilerini elde ederiz.

    Frekans dağılımının aralık serisi aşağıdaki gibidir:

    Frekansların toplamı 6 + 5 + 9 + 11 + 8 + 11 = 50'dir.

    Frekans dağılımının aralık serisi aşağıdaki gibidir:

    Frekansların toplamı 0.12 + 0.1 + 0.18 + 0.22 + 0.16 + 0.22 = 1'dir. ■

    Aralık serileri oluşturulurken, ele alınan problemin özel koşullarına bağlı olarak, başka kurallar da uygulanabilir:

    1. Aralık varyasyon serisi, farklı uzunluklardaki kısmi aralıklardan oluşabilir. Eşit olmayan aralık uzunlukları, bir özelliğin eşit olmayan dağılımıyla istatistiksel bir popülasyonun özelliklerini ayırt etmeyi mümkün kılar. Örneğin, aralıkların sınırları şehirlerde yaşayanların sayısını belirliyorsa, bu problemde uzunlukları eşit olmayan aralıkların kullanılması tavsiye edilir. Açıkçası, küçük şehirler için nüfustaki küçük bir fark da önemlidir ve büyük şehirler için onlarca ve yüzlerce nüfus farkı önemli değildir. Eşit olmayan kısmi aralık uzunluklarına sahip aralık serileri, temel olarak genel istatistik teorisinde incelenir ve bunların değerlendirilmesi bu kılavuzun kapsamı dışındadır.

    2. Matematiksel istatistiklerde, ilk aralığın sol sınırının –∞ ve son aralığın sağ sınırının + ∞ olduğu varsayılan aralık serileri bazen dikkate alınır. Bu, istatistiksel dağılımı teorik olana yaklaştırmak için yapılır.

    3. Aralık serileri oluşturulurken, bazı varyantların değerinin tam olarak aralığın sınırıyla çakıştığı ortaya çıkabilir. Bu durumda yapılacak en iyi şey aşağıdakileri yapmaktır. Böyle bir tesadüf varsa, o zaman, frekansı ile birlikte düşünülen seçeneğin, aralık serisinin ortasına daha yakın bir aralığa düştüğünü düşünün, eğer bu tür birkaç seçenek varsa, o zaman ya hepsi doğru aralıklara atfedilir. bu seçenekler veya tümü - soldakilere.

    4. Aralık sayısı ve uzunlukları belirlendikten sonra aralıkların düzenlenmesi başka bir şekilde yapılabilir. Seçeneklerin dikkate alınan tüm değerlerinin aritmetik ortalamasını bulun x evlenmek ve ilk aralık, bu örnek ortalamanın bir aralık içinde olacağı şekilde oluşturulur. Böylece, bir aralık elde ederiz x evlenmek - 0,5 Hönceki xÇar + 0,5 H... Sonra sola ve sağa, aralığın uzunluğunu ekleyerek, kalan aralıkları oluşturana kadar inşa ediyoruz. x dakika ve x max sırasıyla ilk ve son aralıklara düşmeyecektir.

    5. Çok sayıda aralığa sahip aralık satırları, uygun bir şekilde dikey olarak yazılır, yani. aralıklar ilk satıra değil, birinci sütuna, ikinci sütuna frekanslar (veya frekanslar) kaydedilmelidir.

    Örnek veriler, bazı rastgele değişkenlerin değerleri olarak kabul edilebilir. x... Rastgele bir değişkenin kendi dağıtım yasası vardır. Olasılık teorisinden, ayrık bir rasgele değişkenin dağılım yasasının, bir dağılım serisi ve sürekli bir - dağılım yoğunluğu fonksiyonu kullanılarak belirlenebileceği bilinmektedir. Ancak, hem kesikli hem de sürekli rastgele değişkenler için geçerli olan evrensel bir dağılım yasası vardır. Bu dağıtım yasası bir dağıtım fonksiyonu şeklinde verilmiştir. F(x) = P(x<x). Örnek veriler için, dağıtım işlevinin bir analogunu belirtebilirsiniz - ampirik bir dağıtım işlevi.

     


    Okumak:



    Kusursuz bir yalanın kuralları: Nasıl yalan söylenir ve nasıl inandırıcı görünürsünüz Yalan söylerken kendinizi nasıl ele vermezsiniz

    Kusursuz bir yalanın kuralları: Nasıl yalan söylenir ve nasıl inandırıcı görünürsünüz Yalan söylerken kendinizi nasıl ele vermezsiniz

    Asıl yalan söyleme tekniğine geçmeden önce çok önemli bir şeye karar vermemiz gerekiyor. Soruyu cevaplamaya çalışın: nedir ...

    Video konferansın bilimsel şirketi. Güç orada, zihin koğuşta. RF Savunma Bakanlığı'nın bilim şirketlerinde kimler görev yapıyor ve orada ne yapıyorlar? Kvu bilim şirketi dört müfreze içerir

    Video konferansın bilimsel şirketi.  Güç orada, zihin koğuşta.  RF Savunma Bakanlığı'nın bilim şirketlerinde kimler görev yapıyor ve orada ne yapıyorlar?  Kvu bilim şirketi dört müfreze içerir

    Bu yılın 10 Aralık'ında, Ugreshskaya Caddesi'ndeki Moskova şehir toplanma noktası pratik olarak her zamanki gibi çalıştı. Başka bir toplu...

    Nikolay Yagodkin: yabancı kelimeleri ezberleme tekniği

    Nikolay Yagodkin: yabancı kelimeleri ezberleme tekniği

    Bir veya daha iyisi, birkaç yabancı dili bilmek artık bir lüks değil, bir zorunluluktur. Küreselleşme kendi yasalarını yaratır...

    Marina Rusakova'nın İngilizce kursları hızlı, eğlenceli ve etkili!

    Marina Rusakova'nın İngilizce kursları hızlı, eğlenceli ve etkili!

    İngilizce şu anda en popüler dildir, ancak birçoğunun İngilizce bilgisi sıfırdır. Ve buna rağmen...

    besleme görüntüsü TL