ana - Stepanova Natalia.
Bir varyasyon serisi nasıl yapılır. Öğrenciler ve okullar okumakta yardımcı olur. Tıbbi istatistikler nedir

İstatistiksel analizde özel bir yer, incelenen işareti veya fenomenin ortalama seviyesinin tanımına aittir. Ortalama seviye Özellik ortalama değerlerle ölçülür.

Ortalama değer, çalışma altındaki özelliğin genel kantitatif seviyesini karakterize eder ve istatistiksel bir agreganın bir grup özelliğidir. BT seviyeleri, bireysel gözlemlerin rastgele sapmalarını bir yönde veya başka bir yönde zayıflatır ve ana planı öne sürer tipik özellik İşaret okudu.

Ortalama değişkenler yaygın olarak kullanılır:

1. Nüfusun sağlığını değerlendirmek: Fiziksel gelişimin özellikleri (büyüme, ağırlık, göğüs çevresi, vb.), Çeşitli hastalıkların prevalansını ve süresini tespit etmek, demografik göstergelerin analizi (nüfusun doğal hareketi, ortalama Yaklaşan yaşamın süresi, nüfus üremesi, ortalama nüfus vb.).

2. Terapötik ve önleyici kurumların faaliyetlerini, tıp personelinin ve çalışmalarının kalitesinin değerlendirilmesi, nüfusun ihtiyaçlarını planlama ve belirleme faaliyetlerini incelemek farklı şekiller Tıbbi bakım (yılda ortalama temyiz veya ziyaret sayısı, hastanın ortalama süresi, hastanın ortalama süresi, hastanın anketinin ortalama süresi, doktorların ortalama güvenliği, yaylar vb.).

3. Sıhhi ve epidemiyolojik durumu (atölyedeki havanın ortalama tozu, kişi başı ortalama alan, proteinlerin tüketiminin, yağlar ve karbonhidratların vb. Normları) karakterize etmek.).

4. Tıbbi ve fizyolojik göstergeleri, normal olarak ve patolojiyi, laboratuvar verilerinin işlenmesi sırasında, sosyo-hijyenik, klinik, deneysel çalışmalarda örnek çalışmanın sonuçlarının güvenilirliğini belirlemek.

Ortalama değerlerin hesaplanması, varyasyon serisine dayanır. Varyasyon serisi - Bu, nitel bir ilişkide, bazı birimlerin, incelenen öznitelik veya fenomendeki nicel farklılıkları karakterize eden homojen bir istatistiksel olarak belirlenir.

Kantitatif değişim iki tip olabilir: bir sonlandırılmış (ayrık) ve sürekli.

Süreksiz (ayrık) bir özellik, yalnızca bir tamsayı ile ifade edilir ve herhangi bir orta değere sahip olamaz (örneğin, ziyaretin sayısı, nüfus popülasyonu, ailedeki çocuk sayısı, hastalığın ciddiyeti, vb. .).

Sürekli bir işaret, fraksiyonel dahil olmak üzere belirli sınırlar dahilinde herhangi bir değer alabilir ve sadece yaklaşık olarak (örneğin, yetişkinler için kilogramlar için sınırlı olabilir ve yenidoğanlar için - gramlar; büyüme, kan basıncı, hastanın resepsiyonu vb.).



Varyasyon aralığında yer alan her bir özelliğin veya fenomenin dijital değeri, seçenek olarak adlandırılır ve harf tarafından belirtilir. V. . Matematiksel literatürde, örneğin başka atasallar var. x. veya y.

Her seçeneğin bir kez belirtildiği bir varyasyon aralığı basittir. Bu tür satırlar, bilgisayar veri işleme durumunda çoğu istatistiksel görevde kullanılır.

Gözlem sayısındaki bir artışla, kural olarak, tekrarlayan değerler seçeneği vardır. Bu durumda oluşturulur gruplandırılmış varyasyonlarTekrarlanma sayısının belirtildiği yer (frekans mektubu ile belirtilir " r »).

Rainted varyasyonlar Artan düzende düzenlenen veya inen bir seçenekten oluşur. Hem basit hem de gruplandırılmış satırlar sıralama ile derlenebilir.

Aralık varyasyon serisi Çok sayıda gözlem birimi (1000'den fazla) ile bir bilgisayar kullanmadan gerçekleştirilen hesaplamaları basitleştirmek için makyaj yapın.

Sürekli varyasyon serisi Herhangi bir değerle ifade edilebilecek seçeneğin değerlerini içerir.

Varyasyon serisinde, özniteliğin değerleri (seçenekler), bireysel spesifik sayılar biçiminde verilir, ardından böyle bir sayı ayrık.

Ortak özellikleri Varyasyon serisine yansıyan işaretler ortalama değerlerdir. Bunlar arasında en çok kullanılan: ortalama aritmetik değer M,moda Move mediana Ben mi.Bu özelliklerin her biri başlangıçta. Birbirlerini değiştiremezler ve sadece toplamda tam olarak tam olarak ve sıkıştırılmış bir formda varyasyon serisinin özellikleridir.

Modo (Mo) en yaygın seçeneklerin değerini arayın.

Medyan (Ben mi) - Bu, sıralanan varyasyonları yarıya bölünen seçeneklerin değeridir (medyanın her iki tarafında seçeneğin yarısıdır). Nadir durumlarda, simetrik bir varyasyon serisi olduğunda, bir mod ve medyan birbirine eşittir ve ortalama aritmetik değeri ile çakışır.

Değerlerin en tipik özelliği seçenektir orta aritmetik miktar ( M. ). Matematiksel literatürde, belirtilmiştir. .

Orta aritmetik değer (M, ) - Bu, niteliksel olarak homojen bir istatistiksel agrega oluşturan çalışılan bir fenomen belirtisinin toplam kantitatif özelliğidir. Ortalama aritmetik arasında basit ve ağırlıklı olarak ayrım yapın. Ortalama aritmetik basittir, basit bir varyasyon serisi için basit bir varyasyon serisi için hesaplanır ve bu miktarı bu varyasyon aralığında bulunan toplam seçenek sayısı için bölünür. Hesaplamalar, formül tarafından yapılır:

nerede: M. - ortalama aritmetik basit;

Σ V. - Miktar seçeneği;

n. - Gözlem sayısı.

Gruplandırılmış bir varyasyon serisinde, ağırlıklı bir ortalama aritmetik belirlenir. Hesaplamasının formülü:

nerede: M. - ortalama aritmetik ağırlıklı;

Σ Vp. - frekanslarında ürün seçeneği;

n. - Gözlem sayısı.

Manuel hesaplamalar durumunda çok sayıda gözlemle, anların yöntemi uygulanabilir.

Ortalama aritmetik aşağıdaki özelliklere sahiptir:

· Ortalamadan sapma seçeneği miktarı ( Σ d. ) sıfıra eşit (bkz. Tablo 15);

· Aynı faktördeki (bölücü) tüm seçeneğin çarpılması (bölünmesi), ortalama aritmetik, aynı faktöre (bölünmüş) çarpılır (bölünmüş);

· Tüm varyantlara (çıkarma) eklerseniz, aynı sayı, ortalama aritmetik artar (azalır) aynı numaraya.

Kendi tarafından alınan ortalama aritmetik değerler, hesaplanan serilerin değişkenliğini dikkate almadan, özellikle diğer ortamlarla karşılaştırıldığında, varyasyon serisinin özelliklerini tam olarak yansıtmayabilir. Doğru ortam, farklı saçılma derecelerine sahip bir satırdan elde edilebilir. Birbirlerine kantitatif özelliklerinde bazı seçeneklere daha yakın, daha az saçılma (değişkenlik, değişkenlik) Bir sayı, ortalamanın daha tipik.

Özelliğin değişkenliğini değerlendiren ana parametreler şunlardır:

· Dürbün;

· Genlik;

· Ortalama ikinci dereceden sapma;

· Varyasyon katsayısı.

Yaklaşık, işaretin bölümleri, varyasyon serisinin kapsamı ve genliği ile değerlendirilebilir. Kapsam, satırdaki maksimum (V maks) ve minimum (V dak) seçeneklerini gösterir. Genlik (A M) bu seçeneğin farkıdır: A M \u003d V MAX - V MIN.

Varyasyon aralığı varyasyonlarının temel, genel olarak kabul edilen ölçüsüdür dağılım (D. ). Ancak en yaygın kullanılan daha uygun parametre, dağılıma göre hesaplanan - ortalama ikinci dereceden sapma ( σ ). Sapmanın büyüklüğünü dikkate alır ( d. ) Varyasyonun her bir varyantının orta aritmetikten ( d \u003d v - m ).

Ortalama olarak sapmalar seçeneği pozitif ve negatif olabilir, daha sonra özetlenirken, "0" değerini verirler (S d \u003d 0.). Bundan kaçınmak için sapma değerleri ( d.) İkinci dereceye kadar erken ve ortalama. Böylece, varyasyon serisinin dağılımı, orta aritmetikten ortalama bir sapma seçeneğidir ve formül tarafından hesaplanır:

Değişkenliğin en önemli özelliğidir ve birçok istatistiksel kriteri hesaplamak için kullanılır.

Dispersiyon sapma karesiyle ifade edildiğinden, değeri ortalama aritmetik ile karşılaştırıldığında kullanılamaz. Bu amaçlar için geçerlidir ortalama ikinci dereceden sapma"Sigma" işareti ile gösterilir ( σ ). Orta aritmetik değerdeki tüm varyasyon varyasyonlarının ortalama sapmasını, aynı ünitelerdeki orta değer kendisi olarak karakterize eder, böylece birlikte kullanılabilirler.

Ortalama ikinci dereceden sapma, formül tarafından belirlenir:

Bu formül gözlem sayısı ile uygulanır ( n. ) 30'dan fazla. Daha küçük bir sayı ile n. Ortalama ikinci dereceden sapma değerinin matematiksel yer değiştirme ile ilgili bir hataya sahip olacaktır ( n. - bir). Bu konuda, daha fazla doğru sonuç Standart sapmayı hesaplamak için formülde böyle bir yer değiştirme dikkate alınarak elde edilebilir:

standart sapma (s. ) - Bu rasgele bir değişkenin riconducktik sapmasının bir değerlendirmesidir. H. İle ilgili olarak matematiksel beklenti Dispersiyonunun inanılmaz bir tahminine dayanarak.

Değerlerde N. \u003e 30 ortalama ikinci dereceden sapma ( σ ) ve standart sapma ( s. ) aynı olacak ( Σ \u003d S. ). Bu nedenle, çoğunlukta pratik Kılavuzlar Bu kriterler değişken olarak kabul edilir. Excel programında, standart sapma hesaplaması fonksiyonla gerçekleştirilebilir \u003d StandotClone (aralık). Ve ortalama ikinci dereceden sapmayı hesaplamak için uygun bir formül oluşturmak için gereklidir.

Ortalama ikinci dereceden veya standart sapma, karakter değerlerinin ortalama değerden ne kadar önemli olabileceğini belirlemenizi sağlar. Yaz aylarında aynı ortalama gündüz sıcaklığına sahip iki şehir olduğunu varsayalım. Bu şehirlerden biri sahilde, diğeri kıtada bulunur. Kıyıda bulunan şehirlerde, gündüz sıcaklıklarındaki farklılıkların kıtanın içindeki şehirlerden daha küçük olduğu bilinmektedir. Bu nedenle, kıyı kentindeki gündüz sıcaklıklarının ortalama ikinci dereceden sapması, ikinci şehirden daha az olacaktır. Uygulamada, bu, kıtada bulunan şehirdeki her bir günün ortalama hava sıcaklığının, ortalama değerden sahildeki şehirden daha fazla farklılık göstereceği anlamına gelir. Ek olarak, standart sapma, gerekli olasılık seviyesi ile ortalamadan olası sıcaklık sapmalarını tahmin etmenizi sağlar.

Olasılık teorisine göre, normal dağıtım hukukuna sunulan fenomenlerde, ortalama aritmetik değerler arasında, ortalama ikinci dereceden sapma ve sıkı bir bağımlılık var ( kural Üç Sigm). Örneğin, değişim özelliğinin değerlerinin% 68,3'ü M ± 1 dahilindedir. σ ,% 95.5 - m ± 2 içinde σ ve% 99.7 - m ± 3 içinde σ .

Ortalama ikinci dereceden sapmanın büyüklüğü, varyasyon serisinin ve incelenen grubun homojenliğinin niteliğini değerlendirmenizi sağlar. Ortalama ikinci dereceden sapmanın büyüklüğü küçükse, bu, çalışma altında olgunun yeterince yüksek homojenliğini gösterir. Bu durumda ortalama aritmetik, bu varyasyonal serisinin oldukça özelliği olarak kabul edilmelidir. Bununla birlikte, çok küçük Sigma, yapay gözlem seçimini düşündürmektedir. Çok büyük bir Sigma ile, ortalama aritmetik, daha az ölçüde, çalışılan karakterin veya fenomenin veya grubun heterojenliğini gösteren varyasyon serisini karakterize eder. Bununla birlikte, ortalama ikinci dereceden sapmanın büyüklüğünün karşılaştırılması sadece aynı boyuttaki belirtiler için mümkündür. Nitekim, yeni doğan çocukların ve yetişkinlerin çeşitliliğini karşılaştırırsanız, yetişkinlerde her zaman daha yüksek SIGMA değerleri alırız.

Farklı boyutların işaretlerinin değişkenliğinin karşılaştırılması, kullanılarak gerçekleştirilebilir. katsayı değişimi. Bir yüzde olarak çeşitliliği ifade ediyor orta boyBu, çeşitli işaretlerin karşılaştırılmasını sağlar. Tıbbi literatürdeki varyasyon katsayısı işareti ile gösterilir " Dan "Ve matematiksel" v."Ve formül tarafından hesaplanır:

% 10'tan az olan değişim katsayısının değerleri,% 10 ila% 20'den daha az bir saçılmayı gösterir - ortalama% 20'den fazla - orta aritmetik çevresindeki seçeneği güçlü saçılır.

Ortalama aritmetik değer genellikle seçici veri kümesine göre hesaplanır. Tekrarlanan çalışmalarla, rastgele fenomenlerin etkisi altında, ortalama aritmetik değişebilir. Bunun nedeni, bir kural olarak, muhtemel gözlem birimlerinin sadece bir kısmı, yani seçici bir agrega olduğu gerçeğinden kaynaklanmaktadır. Çalışılan fenomeni temsil eden tüm olası birimler hakkındaki bilgiler, her zaman mümkün olmayan genel popülasyonun tamamını incelirken elde edilebilir. Aynı zamanda, deneysel verilerin genelleştirilmesi amacıyla, genel popülasyondaki ortalamanın değeri ilgi çekicidir. Bu nedenle, incelenen fenomenle ilgili genel sonuçların formülasyonu için, seçici agreganın temelinde elde edilen sonuçlar, genel istatistiksel yöntemler kümesine aktarılmalıdır.

Numune çalışmasının ve genel popülasyonun tesadüf derecesini belirlemek için, hatanın büyüklüğünü, seçici gözlemlendiğinde kaçınılmaz olarak meydana gelir. Bu hata denir " Temsili hata"Veya" orta aritmetik hatası ". Aslında numunedeki ortalama arasında bir farktır. istatistiksel gözlemve aynı nesnenin sürekli bir çalışmasıyla elde edilebilecek benzer değerler, yani. Genel nüfusu incelerken. Seçici ortalama rastgele bir değer olduğundan, böyle bir tahmin araştırmacıya kabul edilebilir bir olasılıkla gerçekleştirilir. Tıbbi çalışmalarda, en az% 95'tir.

Temsilcisi hata, referans hataları veya dikkatindeki yeterli teknikler ve aletlerle en aza indirgenmesi gereken dikkat hataları veya dikkat hataları (vb.) İle karıştırılamaz.

Temsilciliğin hatasının büyüklüğü, hem numune boyutuna hem de sayım değişkenliğine bağlıdır. Gözlem sayısı ne kadar büyükse, örneği genel popülasyona ve daha az hataya yaklaştırır. İşareti ne kadar çok değiştirirseniz, istatistiksel hatanın değeri o kadar büyük olur.

Uygulamada, varyasyon serisinde temsilcilik hatasını belirlemek için aşağıdaki formülü kullanır:

nerede: m. - Temsilci hatası;

σ - İkincil ikinci dereceden sapma;

n. - Örnekteki gözlem sayısı.

Formülden, ortalama hatanın büyüklüğünün doğrudan ortalama ikinci dereceden sapma ile orantılı olduğu görülebilir, yani çalışılan atıfın değişkenliği ve karenin köküyle gözlem sayısından orantılı olarak orantılı olduğu görülmektedir.

İstatistiksel analiz yaparken, göreceli değerleri hesaplamaya dayanarak, bir varyasyon numarasının yapısı zorunlu değildir. Aynı zamanda, nispi göstergeler için ortalama bir hatanın tanımı basitleştirilmiş bir formülde yapılabilir:

nerede: R- değer göreceli göstergeyüzde, ppm vb.

s. - Göstergenin hesaplandığı esasına bağlı olarak, (1-P), (100-p), (1000-p) vb. (1-P), (100-p), (1000-p) vb.;

n. - Seçici agregadaki gözlem sayısı.

Bununla birlikte, göreceli değerler için temsil edici bir hatayı hesaplamak için belirtilen formül yalnızca göstergenin değeri, tabanından daha az olduğunda kullanılabilir. Bazı durumlarda, yoğun göstergelerin hesaplanması, böyle bir duruma uyulmaz ve gösterge,% 100 veya% 1000'den fazla sayı ile ifade edilebilir. Böyle bir durumda, bir birleşme serisi vardır ve ortalama ikinci dereceden sapmaya dayanan ortalama değerler için temsil edici hatayı formülle hesaplamak.

Genel nüfusun ortalama aritmetik değerinin değerinin tahmini, iki değerin göstergesi ile en az ve maksimum. Genel nüfusun istenen ortalama değerinin dalgalanabileceği olası sapmaların bu aşırı değerleri " Güven sınırları».

Olasılık teorisinin çevirileri, özelliğin normal dağılımında% 99.7 olasılıkla, ortalama sapmaların aşırı değerlerinin üçlü temsilcilik hatasının büyüklüğünden daha fazla olmayacağını kanıtlamıştır ( M. ± 3. m. ); % 95.5 - ortalama değerin çift ortalama hatasının değerinden daha fazla değil ( M. ± 2. m. ); % 68.3 - ortalama bir hata miktarından daha fazla değil ( M. ± 1. m. ) (Şekil 9).

%

İncir. 9. Normal dağılım olasılığının yoğunluğu.

Yukarıdaki ifadenin yalnızca Gauss dağılımının normal yasalarına tabi olan bir özellik için oldukça olduğuna dikkat edin.

Tıp alanında da dahil olmak üzere çoğu deneysel çalışmalar, sonuçları belirli bir aralıkta neredeyse herhangi bir değere sahip olabilecek ölçümlerle ilişkilidir, bu nedenle kural olarak, sürekli rastgele değişkenler modeli açıklanmıştır. Bu bakımdan, çoğu istatistiksel yöntemde, sürekli dağılımlar göz önünde bulundurulur. Matematiksel istatistiklerde temel bir rolü olan bu tür bir dağıtım normal veya Gauss, dağıtım.

Bu, birkaç nedenden dolayı açıklanmaktadır.

1. Her şeyden önce, birçok deneysel gözlem normal bir dağılım kullanılarak başarıyla tanımlanabilir. Normalde dağıldıktan dolayı normalde iyi olabilecek ampirik verilerin tahsis edilmesinin derhal belirtilmelidir. rastgele değer Uygulamada asla bulunmayanların aralığında bulunur. Bununla birlikte, normal dağılım yaklaşık olarak bir yaklaşım olarak çok uygundur.

İnsan vücudunun ağırlık, büyüme ve diğer fizyolojik parametrelerinin ölçümlerinin yapılması, sonuçları etkiler. büyük sayı Rastgele faktörler (doğal nedenler ve ölçüm hataları). Ayrıca, bir kural olarak, bu faktörlerin her birinin eylemi önemsizdir. Deneyimler, bu gibi durumlarda sonuçların yaklaşık normal olarak dağıtılacağını göstermektedir.

2. İkincisinde bir artışa sahip, rastgele bir numune ile ilişkili birçok dağılım normaldir.

3. Normal dağılım, diğer sürekli dağılımların yaklaşık bir açıklaması olarak uygundur (örneğin, asimetrik).

4. Normal dağılımın bir çok uygun matematiksel özelliklere sahiptir, birçok bakımdan geniş uygulama İstatistik olarak.

Aynı zamanda, tıbbi verilerde, normal dağılım modelinin imkansız olduğu açıklamadaki birçok deneysel dağılım olduğuna dikkat edilmelidir. Bunu yapmak için, istatistiklerde "parametrik olmayan" olarak adlandırılan yöntemler geliştirmiştir.

Belirli bir deneyin verilerinin işlenmesi için uygun olan istatistiksel bir yöntem seçimi, verilerinin normal dağıtım yasasına bağlı olarak yapılmalıdır. Hipotezi, bir tabelanın normal dağıtım hukukunun sunulmasıyla ilgili hipotezi kontrol etmek, frekans dağıtım histogramı (grafik) ve bir dizi istatistiksel kriter kullanılarak gerçekleştirilir. Aralarında:

Asimetri Kriteri ( b. );

Exscess kontrol kriteri ( g. );

Kriterler Shapiro - Wilx ( W. ) .

Verilerin dağılımının niteliğinin analizi (ayrıca dağıtımın geçerliliği de denir) her parametre için gerçekleştirilir. Parametrenin dağılımının normal yasa ile dağıtımının uyumluluğunu güvence alt olarak yargılamak için, yeterince çok sayıda gözlem birimi gereklidir (en az 30 değer).

Normal dağılım için, asimetri ve aşırılık kriterleri 0 değerini alır. Dağıtım sağa kaydırılırsa b. \u003e 0 (pozitif asimetri), b. < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона g. \u003d 0. İçin g. \u003e 0 keskin dağıtım eğrisi g. < 0 пик более сглаженный, чем функция нормального распределения.

Shapiro - Wilx'in ölçütlenmesiyle normalliğini kontrol etmek için, bu kriterin anlamını istatistiksel tablolardaki anlamını, gerekli anlamlılık seviyesine ve gözlem birimlerinin (özgürlük derecelerinin) sayısına bağlı olarak bulması gerekmektedir. Ek 1. Normallik hipotezi, bu kriterin küçük değerlerinde, kural olarak reddedilir, w. <0,8.

İstatistiksel terimler sözlüğü

İstatistiksel soruların sorunları

Tıbbi istatistikler nedir?

İstatistikler, nicel bir açıklama ve olayların, fenomenlerin, maddelerin ölçülmesi denir. Bir bilgi dalı olarak, bir uygulama dalı olarak pratik bir faaliyet şubesi (topluluk fenomenleri toplanması, işlenmesi ve analizi) anlaşılmaktadır. Özel bilimsel disiplin ve bir dizi özet olarak, genel fenomenlerin herhangi bir bölgesini karakterize etmek için toplanan final dijital göstergeleri toplanır.

İstatistikler - genelleştirici göstergeler yöntemiyle kitle fenomen desenlerini inceleyen bilim.

Tıbbi İstatistikler - Bağımsız Kamu Bilimleri Öğrenimi kütle Sosyal Fenomenlerin Kantitatif Tarafı yüksek kaliteli tarafı ile ayrılabilir bir bağlantıda, izin verir göstergeleri genelleştirerek Bu fenomenlerin kalıplarını, toplumun ekonomik, sosyal yaşamındaki en önemli süreçleri, sağlığı, nüfusa tıbbi bakım düzenleme sistemini inceleyin.

İstatistiksel yöntemler, aşağıdakileri içeren kütle gözlemlerinin işlenmesi için bir dizi tekniktir: gruplama, özet, göstergeler, istatistiksel analizleri vb.

Tıpta istatistiksel yöntemler:

  1. nüfusun halk sağlığını bir bütün olarak incelemek ve temel grupları olarak, nüfusun sayısına ve bileşimi hakkında istatistiksel verileri, üreme, fiziksel gelişimi, yaygınlığı ve çeşitli hastalıkların vb. Hakkında istatistiksel verileri toplayarak ve analiz ederek;
  2. Çeşitli çevresel faktörlerle herhangi bir bireysel hastalıklardan kaynaklanan hastalık ve mortalite bağlarının tanımlanması ve kurulması;
  3. tıbbi kurumların ağındaki sayısal verilerin toplanması ve incelenmesi, sağlık önlemlerinin planlanması için faaliyetleri ve personeli, ağ geliştirme planlarının uygulanması ve sağlık kurumlarının faaliyetlerinin uygulanması ve bireysel tıp kurumlarının iş kalitesini değerlendirin;
  4. hastalıkları önlemek ve tedavi etmek için önlemlerin etkinliğinin değerlendirilmesi;
  5. klinikte ve deneydeki çalışmanın sonuçlarının istatistiksel öneminin belirlenmesi.

Tıbbi İstatistik Bölümleri:

  • İstatistiğin genel teorik ve metodolojik temelleri,
  • nüfus Sağlık İstatistikleri
  • sağlık istatistikleri.

MS Excel'de Bir Veritabanı Oluşturma

Veritabanının sonraki işlem için uygun olması için, zor olmayan prensiplere uymak gerekir:

1) MS Excel, bir veritabanı oluşturmak için en uygun programdır. Excel verileri daha sonra daha karmaşık manipülasyonlar için Statistica, SPSS vb. Gibi diğer özel istatistik paketlerine aktarılabilir. Bununla birlikte, hesaplamaların% 80-90'ına kadar "Veri Analizi" üstyapını kullanarak Excel'de kolayca üretilebilir.

2) Tablonun, veritabanıyla birlikte üst çizgisi, bu sütunda dikkate alındığı göstergelerin adlarının kaydedildiği bir şapka olarak çizilir. Hücrelerin birleşmesini kullanmak istenmezdir (bu gereklilik genellikle genel veri tabanında ise), çünkü birçok işlem kabul edilemez hale gelecektir. Ayrıca, üst çizginin homojen göstergelerin grubunun adını ve alt-spesifik göstergelerin adını gösterdiği bir "iki katlı" kapak oluşturmamalısınız. Homojen göstergeleri gruplamak için, bunları tek renkli bir dolgula not etmek daha iyidir veya adlarında parantez içinde bir gruplandırma işareti ekleyin.

Örneğin, bu taraftan değil:

Genel Kan Analizi
Eritmek Leu. Tr
Er (uac) Leu (UAC) Tr (uac)

son değişkende, kapakların "tek katlı" ve verilerin görsel homojenliği (hepsi UAC'nin göstergesiyle ilgilidir).

3) İlk sütunda, hastanın sekans numarası, çalışma altındaki göstergelerin herhangi birine kaybetmeden, bu veritabanına yerleştirilmelidir. Bu, listenin çok sayıda sıralamasından sonra bile, herhangi bir aşamada hastaların ilk sırasına kolay geri dönüş sağlamaya devam edecektir.

4) İkinci sütun genellikle hastaların soyadları (veya tam adları) ile doldurulur.

5) Kantitatif göstergeler (örneğin - büyüme, ağırlık, kan basıncı, kalp atış hızı vb. Numaralarla ölçülenler) sayısal biçimde bir tabloya oturur. Bununla birlikte, bu kadar net olacağı görülüyor, ancak, Excel'de 2007 sürümünden başlayarak fraksiyonel değerlerin nokta yoluyla belirlenmesi gerektiği hatırlanmalıdır: 4.5. Virgül aracılığıyla bir numara yazarsanız, metin olarak algılanır ve bu sütunlar yeniden yazması gerekecektir.

6) Yüksek kaliteli göstergeler daha zor. İki değer seçeneğine sahip olanlar (ikili değerler denilen: evet-hayır, yok, erkek kadınlar yok), bir ikili sisteme çevirmek daha iyidir: 0 ve 1. Değer 1 genellikle A'ya atanır. Pozitif değer (evet, var) 0 - negatif (hayır, eksik).

7) Ciddiyet açısından farklılık gösteren niteliksel göstergeler, fenomen seviyesi (zayıf-orta-güçlü; soğuk-sıcak-sıcak), buna göre sıralanabilir ve ayrıca sayılara çevrilebilir. Fenomenin en küçük seviyesi en küçük sıralama - 0 veya 1 olarak atanır, aşağıdaki dereceler sırayla sıralama değerleriyle gösterilir. Örneğin: hastalık yoktur - 0, kolay şiddeti -1, orta derecede - 2, şiddetli derece - 3.

8) Bazen bir yüksek kaliteli gösterge, birkaç değere karşılık gelir. Örneğin, birkaç hastalığın varlığında "ilgili tanı" sütununda, virgül aracılığıyla işaret etmek istiyoruz. Bu tür verilerin işlenmesi çok zor ve otomatikleştirilememesi için yapılmamalıdır. Bu nedenle, belirli hastalık gruplarıyla ("CSS hastalıkları", "gastrointestinal hastalıklar", vb.) Veya bazı nozolojiler ("xpstrat", "IBS", vb.) İkilideki verilerin bulunduğu birkaç sütun yapmak daha iyidir. İkili Form: 1 ("belirli bir hastalık var" anlamına gelir) - 0 ("bu hastalığın yok").

9) Bireysel gösterge gruplarını sınırlandırmak için, rengi aktif olarak kullanmak mümkündür: Örneğin, UAC'nin göstergelerinin göstergelerine sahip sütunlar, OAM - sarı, vb.

10) Her hasta bir masa satırına karşılık gelmelidir.

Veritabanının bu tasarımı, yalnızca istatistiksel işlemlerinin işlemini önemli ölçüde basitleştirmeyi, aynı zamanda malzeme toplama aşamasında dolumunu kolaylaştırmak için de sağlar.

İstatistiksel analiz için hangi yöntemi seçmek için?

Tüm veriler toplandıktan sonra, her araştırmacının en uygun şekilde istatistiksel işleme yöntemini seçme sorusu. Ve bu şaşırtıcı değil: Modern istatistikler, çok sayıda kriter ve yöntemi birleştiriyor. Hepsinin kendi özelliklerine sahip, iki kişilik yaklaşabilir veya uyuşabilir, benzer durumlar gibi görünecektir. Bu yazıda, tüm ana, en yaygın istatistiksel analiz yöntemlerini amaçladığımız şekilde sistematikleştirmeye çalışacağız.

Bununla birlikte, ilk olarak, istatistiksel verilerin hangi istatistiksel verilerin olduğu hakkında birkaç kelimenin olduğu için, en uygun analiz yönteminin seçimine bağlıdır.

Ölçek ölçümü

Bir çalışma yaparken, her gözlem birimi çeşitli işaretlerin değerlerini tanımlar. Hangi ölçeğe göre ölçüldüğüne bağlı olarak, tüm işaretler ayrılır. nicelve kalite. Çalışmalardaki nitel göstergeler sözde olarak dağıtılmaktadır. nominalÖlçek. Ek olarak, göstergeler tarafından temsil edilebilir. rütbeÖlçek.

Örneğin, kardiyak göstergelerin sporculardaki ve hareketsiz bir yaşam tarzı liderlik eden kişilerin karşılaştırılması yapılır.

Aynı zamanda, incelenen aşağıdaki özellikler belirlenmiştir:

  • kat - bir nominalİki değeri barındıran bir gösterge erkek veya dişidir.
  • yaş - nicelgösterge,
  • spor sınıfları - nominalİki değer alan bir gösterge: Fırsatlar veya nişanlanmamış,
  • kalp atışı - nicelgösterge,
  • sistolik kan basıncı - nicelgösterge,
  • göğüs ağrısı şikayetlerinin kullanılabilirliği - bir nitel Değerleri olarak tanımlanabilir gösterge nominal (Şikayetler var - şikayet yok) ve rütbe Sıklığa bağlı olarak ölçek (örneğin, eğer ağrı günde birkaç kez meydana gelirse, 3 sıralamaya, ayda birkaç kez göstergeye atanır - Sıra 2, Sıra 1, Rütbe 1, Acı ile ilgili şikayetlerin yokluğunda Göğüste - RAG 0).

Pekiştirilmiş set sayısı

İstatistiksel bir yöntem seçmek için çözülmesi gereken bir sonraki soru, çalışmanın bir parçası olarak karşılaştırıldığında agrega sayısıdır.

  • Çoğu durumda, klinik çalışmalarda, iki hasta grubu ile ilgileniyoruz - anave kontrol. Ana, veya tecrübeliÇalışılan tanı veya tedavi yönteminin uygulandığı veya hastaların bu çalışmanın konusu olan bir hastalıktan muzdarip olduğu bir grubun göz önünde bulundurulması gelenekseldir. Kontrol Aksine, bir grup, geleneksel tıbbi bakım, plasebo veya çalışılan hastalığı olan kişileri alan hastaları oluşturur. Farklı hastalar tarafından temsil edilen bu tür organikasyonlar denir yenilmez.
    Hala var İlişkili, veya eşleştirilmiş, aynı insanlara gelince agrega, ancak elde edilen herhangi bir işaretin değerlerini karşılaştırır. önce ve sonra Araştırma. Karşılaştırma agrega sayısı da 2'dir, ancak diğer teknikler bunlara bağlanmadan daha uygulanır.
  • Başka bir seçenek tanımlamaktır birtanınması gereken agrega genellikle herhangi bir araştırmanın azalması. İşin temel amacı iki veya daha fazla grubu karşılaştırmak olsa bile, her biri daha önce karakterize edilmelidir. Bunun için, yöntemler kullanılır tanımlayıcı istatistikler. Ek olarak, bir set için yöntemler başvurabilir korelasyon analiziİki veya birkaç inceleme semptomu arasında bir bağlantı bulmak için kullanılır (örneğin, vücut ağırlığının büyümesinin veya vücut sıcaklığındaki kalp atış hızının bağımlılığının bağımlılığı).
  • Son olarak, karşılaştırılan toplam agrega birkaç olabilir. Tıbbi araştırma ile ilgili olarak çok sık bulunur. Hastalar çeşitli ilaçların kullanımına bağlı olarak gruplandırılabilir (örneğin, antihipertansif ajanların etkinliğini karşılaştırırken, 1 grup - ACE inhibitörleri, 2 - beta-adrenobloklar, 3 - merkezi eylem preparatları), hastalığın ciddiyetine göre ( 1 Grup - Kolay derece, 2 - ortalama, 3 - ağır), vb.

Önemli bir soru da önemlidir. dağıtım normalliğiagregalar okudu. Yöntemleri kullanmanın mümkün olup olmadığına bağlıdır parametrik analiz ya da sadece parametrik olmayan. Normalde dağıtılmış agregalarda saygı duyulması gereken koşullar şunlardır:

  1. orta ölçekli aritmetik, modlar ve medyanların değerlerinin maksimum yakınlığı veya eşitliği;
  2. "Üç SIGM" kurallarına uygunluk (M ± 1σ aralığında, en az% 68.3 seçenek, m ± 2σ - değişkenin en az% 95.5'inde, M ± 3σ aralığında en az% 95.5, en az% 99.7 seçenektir. ;
  3. göstergeler kantitatif bir ölçekte ölçülür;
  4. Özel kriterler - Kolmogorov-Smirnov veya Shapiro-Willow yardımı ile dağıtımın normalliğini kontrol etmenin olumlu sonuçları.

Bizim tarafımızdan belirtilen tüm belirtileri belirledikten sonra, en optimum istatistiksel analiz yöntemini seçmek için aşağıdaki tabloyu kullanmanızı öneririz.

Yöntem Ölçek Ölçüm Göstergeleri Karşılaştırılan set sayısı İşleme hedefi Veri Dağıtımı
t-Kriter öğrencisi nicel 2 normal
bonferroni Değişikliği ile Öğrenci T-Kriterleri nicel 3 veya daha fazla İlişkili agregaların karşılaştırılması normal
Steam T-Kriterleri Öğrenci nicel 2 normal
Tek faktörlü dispersiyon analizi (ANOVA) nicel 3 veya daha fazla İlişkili agregaların karşılaştırılması normal
Tekrarlanan ölçümlerle tek faktörlü dispersiyon analizi (ANOVA) nicel 3 veya daha fazla İlgili setlerin karşılaştırılması normal
U-Kriter Mann-Whitney kantitatif, rütbe 2 İlişkili agregaların karşılaştırılması kimse
Q-Kriter Rosenbaum kantitatif, rütbe 2 İlişkili agregaların karşılaştırılması kimse
Kraskella Wallis Kriteri nicel 3 veya daha fazla İlişkili agregaların karşılaştırılması kimse
Kriterler Wilkexon kantitatif, rütbe 2 İlgili setlerin karşılaştırılması kimse
İşaretler için G-kriterleri kantitatif, rütbe 2 İlgili setlerin karşılaştırılması kimse
Kriterler Friedman. kantitatif, rütbe 3 veya daha fazla İlgili setlerin karşılaştırılması kimse
Kriter χ 2 Pearson nominal 2 veya daha fazla İlişkili agregaların karşılaştırılması kimse
Doğru Kriter Fisher nominal 2 İlişkili agregaların karşılaştırılması kimse
Test mac-nemara nominal 2 İlgili setlerin karşılaştırılması kimse
Q-Kriter Kohrena nominal 3 veya daha fazla İlgili setlerin karşılaştırılması kimse
Göreceli Risk (Risk Oranı, RR) nominal 2 kohort Çalışmalarında İlişkili Agrega'nın Karşılaştırılması kimse
Oran oranı (oran oranı veya) nominal 2 "Case-Control" ile ilgili çalışmalarda ilgisiz agreganın karşılaştırılması kimse
Pearson korelasyon katsayısı nicel 2 Ölçüm Sıraları normal
Spearman'ın rütbesi korelasyon katsayısı kantitatif, rütbe 2 Ölçüm Sıraları İşaretler arasındaki iletişimin tespiti kimse
Cendalla Korelasyon Katsayısı kantitatif, rütbe 2 Ölçüm Sıraları İşaretler arasındaki iletişimin tespiti kimse
Kefektif Katsayısı Kendalla kantitatif, rütbe 3 veya daha fazla ölçüm satırı İşaretler arasındaki iletişimin tespiti kimse
Orta değerlerin (M) ve ortalama hataların (m) hesaplanması nicel 1 tanımlayıcı istatistikler kimse
Medyan (IU) ve yüzdesinin (çeyrek) hesaplanması rankovaya 1 tanımlayıcı istatistikler kimse
Nispi değerlerin (P) ve ortalama hataların (m) hesaplanması nominal 1 tanımlayıcı istatistikler kimse
Kriter shapiro-söğüt nicel 1 dağıtım Analizi kimse
Kriter Kolmogorov-Smirnova nicel 1 dağıtım Analizi kimse
Kriter Ω 2 Smirnov-Krameron-Arka Plan Mises nicel 1 dağıtım Analizi kimse
Kaplan-Meyer hiç 1 hayatta kalma analizi kimse
Oransal Kok Riskleri Modeli hiç 1 hayatta kalma analizi kimse

Büyük istatistikler

Karl Pearson (27 Mart 1857 - 27 Nisan 1936)

27 Mart 1857'de Karl Pearson doğdu - büyük İngilizce matematikçi, istatistikler, biyolog ve filozof; Biyometrilerin kurucularından biri olan matematiksel istatistiklerin kurucusu.

University College London'da 27 yaşında Uygulamalı Matematik Profesörü aldıktan sonra, Karl Pearson, genel bir bilimsel enstrüman olarak aldığı istatistikleri çalışmaya başladı, ona karşılık gelen genel bir bilimsel enstrüman olarak görev yapmaya başladı, genellikle öğrencilere sunma gereği hakkında düşünceleri kabul etmiyor. geniş bir yelpazede.

İSTATİSTİK alanındaki Pearson'un ana değeri, korelasyon teorisinin kimliğinin ve işaretlerin konjugasyonu, "Pearson Curves" tanıtımı, ampirik dağılımları tanımlamak için "Pearson Curves" ın tanıtımını ve son derece önemli bir kriteri ile ilişkilendirilebilir. Chi-Meydanı, ayrıca çok sayıda istatistiksel masanın derlenmesi. Pearson, istatistiksel yöntemi ve özellikle de birçok bilim endüstrisindeki korelasyon teorisini uyguladı.

İşte onların ifadelerinden biri: "İyi kurulmuş bilimdeki modern istatistiksel yöntemlerin ilk amatör tanıtımı, tipik saygısızlığa karşı çıkıyor. Ama o zamandan önce yaşadım, birçoğu, ilk önce kınadıkları aynı yöntemleri gizlice uygulamaya başladım."

Ve 1920'de zaten, Peyson, biyometrik okulun hedefinin, "Uygulamalı Matematik Şubesine istatistiklerini dönüştürmek, eski siyasi ve sosyal istatistik okulunun kıt yöntemlerini özetlemek, atma veya kanıtlamak için" istatistikleri dönüştürmek için "bir not haline getirdi. Genel olarak, ve genel olarak, ciddi bir bilim dalındaki severler ve dördünçler için spor toprağından istatistikleri dönüştürmek için. Hasır, antropoloji, kraniyometri, psikoloji, kriminoloji, biyoloji, sosyolojide kusurlu ve sık sık hatalı yöntemler eleştirmek gerekiyordu. Bu bilim yeni ve daha güçlü araçlarla. Savaş neredeyse yirmi yıl sürdü, ancak çoğu eski düşmanlığın geride kaldığı ve yeni yöntemlerin her yerde kabul edildiği belirtiler ortaya çıktı. "

Karl Pearson çok yönlü ilgi alanları seçildi: Heidelberg'de fizik okudu, dinin sosyal ve ekonomik rolüyle ilgilendi ve hatta Cambridge ve Londra'daki Alman Tarihi ve Edebiyatı'nda ders okudu.

28 yaşındayken Karl Pearson, "kadın sorusu" konusundaki dersleri okudu ve hatta erkek ve kadınların kulübünü kurdu, 1889 yılına kadar olan, her şeyin katlar arasındaki ilişki de dahil olmak üzere serbestçe ve sınırsız bir şekilde tartışıldığı.

Kulüp, eşit sayıda erkek ve kadın, orta sınıfın, sosyalistlerin ve feministlerin liberal temsilcilerinden oluşuyordu.

Kulübün tartışılmasının konusu, en geniş yelpazenin meselesiydi: Antik Yunan Atina'daki cinsel ilişkilerden Budist rahibelerinin budist rahibelerinin konumuna, ilişkiden fuhuş problemlerine olan ilişkilerinden. Temel olarak, "Erkek ve Kadınlar Kulübü", erkek ve kadınların etkileşiminin uzun süredir kurulan normlarına ve "doğru" cinsellik hakkındaki fikirleri zorlaştırdı. Victoria İngiltere'nin çağında, "düşük" ve "hayvan" bir şey olarak algılanan cinsellik ve seks eğitimine karşı cehaletin her yerinde dağıtıldığı, bu tür meselelerin tartışılması gerçekten radikaldir.

1898'de Pearson, Darwinian Madalyası Kraliyet Derneği'ne layık görüldü, hangi ödüllerin onları cesaretlendirmesi için gençlere verilmesi gerektiğini düşünüyor. "

Florence Plantnelel (12 Mayıs 1820 - 13 Ağustos 1910)

Floransa Plantneleyl (1820-1910) - Doğum gününde Tıbbi Kız kardeşinin uluslararası gününü kutladığımız Doğum Günü'nde, Büyük Britanya'nın Merhamet ve Kamu İşleri.

Floransa'da zengin bir aristokrat ailede doğdu, mükemmel bir eğitim aldı, altı dil biliyordu. Genç yaştan, Mercy'nin kız kardeşi olmayı hayal etti, 1853'te Pastor Flender'ın Kaiserverte'deki kız kardeşlerin toplumunda hemşirelik eğitimi aldı ve Londra'da küçük bir özel hastanenin yönetimi oldu.

1854 Ekim ayında, Kırım Savaşı sırasında, Floransa, 38 asistanla birlikte Kırım'daki tarla hastanelerine gitti. Yaralı bakımı düzenleyerek, sürekli olarak sanitasyon ve hijyen ilkelerini uygular. Sonuç olarak, altı aydan az, Lazareta'daki mortalite 42'den% 2,2'ye düştü!

Kendimi kendimi ordudaki tıbbi hizmeti reform etme görevini koyduktan sonra, Plantneyale, havalandırma ve kanalizasyon sistemleri ile donatılacak hastanelere ulaştı; Hastane personeli mutlaka gerekli eğitime tabi tutulur. Bir askeri tıp fakültesi organize edildi ve askerler ve memurlar arasında, hastalığın önlenmesinin önemi konusunda açıklayıcı bir çalışma yapıldı.

Büyük Merit Floransa Travel istatistiklerinde Floransa Plangeyl!

  • 800 sayfalık kitap ", İngiliz Ordusu Hastanelerinin Hastanelerinin Etkinliğini ve Yönetimi Etkileyen Faktörler Üzerine Notlar" (1858) İstatistiklere ve resimli diyagramlara adanmış bir bütün bölüm içeriyordu.
  • Funkyale, istatistikte grafik görüntüleri kullanmak için yenilikçi oldu. "Kavurma tarak" olarak adlandırılan ve mortalite yapısını tanımlamak için kullanılan dairesel çizelgeleri icat etti. Diyagramlarının çoğu, ordu tıbbını reform yapmaya karar verildiği için, ordudaki sağlık sorunları hakkındaki Komisyon raporuna dahil edildi.
  • Hastanelerde, hastanenin faaliyetleri üzerindeki modern raporlama formlarının selefi olan hastanelerde istatistikleri toplamak için ilk form gelişti.

1859'da, Kraliyet İstatistik Topluluğu'nun bir üyesi tarafından seçildi ve ardından Amerikan İstatistik Derneği'nin onursal bir üyesi oldu.

Johann Karl Friedrich Gauss (30 Nisan, 1777 - 23 Şubat 1855)

30 Nisan 1777'de, büyük bir Alman matematikçi, bir tamirci, bir fizikçi, astronom, bir anketçı ve istatistik, Johann Karl Friedrich Gauss, Braunschweig şehrinde doğdu.

Tüm zamanların en büyük matematikçilerinden biri, "Matematik Kralı" olarak kabul edilir. Copli Madalyaları (1838) Laureate (1838), İsveç (1821) ve Rusça (1824) Bilimler Akademisi'nin yabancı üyesi, İngiliz Kraliyet Topluluğu.

Zaten üç yılda, Karl nasıl okunur ve yazacağını biliyordu, hatta babasının sayısız hatasını bile düzeltti. Legend'e göre, okulu matematik öğretmeni, çocukları uzun süre almak için, 1'den 100'e kadar olan sayıların toplamını saymanızı önerdi. Genç Gauss, zıt uçlardan ikili toplamların aynı olduğunu fark etti: 1 + 100 \u003d 101, 2 + 99 \u003d 101, vb. D. Ve anında sonuç aldı: 50 × 101 \u003d 5050. En eski olana kadar, aklın çoğunu zihninde üretirdi.

İstatistiklerdeki Charles Gauss'un ana bilimsel esası, regresyon analizinin azaldığı en küçük kareler yöntemi oluşturulmasıdır.

Ayrıca, o zamandan beri programı genellikle Gaussiana adlı olarak adlandırılan normal dağıtım hukuku dağılımını araştırdı. "Tedavi Edilen SIGM" kuralı (Gauss kuralı) normal dağılımı açıklar.

Lion Semenovich Kaminsky (1889 - 1962)

Büyük Vatanseverlik Savaşı'ndaki galibiyetin 75. yıldönümünde, SSCB - Lev Semenovich Kaminsky (1889-1962) 'de askeri tıbbi ve sıhhi istatistiklerin kurucularından biri olan harika bir bilim adamı hakkında hatırlamak ve anlatmak istiyorum.

Kiev'de 27 Mayıs 1889'da doğdu. 1918'de onurdan mezun olduktan sonra, Kaminsky Tıp Fakültesi, KAMINSKY, 1920'sinin 1920 yılının sonuna kadar Kızıl Ordu'nun safrasındaydı. Güneydoğu'daki 136. konsolide evakosital Ön.

1922'den itibaren Lion Semenovich, Kuzey-Batı Demiryolu Tıbbi Hizmeti'nin sıhhi ve epidemiyolojik bölümü başkanlığındaydı. Bu yıllar boyunca, Kaminsky'nin prof. rehberliğinde bilimsel faaliyetleri. S.A. Novoselsky. Ortak temel emeklerinde "Geçmiş Savaşlardaki Kayıplar", 1756'dan 1918'e kadar dünyanın çeşitli ordularının savaşlarındaki insan zararları hakkında istatistiksel bir malzeme, daha sonra Kaminsky'nin çalışmalarında analiz edildi, askeri kayıpların yeni, daha doğru bir şekilde sınıflandırılması gelişmiş ve haklı.

Monografında "İnsanların Yiyecekleri ve Halk Sağlığı" (1929), Halk Sağlığı üzerindeki savaşların etkisinin sıhhi ve hijyenik yönleri, aynı zamanda savaş sırasında nüfusa ve orduya tıbbi bakım düzenleme konularının yanı sıra yıllar.

1935'ten 1943'e kadar Lion Semenovich, SSCB'nin NARC komplemesinin sıhhi tesisat bölümünü (1942 - tıbbi) istatistiklerini ele geçirdi. Ekim 1943'te Prof. Şef, Askeri Tıp Akademisi'nin Askeri Tıp İstatistikleri Bölümü'nün başı haline geldi. S.M. Kirova ve 1956'dan beri Leningrad Eyalet Üniversitesi'nde İstatistik Bölümü ve Muhasebe Profesörü tarafından yapılır.

Lion Semenovich, nicel yöntemlerin sıhhi ve tıbbi istatistik uygulamalarına yaygın olarak tanıtımı için gerçekleştirildi. 1959'da, yazarlığının altında, bir çalışma rehberi yayınlandı "Laboratuar ve klinik verilerin istatistiksel olarak işlenmesi: Doktorun bilimsel ve pratik çalışmalarında istatistiklerin kullanımı", tıbbi istatistiklerdeki en iyi yerli ders kitaplarından biri haline gelmiştir. Önsözde, L.S.Kamnsky notları:
"... Katılan doktorların işin nasıl yapıldığını bilmesi, karşılaştırmalar ve karşılaştırmalar için uygun sadık sayıları toplayabilecek ve işleyebilecekleri önemli görünüyor."

Kriterler ve Yöntemler

bağımsız agregalar için öğrencinin t-kriteri

Öğrenci t-kriteri, öğrencinin dağılımına dayanarak hipotezlerin (istatistiksel kriterler) istatistiksel olarak test edilmesi için bir yöntem sınıfı için genel bir isimdir. T-kriterlerini uygulama vakaları, iki örnekte orta değerlerin eşitliğini kontrol etmekle ilişkilidir.

Bu kriter geliştirildi William Sili Gosset

2. Öğrencinin t-kriteri nedir?

Öğrencinin t-kriteri, farklılıkların ortalama değerlerde istatistiksel önemini belirlemek için kullanılır. Bağımsız numuneleri (örneğin, diyabeti ve sağlıklı grupları olan hasta grupları) hem de ilgili kümeleri karşılaştırırken (örneğin, bir antiaritmik ilaç almadan önce ve sonra aynı hastalarda ortalama nabız hızı) karşılaştırırken kullanılabilir. . İkinci durumda, öğrencinin çifti t-kriteri hesaplanır

3. Öğrenci t-kriterini hangi durumlarda kullanabilirim?

Öğrencinin t-kriterini kullanmak için, ilk verilerin normal bir dağılıma sahip olması gerekir. Karşılaştırılan grupların (dağılım) eşitliği (homosajlar) da önemlidir. Eşit olmayan dispersiyonlarda, Welch modifikasyonundaki T-kriteri (Welch "s T) kullanılır.

Normal bir dağılımın yokluğunda, öğrenci yerine T-kriteri yerine, en ünlü olanların benzer parametrik olmayan istatistiklerin benzer yöntemlerini kullanır. U-Kriteri Mann - Whitney.

4. Öğrencinin t-kriteri nasıl hesaplanır?

Aşağıdaki formülle hesaplanan öğrencinin t-kriterinin ortalama değerlerini karşılaştırmak:

nerede M 1. - Ortalama aritmetik ilk karıştırılabilir agrega (Grup), M 2. - Ortalama aritmetik ikinci karşılaştırmalı agrega (Grup), m 1. - İlk orta aritmetik ortalama hatası, m 2. - İkinci orta aritmetik ortalama hatası.

Elde edilen t-kriteri, düzgün bir şekilde yorumlanmalıdır. Bunu yapmak için, her gruptaki incelenen sayısını bilmemiz gerekir (N1 ve N2). Özgürlük derecelerinin sayısını buluruz f. Aşağıdaki formüle göre:

F \u003d (n 1 + n2) - 2

Bundan sonra, gerekli anlamlılık düzeyi (örneğin, p \u003d 0.05) ve belirli bir özgürlük ile öğrenci t-kriterinin kritik değerini belirliyoruz. f. Tablo (aşağıya bakınız).

  • Öğrencinin T-kriterinin hesaplanan değeri, masada bulunursa, karşılaştırılan değerler arasındaki farkların istatistiksel olarak önemi hakkında kararlıyız.
  • Öğrencinin hesaplanan t-kriterinin değeri daha az tablo halinde ise, karşılaştırılan değerler arasındaki farklar istatistiksel olarak anlamlı değildir.

Yeni demir hazırlığının etkinliğini incelemek için anemili iki hasta grubu seçildi. Birinci grupta hastalar iki hafta boyunca yeni bir ilaç aldı ve ikinci grupta plasebo aldı. Bundan sonra, periferik kandaki hemoglobin seviyesinin ölçülmesi gerçekleştirildi. Birinci grupta, ortalama hemoglobin seviyesi 115.4 ± 1.2 g / l'dır ve ikincisi - 103.7 ± 2.3 g / l (veriler M ± M formatında sunuldu), toplamları normal bir dağılıma sahiptir. Aynı zamanda, ilk grubun sayısı 34 ve ikinci - 40 hasta idi. Farklılıkların istatistiksel olarak önemini ve yeni demir hazırlığının etkinliğini sonuçlandırmak gerekir.

Karar: Farklılıkların önemini değerlendirmek için, öbeğin t-kriterini kullanıyoruz, ortalama değerlerin karelerinin karesi miktarına bölünmesindeki fark olarak hesaplanan,

Hesaplamaları yaptıktan sonra, T-Kriterin değeri 4.51 olarak ortaya çıktı. Özgürlük derecelerinin sayısını (34 + 40) - 2 \u003d 72 olarak buluyoruz. Student 4.51'in T-Kriterinin T-Kriteri değerini, Tablo: 1,993'te belirtilen değerde kritik bir değerle karşılaştırın. Kriterin hesaplanan değeri daha kritik olduğundan, gözlenen farklılıkların istatistiksel olarak anlamlı olduğu sonucuna varıyoruz (önem seviyesi r düzeyi<0,05).


Steam T-Kriterleri Öğrenci

Bir çift t-kriteri, eşleştirilmiş (tekrarlanan) ölçümlerde farklılıkların istatistiksel önemini belirlemek için kullanılan öğrenci yönteminin modifikasyonlarından biridir.

1. T-Kriterleri Geliştirme Tarihi

t-kriterleri tasarlandı William Gossetomginnes şirketinde bira kalitesini değerlendirmek. Ticari sırların açıklanmaması için şirkete yükümlülükler ile bağlantılı olarak, Gosset'in makalesi 1908 yılında "Öğrenci" (Öğrenci) takma adamında "Biyometrik" dergisinde yayınlandı.

2. Öğrencinin çifti t-kriteri nedir?

İki bağımlı (eşleştirilmiş) örneği karşılaştırmak için Stear T-kriteri kullanılır. Aynı hastalarda yapılan boyutlar bağımlıdır, ancak farklı zamanlarda, örneğin, antihipertansif bir hazırlık yapmadan önce ve sonra hipertansif hastalığı olan hastalarda kan basıncıdır. Sıfır hipotez, karşılaştırılan numuneler arasındaki farklılıkların olmaması, alternatif - istatistiksel olarak anlamlı farklılıkların varlığı hakkında.

3. Hangi durumlarda, bir çift t-kriteri kullanabilirsiniz?

Ana durum, numunelerin bağımlılığıdır, yani, aynı hastalarda bir parametrenin tekrarlanan ölçümler ile komplo değerler elde edilmelidir.

Bağımsız numuneleri karşılaştırması durumunda, bir çift t-kriterin kullanılması için, ilk verilerin normal bir dağılıma sahip olması gerekir. Bu durum, örnek ortamın karşılaştırılmasıyla karşılaştırıldığında, parametrik olmayan istatistikler kullanılmalıdır. İşaretler için G-kriterleri veya T-kriter wilcoxon.

Bir çift t-kriteri, yalnızca iki diski karşılaştırırken kullanılabilir. Üç veya daha fazla yeniden ölçümü karşılaştırmanız gerekirse, kullanmalısınız. tekrarlanan ölçümler için tek faktörlü dispersiyon analizi (ANOVA).

4. Öğrencinin çifti t-kriteri nasıl hesaplanır?

Öğrencinin sızdırmaz t-kriteri, aşağıdaki formüle göre hesaplanır:

nerede M d. - Önce ve sonra ölçülen ortalama aritmetik farklar Σ D. - Göstergelerin farklılıklarının ortalama ikinci dereceden sapması, n. - Çalışılan sayısı.

5. Öğrencinin T-Kriterinin değerini nasıl yorumlayabilirsiniz?

Öğrencinin buharlayan t-kriterinin elde edilen değerinin yorumlanması, ilgisiz agregaların t-kriterinin değerlendirilmesinden farklı değildir. Her şeyden önce, özgürlük derecelerinin sayısını bulmak gerekir. f. Aşağıdaki formüle göre:

F \u003d n - 1

Bundan sonra, istenen anlamlılık düzeyi için Öğrenci T-Kriterinin kritik değerini belirliyoruz (örneğin, P<0,05) и при данном числе степеней свободы f. Tablo (aşağıya bakınız).

Kriterin kritik ve hesaplanmış değerlerini karşılaştırın:

  • Stroke t-kriterinin hesaplanan değeri, masada bulunursa veya daha kritik olduğuna göre, karşılaştırılan değerler arasındaki farkların istatistiksel olarak önemi hakkındadır.
  • Hesaplanan çiftin t-kriterinin değeri daha az tablo halinde ise, karşılaştırılan değerler arasındaki farklar istatistiksel olarak anlamlı değildir.

6. Öğrencinin T-Kriteri Hesaplanmasının Örneği

Yeni hipoglisemik ajanın etkinliğini değerlendirmek için, ilacı aldıktan önce ve sonra diyabet hastalarının kanındaki glikoz seviyesinin ölçülmesi. Sonuç olarak, aşağıdaki veriler elde edildi:

Karar:

1. Her bir değerdeki farkı hesaplayın (D):

N hasta Kan şekeri seviyesi, mmol / l Değerlerin farkları (D)
İlacayı almadan önce İlacayı aldıktan sonra
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. Formül tarafından ortalama aritmetik farklılıkları bulun:

3. Farklılıkların ortalama ikinci dereceden sapmasını, ortalamadan formülle bulacağız:

4. Öğrencinin Pair T-Kriterini Hesaplayın:

5. Öğrenci 8.6'nın T-Kriterinin T-Kriterinin T-Kriteri değerini bir tablo değeri ile karşılaştırın, bu, FREFE derecelerinin sayısı 10 - 1 \u003d 9'dur ve anlamlılık düzeyi p \u003d 0.05, 2.262'dir. Elde edilen değer daha kritik olduğundan, yeni bir ilaç aldıktan önce ve sonra kan şekeri içeriğinde istatistiksel olarak anlamlı farklılıkların varlığı ile ilgilidir.

Tablo Göster Kritik Değerler T-Kriter Öğrenci

U-Kriter Mann-Whitney

U-Kriteri Mann-Whitney - İki bağımsız numuneyi nicel olarak ölçülen herhangi bir işaret açısından karşılaştırmak için kullanılan parametrik olmayan istatistiksel kriter. Yöntem, kesişen değerlerin bölgesinin iki varyasyon satırı (ilk numunedeki sıralanmış parametre değerleri sayısı ve ikinci numunedeki aynı) arasında yeterli olup olmadığı tanımına dayanır. Kriterin değeri, büyük olasılıkla, örneklerdeki parametre değerleri arasındaki farklar güvenilirdir.

1. U-kriter geliştirme tarihi

Örnekler arasındaki farkları belirleme yöntemi, 1945 yılında Amerikan kimyacı ve istatistikler tarafından önerildi. Frank Wilkexon.
1947'de, matematikçiler tarafından önemli ölçüde revize edildi ve genişletildi. H.B. Kudret helvası(H.B. Mann) ve D.R. Whitney(D.R. Whitney), bugünün genellikle adlandırıldığı isimlerde.

2. Mann-Whitney'in U Kriteri Nedir?

U-kriterleri Mann-Whitney, herhangi bir nicel özellik açısından iki bağımsız numune arasındaki farkları değerlendirmek için kullanılır.

3. Hangi durumlarda Mann-Whitney'in kriterleri olabilir?

U-kriterleri Mann-Whitney, parametrik olmayan bir kriterdir, bu nedenle aksine t-kriter öğrencisi

U kriteri, küçük örnekleri karşılaştırmak için uygundur: Numunelerin her birinde en az 3 işaret olmalıdır. Bir numunede 2 değer olmasına izin verilir, ancak ikincisinde en az beş olmalıdır.

Mann-Whitney U kriterinin uygulanmasının durumu, karşılık gelen işaretlerin (tüm numaralar - farklı) veya çok az sayıda bu tesadüf gruplarının karşılaştırılan gruplarının olmamasıdır.

Üç ve daha fazla grubun karşılaştırması için Manna-Whitney'in U kriterinin analogu Kraklala Wallis Kriteri.

4. Mann-Whitney U kriteri nasıl hesaplanır?

İlk olarak, her iki karşılaştırmaya göre numuneler derlendi tek sıralı satır, gözlem birimlerini imzadaki artış derecesinde çürüterek ve daha küçük bir rütbenin daha küçük bir değerini atamak. Özelliğin eşit değerleri durumunda, her birinin birkaç birimleri ortalama aritmetik tutarlı sıralar atanır.

Örneğin, tek bir sıralı satırda 2 ve 3 yer (rütbeli) işgal eden iki birim aynı değerlere sahiptir. Sonuç olarak, her biri (3 + 2) / 2 \u003d 2.5'e eşit rütbeye atanır.

Tek sıralı bir satırdan oluşan bir sıra halinde, toplam sıra sayısı eşit olacaktır:

N \u003d n 1 + n 2

n1, ilk numunedeki elementlerin sayısıdır ve N2, ikinci numunedeki elemanların sayısıdır.

Daha sonra, sırasıyla sırasıyla, her birim için sıradaki değerlerden gelen birinci ve ikinci numunelerin birimlerinden oluşan tek bir sıralı satırı yinelemektedir. İlk numunenin elemanlarının payına gelen ve ayrı ayrı - ikinci numunenin elemanlarının payını ayrı olarak sayarız. N X Elements ile karşılık gelen numuneyi iki sıralı toplamı (t x) tanımlıyoruz.

Son olarak, Manna-Whitney'in U-kriterinin Formula tarafından önemini buluruz:

5. Manu-Whitney U kriteri değerini nasıl yorumlayabilirsiniz?

Elde edilen U-kriter değeri, belirli bir sayıda karşılaştırmalı numune için kritik bir değeri olan seçilen istatistiksel anlamlılık düzeyi (p \u003d 0.05 veya p \u003d 0.01) için tablo ile karşılaştırılır:

  • Elde edilen değer ise daha azdüzenli veya eşit derecedeÖrneklerdeki semptomlar arasındaki farkların istatistiksel olarak önemi olarak kabul edilir (alternatif bir hipotez alınır). Farklılıkların doğruluğu daha yüksektir, ABD'nin değeri daha küçüktür.
  • Elde edilen değer dahatabüler, sıfır hipotez alınır.
Kritik değerlerin tablosunu göstermek U-kriter manna-whitney p \u003d 0.05

Kriterler Wilkexon

Wilkexon'un ilgili numuneler için kriter (Wilcoxon T-Kriteri'nin isimleri, Wilcoxon kriteri, Wilcoxon'un ikonik saflıklarının kriteri, Wilcoxon'un ikonik sıralarının kriteri) - parametrik olmayan (eşleştirilmiş) örneği karşılaştırmak için kullanılan parametrik olmayan istatistiksel kriter Sürekli veya düz ölçekte ölçülen herhangi bir nicel özellik.

Metodun özü, bir yönde veya başka bir yönde vardiya şiddetinin mutlak değerlerinin karşılaştırılmasıdır. Bunu yapmak için, ilk önce vardiyaların tüm mutlak değerleri sıralanır ve ardından sıralar toplanır. Bir yönde veya başka bir değişim tesadüfen meydana gelirse, sıralarının miktarları yaklaşık olarak eşit olacaktır. Bir yöndeki vardiyaların yoğunluğu daha büyükse, o zaman zıt yöndeki vardiyalardaki mutlak değişikliklerin saflarının toplamı, rastgele değişikliklerle olabileceğinden önemli ölçüde düşük olacaktır.

1. Wilkexon'un ilgili örnekler için kriterlerin gelişimi

Test ilk olarak 1945 yılında Amerikan istatistiki ve kimyager Frank Wilkexon (1892-1965) tarafından önerildi. Aynı bilimsel çalışmada, yazar bağımsız örnekleri karşılaştırdığında kullanılan başka bir kriteri tanımlar.

2. Wilcoxon kriteri nedir?

Wilcoxon'un t-kriteri, aynı incelenen set için yapılan, ancak farklı koşullarda veya farklı zamanlarda yapılan iki ölçüm arasındaki farkları değerlendirmek için kullanılır. Bu test, değişikliklerin odağını ve ifadesini tanımlayabilir - yani göstergelerin bir yönde daha fazla kaydırılı olup olmadığı.

Wilcoxon'un t-kriterinin ilişkili kümeler için kullanılabileceği bir durumun klasik bir örneği, göstergelerin tedavi öncesi ve sonrası karşılaştırıldığında "daha önce" çalışmasıdır. Örneğin, antihipertansif ajanın etkinliğini incelerken, arteriyel basınç ilacı almadan önce ve resepsiyondan sonra karşılaştırılır.

3. T-Kriterleri Wilcoxon kullanımındaki koşullar ve kısıtlamalar

  1. Wilkexon'un kriteri parametrik olmayan bir kriterdir, bu nedenle, aksine t-Kriter Öğrencikarşılaştırılan setlerin normal dağılımını gerektirmez.
  2. Wilkexon'un çalışma altındaki t-kriteri sayısı en az 5 olmalıdır.
  3. Çalışılan işaret, hem kantitatif sürekli (kan basıncı, kalp atış hızı, lökositlerin 1 ml kan içeriği) hem de birim ölçekte (nokta sayısı, hastalığın ciddiyeti, mikroorganizmalar tarafından yayılma derecesi) ölçülebilir. ).
  4. Bu kriter, yalnızca iki ölçüm sayısını karşılaştırması durumunda kullanılır. T-kriterleri Wilcoxon'un analogu, üç ve daha fazla ilişkili setleri karşılaştırdığı için Kriterler Friedman..

4. İlgili örnekler için T-kriterleri Wilcoxon nasıl hesaplanır?

  1. Çalışılan her biri için eşleştirilmiş ölçümlerin değerleri arasındaki farkı hesaplayın. Sıfır kaymalar daha da dikkate alınmaz.
  2. Hangi farklılıkların tipik olduğunu belirleyin, yani göstergeyi değiştirmek için sıklığa karşılık gelirler.
  3. Çiftlerdeki farkları mutlak değerlerinde (yani, işaretini dikkate almadan), artan sırayla çalıştırmak. Daha küçük farkın mutlak değeri, daha küçük rütbeye atfedilir.
  4. Atipik vardiyalara karşılık gelen rütbelerin miktarını hesaplayın.

Böylece, ilgili numuneler için Wilcoxon'un t-kriteri, aşağıdaki formüle göre hesaplanır:

ΣRR, göstergedeki atipik değişikliklere karşılık gelen rütbelerin toplamıdır.

5. Wilcoxon kriterinin değerini nasıl yorumlayabilirsiniz?

Wilcoxon'un t-kriterinin elde edilen değeri, seçilen istatistiksel anlamlılık düzeyi için masadaki kritik bir şekilde karşılaştırılır ( p \u003d 0.05veya p \u003d 0.01.) Belirli sayıda karşılaştırılan numune ile N:

  • T emp hesaplanan (ampirik) değeri ise. daha az tabular t cr. Ya da eşit olarak, göstergedeki değişikliklerin tipik bir tarafta istatistiksel önemini tanır (alternatif bir hipotez alınır). Farklılıkların doğruluğu daha yüksektir, T'nin değeri küçülür.
  • Eğer t emp ise. Daha fazla t KR. Göstergedeki değişikliklerin istatistiksel olarak önemi yokluğu hakkında boş bir hipotez uygulanmaktadır.

Wilcoxon'un ilgili örnekler için kriterlerini hesaplama örneği

İlaç şirketi, bir gruptan steroidal olmayan bir anti-enflamatuar fondan yeni bir ilacın çalışmasını yürütmektedir. Bunu yapmak için, hipertermi ile Orvi'den muzdarip 10 gönüllü grubu seçildi. Yeni bir ilaç aldıktan sonra vücut sıcaklığını ve 30 dakika önce ölçtüler. İlaç alımının bir sonucu olarak vücut sıcaklığındaki bir azalmanın önemini sonuçlandırmak zorundadır.

  1. Kaynak veriler aşağıdaki tablo formunda dekore edilmiştir:
  2. WilCoxon'un t-kriterini hesaplamak için, eşleştirilmiş göstergelerdeki farkı hesaplar ve mutlak değerlerini yakıyoruz. Aynı zamanda, atipik rütbeler kırmızı renkte ortaya çıktı:
    N. Soyadı İlaç almadan önce t vücut ilaç aldıktan sonra t vücut Göstergelerdeki fark, D | D | Rütbe
    1. İvanov 39.0 37.6 -1.4 1.4 7
    2. Petrov 39.5 38.7 -0.8 0.8 5
    3. Sidorov 38.6 38.7 0.1 0.1 1.5
    4. Popov 39.1 38.5 -0.6 0.6 4
    5. Nikolaev 40.1 38.6 -1.5 1.5 8
    6. Kozlov. 39.3 37.5 -1.8 1.8 9
    7. İgnatiev 38.9 38.8 -0.1 0.1 1.5
    8. Semenov 39.2 38.0 -1.2 1.2 6
    9. Egorov 39.8 39.8 0
    10. Alekseev 38.8 39.3 0.5 0.5 3
    Gördüğümüz gibi tipik vardiya Gösterge, 7 yaşındayken 7 olguda işaretlenmiştir. Bir durumda (hastada, Egorov) - ilacı aldıktan sonra sıcaklık değişmedi ve bu nedenle bu dava daha fazla analizde kullanılmadı. İki durumda (Hastalar Sidorov ve Alekseev) kutlandı nonfil kayması Arttırma yönünde sıcaklıklar. Atipik bir kaymaya karşılık gelen sıralar 1.5 ve 3'e eşittir.
  3. Göstergenin atipik bir kaymasına karşılık gelen rütbelerin toplamına eşit olan Wilcoxon'un T-Kriterini Hesaplayın:

    T \u003d Σrr \u003d 3 + 1.5 \u003d 4.5

  4. T emf'i karşılaştırın. t k kr. Hangi anlamlılık düzeyinde p \u003d 0.05 ve n \u003d 9'dur. Sonuç olarak, T emf.
  5. Sonuç olarak: ORVI'li hastalarda vücut ısısını azaltmak, yeni bir ilacın kabulü bir sonucu olarak istatistiksel olarak anlamlıdır (p<0.05).
Tablo Göster Kritik Değerler T-Kriteri Wilcoxon

Criteri Chi-Square Pearson

Pearson'ın (2) kriteri χ 2, her kategoriye düşen numunenin sonuç sayısı veya nitel özellikleri arasında, fiili (çalışmanın bir sonucu olarak tanımlanan) arasındaki farkın önemini değerlendirmenize olanak sağlayan parametrik olmayan bir yöntemdir. ve incelenen gruplarda sıfır hipotez adaletiyle beklenebilecek teorik miktar. Geçiş yapılması daha kolaydır, yöntem, iki veya daha fazla göreceli göstergedeki farklılıkların istatistiksel önemini tahmin etmenizi sağlar (frekanslar, paylar).

1. Kriterin geliştirilmesinin geçmişi χ 2

Conjugacy tablolarını analiz etmek için ki-kare kriteri, 1900 yılında İngiliz matematikçiliği, istatistiksel, biyologlar ve filozof, matematiksel istatistiklerin kurucusu ve biyometrilerin kurucularından biri tarafından geliştirilmiş ve önerilmiştir. Karl Pearson(1857-1936).

2. χ 2 Pearson kriteri nedir?

Analiz edildiğinde ki-kare kriteri kullanılabilir conitry TablolarıBir risk faktörünün varlığına bağlı olarak sonuçların sıklığı hakkında bilgi içeren bilgi içerir. Örneğin, dört alan bir konjugasyon tablosu şöyle görünür:

Exodus (1) Sonuç yok (0) Toplam
Risk faktörü (1) A. B. A + B.
Risk faktörü eksik (0) C. D. C + D.
Toplam A + C. B + D. A + B + C + D

Böyle bir konjugasyon tablosunu nasıl doldurursunuz? Küçük bir örnek düşünün.

Bir çalışma, sigarayı arteriyel hipertansiyon riski üzerindeki etkisi ile gerçekleştirilir. Bunun için, incelenen grupların iki grubu seçildi - 70 kişi, aynı yaşta en az 1 paket sigara içen en az 1 paket sigara içiyordu. İlk grupta, 40 kişinin tansiyonu artmıştır. İkinci - arteriyel hipertansiyon 32 kişide gözlendi. Buna göre, sigara içenler grubundaki normal kan basıncı 30 kişide (70 - 40 \u003d 30) ve sigara içilmeyen grupta - 48 (80 - 32 \u003d 48).

Dört turlu bir konjugasyon tablosunun kaynak verilerini doldurun:

Elde edilen konjugasyon tablosunda, her satır çalışılan belirli bir gruba karşılık gelir. Sütunlar - Arteriyel hipertansiyona sahip kişilerin sayısını veya normal arteriyel basınçla gösterin.

Araştırmacının önüne yerleştirilen görev: Sigara içenler ve sigara içmeyenler arasında arteriyel basınçlı kişilerin sıklığı arasında istatistiksel olarak anlamlı farklar var mı? Bu soruyu Chi-Square Pearson kriterini hesaplayarak ve elde edilen değeri eleştirel olarak karşılaştırarak cevaplayabilirsiniz.

  1. Komplo göstergeler, nominal bir ölçekte (örneğin, bir hasta - erkek veya dişi) veya sırayla ölçülmelidir (örneğin, 0 ile 3 arasında değer alan arteriyel hipertansiyon derecesi).
  2. Bu yöntem, sadece dört yuvarlak tabloları, faktör ve sonuç ikili değişkenler olduğunda, yani sadece iki olası değer (örneğin, erkek veya kadın zeminler, belirli bir varlığı veya yokluğu) olduğunda analiz etmenizi sağlar. anamnezi hastalığı ...). Chi-Square Pearson kriteri, multipolum tabloları analiz etmesi durumunda, faktör ve (veya) exodus üç veya daha fazla değer aldığında da kullanılabilir.
  3. Karşılaştırılmış gruplar bağımsız olmalıdır, yani "to-" sonrası gözlemleri karşılaştırırken ki-kare kriteri kullanılmamalıdır. Bu durumlarda gerçekleştirilir test mac-nemara(iki ilişkili kümeyi karşılaştırırken) veya hesaplanır Q-Kriter Kohrena(Üç veya daha fazla grubun karşılaştırılması durumunda).
  4. Dörtlü masaları analiz ederken beklenen değerlerher hücre en az 10 olmalıdır. En azından aynı hücreye göre, beklenen fenomen değeri 5 ila 9'dan alır, ki-kare kriter hesaplanmalıdır. jate'in değişikliği ile. En az bir hücre, 5'in beklenen fenomenden az olması durumunda, daha sonra analiz kullanılmalıdır. doğru Kriter Fisher.
  5. Multipolum tablolarını analiz etmesi durumunda, beklenen gözlem sayısı, hücrelerin% 20'sinden daha fazla 5'ten az değerleri almamalıdır.

4. Chi-Square Pearson kriteri nasıl hesaplanır?

Ki-kare ihtiyacının kriterlerini hesaplamak için:

Bu algoritma hem dörtlü hem de çok yönlü tablolar için geçerlidir.

5. Chi-Square Pearson kriterinin değerini nasıl yorumlayabilirsiniz?

Elde edilen χ 2 kriterinin değerinin daha kritik olması durumunda, tedavi edilen risk arasındaki istatistiksel ilişkinin varlığını ve ilgili öneme sahip olan sonucu varlığını sonlandırıyoruz.

6. ki-kare Pearson kriterinin hesaplanması örneği

Yukarıda tartışılan tablodaki arteriyel hipertansiyon vakalarının sıklığı üzerine sigara faktörünün etkisinin istatistiksel önemini tanımlarız:

  1. Her hücre için beklenen değerleri hesaplayın:
  2. Chi-Square Pearson kriterinin değerini bulun:

    χ 2 \u003d (40-33.6) 2 /33.6 + (30-36.4) 2 /36.4 + (32-38.4) 2 /38.4 + (48-41.6) 2 /41.6 \u003d 4.396.

  3. Özgürlük özgürlüğü sayısı F \u003d (2-1) * (2-1) \u003d 1. Pearson'un öneminin kritik değerini, anlamlılık düzeyinde p \u003d 0.05 ve sayısının kritik değerini bulun. Özgürlük derecelerinin 1, 3.841'dir.
  4. Ki-kare kriterinin elde edilen değerini eleştirel olarak karşılaştırın: 4.396\u003e 3.841, bu nedenle, arteriyel hipertansiyon sıklığının sigara içilmesinin kullanılabilirliğinden bağımlılığı istatistiksel olarak anlamlıdır. Bu ilişkinin önemi düzeyi p'ye karşılık gelir<0.05.
Kritik kritik kriter kriterlerini göster

Doğru Kriter Fisher

Fisher'ın doğru kriteri, iki değere sahip belirli bir özelliğin sıklığını karakterize eden iki nispi göstergeyi karşılaştırmak için kullanılan bir kriterdir. Kesin Fischer kriterini hesaplamak için ilk veriler genellikle dört haddelenmiş bir tablo biçiminde gruplandırılır.

1. Kriterler Geliştirme Tarihi

İlk defa kriter önerildi Ronald Fisher "Deneylerin tasarımı" kitabında. Bu 1935'te oldu. Fisher kendisi, Muriel Bristol'un bu düşünce için indiğini savundu. 1920'lerin başında Ronald, Muriel ve William Roach deneysel bir tarım istasyonunda İngiltere'de idi. Muriel, hangi dizinin çayını ve sütünün kabına döküldüğünü belirlediğini savundu. O zaman, ifadesinin doğruluğunu doğrulamak mümkün değildi.

Bu, ivmedi "sıfır hipotez" hakkında balıkçı fikrine verdi. Amaç, Muriel'in farklı pişmiş çay bardağı arasındaki farkı belirleyebileceğini kanıtlama girişimi değildi. Bir kadının seçiminin rastgele yaptığı hipotezi çürütmeye karar verildi. Sıfır-hipotezin, ne de haklı göstermeyeceği tespit edildi. Ancak deneyler sırasında çürütülebilir.

8 bardak pişirildi. İlk başta ilk dört nital sütünde, diğer dört çayda. Bardaklar takıntılıydı. Bristol, çay tadı denemeyi ve çayları pişirerek bardakları denemeyi teklif etti. Sonuç olarak, iki grup elde edilmelidir. Tarih, deneyin başarılı olduğunu söylüyor.

Fisher testi sayesinde, Bristol'in sezgisel davrandığı olasılığı 0,01428'e düşürüldü. Yani, fincanı 70'teki bir durumda doğru bir şekilde belirlemek mümkündü. Ancak hala Madam'ın rastgele tanımladığı gerçeğinin şansını azaltmak mümkün değil. Bardak sayısını arttırsanız bile.

Bu hikaye, "sıfır hipotez" gelişimine itici güç verdi. Aynı zamanda, olası tüm bağımlı ve bağımsız değişkenler kombinasyonlarının etkileşiminde bulunan, balıkçının kesin kriteri önerildi.

2. Doğru fisher kriteri nedir?

Doğru Fisher Kriteri, çoğunlukla küçük örnekleri karşılaştırmak için kullanılır. Bunun için iki önemli neden var. İlk olarak, kriterin hesaplamaları oldukça hantaldır ve uzun zaman alabilir veya güçlü bilgi işlem kaynakları gerektirebilir. İkincisi, kriter, az sayıda gözlemle yapılan çalışmalarda kullanılmasını sağlayan oldukça doğrudur (adında bile yansıtılır).

Tıpta balıkçının tam kriterine özel bir yer verilir. Bu, birçok bilimsel araştırmada kullanımını bulmuş tıbbi verilerin işlenmesinin önemli bir yöntemidir. Bunun için, belirli faktörlerin ve sonuçların ilişkisini keşfetmek, çalışılan iki grup arasındaki patolojik koşulların sıklığını karşılaştırmak mümkündür.

3. Balıkçının doğru kriterini hangi durumlarda kullanabilirim?

  1. Karşılaştırılabilir değişkenler, nominal bir ölçekte ölçülmeli ve sadece iki değere sahip olmalıdır, örneğin kan basıncı normal veya yükseltilmiş, olumlu veya olumsuz, postoperatif komplikasyonların sonucudur veya olmaz.
  2. Kesin Fischer kriteri, iki bağımsız grubu bir faktöre göre karşılaştırmak için tasarlanmıştır. Buna göre, faktörün de sadece iki olası değeri olmalıdır.
  3. Kriter, çok küçük örnekleri karşılaştırmak için uygundur: Kesin Fischer kriteri, beklenen fenomen değerleri durumunda, kullanım için bir sınırlama olan beklenen fenomen değerleri durumunda dört platformları analiz etmek için kullanılabilir. cheri-Squarer Peson, hatta Yeats'in düzeltilmesini dikkate alarak bile.
  4. Fisher'ın doğru kriteri tek taraflı ve bilateraldir. Tek taraflı sürümüyle, göstergelerden birinin reddedileceği tam olarak bilinir. Örneğin, çalışma sırasında, kaç hastanın kontrol grubuna kıyasla geri kazanıldığını karşılaştırırlar. Terapinin hastaların durumunu kötüleştiremediği varsayılmaktadır, ancak sadece tedavi ya da değil.
    İki bilateral test, iki yönde frekans farklılıklarını tahmin eder. Yani, sadakat, deney grubunda kontrol grubuna kıyasla hem daha fazla hem de daha az fenomen tahmin ediliyor.

Balıkçının kesin kriterinin analogu Criteri Chi-Square PearsonAynı zamanda, Fischer'in kesin kriteri, özellikle de küçük örnekleri karşılaştırırken, bu durumda, bu durumda bir avantaja sahip olduğunda.

4. Doğru Fisher'in kriterini nasıl hesaplayabilirsiniz?

Gebelik sırasında annenin sigortalanmasından gelen çocukların doğum oranının doğuştan kusurları (PRD) olan doğum oranının bağımlılığı incelenmiştir. Bunun için, bir tanesi hamile kadın grubu seçilir, bunlardan biri, hamileliğin ilk trimesterinde sigara içen 80 kadından oluşan ve ikincisi, hamilelik boyunca sağlıklı bir yaşam tarzı lider 90 kadını içeren bir karşılaştırma grubudur. . Deney grubundaki PRPS vakasının sayısı 10, karşılaştırma grubunda - 2'dir.

Başlangıçta, dört turlu bir konjugasyon tablosu yapıyoruz:

Fisher'ın doğru kriteri aşağıdaki formülle hesaplanır:

n, n iki grupta çalışılan toplam sayısıdır; K! - Her biri bir öncekinden daha az olan sayıların sırasındaki sayının bir ürünü olan faktör, (örneğin, 4! \u003d 4 · 3 · 2 · 1)

Hesaplamaların bir sonucu olarak, p \u003d 0.0137 olduğunu görüyoruz.

5. Kesin balıkçı kriterinin değerini nasıl yorumlayabilirsiniz?

Yöntemin avantajı, elde edilen kriterin anlamlılık seviyesinin tam değerine göre yazışmasıdır. Yani, örneğimizde elde edilen değer 0,0137 ve karşılaştırılan gruplardaki farklılıkların, PRP fetüsünün gelişimi sıklığında bir önemi vardır. Bu sayıyı yalnızca 0.05'te tıbbi çalışmalarda kabul edilen kritik bir önem düzeyi ile karşılaştırmak gereklidir.

  • Tam Fischer kriterinin değeri daha kritik olduğunda, sıfır hipotez alınır ve bir risk faktörü varlığına bağlı olarak sonuç frekansında istatistiksel olarak anlamlı farklılıkların olmaması konusunda bir sonuç var.
  • Kesin fischer kriterinin değeri daha az kritik olması durumunda, risk faktörünün etkilerine bağlı olarak sonuç frekansında istatistiksel olarak anlamlı farkları önlemek için alternatif bir hipotez alınır ve bir sonuç oluşur.

Örneğimizde p< 0,05, в связи с чем делаем вывод о наличии прямой взаимосвязи курения и вероятности развития ВПР плода. Частота возникновения врожденной патологии у детей курящих женщин статистически значимо выше, чем у некурящих.


Tutum şansı

Şansaların oranı, istatistiksel göstergedir (Rusça, adı Osh olarak kesilmek üzere, adının, İngilizce olarak kesilmesi için yapılır.), Sayısal ifadeyi tanımlamanın ana yollarından biri, belirli bir şeyin yokluğunun veya varlığının ne kadar olduğunu Sonuç, belirli bir istatistik grupta belirli bir faktörün varlığı veya yokluğu ile ilişkilidir.

1. Şansın oranının gelişmesinin tarihi

"Şans" terimi, kumar teorisinden geldi, bu konseptin yardımıyla, kazanma pozisyonlarının kaybedilmesine oranını gösterdiğini belirtti. Bilimsel tıbbi literatürde, 1951'de J. Cornfield'in çalışmasında şans oranı ilk olarak belirtildi. Daha sonra, bu araştırmacı, Gizli Aralığın% 95'ini Hesaplama İhtiyacının, şansın oranı için de belirtildiği belirtildi. (Cornfield, J. Klinik verilerden karşılaştırmalı oranları tahmin etmek için bir yöntem. Akciğer, meme ve Cervix // Ulusal Kanser Enstitüsü Dergisi, 1951. - n.11. - P.1269-1275.)

2. Şansın oranının göstergesi nedir?

Şansın tutumu, belirli bir sonuç ve risk faktörü arasındaki ilişkiyi tahmin etmenizi sağlar.

Şansın oranı, belirli bir risk faktörünü tanımlamak için çalışılan sıklık gruplarını karşılaştırmanıza olanak sağlar. Şansa oranının uygulanmasının sonucunun sadece bir faktör ve sonuç arasındaki ilişkinin istatistiksel önemini de belirlemektir, aynı zamanda kantitatif değerlendirmesidir.

3. Bir şansın uygulanmasının koşulları ve sınırlamaları

  1. Nominal ölçekte kapsamlı ve faktör göstergeleri ölçülmelidir. Örneğin, sonuç, fetüsün doğuştan bir malformasyonunun varlığı veya yokluğudur, faktör incelenmiştir - annenin (sigara içmeyen veya sigara içmeyen).
  2. Bu yöntem, faktör ve sonuç ikili değişkenler olduğunda, yani sadece iki olası değer (örneğin, cinsiyet - erkek veya dişi, arter hipertansiyonu - varlığı veya yokluğu, sonuç veya yokluğu, hastalık - bir gelişme veya iyileştirme olmadan ...).
  3. Çözünmüş gruplar bağımsız olmalıdır, yani, derecelendirme göstergesi "-" sonrası gözlemleriyle karşılaştırmak için uygun değildir.
  4. Şansın oranının bir göstergesi "vaka kontrolü" tipi çalışmalarda (örneğin, birinci grup - hipertansif hastalığı olan hastalar, ikincisi nispeten sağlıklı insanlardır). Gruplar, risk faktörünün varlığı veya yokluğu temelinde (örneğin, ilk grup - sigara içenler, ikinci grup - sigara içmeyenler) temelinde oluştuğunda, prospektif çalışmalar için de hesaplanabilir. göreceli risk.

4. Şans oranı nasıl hesaplanır?

Şansın oranı, fraksiyonun değeridir, bu sayısındaki, birinci grup için belirli bir olayın şansı var ve payda ikinci grup için aynı olayın şansı var.

ŞansÇalışılan, belirli bir özelliğe (sonuç veya faktör), bu özelliğin bulunmadığı çalışma sayısına sahip olan sayısının oranıdır.

Örneğin, pankreonekroz hakkında işletilen bir grup hasta seçildi, bunların sayısı 100 kişidir. 5 yıl sonra, 80 kişi hayatta kalanlarından ayrıldı. Buna göre, hayatta kalma şansı 80 ila 20 veya 4 idi.

Uygun bir şekilde, Tablo 2x2'deki veri şansının oranını hesaplamaktır:

Exodus (1) Sonuç yok (0) Toplam
Risk faktörü (1) A. B. A + B.
Risk faktörü eksik (0) C. D. C + D.
Toplam A + C. B + D. A + B + C + D

Bu tablo için, şansın oranı aşağıdaki formülle hesaplanır:

Sonuç ve risk faktörü arasındaki tespit edilen bağlantının istatistiksel önemini tahmin etmek çok önemlidir. Bunun nedeni, birine yakın olan şansların düşük değerlerinin düşük değerlerine sahip olması, bununla birlikte, ilişkinin anlamlı olabileceği ve istatistiksel sonuçlarda dikkate alınması gerektiği gerçeğinden kaynaklanmaktadır. Aksine, büyük değerlerde, veya, gösterge istatistiksel olarak önemsiz olarak ortaya çıkıyor ve bu nedenle tanımlanmış bağ ihmal edilebilir.

Şansın ihtimalinin önemini değerlendirmek için, gizli aralığın% 95'inin sınırları hesaplanır (% 95 di veya İngilizce'den% 95 CI, "Güven aralığı"). % 95 CI'nin üst sınırının değerini bulmak için formül:

% 95 CI alt sınırının değerini bulmak için formül:

5. Şansın oranının değerini nasıl yorumlayabilirsiniz?

  • Şansın oranı 1'i aşıyorsa, bu, bu, gruptaki risk faktörünü daha fazla sonuç varlığıyla tespit etme şansının. Şunlar. Faktör, gerçekleşen sonuç olasılığı ile doğrudan bir bağlantıya sahiptir.
  • 1'den az olan şansın oranı, risk faktörünü tespit etme şansının ikinci grupta daha fazla olduğunu göstermektedir. Şunlar. Faktör, bir sonuç olasılığıyla geri bildirimde bulunur.
  • Birine eşit bir şans olmadan, risk faktörünü aynı olan grupları tespit etme şansı. Buna göre, faktörün sonuç olasılığı üzerinde hiçbir etkisi yoktur.

Ek olarak, her durumda, ihtimalin oranının istatistiksel olarak önemi, gizli aralığın% 95'inin değerlerine dayanarak gereklidir.

  • Güven aralığı 1'i içermezse, yani Her iki sınır veya daha yüksek veya 1'in altındaki değerler, faktörü ile sonuç arasındaki tespit edilen bağlantının istatistiksel olarak önemi hakkında sonuçlandırılır.<0,05.
  • Güven aralığı 1, yani Üst sınırı 1'den büyük ve alt, 1'den az, faktörü ile sonuç arasındaki ilişkinin istatistiksel bir önemi olmadığı sonucuna varılmıştır. P\u003e 0.05.
  • Güven aralığının değeri, faktör ve sonucun bağlantısının önemi ile tersine orantılıdır, yani. % 95'ten az DI, daha önemli olan bağımlılıktır.

6. Şans oranının hesaplanmasının örneği

İki grubu hayal edin: İlk önce fetus gelişmesinin doğuştan bir malformasyonu olan 200 kadından oluşuyordu (Exodus +). Hamilelik sırasında sigara içtiler (faktör +) - 50 kişi (FAKAT)sigara içmeyenlerdi (faktör-) - 150 kişi (Dan).

İkinci grup, hamilelik sırasında sigara içtikleri PRP (sonuç -) işaretleri olmayan 100 kadına (Faktör +) 10 kişi olarak gerçekleşti. (B), füme değil (faktör-) - 90 kişi (D).

1. Dört turlu bir konjugasyon tablosu yapın:

2. Şans oranı değerinin değerini hesaplayın:

Veya \u003d (a * d) / (b * c) \u003d (50 * 90) / (150 * 10) \u003d 3.

3.% 95 CI sınırlarını bulun. Yukarıdaki formüle göre hesaplanan alt sınırın değeri 1.45 ve üst - 6.21 idi.

Böylece, çalışma, bir sigara içme kadını, fetusun teşhis edilmiş bir PRP'si olan hastalar arasında, meyve belirtileri olmayan kadınlar arasında 3 kat daha yüksektir. Gözlenen bağımlılık istatistiksel olarak anlamlıdır, çünkü% 95 CI 1 içermez, düşük ve üst sınırların değerleri 1'den büyüktür.


Göreceli risk

Risk, belirli bir sonucu, örneğin hastalık veya yaralanma olasılığıdır. Risk, 0'dan (bir sonucun oluşma olasılığı yoktur) 1'e değer verebilir (her durumda olumsuz bir sonuç bekleniyor). Tıbbi istatistiklerde, kural olarak, herhangi bir faktöre bağlı olarak sonuç oluşumu riskindeki değişiklikler incelenmiştir. Hastalar şartlı olarak 2 gruba ayrılır, bunlardan biri faktörün diğerini etkilediği - hayır.

Göreceli risk, incelenen faktörün etkilenmeyen, bu faktörden etkilenmeyen, incelenen sonuçların sıklığına etkilendiği, incelenen sonuçların sıklığının oranıdır. Bilimsel literatürde, göstergenin kısaltılmış adı genellikle kullanılır - OP veya RR (İngilizce'den "." Nispi Risk ").

1. Göreceli Riskin Geliştirilmesi Tarihi

Nispi riskin hesaplanması, ekonomiden tıbbi istatistikler tarafından ödünç alınmaktadır. Siyasi, ekonomik ve sosyal faktörlerin mal veya hizmetlerin talebi üzerindeki etkisinin doğru değerlendirmesi başarıya yol açabilir ve bu faktörlerin küçümseme, işletmenin finansal başarısızlıkları ve iflasına neden olabilir.

2. Göreceli risk nedir?

Nispi risk, risk faktörünün varlığına bağlı olarak sonuç olasılığını karşılaştırmak için kullanılır. Örneğin, sigaranın hipertansiyon frekansı üzerindeki etkisini değerlendirirken, meme kanseri frekansının oral kontraseptiflerin alınmasından kaynaklandığında vb. Göreceli risk, belirli tedavi yöntemlerinin atanması veya araştırma yapılması için en önemli göstergedir. olası yan etkilerle.

3. Göreceli risk kullanımındaki koşullar ve kısıtlamalar

  1. Faktör ve sonuç göstergeleri nominal bir ölçekte ölçülmelidir (örneğin, Paul Hasta - erkek veya kadınlar, arteriyel hipertansiyondur).
  2. Bu yöntem, faktör ve sonuç dahili olarak değişkenler olduğunda, bu, sadece iki olası değer (örneğin, 50 yaşından küçük veya 50 yaşından büyük, belirli bir hastalığın varlığı veya yokluğu) olduğunda sadece dört yuvarlak tablolara izin verir. Tarih).
  3. Çalışılan gruplar risk faktörünün varlığı veya yokluğu temelinde oluşturulduğunda, prospektif çalışmalarda göreceli risk uygulanır. "Vaka Kontrolü" ilkesi üzerinde araştırma durumunda, göreceli risk yerine, gösterge kullanılmalıdır. İlişki.

4. Nispi riski nasıl hesaplanır?

Göreceli riski hesaplamak için gereklidir:

5. Nispi riskin değerini nasıl yorumlayabilirsiniz?

Bağıl risk göstergesi, faktör ve sonuç ilişkisinin niteliğini belirlemek için 1 ile karşılaştırılır:

  • Eğer 1 ise, çalışma altındaki faktörün sonuç olasılığını etkilemediği sonucuna varılabilir (faktör ve sonuç arasındaki iletişim eksikliği).
  • 1'den fazla değerlerde, faktörün sonuçları arttırdığı sonucuna varılmıştır (doğrudan bağlantı).
  • 1'den küçük değerlerde - Faktöre maruz kaldığında sonuç olasılığını azaltmak için (geri bildirim).

Gizli aralığın% 95'inin sınırları da gereklidir. Her iki değer - ve alt ise ve üst sınırlar 1'den bir yoldur veya başka bir deyişle, güven aralığı 1 içermez, daha sonra faktör arasındaki tespit edilen bağlantının istatistiksel olarak önemi ile sonuçlanır. hata p olasılığı ile sonuç<0,05.

% 95 di alt sınırı 1'den az ise ve üst daha fazla ise, faktörün etkisinin, veya (P'nin büyüklüğünden bağımsız olarak sonuç frekansı üzerindeki etkisinin istatistiksel olarak önemi olmadığı sonucuna varılmıştır. \u003e 0.05).

6. Nispi riskin hesaplanmasının örneği

1999 yılında, gastrik ülserin erkeklerinin görülme sıklığı Oklahoma'da yapıldı. Düzenli fast food tüketimi, etkili bir faktör olarak seçildi. Birinci grupta, aralarında mide ülserinin 96 kişi tanısı konduğu 500 erkek vardı. İkinci grupta, mide ülserinin 31 vakada teşhis edildiği 500 sağlıklı yiyeceklerin destekçisi seçildi. Elde edilen verilere dayanarak, aşağıdaki konjugasyon tablosu inşa edilmiştir:


Pienson Korelasyon Kriterleri

Pearson korelasyon kriterleri, parametrik istatistiklerin bir yöntemidir, bu da iki kantitatif gösterge arasında doğrusal bir bağlantının varlığını veya yokluğunun ve yakınlığını ve istatistiksel önemini değerlendirmeyi mümkün kılar. Başka bir deyişle, Pearson korelasyon kriterleri, bir göstergenin diğerindeki değişikliklere yanıt olarak değişip değişmediğini belirlemeyi mümkün kılar mı? İstatistiksel hesaplamalar ve sonuçlarda, korelasyon katsayısı genellikle R XY veya R XY olarak gösterilir.

1. Korelasyon kriterinin gelişmesinin geçmişi

Pearson korelasyon kriterleri tarafından yönetilen bir İngiliz bilim adamları ekibi tarafından geliştirilmiştir. Karl Pearson (1857-1936) 19. yüzyılın 90'lı yılların 90'lı yıllarda, iki rastgele değişkenin kovaryansının analizini basitleştirmek. Pearson korelasyon kriterleri üzerinde Karl Pearson'a ek olarak Francis Edzhuort ve Rafael Weldon.

2. Kriterleme kriteri kriteri nedir?

Pearson korelasyon kriterleri, kantitatif ölçekte ölçülen iki gösterge arasındaki korelasyon bağının paren (veya gücünün) neyin neyin olduğunu belirlemenizi sağlar. Ek hesaplamaların yardımı ile, tespit edilen bağlantının ne kadar süre önemli olduğunu belirlemek de mümkündür.

Örneğin, kişi korelasyon kriterinin yardımı ile, hastanın büyümesi ve ağırlığı arasında akut solunum yolu enfeksiyonları sırasında kandaki vücutun vücut ve kandaki lökositlerin içeriği arasındaki mevcudiyetinin sorusunu cevaplamak mümkündür. Flor içme suyundaki içerik ve çürük nüfusunun insidansı arasında.

3. Kriterlerin Uygulanmasına İlişkin Koşullar ve Kısıtlamalar Chi-Square Pearson

  1. Komplo göstergeler, nicel bir ölçekte (örneğin, kalp atış hızı, vücut ısısı, lökosit içeriği, 1 ml kan, sistolik kan basıncı) ölçülmelidir.
  2. Korelasyon kriterleştirilmesi sayesinde, yalnızca değerler arasındaki doğrusal bir ilişkinin varlığını ve gücünü belirlemek mümkündür. Yönetimin (doğrudan veya tersi), değişikliğin niteliği (düz veya eğrisel), yanı sıra bir değişkenin diğerinden bağımlılığını da içeren diğer özellik özellikleri; regresyon analizi.
  3. Karşılaştırılan miktar sayısı iki olmalıdır. Üç veya daha fazla parametrenin ara bağlantısının analizi durumunda, yöntemi kullanmalısınız. faktor analizi.
  4. Pereson korelasyon kriteri parametriktir ve bu nedenle uygulamasının durumu, ilişkili değişkenlerin her birinin normal dağılımıdır. Göstergelerin korelasyon analizine ihtiyaç duyulması durumunda, dağılımın normalden farklıdır, ordinal ölçekte ölçülenler de dahil olmak üzere, kullanılmalıdır. spearman'ın rütbesi korelasyon katsayısı.
  5. Bağımlılık ve korelasyon kavramlarını açıkça ayırt etmelidir. Büyüklüklerin bağımlılığı, aralarında bir korelasyonun varlığına neden olur, ancak tam tersi değildir.

Örneğin, bir çocuğun büyümesi yaşına bağlı, yani, büyük çocuk, daha yüksek. Farklı yaşların iki çocuğunu alırsak, daha sonra yüksek olasılıkla, büyük çocuğun büyümesi daha genç olacaktır. Bu fenomen bağımlılık denir, göstergeler arasında nedensel bir ilişki anlamına gelir. Tabii ki, aralarında bir korelasyon bağ, yani, bir göstergedeki değişikliklerin başka bir göstergedeki değişikliklerle eşlik etmesi anlamına gelir.

Başka bir durumda, çocuğun büyümesinin ve kalp kısaltmalarının (CSS) sıklığının ilişkisini düşünün. Bildiğiniz gibi, bu değerlerin her ikisi de doğrudan yaşa bağlıdır, bu nedenle çoğu durumda, daha fazla büyüme (daha yaşlı anlamına gelir), kalp atış hızının daha küçük değerlerine sahip olacaktır. Yani, korelasyon bağı gözlenecek ve yeterince yakınlığa sahip olabilir. Bununla birlikte, bir yaşın çocuğunu alırsak, ancak farklı bir büyüme, daha sonra, büyük olasılıkla, kalp atış hızı önemsiz olacaktır ve bu nedenle kalp atış hızının büyümesinden bağımsızlığı hakkında sonuçlandırabiliriz.

Yukarıdaki örnek, iletişim kavramları ile inançlı sonuçların inşası için göstergelerin bağımlılığı arasında ayrım yapmanın nasıl önemli olduğunu göstermektedir.

4. Pearson korelasyon katsayısını nasıl hesaplayabilirsiniz?

Pearson korelasyon katsayısının hesaplanması, aşağıdaki formüle göre yapılır:

5. Pearson korelasyon katsayısının değerini nasıl yorumlayabilirsiniz?

Purson korelasyon katsayısı, mutlak değerlerine göre yorumlanır. Korelasyon katsayısının olası değerleri 0 ila ± 1 arasında değişmektedir. R XY'nin mutlak değeri ne kadar büyükse, iki değer arasındaki bağlantının tonu ne kadar yüksek olursa. R xy \u003d 0, iletişimin eksiksiz olmasını sağlar. R xy \u003d 1 - Mutlak (işlevsel) bir bağlantının varlığını gösterir. Purson korelasyon kriteri değeri 1 veya daha az birden fazla olduğu ortaya çıkmışsa, hesaplamalarda bir hataya izin verilir.

Daha yakın veya kuvveti değerlendirmek için, korelasyonlar genellikle R XY'nin mutlak değerlerinin olduğu gibi genel olarak kabul edilen kriterler tarafından kullanılır.< 0.3 свидетельствуют о güçsüz iletişim, r xy, 0.3 ila 0.7 - iletişim hakkında ortagerginlik, değerler r xy\u003e 0.7 - Hakkında kuvvetliİletişim.

Chadek tablosunu kullanırsanız, korelasyon kuvvetinin daha doğru bir değerlendirmesi elde edilebilir:

Korelasyon katsayısının istatistiksel öneminin değerlendirilmesi R XY, aşağıdaki formülle hesaplanan T-kriteri kullanılarak gerçekleştirilir:

T R'nin elde edilen değeri, belirli bir anlamlılık düzeyinde kritik bir değer ve N-2 özgürlüğü derecelerinin sayısı ile karşılaştırılır. Eğer tr'yu geçerse, tanımlanmış korelasyonun istatistiksel olarak önemi hakkında sonuçlandırılmıştır.

6. Pearson korelasyon katsayısının hesaplanması örneği

Çalışmanın amacı, iki kantitatif gösterge arasındaki korelasyonun haçlarını ve istatistiksel önemini tanımlamak, kandaki testosteron seviyesi (x) ve vücuttaki kas kütlesinin yüzdesi (Y). 5 incelenen (n \u003d 5) oluşan numunenin kaynak verileri tabloya düşürülür:


Spirmend Kriteri

Spearman'ın rütbe korelasyon katsayısı, fenomen arasındaki ilişkiyi istatistiksel olarak incelemek için kullanılan parametrik olmayan bir yöntemdir. Bu durumda, gerçek paralellik derecesi, incelenen özelliklerin iki kantitatif satırı arasında belirlenir ve niceliksel olarak belirgin bir katsayı kullanarak belirlenmiş bağlantının tanımının değerlendirilmesi göz önüne alındığında belirlenir.

1. Rütbe korelasyon katsayısının gelişmesinin tarihi

Bu kriter geliştirildi ve 1904'te bir korelasyon analizi için önerildi. Charles Edward Spearmen, İngilizce psikolog, Londra ve Chesterfield üniversitelerinin Profesörü.

2. Spirote katsayısı nedir?

Ruhun rütbe korelasyonu katsayısı, iki sıra ile karşılaştırılmış kantitatif göstergeler arasındaki bağlantıları tanımlamak ve değerlendirmek için kullanılır. Çoğu durumda, artış veya azaltma derecesi ile sipariş edilen göstergelerin sıralanması durumunda (bir göstergenin daha büyük değeri, örneğin hastanın büyümesini ve vücut ağırlığını karşılaştırırken, başka bir göstergenin daha yüksek değerine karşılık gelir. ), bir sonuç var. düz korelasyon. Göstergelerin rütbeleri ters yöne sahipse (bir göstergenin daha büyük değeri, örneğin yaş ve kalp atışı yaparken, örneğin yaş ve kalp atışı yaparken ters Göstergeler arasındaki bağlantılar.

    Spirmenend'in korelasyon katsayısı aşağıdaki özelliklere sahiptir:
  1. Korelasyon katsayısı, eksi birimlerden birine değer alabilir, Rs \u003d 1 ile kesinlikle doğrudan bir bağlantı vardır ve Rs \u003d -1 - kesinlikle geri bildirimde bulunur.
  2. Korelasyon katsayısı negatifse, pozitif ise, sonra doğrudan bir bağlantı varsa bir geri bildirim vardır.
  3. Korelasyon katsayısı sıfır ise, değerler arasındaki bağlantı pratik olarak yoktur.
  4. Korelasyon katsayısı modülünü birine yaklaştırın, ölçülen değerler arasındaki ilişki ne kadar şiddetlidir.

3. Hangi durumlarda Ruh katsayısını kullanabilirim?

Katsayının parametrik olmayan bir analiz yöntemi olması nedeniyle, dağılımın geçerliliği gerekli değildir.

Karşılaştırılmış göstergeler hem sürekli ölçekte (örneğin, 1 μl kandaki eritrosit sayısı) hem sıra halinde (örneğin, 1 ila 5 arasındaki uzman puanının skoru) ölçülebilir.

Değerlendirmenin verimliliği ve kalitesi, ölçülen değerlerin herhangi birinin farklı değerleri arasındaki farkın yeterince büyük olması durumunda alkolün ruhu yöntemi azalır. Ölçülen değer değerlerinin eşit olmayan dağılımı meydana gelirse, bir ruh katsayısını kullanmanız önerilmez.

4. Ruh katsayısını nasıl hesaplayabilirsiniz?

Spirmend'in rütbe korelasyonu katsayısının hesaplanması aşağıdaki adımları içerir:

5. Spearmen katsayısının değerini nasıl yorumlayabilirsiniz?

Bir rütbe korelasyon katsayısı kullanırken, geleneksel olarak 0.3'ten küçük katsayının değeri göz önüne alındığında, özellikler arasındaki ilişkinin sıkılığı ile değerlendirilir - zayıf bir sızdırmazlık işareti; 0,3'ten fazla değerler, ancak 0.7'den az, ancak orta derecede iletişimin bir işareti ve 0.7 ve daha fazlası değerleri - yüksek sızdırmazlık işareti.

Ayrıca iletişimin gerginliğini değerlendirmek için kullanılabilir cheddok ölçeği.

Elde edilen katsaymanın istatistiksel olarak önemi, Öğrenci T-Kriteri kullanılarak tahmin edilmektedir. T-kriterinin hesaplanan değeri, belirli sayıda özgürlük derecesine sahip bir tablodan daha azsa, gözlemlenebilir ilişkinin istatistiksel olarak önemi eksiktir. Daha fazlası varsa, korelasyon ilişkisi istatistiksel olarak anlamlı kabul edilir.


Colmogorov-smirnov

Kolmogorov-Smirnov'un kriteri parametrik olmayan bir onay kriteridir, klasik bir anlayışta, analiz edilen numunenin ait olduğu hakkında iyi bilinen bir dağıtım hukukuna ait basit hipotezleri doğrulaması amaçlanmıştır. Bu kriterin en iyi bilinen uygulaması, çalışılan agregayı dağıtımın normalliğini kontrol etmek için.

1. Kriterlerin Gelişiminin Tarihi Kolmogorov-Smirnov

Kolmogorov-Smirnov'un kriteri Sovyet matematikçileri tarafından geliştirilmiştir. Andrei Nikolayevich Kolmogorov ve Nikolai Vasilyevich Smirnov.
Kolmogorov A.N. (1903-1987) - Sosyalist Emek'in Kahramanı, Moskova Devlet Üniversitesi, SSCB Bilimler Akademisyeni - 20. yüzyılın en büyük matematikçisi, mevcut olasılık teorisinin kurucularından biridir.
Smirnov N.V. (1900-1966) - Matematiksel istatistiklerin parametrik olmayan yöntemlerinin yaratıcısından biri olan SSCB Bilimler Akademisi'nin karşılık gelen üyesi ve sıra istatistiklerin limit tahsisi teorisi.

Daha sonra, KOLMOGOROV-SMIRNOV'un rızası için kriter, George Washington Üniversitesi'nin Amerikan istatistiki, Amerikan istatistiki tarafından dağıtımın normalliği üzerindeki kümeleri doğrulamak için kullanılacaktı. Hubert Lilliefors(Hubert Whitman Lilliefors, 1928-2008). Profesör lilliefors, bilgisayar ekipmanlarının istatistiksel hesaplamalarda kullanımı için öncülerden biriydi.

Hubert Lilliefors

2. Kolmogorov-Smirnov'un kriteri nedir?

Bu kriter, iki numunenin dağılımları arasındaki farkların önemini değerlendirmenize izin verir, bu da, çalışılan numunenin dağılımının normal dağılım yasası ile dağıtımının uygunluğunu değerlendirmek için uygulamak mümkündür.

3. KOLMOGOROV-SMIRNOV'un kriterini hangi durumlarda kullanabilirim?

Kolmogorov-Smirnova'nın kriteri, kantitatif veri kümelerinin dağılımının normalliğini doğrulamak için tasarlanmıştır.

Elde edilen verilerin daha fazla güvenilirliği için, dikkate alınan numunelerin hacimleri oldukça büyük olmalıdır: n ≥ 50. Tahmini ayarlanan ayarların 25 ila 50 elemanının boyutlarında, Bolşev Değişikliğinin uygulanması önerilir.

4. Kolmogorov-Smirnov'un kriterini nasıl hesaplayabilirsiniz?

Kolmogorov-Smirnov'un kriteri özel istatistik programları kullanılarak hesaplanır. Temel, formun istatistikleridir:

nerede s. - SET S'nin tam üst yüzü, F N. - Toplam toplamın dağılımının işlevi, F (x) - Normal dağılımın işlevi

Önerilen olasılık değerleri, normal dağılımın ortalama ve standart sapmasının bir önceli olduğu ve verilerden değerlendirilmediği varsayımına dayanmaktadır.

Bununla birlikte, pratikte, parametreler genellikle doğrudan verilerden hesaplanır. Bu durumda, normallik kriteri, karmaşık bir hipotezi içerir ("Bu ya da verilerden hesaplanan ortalama ve standart sapmaya bağlı olarak," verilerden hesaplanan ortalama ve standart sapmaya bağlı olarak, lilliefors (lilliefors, 1967) olasılıklarıdır. verilen.

5. Kolmogorov-Smirnov'un kriterinin değerini nasıl yorumlayabilirsiniz?

D İSTATİSTİK KOLMOGOROV-SMIRNOVA'NIN ÖNEMLİDİR (P<0,05), то гипотеза о том, что соответствующее распределение нормально, должна быть отвергнута.


Dane Bölümünün gelişmesinin bir sonucu olarak, öğrenci şunları yapmalıdır: tanımak

  • Varyasyonun göstergeleri ve ilişkileri;
  • İşaretlerin dağılımının ana yasaları;
  • Rıza kriterlerinin özü; yapabilmek
  • Rıza göstergelerinin ve rıza kriterlerini hesaplar;
  • Dağıtım özelliklerini tanımlar;
  • İstatistiksel dağılım satırlarının ana sayısal özelliklerini değerlendirir;

kendi

  • Dağıtım serisinin istatistiksel analiz yöntemleri;
  • Dispersiyon analizinin temeli;
  • Dağıtımın temel yasalarına uymak için istatistiksel dağıtım satırlarını kontrol etme teknikleri.

Varyasyonun Göstergeleri

Çeşitli istatistiksel setlerin belirtilerinin istatistiksel bir çalışmasıyla, büyük ilgi, agrega bireysel istatistiksel birimlerinin özelliğinin ve aynı zamanda birimlerin bu temelde dağılımın niteliğinin değişmesidir. Varyasyon - Bunlar, agrega birimlerinin işaretinin bireysel değerlerindeki farklılıklardır. Varyasyonun araştırılması büyük bir pratik değere sahiptir. Varyasyon derecesine göre, özelliğin varyasyonunun sınırlarını, bu temelde toplamın homojenliği, ortalamanın tipik olanı, varyasyonun belirleyen faktörlerin ilişkisi ile ilgilidir. İstatistiksel agregaları karakterize etmek ve düzenlemek için varyasyon göstergeleri kullanılır.

İstatistiksel gözlem malzemelerinin özet ve gruplandırılması, istatistiksel dağılım satırları şeklinde dekore edilmiş olan istatistiksel gözlem malzemelerinin sonuçları, gruptaki ortak agreganın birimlerinin bir gruplandırma (değişken) özelliğindeki sıralı bir dağılımıdır. Nitel bir karakter temel olarak alınırsa, böyle bir dizi dağıtım çağrılır. nitelik (Mesleğin, yerden, renk vb. Dağıtımı). Bir dizi dağıtım nicel olarak dayanırsa, böylece böyle bir sayı varyasyonel (Büyüme, ağırlık, ücretler, vb.). Bir varyasyon serisi oluşturun - Set birimlerinin birimlerinin nicel dağılımını, özniteliğin değerleri ile aktarmak, bu değerlerle (frekans), sonuçların tabloyu ile ayarlanan birim sayısını hesaplar.

Seçeneğin frekansı yerine, ilişkisini frekans (göreceli frekans) olarak adlandırılan toplam gözlem hacmiyle kullanmak mümkündür.

İki çeşit varyasyon serisi ayırt edilir: ayrık ve aralık. Ayrık satır- Bu, böyle bir varyasyon serisidir, sonlandırma değişikliğine sahip olan (ayrık işaretler) özelliklerinin temeli yerleştirilir. İkincisi, işletmedeki çalışan sayısını, tarife rütbesini, ailedeki çocukların sayısı vb. Ayrık değişim aralığı, iki grafikten oluşan bir tabloyu temsil eder. İlk sütun, özelliğin belirli değerini gösterir ve ikincisinde, agreganın birimin biriminin sayısı özelliğin belirli bir değeri olan. İşaretin sürekli bir değişikliğe sahipse (gelir büyüklüğü, iş tecrübesi, işletmenin sabit varlıklarının maliyeti, vb. Bazı sınırlarda herhangi bir değere sahip olabilir), ardından bu özellik için inşa etmek mümkündür aralık varyasyon serisi. Bir aralık varyasyon serisi inşa ederken tablo da iki grafiktedir. Birincisi, özniteliğin "ila" (Seçenekler), ikincisinde) aralıktaki (frekans) 'nın (frekans) sayısının sayısıdır. Frekans (tekrarlama frekansı), işaret değerlerinin ayrı bir sürümünün tekrarı sayısıdır. Aralıklar kapatılabilir ve açık olabilir. Kapalı aralıklar her iki tarafta da sınırlıdır, yani. Sınırı alt ("dan") ve üst ("daha önce") olarak sahip olun. Açık aralıklar herhangi bir sınır vardır: Yukarı ya da alt. Seçenekler artan veya inen bir şekilde düzenlenirse, sıralar denir sıralandı.

Varyasyon serisi için, iki tür frekans özellikleri seçenekleri vardır: birikmiş frekans ve birikmiş frekans. Birikmiş frekans, karakter hızının, değeri belirtilenden daha az gözlemlediğini gösterir. Birikmiş frekans, önceki grupların tüm frekansları ile bu gruba göre özelliğin sıklığının değerlerini özetlenerek belirlenir. Birikmiş frekans, özniteliğin değerlerinin dalış grubunun üst sınırını aşmadığı gözlem birimlerinin oranını karakterize eder. Böylece, biriken frekans, agregadaki seçeneğin, bundan daha fazla olmayan bir değeri olan seçeneğin oranını göstermektedir. Frekans, frekans, mutlak ve göreceli yoğunluk, birikmiş frekans ve frekans, varyantın boyutunun özellikleridir.

Setin istatistiksel birimlerinin işaretinin yanı sıra dağılımın niteliği, satırın ortalama düzeyi, ortalama doğrusal sapma, ortalama ikinci dereceden sapma içeren varyasyon serisinin göstergeleri ve özellikleri kullanılarak incelenmektedir. , dağılım, salınım katsayıları, varyasyon, asimetri, aşırılık vb.

Dağıtım merkezini karakterize etmek için orta değerler kullanılır. Ortalama, nicel bir ifadenin, ortak agrega üyelerinin sahip olduğu karakteristiğin tipik bir seviyesi ile elde edildiği genelleştirici bir istatistiksel özelliktir. Bununla birlikte, farklı bir karakter karakterine sahip ortalama aritmetik tesadüf vakaları vardır, bu nedenle, sözde yapısal orta modlar, medyan, ayrıca bir dizi dağıtımı eşit parçalara (Quartiles, Kararlar, yüzde, varyasyonların istatistiksel özellikleri olarak hesaplanır.).

Moda - Bu, diğer değerlerden daha sık bir dizi dağılımda meydana gelen anlam değeridir. Ayrık satırlar için en yüksek frekansı olan bir seçenektir. Aralık varyasyonları satırlarında modu belirlemek için, ilk önce bulunduğu tüm aralığın, sözde modal aralığı olarak belirlemek gerekir. Değişimsel satırda eşit aralıklarla, modal aralık, eşit olmayan aralıklarla satırlarda en yüksek frekansla belirlenir - ancak en büyük dağıtım yoğunluğu. Ardından, aynı aralıklarla satırdaki modu belirlemek için, formül kullanılır.

mo'nun moda anlamıdır; Modal aralığın x MO - alt sınırı; h - Modal aralığın genişliği; / MO - Modal aralığın frekansı; / MO J - Divodinal interfilinin sıklığı; / MO + 1 - Posta aralığının frekansı ve frekanslar / mo yerine bu hesaplama formülünde eşit olmayan aralıklarla bir sayı için / MO, / mo, dağıtım yoğunluğunu kullanmalıdır. Zihin 0 _| , Zihin 0> UMO + "

Tek bir moda varsa, rastgele varyansın olasılık dağılımı ODYModal denir; Birden fazla mod varsa, iki modda - bimodal durumunda multimodal (polimodal, multimodal) olarak adlandırılır. Kural olarak, multimodalite, çalışma altındaki dağılımın normal dağılım kanununa uymadığını gösterir. Homojen agregalar için, kural olarak, eşgilers dağılımları karakteristikdir. Çarpma ayrıca, çalışılan agreganın heterojenliğine de tanıklık eder. İki veya daha fazla köşenin görünümü, daha fazla homojen grup tahsis etmek için veri yeniden kurulmasını gerekli kılıyor.

Aralık varyasyon satırında, moda bir histogram kullanılarak grafiksel olarak belirlenebilir. Bunun için, iki kesişen hat, histogramın en yüksek sütununun üst noktalarından iki bitişik sütunun üst noktalarından iki kesişen hattı gerçekleştirir. Daha sonra apsis eksenine dik, kesişme noktasından indirilir. Appissa ekseni üzerindeki özniteliğin değeri, dikeye karşılık gelen modadir. Çoğu durumda, kombinasyon karakteristik, moda tercihi genelleştirilmiş bir gösterge olarak verilir ve ortalama aritmetik değil.

Medyan - Bu, işaretin merkezi anlamıdır, sıralanan dağılım aralığının merkezi bir üyesidir. Medyan değerini bulmak için ayrık satırlarda, sıra numarası önce belirlenir. Bunun için, tüm frekansların toplamına tek bir birim ile bir birim eklenir, bir birim eklenir, sayı iki ayrılır. Bir dizide eşit sayıda birim ile iki medyan birim olacaktır, bu nedenle bu durumda, ortanca iki medyan birimin değerlerinin ortalaması olarak tanımlanır. Böylece, ayrık değişim satırındaki medyan, bir numarayı aynı sayıda seçeneği içeren iki parçaya ayıran bir değerdir.

Medyanın sıra sayısını belirledikten sonra aralık serisinde, medya aralığı birikmiş frekanslar (generaller) (generaller) ve daha sonra medyanın hesaplanmasında formülün yardımı ile arandı, medyanın değeri belirlenir:

ben ortanca değeri olduğu yer; x ben medyan aralığın alt sınırı; h - Medyan aralığın genişliği; - bir dizi dağıtımın frekanslarının miktarı; / D - Tahkeme aralığının birikmiş frekansı; / I - Ortanca aralığın sıklığı.

Medyan, Kum'un yardımıyla grafiksel olarak bulunabilir. Bunu yapmak için, birikmiş frekanslar (frekanslar) ölçeğinde, medyanın sekans numarasına karşılık gelen noktadan gelen kümülatlar, abscissa'nın düz, paralel ekseni, kümülatif ile kesişme noktasına kadar gerçekleştirilir. Daha sonra, belirtilenlerin kesişme noktasından kümülatör ile, abscissa eksenine dik olarak düşürülür. Abscissa ekseni üzerindeki niteliğin değeri (dikey) medyandır.

Medyan, aşağıdaki özelliklerle karakterizedir.

  • 1. Her iki tarafında bulunan işaretin belirtilerine bağlı değildir.
  • 2. Karakterin, ortanca olan karakterlerin değerlerinin mutlak sapmalarının toplamının, işaretlerin herhangi bir değerinden sapmasına kıyasla minimum bir değer olduğu gerçeğine sahiptir.
  • 3. İki dağıtımı bilinen medyanlarla birleştirirken, yeni dağılımın medyanının büyüklüğünü önceden tahmin etmek imkansızdır.

Bu medyan özellikleri, kütle servis noktalarının konumlarının tasarımında, okullar, poliklinik, benzin istasyonları, su sütunları vb. Örneğin, şehrin belirli bir çeyreğinde, bir klinik oluşturması gerekiyorsa, o zaman bir çeyreğin yarım çeyrek ve sakinlerin sayısını birbirinden ayıran bir çeyrek noktaya yerleştirmeniz önerilir.

Modların, medyanların ve ortalama aritmetik oranının oranı, özelliğin dağılımının doğasını gösterir, dağılımın simetrisini tahmin etmenizi sağlar. Eğer bir x ben daha sonra bir dizinin sağ taraflı bir asimetrisi var. Normal dağılımla x - ME - MO.

K. Pearson, çeşitli eğrilerin hizalanmasına dayanarak, orta aritmetik, medyan ve Moda arasındaki bu yaklaşık ilişkilerin ortalaması için bu tür ilişkilerin geçerli olduğu belirlenmiştir:

ben ortanca değeri olduğu yer; MO - MODA değeri; x aritm - ortalama aritmetik değeri.

Varyasyon numarasının yapısını daha ayrıntılı olarak öğrenmek için bir ihtiyaç varsa, ortanca benzer niteliğin değerleri hesaplanır. Özelliğin bu değerleri tüm dağıtım birimlerini eşit sayılara böler, kantil veya gradyanlar denir. Quantili, çeyreğe, ayrıntı, yüzde, vb.

Quartiles, dört eşit parçanın bir kombinasyonunu paylaşır. İlk çeyrek, ilk üç aylık aralığın önceden belirlenmesi için, ilk çeyreğin önceden belirlenmesi için formül tarafından medyana benzer şekilde hesaplanır:

qi'nin ilk çeyreğin değeri olduğu; x q ^ - ilk çeyrek aralığın alt sınırı; h. - İlk çeyrek aralığın genişliği; /, - Aralık serisinin frekansları;

İlk apartman aralığından önceki aralıkta birikmiş frekans; JQ (- ilk çeyrek aralığın frekansı.

İlk daire, agreganın birimlerinin% 25'inin değerinden daha az olduğunu ve% 75'i daha az olduğunu göstermektedir. İkinci daire ortanca, yani. S2 \u003d. Ben mi.

Analoji ile, üçüncü çeyreğe öncelikle üçüncü çeyreği sayarlar:

Üçüncü ön aralığın alt sınırı nerede; h. - Üçüncü apartman aralığının genişliği; /, - Aralık serisinin frekansları; / X "- Önceki aralıkta birikmiş frekans

g.

Üçüncü Daire Aralığı; JQ - üçüncü aralığın sıklığı.

Üçüncü apartman, agrega birimlerinin% 75'inin değerinden az olduğunu ve% 25'i daha az olduğunu göstermektedir.

Üçüncü ve ilk dörtlüler arasındaki fark, interkom aralığıdır:

aQ'nin aralıklı aralığın değeri olduğu; S3 - üçüncü çeyreğin değeri; S, - ilk çeyreğin değeri.

Dekil, 10 eşit parçada bir bütünlüğü paylaşır. Dekil, agrega sayısının onuncu lobuna karşılık gelen bir dizi dağıtımda bir işaretin böyle bir değeridir. Quartiles ile analoji ile, ilk dekil, setlerin% 10'unun değerinden daha az olduğunu ve% 90'ı daha büyük olduğunu ve dokuzuncu ayrıntı, agrega birimlerinin% 90'ının değerinden daha az olduğunu gösteriyor ve% 10'u ortaya koyuyor. Daha. Dokuzuncu ve ilk bozulmaların oranı, yani. Dekil katsayısı, en güvenli nüfusun% 10'unun gelir seviyelerinin% 10'unun gelir seviyelerinin% 10'unun oranını ölçmek için gelirin farklılaşmasında yaygın olarak kullanılır. Yüzde 100 eşit parçanın bir arada bir kombinasyonuna bölünmüştür. Hesaplama, değer ve yüzde uygulama ondalıklarına benzer.

Quartiles, deciles ve diğer yapısal özellikler, medyan ile birikmiş kullanarak analoji ile grafik olarak tanımlanabilir.

Varyasyonun boyutunu ölçmek için aşağıdaki göstergeler kullanılır: varyasyon varyasyonu, ortalama doğrusal sapma, ikincil ikinci dereceden sapma, dispersiyon. Varyasyonun varyasyonunun değeri tamamen satırın aşırı üyelerinin dağılımı olma şansına bağlıdır. Bu gösterge, karakteristik belirtilerin salınımlarının genliğinin ne olduğunu bilmenin önemli olduğu durumlarda ilgi çekicidir:

nerede R - Değer Değeri Varyasyonu; x TAH - Maksimum işaret değeri; x tt - Özelliğin minimum değeri.

Varyasyonun kapsamını hesaplarken, satır üyelerinin ezici çoğunluğunun değeri dikkate alınırken, varyasyon, satırın elemanının her bir değeri ile ilişkilendirilir. Bu dezavantaj, özelliğin bireysel değerlerinin sapmalarından ortalama boyutlarından elde edilen ortalama göstergelerden yoksundur: ortalama doğrusal sapma ve ortalama ikinci dereceden sapma. Özel bir özelliğin ortalamasından ve volatilitesinden bireysel sapmalar arasında doğrudan bağımlılık vardır. Volatilite daha güçlü olursa, sapmaların ortalamasından mutlak boyutları arttırır.

Ortalama doğrusal sapma, bireysel seçeneklerin ortalama değerlerinden sapmaların mutlak değerlerinin ortalama bir aritmetiktir.

İşaretlenmeyen veriler için orta doğrusal sapma

nerede / pr - ortalama doğrusal sapmanın değeri; X, - - Özelliğin değeri; x - p - Agrega birimlerinin sayısı.

Gruplandırılmış satırın orta doğrusal sapması

nerede / almak, ortalama doğrusal sapmanın değeridir; X, - özelliğin değeri; x - Çalışılan agrega için ortalama değer; / - Ayrı bir grupta agrega birimlerinin sayısı.

Bu durumda sapma belirtileri göz ardı edilir, aksi takdirde tüm sapmaların toplamı sıfır olacaktır. Analiz edilen verilerin gruplamasına bağlı olarak ortalama doğrusal sapma, çeşitli formüllere göre hesaplanır: gruplandırılmış ve bozuk olmayan veriler için. Sözleşmesinden ayrı olarak, diğer değişiklik göstergelerinden ayrı olarak, ortalama doğrusal sapma, pratikte nispeten nadir görülen (özellikle, doğum homojekliği üzerindeki sözleşme yükümlülüklerinin yürütülmesini karakterize etmek; dış ticaret cirosunun analizinde, çalışma bileşimi , üretimin ritmi, ürünlerin kalitesi, üretim ve üretimin teknolojik özelliklerini dikkate alarak vb.).

Ortalama ikinci dereceden sapma, ortalama ortalama niteliğin ortalama değerinden bireysel değerlerinin nasıl saptırıldığını karakterize eder ve Tracca'nın ölçüm birimlerinde ifade edilir. Ana çeşitlilik önlemlerinden biri olan ortalama ikinci dereceden sapma, normal dağılımın koordinasyon eğrisinin değerlerini belirlerken, özelliğin karakterizasyonunun homojen bir şekilde karakterizasyonun sınırlarını değerlendirmede yaygın olarak kullanılır. Seçici gözlem organizasyonu ve örnek özelliklerin doğruluğunun kurulması ile ilgili hesaplamalarda. Ortalama ikinci dereceden sapma aşağıdaki algoritmaya göre hesaplanır: ortalamanın her sapması meydana yerleştirilir, tüm kareler toplanır, ardından karelerin toplamı satırın üyesi ve özel olarak üyelerinin sayısına ayrılır. Çıkarılan karekök:

bir IIP'nin ortalama ikinci dereceden sapmanın değeri olduğu; Xj - Özelliğin değeri; h. - Ortak nüfus için sembolün ortalama özelliği; p - Agrega birimlerinin sayısı.

Gruplandırılmış analiz verileri için, ortalama ikinci dereceden veri sapması askıya alınmış bir formülle hesaplanır.

nerede - Ortalama ikinci dereceden sapmanın değeri; Xj - Özelliğin değeri; x - Çalışılan agrega için ortalama değer; f x - Ayrı bir grupta agrega birimlerinin sayısı.

Her iki durumda da kök altındaki ifade dağılımı denir. Böylece, dispersiyon, ortalama boyutlarından, özelliğin belirtilerinin ortalama sapmalarının meydana gelmesi olarak hesaplanır. İnanılmaz (basit) değerler için, dispersiyon özelliği aşağıdaki gibi tanımlanır:

Askıya alınmış işaretler için

Ayrıca dağılımın hesaplanması için özel bir basitleştirilmiş yöntem vardır: genel olarak

İnanılmaz (basit) işaret değerleri için Askıya alınmış işaretler için
Koşullu sıfırdan referans yöntemini kullanma

2'nin dispersiyonun değeri olduğu yer; X, - - Özelliğin değeri; x -Özelliğin ortalama değeri h - Grup aralığının büyüklüğü, t 1 - Ağırlık (a \u003d

Dispersiyon istatistiklerde bağımsız bir ekspresyona sahiptir ve varyasyonun en önemli göstergeleri arasındadır. Çalışılan özelliği ölçme birimlerinin karesine karşılık gelen birimlerde ölçülür.

Dispersiyon aşağıdaki özelliklere sahiptir.

  • 1. Sabit bir değerin dağılması sıfırdır.
  • 2. Özelliğin tüm değerlerini aynı boyutta azaltmak, dispersiyonun varyansını değiştirmez. Bu, ortalama sapmalar meydanının, özelliğin belirtilen değerleri ile değil, sabit bir sayıdan sapmalarına göre hesaplanabileceği anlamına gelir.
  • 3. Girişin değerlerini azaltmak k. Bir kez dağılımı azaltır k. 2 kat ve ortalama ikinci dereceden sapma - içinde k. kez, yani Özelliğin tüm değerleri bir tür sabit sayıya bölünebilir (satırın aralığının boyutuyla), ortalama ikinci dereceden sapmayı hesaplar ve ardından sabit bir sayıya çarpın.
  • 4. Herhangi bir değerden sapmaların orta karesini hesaplarsanız Bir W. Orta aritmetikten bir dereceye kadar veya başka bir farklı olarak, ortalama aritmetikten hesaplanan ortalama sapmalar meydanından her zaman daha büyük olacaktır. Ortalama sapmalar karesi tamamen tanımlanmış bir değer üzerinde daha büyük olacaktır - ortalama arasındaki farkın meydanına ve bu şartlı olarak alınmış büyüklük.

Alternatif bir özelliğin varyasyonu, agrega birimlerinde incelenen özelliğin varlığında veya yokluğundadır. Alternatif bir özelliğin miktar değişimi iki değerle ifade edilir: Çalışılan özelliğin bir biriminin varlığı bir (1) ile gösterilir ve yokluğu sıfırdır (0). Birimlerin incelenen özelliğe sahip payının payı P tarafından belirtir ve bu özelliğe sahip olmayan birimlerin payı - G. Böylece, alternatif bir özelliğin dağılması, bu özelliğin (P), birimlerin payının, birimlerin payı, bu mülkiyetin bu özelliğine eşittir. (G). Toplamın bir kısmının, bir kombinasyonun toplam toplamının% 50'sinin bir kısmının, bir kombinasyonun% 50'sinin bir parçasına sahip olduğu durumlarda en büyük varyasyonu,% 50'ye eşit olan toplamın bir işareti ve diğer kısmı yoktur. Bu özellik, dispersiyon, 0,25, t'ye eşit maksimum değere ulaşır. P \u003d 0.5, G \u003d. 1 - p \u003d 1 - 0.5 \u003d 0.5 ve 2 \u003d 0.5 0.5 \u003d 0.25. Bu göstergenin alt sınırı, agrega'da varyasyonun olmadığı duruma karşılık gelen sıfırdır. Alternatif bir özelliğin dağılımının pratik uygulaması, seçici gözlem sırasında güven aralıkları oluşturmaktır.

Dispersiyon ve ortalama ikinci dereceden sapma arasındaki fark, toplamlık, toplamlık ve daha tipik olan ortalama değer olacaktır. Uygulamada, istatistikler genellikle çeşitli işaretlerin varyasyonlarını karşılaştırma ihtiyacını ortaya çıkarır. Örneğin, işçi çağı ve yeterlilikleri, iş tecrübesi, ücret, maliyet ve kar, iş tecrübesi ve emek verimliliği vb. Karşılaştırmak ilginçtir. Bu tür karşılaştırmalar için, tabelaların mutlak bölümlerinin göstergeleri uygun değildir: kişi, ruble cinsinden ifade edilen ücret varyasyonu ile yıllarca ifade edilen iş deneyiminin miktarlarını karşılaştıramaz. Bu tür karşılaştırmaların yanı sıra, aynı özelliğin miktarlarının farklı ortalama aritmetik olan çeşitli koleksiyonlarda karşılaştırılması, varyasyon göstergeleri kullanılır - salınım katsayısı, doğrusal varyasyon katsayısı ve ölçüsünü gösteren varyasyon katsayısı katsayısı Ortamın etrafındaki aşırı değerler.

Oscill katsayısı:

nerede V r - Salınım katsayısının değeri; R. - varyasyon varyasyonunun değeri; x -

Doğrusal değişim katsayısı. "

nerede Vj - Doğrusal değişim katsayısının değeri; BEN -ortalama doğrusal sapmanın değeri; x - Çalışılan bütünlük için ortalama değer.

Varyasyon katsayısı:

nerede V a - Varyasyon katsayısının değeri; a - ortalama ikinci dereceden sapmanın değeri; x - Çalışılan bütünlük için ortalama değer.

Salınım katsayısı, incelenen işaretin orta değerindeki varyasyonların yüzdesidir ve doğrusal değişim katsayısı, ortalama doğrusal sapma işleminin incelenen işaretin ortalama değerine oranıdır, yüzde olarak ifade edilir. Varyasyon katsayısı, ortalama ikinci dereceden sapmanın, incelenen işaretin ortalama değerine oranının yüzdesidir. Göreceli bir değer olarak, yüzde olarak telaffuz edilir, çeşitli işaretlerin varyasyon derecesini karşılaştırmak için varyasyon katsayısı kullanılır. Varyasyon katsayısını kullanarak, istatistiksel agreganın homojenliği tahmin edilmektedir. Varyasyon katsayısı% 33'ten az ise, toplam toplamlık homojendir ve zayıf değişimdir. Varyasyon katsayısı% 33'ten büyükse, toplam kombinasyon homojendir, güçlü ve ortalama değer atipiktir ve bu toplamın genelleyici bir göstergesi olarak kullanılamaz. Ek olarak, çeşitli setlerde bir özelliğin miktarlarını karşılaştırmak için varyasyon katsayıları kullanılır. Örneğin, iki işletmeden çalışanların deneyiminin değişimini değerlendirmek. Katsayının değeri ne kadar büyükse, işaretin türleri önemlidir.

Hesaplanan çeyrek bazında, formüle göre üç aylık değişimin göreceli oranını hesaplamak mümkündür.

nerede S. 2 ve

EmerQuarted kapsam, formül tarafından belirlenir.

Daire sapması, aşırı değerlerin kullanımıyla ilişkili eksiklikleri önlemek için varyasyonların kapsamı yerine kullanılır:

Eşit olmayan aralık dışı varyasyon serisi için, dağıtım yoğunluğu da hesaplanır. İlgili frekansın veya frekansın aralığın boyutuyla bölünmesinden özel olarak tanımlanır. Eşit olmayan aralık sıraları mutlak ve göreceli dağıtım yoğunluğunu kullanır. Mutlak dağıtım yoğunluğu, aralığın birim uzunluğu başına frekansdır. Göreceli dağıtım yoğunluğu, aralığın birim uzunluğu başına frekansdır.

Yukarıdakilerin tümü, dağıtım serisi için geçerlidir, dağıtımın normal dağıtım yasası veya bunun yakınında açıklanmıştır.

Herhangi bir işaretle birleştirilen sayı grubu denir agrega.

Yukarıda belirtildiği gibi, birincil istatistiksel spor malzemesi, bir fenomenin veya sürecin özü hakkında fikirlerin koçunu vermeyen bir grup dağınık sayılardır. Görev bu tamamen sisteme dönüştürmek ve gerekli bilgileri elde etmek için göstergelerle kullanın.

Varyasyon serisinin hazırlanması tam olarak belirli bir matematiksel oluşumudur.

Örnek 2. 34 kayakçı sporcularında, geçen mesafeden sonra (saniye cinsinden) böyle bir darbe iyileşme süresi kaydedilmiştir:

81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

Görüldüğü gibi, bu sayı grubu herhangi bir bilgi dayanmaz.

Varyasyon numarasının hazırlanması için, önce işlem üretir sıralama - Sayıların konumu artan sırada veya azalan. Örneğin, artan sırada, sıralama aşağıdakilere yol açar;

78; 78; 78; 78; 78; 78;

81; 81; 81; 81; 81; 81; 81; 81; 81;

84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

Azalan sırayla, sıralama böyle bir gruba yol açar:

84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

81; 81; 81; 81; 8!; 81: 81; 81; 81;

78; 78; 78; 78; 78; 78;

Sıraladıktan sonra, bu grubun bu grubun kaydedilmesinin irrasyonel formu ve aynı sayılar aynı sayıda defalarca tekrarlanır. Bu nedenle, kaydı, hangi numarayı tekrar tekrarlandığını belirtmek için böyle bir şekilde dönüştürmek için gerçekleşir. Örneğin, artan sırada sıralamayı düşünün:

Burada, numara, sporcunun nabzının iyileşme süresini, bu tanıklığın 34 sporcu grubundaki tekrarı hakkının sağlığını gösteren sayı ile kaydedilir.

Matematiksel sembollerle ilgili yukarıdaki kavramlara uygun olarak, dikkate alınan ölçüm grubu, örneğin x için herhangi bir harf belirleyecektir. Bu gruptaki artan sayı sırası göz önüne alındığında: x 1 -74 c; x 2 - 78 s; x 3 - 81 s; x 4 - 84 s; x 5 - 85 s; X 6 N - 90 S, her biri sayılı sayı X I sembolü tarafından belirlenebilir.

Sözlü olarak kabul edilen ölçümlerin tekrarlarının sayısını belirtir. Sonra:

n 1 \u003d 4; N 2 \u003d 6; N 3 \u003d 9; N 4 \u003d 11; N 5 \u003d 3; n 6 \u003d n n \u003d 1 ve her bir tekrarlama sayısı n i olarak gösterilebilir.

Örneğin durumundan aşağıdaki gibi gerçekleştirilen toplam ölçüm sayısı 34'tür. Bu, tüm N'nin toplamının 34'e eşit olduğu anlamına gelir. Veya sembolik ifadeyle:

Bu miktarı bir harf ile belirtir - n. Daha sonra dikkate alınan örneğin ilk verileri bu formda kaydedilebilir (Tablo 1).

Elde edilen sayı grubu, koç tarafından iş başlangıcında elde edilen dönüştürülmüş dizi kaotik dağınık ifadesidir.

tablo 1

X I. N ben.
N \u003d 34.

Böyle bir grup, parametreleri gerçekleştirilen ölçümleri karakterize eden belirli bir sistemdir. Ölçüm sonuçlarını temsil eden sayılar (x i) seçenekler; N. Ben - tekrarlarının sayısı - denir frekanslar; n - tüm frekansların toplamı - orada toplamın hacmi.

Elde edilen tüm sistem denir yakınında varyasyonal. Bazen bu satırlar ampirik veya istatistiksel olarak adlandırılır.

Tüm frekansların bir N \u003d\u003d 1'e eşit olduğu, yani bu sayı grubundaki her bir ölçüm yalnızca bir kez daha karşılaşıldığında, varyasyon serisi belirli bir varyasyon serisi olmanın mümkün olduğunu fark etmek kolaydır.

Elde edilen varyasyon serisi, diğerleri gibi, grafiksel olarak gösterilebilir. Elde edilen serilerin grafiğini oluşturmak için, her şeyden önce yatay ve dikey eksende ölçeğinde olmalıdır.

Bu görevde, yatay eksende, nabız geri kazanım süresini (X 1), seçilen uzunluğun uzunluğunun bir saniyenin değerine karşılık geleceği şekilde yatıracağız. Bu değerleri 70 saniyeden ertelemeye başlayacak, geleneksel olarak iki eksenin kesişmesinden gelen geleneksel olarak geri çekilecektir.

Dikey eksende, satırımızın (n i) frekanslarının değerlerini erteleyin, ölçeği alarak: uzunluk birimi, bir frekans birimine eşittir.

Bir program oluşturma koşullarını hazırlayın, elde edilen varyasyonla çalışmaya devam edin.

X 1 \u003d 74, n 1 \u003d 4 sayısının ilk çifti, şuna benzer şekilde uygulanır: x ekseni; X 1 buluruz =74 Ve bu noktadan dik, N 1 \u003d 4'ü bulduk ve restore edilmiş dikey ile kesişme noktasına yatay bir çizgi taşıdık. Her iki çizgi dikey ve yatay, yardımcı çizgilerdir ve bu nedenle noktalı çizginin çizimine uygulanır. Kesişmelerinin amacı, bu grafiğin ölçeğinde X 1 \u003d 74 ve N 1 \u003d 4'tür.

Aynı şekilde, programın diğer tüm noktaları uygulanır. Sonra düz çizgilerin bölümleri ile bağlanırlar. Programın kapalı bir görünüme sahip olması için, aşırı noktalar segmentleri yatay eksenin bitişik noktalarıyla bağlar.

Elde edilen rakam, varyasyon serimizin bir grafiğidir (Şekil 1).

Her varyasyon serisinin kendi programları gibi görünmesi oldukça açıktır.

İncir. 1. Varyasyon serisinin grafik gösterimi.

İncirde. 1 şovlar:

1) En çok ankete katılan en büyük grubun sporcular için muhasebeleştirilen, nabızın iyileşme süresi olan 84 s;

2) Bu süre çoğu 81 s;

3) En küçük grup, küçük bir darbe iyileşme süresi olan sporculardı - 74 S ve büyük - 90 s.

Böylece, bir dizi test yaparak, elde edilen sayılar sıralanmalı ve belirli bir matematiksel sistem olan bir varyasyon serisi çizmelidir. Netlik için, varyasyonlar programla gösterilebilir.

Yukarıdaki varyasyon aralığı henüz denir ayrık Sonraki - Her seçeneğin bir numarada ifade edildiği bu.

Derleme serisini derlemek için birkaç örnek verelim.

Örnek 3. 12 atıcı, 10 çekimden çıkan bir egzersizi gerçekleştiren, bu tür sonuçları gösterdi (bardaklarda):

94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

Bir varyasyon aralığı oluşturmak için veri numarasını sıralayacağız;

94; 94; 94; 94; 94;

Sıradan sonra bir varyasyon serisi yaparız (Tablo 3).

Bu deneyde çalışılan değerin değerleri veya büyüklükte (artan veya azalan) yönlendirilen parametrenin gözlemlenmesi bir varyasyon numarası denir.

Kan basıncının üst eşiğini elde etmek için on hastada kan basıncını ölçdük: sistolik basınç, yani Sadece bir numara.

10 gözlemdeki arteriyel sistolik basıncın bir dizi gözlem (istatistiksel agrega) olduğunu hayal edin (Tablo 1):

tablo 1

Varyasyon numarasının bileşenleri seçenekler denir. Seçenekler, çalışılan işaretin sayısal bir değeridir.

Varyasyon serisinin istatistiksel agrega gözleminden bina - tüm nüfusun özelliklerinin anlaşılmasında ilk adım. Daha sonra, sonuçta ortaya çıkan kantitatif özelliğin ortalama seviyesinin belirlenmesi gerekir (ortalama kan proteininin, hastaların ortalama ağırlığı, anestezi oluşumunun ortalama ağırlığı, vb.)

Ortalama seviye, ortalama değerler denilen kriterler kullanılarak ölçülür. Ortalama değer, niteliksel homojen değerlerin genel bir özelliğidir; bu, bir bazda tüm istatistiksel olarak belirlenen bir sayıda istatistiksel olarak karakterize eder. Ortalama değer genel olarak, bu gözlemler kümesinde bir işaretin karakteristik olanıdır.

Üç tür ortalama değer yaygın olarak kullanılır: moda (), medyan () ve orta tarife değeri ().

Herhangi bir ortalamayı belirlemek için, bireysel gözlemlerin sonuçlarını kullanmak, bunları bir varyasyon serisi formunda yazarak kullanmanız gerekir (Tablo 2).

Moda - Bir dizi gözlemde en yaygın değer. Moda \u003d 120 örneğimizde. Varyasyon serisinde tekrarlayan değerler yoksa, mod olmadığını söylerler. Birden fazla değer aynı sayıda tekrarlanırsa, en küçüğü moda olarak alır.

Medyan - Dağılımı iki eşit parçaya bölünen değer, bir dizi gözlemin merkezi veya ortanca değeri, artan veya azaltılarak emreder. Öyleyse, değerlerin 5'lik varyasyon serisinde ise, ortancası varyasyon serisinin üçüncü bir üyesine eşittir, eğer bir üst üste bir üye, daha sonra ortanca, iki merkezi gözleminin aritmetik ortalamasıdır, daha sonra iki merkezi gözleminin aritmetik ortalamasıdır. yani 10 gözlem varsa, ortanca ortalama aritmetik 5 ve 6 gözlemlerine eşittir. Örneğimize göre.

Moda ve medyanların önemli bir özelliğini not ediyoruz: aşırı seçeneğin sayısal değerleri değerlerini etkilemez.

Orta aritmetik değer Formül tarafından hesaplanan:

nerede - gözlemin gözlemlenen değeri ve gözlem sayısı. Bizim durumumuz için.

Ortalama aritmetik değerin üç özelliğine sahiptir:

Ortalama, varyasyon serisinde orta pozisyonda bulunur. Kesinlikle simetrik bir satırda.

Ortalama bir genelleştirici büyüklüktir ve ortalama için rastgele dalgalanmalarla görünmüyor, bireysel verilerdeki farklılıklar. Tüm bütünlük için tipik olan tipik olduğunu yansıtır.

Tüm seçeneğin ortalamasından sapma miktarı sıfırdır :. Ortamdan sapma seçeneği belirtilir.

Varyasyon serisi bir seçenek ve karşılık gelen frekanslardan oluşur. Digit 120'ın on değerinin 6 kez, 115 - 3 kez, 125 - 1 kez arasındadır. Frekans (), bu seçeneğin varyasyon serisinde kaç kez bulunduğunu gösteren toplamdaki mutlak bireysel seçenek sayısıdır.

Varyasyon serisi basit (frekans \u003d 1) olabilir veya kısaltılmış 3-5 seçenek olabilir. Basit bir menzil az sayıda gözlem (), gruplandırılmış, çok sayıda gözlem () ile kullanılır.

 


Oku:



Kişilik - Nedir, Yapı, Özellikler

Kişilik - Nedir, Yapı, Özellikler

sınav 1. Kişilik 1.1. Kişilik, insan, birey, bireysellik ve oranlarındaki kavramlar Psikoloji, kişiliğini kötülük ...

Büyük Rus sözcüğü, Slav "atası" nın hangi diline yaklaştığını

Büyük Rus sözcüğü, Slav

Rusça en zor olanlardan biri. Ve bu sadece kelime hazinesi ve sözdizimi ile değil, aynı zamanda tarihi ile de bağlanır. Bizim için bile, anadili, hala ...

Rus kralının ana özellikleri Literatürde Barma kelimesinin tüketiminin örnekleri

Rus kralının ana özellikleri Literatürde Barma kelimesinin tüketiminin örnekleri

Barma Barma (Yunanca). Yaygın ihale, değerli taşlar, yazıtlar ve Moskova krallarının gündelerine konduğu resimlerle dekore edilmiştir ...

Ayrıca ilgileneceksin

Ayrıca ilgileneceksin

3D Kalıp "Ayı" Kum ve Kar "Penguin", 3 adet için 3D Kalıplar. Kar kum, alçı için moda kalıplar. En küçük için ...

yEM görüntü. RSS.