У дома - Коелю Пауло
Пробата се дава, за да се направи вариационна серия. V. Вариационни серии, средни стойности, вариабилност на признака. История на развитието на корелационния тест
групиране- това е разделянето на населението на групи, които са хомогенни по някакъв начин.

Възлагане на услугата. С онлайн калкулатора можете:

  • изградете серия от вариации, изграждане на хистограма и многоъгълник;
  • намират индикатори за вариация (средно, режим (включително графично), медиана, диапазон на вариация, квартили, децили, квартилен коефициент на диференциация, коефициент на вариация и други показатели);

Инструкция. За да групирате серията, трябва да изберете типа на получената вариационна серия (дискретна или интервална) и да посочите количеството данни (брой редове). Полученото решение се записва в Word файл (вижте примера за групиране на статистически данни).

Ако групирането вече е извършено и дискретни вариационни серииили интервална серия , тогава трябва да използвате онлайн калкулатора Индикатори за вариация. Тестване на хипотезата за вида на разпределениетопроизведени с помощта на услугата Изследване на формата на разпространение.

Видове статистически групировки

Вариационна серия. В случай на наблюдения на дискретна случайна променлива една и съща стойност може да се срещне няколко пъти. Такива стойности на x i на произволна променлива се записват, което показва n i колко пъти се появява в n наблюдения, това е честотата на тази стойност.
В случай на непрекъсната случайна променлива, групирането се използва на практика.
  1. Типологично групиране- това е разделянето на изследваното качествено разнородно население на класове, социално-икономически типове, хомогенни групи от единици. За да изградите това групиране, използвайте параметъра Discrete variational series.
  2. Структурното групиране се нарича, при което хомогенна популация се разделя на групи, които характеризират нейната структура според някакъв променлив признак. За да изградите това групиране, използвайте параметъра Interval series.
  3. Нарича се групиране, което разкрива връзката между изследваните явления и техните особености аналитична група(виж аналитичното групиране на сериите).

Пример №1. Съгласно таблица 2, изградете серия за разпространение за 40 търговски банки на Руската федерация. Съгласно получения ред на разпределение, определете: средна печалба за една търговска банка, кредитни инвестиции средно за една търговска банка, модална и средна стойност на печалбата; квартили, децили, диапазон на вариация, средно линейно отклонение, стандартно отклонение, коефициент на вариация.

Решение:
В гл "Тип статистически серии"изберете Дискретна серия. Щракнете върху Поставяне от Excel. Брой групи: по формулата на Стърджис

Принципи на изграждане на статистически групировки

Поредица от наблюдения, подредени във възходящ ред, се наричат ​​серия от вариации. групиращ знаке признакът, по който населението се разделя на отделни групи. Нарича се база на групата. Групирането може да се основава както на количествени, така и на качествени характеристики.
След определяне на основата на групирането трябва да се реши въпросът за броя на групите, на които трябва да бъде разделена изследваната популация.

При използване на персонални компютри за обработка на статистически данни групирането на единици на обект се извършва по стандартни процедури.
Една такава процедура се основава на използването на формулата на Стърджес за определяне на оптималния брой групи:

k = 1+3,322*lg(N)

Където k е броят на групите, N е броят на единиците на населението.

Дължината на частичните интервали се изчислява като h=(x max -x min)/k

След това пребройте броя на попаденията на наблюденията в тези интервали, които се приемат като честоти n i . Няколко честоти, чиито стойности са по-малки от 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Средните точки на интервалите x i =(c i-1 +c i)/2 се приемат като нови стойности.

Пример №3. В резултат на 5% собствено произволна проба се получава следното разпределение на продуктите по съдържание на влага. Изчислете: 1) средния процент на влажност; 2) показатели, характеризиращи изменението на влажността.
Решението е получено с помощта на калкулатор: Пример №1

Създайте серия от вариации. Въз основа на намерената серия построете разпределителен полигон, хистограма и кумулация. Определете режима и медианата.
Изтеглете решение

Пример. Според резултатите от селективното наблюдение (приложение на образец А):
а) направете серия от вариации;
б) изчисляват относителните честоти и натрупаните относителни честоти;
в) построете многоъгълник;
г) съставете емпирична функция на разпределение;
д) начертайте емпиричната функция на разпределение;
е) изчисляване на числени характеристики: средноаритметично, дисперсия, стандартно отклонение. Решение

Въз основа на данните, дадени в Таблица 4 (Приложение 1) и съответстващи на вашата опция, изпълнете:

  1. Въз основа на структурното групиране изградете вариационна честота и кумулативна серия на разпределение, като използвате равни затворени интервали, като приемете, че броят на групите е 6. Представете резултатите в таблица и графично.
  2. Анализирайте вариационното разпределение, като изчислите:
    • средноаритметична стойност на признака;
    • режим, медиана, 1-ви квартил, 1-ви и 9-ти децил;
    • стандартно отклонение;
    • коефициентът на вариация.
  3. Направете изводи.

Изисква се: да се класира серията, да се изгради интервална серия за разпределение, да се изчисли средната стойност, дисперсията на средната стойност, режимът и медианата за диапазона и интервалната серия.

Въз основа на изходните данни построете дискретна вариационна серия; представят го под формата на статистическа таблица и статистически графики. 2). Въз основа на първоначалните данни постройте интервална вариационна серия с равни интервали. Изберете сами броя на интервалите и обяснете този избор. Представете получените вариационни серии под формата на статистическа таблица и статистически графики. Посочете видовете използвани таблици и графики.

За да се определи средната продължителност на обслужването на клиенти в пенсионен фонд, чийто брой клиенти е много голям, беше проведено проучване на 100 клиенти по схемата на самослучайна неповтаряща се извадка. Резултатите от проучването са представени в таблицата. Намирам:
а) границите, в които с вероятност 0,9946 се приключва средното време за обслужване на всички клиенти на пенсионния фонд;
б) вероятността делът на всички клиенти на фонда с продължителност на услугата по-малко от 6 минути да се различава от дела на тези клиенти в извадката с не повече от 10% (в абсолютна стойност);
в) обем на повторна семплиране, при който с вероятност 0,9907 може да се твърди, че делът на всички клиенти на фонда с продължителност на услугата по-малко от 6 минути се различава от дела на такива клиенти в извадката с не повече от 10% (в абсолютна стойност).
2. Съгласно задача 1, използвайки теста на Пиърсън X 2, при ниво на значимост α = 0,05, проверете хипотезата, че произволна стойност X - време за обслужване на клиенти - разпределено според нормалния закон. Конструирайте върху един чертеж хистограма на емпиричното разпределение и съответната нормална крива.
Изтеглете решение

Дадена е извадка от 100 артикула. Необходимо:

  1. Изградете класирана вариационна серия;
  2. Намерете максималния и минималния член на редицата;
  3. Намерете диапазона на вариация и броя на оптималните интервали за конструиране на интервална серия. Намерете дължината на интервала на интервалната серия;
  4. Изградете интервална серия. Намерете честотите на елементите на извадката, попадащи в съставените празнини. Намерете средните точки на всеки интервал;
  5. Създайте хистограма и многоъгълник от честоти. Сравнете с нормалното разпределение (аналитично и графично);
  6. Начертайте емпиричната функция на разпределение;
  7. Изчислете числените характеристики на извадката: средна извадка и централен извадков момент;
  8. Изчислете приблизителните стойности на стандартното отклонение, изкривяването и ексцеса (с помощта на пакета за анализ на MS Excel). Сравнете приблизителните изчислени стойности с точните (изчислени с помощта на формули на MS Excel);
  9. Сравнете избраните графични характеристики със съответните теоретични.
Изтеглете решение

Имаме следните примерни данни (10% проба, механични) за продукцията и размера на печалбата, милиони рубли. Според оригиналните данни:
Задача 13.1.
13.1.1. Изградете статистическа серия от разпределение на предприятията по размер на печалбата, като образувате пет групи на равни интервали. Графики на сериите за разпределение на сюжета.
13.1.2. Изчислете числените характеристики на поредица от разпределение на предприятията по размера на печалбата: средно аритметично, стандартно отклонение, дисперсия, коефициент на вариация V. Направете изводи.
Задача 13.2.
13.2.1. Определете границите, в които с вероятност 0,997 се заключава размерът на печалбата на едно предприятие в общата съвкупност.
13.2.2. Използвайки x2-критерия на Пиърсън, при ниво на значимост α, проверете хипотезата, че случайната променлива X - размерът на печалбата - се разпределя според нормалния закон.
Задача 13.3.
13.3.1. Определете коефициентите на извадковото регресионно уравнение.
13.3.2. Установете наличието и естеството на корелацията между себестойността на произведените продукти (X) и размера на печалбата на предприятие (Y). Начертайте диаграма на разсейване и регресионна линия.
13.3.3. Изчислете коефициента на линейна корелация. Използвайки t-теста на Студент, проверете значимостта на коефициента на корелация. Направете заключение за близостта на връзката между факторите X и Y с помощта на скалата на Чадок.
Насоки . Задача 13.3 се изпълнява с помощта на тази услуга.
Изтеглете решение

Задача. Следните данни представляват времето, прекарано от клиентите при сключване на договори. Изградете интервална серия от вариации на представените данни, хистограма, намерете безпристрастна оценка математическо очакване, предубедената и безпристрастна оценка на дисперсията.

Пример. Според таблица 2:
1) Създайте серия за разпространение за 40 търговски банки на Руската федерация:
А) по размера на печалбата;
Б) от размера на кредитните инвестиции.
2) Според получената серия на разпределение определете:
А) средна печалба на търговска банка;
Б) кредитни инвестиции средно за една търговска банка;
В) модална и средна стойност на печалбата; квартили, децили;
Г) модална и средна стойност на кредитните инвестиции.
3) Съгласно сериите на разпределение, получени в параграф 1, изчислете:
а) диапазон на вариации;
б) средно линейно отклонение;
в) стандартно отклонение;
г) коефициент на вариация.
Запишете необходимите изчисления в табличен вид. Анализирайте резултатите. Направете свои собствени изводи.
Начертайте резултантната серия на разпределение. Определете режима и медианата графично.

Решение:
За изграждане на групиране с равни интервали ще използваме услугата Групиране на статистически данни.

Фигура 1 - Въвеждане на параметри

Описание на параметрите
Брой линии: количество необработени данни. Ако размерът на серията е малък, посочете нейния номер. Ако изборът е достатъчно голям, щракнете върху бутона Поставяне от Excel.
Брой групи: 0 - броят на групите ще бъде определен по формулата на Стърджис.
Ако е посочен конкретен брой групи, посочете го (например 5).
Тип ред: Дискретна серия.
Ниво на значимост: например 0,954 . Този параметър е настроен за определяне доверителен интервалсредна стойност.
Проба: Например се прави 10% механично вземане на проби. Посочете числото 10. За нашите данни ние посочваме 100 .

Изградените редове по количество, са наречени вариационен.

Серията за разпространение се състои от настроики(характерни стойности) и честоти(брой групи). Извикват се честоти, изразени като относителни стойности (дяли, проценти). честоти. Сборът от всички честоти се нарича обем на разпределителната серия.

По вид разпределителните серии са разделени на отделен(изграден на базата на прекъснати стойности на характеристиката) и интервал(изграден върху непрекъснати стойности на характеристиките).

Вариационна серияпредставлява две колони (или редове); един от които предоставя индивидуални стойности на променливия атрибут, наречен варианти и обозначен с X; а в другия - абсолютни числа, показващи колко пъти (колко често) се среща всяка опция. Индикаторите на втората колона се наричат ​​честоти и условно се означават с f. Имайте предвид отново, че втората колона също може да се използва относителна производителностхарактеризиращ съотношението на честотата на отделните варианти в общия обем на честотите. Тези относителни показатели се наричат ​​честоти и условно се означават с ω. Сумата от всички честоти в този случай е равна на единица. Честотите обаче могат да бъдат изразени и като процент и тогава сборът от всички честоти дава 100%.

Ако вариантите на вариационния ред са изразени като дискретни количества, тогава такава вариационна серия се нарича отделен.

За непрекъснати характеристики, вариационните серии се изграждат като интервал, тоест стойностите на атрибута в тях се изразяват „от ... до ...“. В този случай минималните стойности на атрибута в такъв интервал се наричат ​​долна граница на интервала, а максималните - горна граница.

Интервалните вариационни серии също са създадени за дискретни характеристики, които варират в широк диапазон. Интервалната серия може да бъде равнии неравностойноинтервали.

Помислете как се определя стойността на равни интервали. Нека въведем следната нотация:

и– стойност на интервала;

- максималната стойност на атрибута за единици от съвкупността;

- минималната стойност на атрибута за единици от съвкупността;

н-броя на разпределените групи.

ако n е известно.

Ако броят на разпределените групи е трудно да се определи предварително, тогава формулата, предложена от Стърджис през 1926 г., може да се препоръча за изчисляване на оптималния размер на интервала с достатъчен размер на популацията:

n = 1+ 3,322 log N, където N е броят на единиците в популацията.

Стойността на неравните интервали се определя във всеки отделен случай, като се вземат предвид характеристиките на обекта на изследване.

Статистическото разпределение на извадкатаизвикване на списъка с опции и съответните им честоти (или относителни честоти).

Статистическото разпределение на извадката може да се посочи под формата на таблица, в първата колона на която има опции, а във втората - честотите, съответстващи на тези опции. ни, или относителни честоти Пи .

Статистическо разпределение на извадката

Интервални серии се наричат ​​вариационни серии, в които стойностите на характеристиките, залегнали в тяхното формиране, се изразяват в определени граници (интервали). Честотите в този случай не се отнасят за отделни стойности на атрибута, а за целия интервал.

Интервалните разпределителни редове се конструират по непрекъснати количествени характеристики, както и по дискретни характеристики, вариращи в значителен диапазон.

Интервалната серия може да бъде представена чрез статистическото разпределение на извадката, като се посочват интервалите и съответните им честоти. В този случай сумата от честотите на варианта, попаднал в този интервал, се приема за честота на интервала.

При групиране по количествени непрекъснати признаци е важно да се определи размерът на интервала.

В допълнение към средната стойност на извадката и дисперсията на извадката се използват и други характеристики на сериите от вариации.

моданазовете варианта, който има най-висока честота.

Съвкупност от предмети или явления, обединени от някои обща чертаили свойство от качествен или количествен характер, се нарича обект на наблюдение .

Всеки обект статистическо наблюдениесе състои от отделни елементи - единици за наблюдение .

Резултатите от статистическото наблюдение са цифрова информация - данни . Статистически данни - това е информация за това какви стойности е приела чертата, която представлява интерес за изследователя в статистическата съвкупност.

Ако стойностите на даден признак са изразени като числа, тогава характеристиката се извиква количествен .

Ако даден признак характеризира някакво свойство или състояние на елементите на популацията, тогава признакът се нарича качество .

Ако всички елементи на съвкупността са обект на изследване (непрекъснато наблюдение), тогава статистическата съвкупност се нарича общ.

Ако част от елементите на генералната съвкупност е обект на изследване, тогава се нарича статистическа съвкупност селективен (селективен) . Извадка от популацията се изтегля на случаен принцип, така че всеки от n-те членове на извадката да има равен шанс да бъде избран.

Стойностите на атрибута се променят (променят) при преминаване от един елемент на популацията към друг, следователно в статистиката различни стойности на атрибута също се наричат настроики . Опциите обикновено се означават с малки латински букви x, y, z.

Извиква се поредният номер на варианта (характеристична стойност). ранг . x 1 - 1-ва опция (1-ва стойност на характеристиката), x 2 - 2-ра опция (2-ра характеристика), x i - i-ти вариант (i-та стойностзнак).

Поредица от стойности на атрибути (опции), подредени във възходящ или низходящ ред със съответните им тегла, се нарича вариационна серия (разпределителна серия).

Като везни се появяват честоти или честоти.

Честота(m i) показва колко пъти този или онзи вариант (стойност на характеристиките) се среща в статистическата съвкупност.

Честота или относителна честота(w i) показва каква част от единиците на населението имат един или друг вариант. Честотата се изчислява като отношение на честотата на един или друг вариант към сумата от всички честоти в серията.

. (6.1)

Сборът от всички честоти е 1.

. (6.2)

Вариационните редове са дискретни и интервални.

Дискретни вариационни сериите обикновено се изграждат в случай, че стойностите на изследваната характеристика могат да се различават една от друга поне с някаква крайна стойност.

В дискретни вариационни серии се определят точковите стойности на даден елемент.

Общият изглед на дискретната вариационна серия е показан в Таблица 6.1.

Таблица 6.1

където i = 1, 2, … , л.

В интервалните вариационни серии във всеки интервал се разграничават горната и долната граница на интервала.

Разликата между горната и долната граница на интервала се нарича интервална разлика или дължината (размера) на интервала .

Стойността на първия интервал k 1 се определя по формулата:

k 1 = а 2 - а 1;

второ: k 2 = а 3 - а 2; …

последно: k l = a l - a l -1 .

Общо взето интервална разлика k i се изчислява по формулата:

k i \u003d x i (макс.) - x i (мин.) . (6.3)

Ако интервалът има и двете граници, тогава той се извиква затворен .

Първият и последният интервал могат да бъдат отворен , т.е. имат само една граница.

Например първият интервал може да бъде зададен като "до 100", вторият - "100-110", ... , предпоследният - "190-200", последният - "200 и повече". Очевидно е, че първият интервал няма долна граница, а последният няма горна граница, и двата са отворени.

Често отворените интервали трябва да бъдат условно затворени. За да направите това, обикновено стойността на първия интервал се приема равна на стойността на втория, а стойността на последния - на стойността на предпоследния. В нашия пример стойността на втория интервал е 110-100=10, следователно долната граница на първия интервал условно ще бъде 100-10=90; стойността на предпоследния интервал е 200-190=10, следователно горната граница на последния интервал условно ще бъде 200+10=210.

В допълнение, интервали с различни дължини могат да се появят в сериите от вариации на интервала. Ако интервалите във вариационния ред имат еднаква дължина (интервална разлика), те се извикват равни по размер , в противен случай - неравностойно.

При конструирането на интервална вариационна серия често възниква проблемът с избора на размера на интервалите (интервална разлика).

За да определите оптималния размер на интервалите (в случай, че серия е изградена с равни интервали), приложите Формула на Стърджес:

, (6.4)

където n е броят на единиците на населението,

x (max) и x (min) - най-големите и най-малките стойности на вариантите на серията.

За характеризиране на вариационния ред, заедно с честотите и честотите, се използват натрупаните честоти и честоти.

Кумулативни честоти (честоти)показват колко единици от съвкупността (каква част от тях) не надвишават дадена стойност (опция) x.

Натрупани честоти ( v i) според данните от дискретната серия може да се изчисли по следната формула:

. (6.5)

За интервална вариационна серия това е сумата от честотите (честотите) на всички интервали, които не надвишават този.

Дискретна вариационна серия може да бъде представена графично с помощта на полигонно разпределение на честоти или честоти.

При конструиране на многоъгълник на разпределение стойностите на атрибута (опциите) се нанасят по оста на абсцисата, а честотите или честотите се нанасят по оста на ординатата. В пресечната точка на характерните стойности и съответните им честоти (честоти) се нанасят точки, които от своя страна са свързани с сегменти. Така получената прекъсната линия се нарича многоъгълник на разпределението на честотите (честоти).

x k
x2
x 1 x i


Ориз. 6.1.

Интервалните вариационни серии могат да бъдат представени графично с помощта на хистограми, т.е. лента диаграма.

При конструиране на хистограма по абсцисата се нанасят стойностите на изследваната характеристика (граници на интервала).

В случай, че интервалите са с еднакъв размер, честотите или честотите могат да бъдат нанесени по оста y.

Ако интервалите имат различни стойности, е необходимо да се начертаят стойностите на абсолютната или относителната плътност на разпределение по оста y.

Абсолютна плътност- съотношението на честотата на интервала към размера на интервала:

; (6.6)

където: f(a) i - абсолютна плътност на i-тия интервал;

m i - честота на i-тия интервал;

k i - стойността на i-тия интервал (интервална разлика).

Абсолютната плътност показва колко единици на населението са на единичен интервал.

Относителна плътност- съотношението на честотата на интервала към размера на интервала:

; (6.7)

където: f(o) i - относителна плътност на i-тия интервал;

w i - честота на i-тия интервал.

Относителната плътност показва каква част от единиците на населението попада в интервалната единица.

а л
a 1 x i
а 2

Както дискретните, така и интервалните вариационни серии могат да бъдат графично представени като кумулати и огиви.

При изграждане натрупва сеСпоред данните от дискретната серия абсцисата показва стойностите на атрибута (опции), а ординатата показва натрупаните честоти или честоти. На пресечната точка на стойностите на характеристиката (опции) и натрупаните честоти (честоти), съответстващи на тях, се изграждат точки, които от своя страна са свързани чрез сегменти или крива. Така получената прекъсната линия (крива) се нарича кумулативна (кумулативна крива).

При конструиране на кумулата според данните от интервалната серия, границите на интервалите се нанасят по абсцисата. Абсцисите на точките са горните граници на интервалите. Ординатите образуват натрупаните честоти (честоти) на съответните интервали. Често се добавя още една точка, чиято абциса е долната граница на първия интервал, а ординатата е нула. Свързвайки точките със сегменти или крива, получаваме кумулата.

Огивасе конструира подобно на кумулата с единствената разлика, че точките, съответстващи на натрупаните честоти (честоти), се нанасят по оста на абсцисата, а характерните стойности (опции) се нанасят по оста на ординатата.

Вариационни серии: определение, видове, основни характеристики. Метод на изчисление
мода, медиана, средноаритметично в медицинските и статистическите изследвания
(Показване на условен пример).

Вариационна серия е поредица от числови стойности на изследваната черта, които се различават една от друга по своята величина и са подредени в определена последователност (във възходящ или низходящ ред). Всяка числова стойност на серията се нарича вариант (V), а числата, показващи колко често този или онзи вариант се среща в състава на тази серия, се наричат ​​честота (p).

Общ бройслучаите на наблюдения, от които се състои вариационният ред, се обозначават с буквата n. Разликата в значението на изследваните характеристики се нарича вариация. Ако променливият знак няма количествена мярка, вариацията се нарича качествена, а редът на разпределение се нарича атрибут (например разпределение по изход на заболяването, здравен статус и т.н.).

Ако променлив знак има количествен израз, такава вариация се нарича количествена, а редът на разпределение се нарича вариационен.

Вариационните серии се делят на прекъснати и непрекъснати - според естеството на количествения признак, прости и претеглени - според честотата на поява на варианта.

В проста вариационна серия всеки вариант се среща само веднъж (p=1), в претеглена един и същи вариант се среща няколко пъти (p>1). Примери за такива серии ще бъдат разгледани по-нататък в текста. Ако количественият атрибут е непрекъснат, т.е. между целочислени стойности има междинни дробни стойности, вариационният ред се нарича непрекъснат.

Например: 10.0 - 11.9

14.0 - 15.9 и др.

Ако количественият знак е прекъснат, т.е. неговите отделни стойности (опции) се различават една от друга с цяло число и нямат междинни дробни стойности, вариационният ред се нарича прекъснат или дискретен.

Използвайки данните от предишния пример за сърдечната честота

за 21 ученика ще изградим вариационна серия (Таблица 1).

маса 1

Разпределение на студентите по медицина по честота на пулса (bpm)

По този начин, изграждането на вариационна серия означава систематизиране, рационализиране на съществуващите числови стойности (опции), т.е. подреждат в определена последователност (във възходящ или низходящ ред) със съответните им честоти. В разглеждания пример опциите са подредени във възходящ ред и се изразяват като прекъснати (дискретни) цели числа, като всяка опция се среща няколко пъти, т.е. имаме работа с претеглена, прекъсната или дискретна вариационна серия.

Като правило, ако броят на наблюденията в статистическата популация, която изучаваме, не надвишава 30, тогава е достатъчно да подредите всички стойности на изследваната черта във вариационна серия в нарастващ ред, както е в таблицата. 1, или в низходящ ред.

При голям брой наблюдения (n>30) броят на възникващите варианти може да бъде много голям, в този случай се съставя интервална или групирана вариационна серия, в която, за да се опрости последващата обработка и да се изясни естеството на разпределението, вариантите се обединяват в групи.

Обикновено броят на груповите опции варира от 8 до 15.

Трябва да са поне 5 от тях, т.к. в противен случай това ще бъде твърде грубо, прекомерно уголемяване, което изкривява цялостната картина на вариациите и силно се отразява на точността на средните стойности. Когато броят на груповите опции е повече от 20-25, точността на изчисляване на средните стойности се увеличава, но характеристиките на вариацията на характеристиките са значително изкривени и математическата обработка става по-сложна.

При съставянето на групирана серия е необходимо да се вземе предвид

− вариантните групи трябва да бъдат поставени в определен ред (възходящ или низходящ);

- интервалите във вариантните групи трябва да са еднакви;

− стойностите на границите на интервалите не трябва да съвпадат, т.к няма да е ясно в кои групи да се приписват отделни опции;

- необходимо е да се вземат предвид качествените характеристики на събрания материал при определяне на границите на интервалите (например при изучаване на теглото на възрастни, интервал от 3-4 кг е приемлив, а за деца през първите месеци от живота не трябва да надвишава 100 g.)

Нека изградим групирана (интервална) серия, която характеризира данните за честотата на пулса (брой удари в минута) за 55 студенти по медицина преди изпита: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

За да създадете групирана серия, трябва:

1. Определете стойността на интервала;

2. Определете средата, началото и края на групите на варианта на вариационния ред.

● Стойността на интервала (i) се определя от броя на очакваните групи (r), чийто брой се задава в зависимост от броя на наблюденията (n) съгласно специална таблица

Брой групи в зависимост от броя на наблюденията:

В нашия случай за 55 ученици е възможно да се съставят от 8 до 10 групи.

Стойността на интервала (i) се определя по следната формула -

i = Vmax-Vmin/r

В нашия пример стойността на интервала е 82-58/8= 3.

Ако стойността на интервала е дробно число, резултатът трябва да се закръгли нагоре до цяло число.

Има няколко вида средни стойности:

средноаритметично,

● средно геометрична,

● средно хармонично,

● среден квадратен корен,

● средно прогресивно,

● медиана

V медицинска статистиканай-често използвани са средните аритметични стойности.

Средноаритметичната стойност (M) е обобщаваща стойност, която определя типичната стойност, която е характерна за цялата съвкупност. Основните методи за изчисляване на М са: методът на средноаритметичната стойност и методът на моментите (условни отклонения).

Методът на средноаритметичната стойност се използва за изчисляване на простата средна аритметична и среднопретеглената аритметична стойност. Изборът на метод за изчисляване на средноаритметичната стойност зависи от вида на вариационния ред. В случай на проста вариационна серия, в която всеки вариант се среща само веднъж, простата средна аритметична се определя по формулата:

където: М – средноаритметична стойност;

V е стойността на променливата характеристика (опции);

Σ - обозначава действието - сумиране;

n е общият брой на наблюденията.

Пример за изчисляване на средноаритметичната стойност е прост. Честота на дишане (брой вдишвания в минута) при 9 мъже на възраст 35 години: 20, 22, 19, 15, 16, 21, 17, 23, 18.

За да се определи средното ниво на дихателна честота при мъже на възраст 35 години, е необходимо:

1. Изградете вариационна серия, като поставите всички опции във възходящ или низходящ ред.Получихме проста вариационна серия, т.к. стойностите на варианта се появяват само веднъж.

M = ∑V/n = 171/9 = 19 вдишвания в минута

Заключение. Честотата на дишане при мъжете на възраст 35 години е средно 19 вдишвания в минута.

Ако отделните стойности на варианта се повтарят, няма нужда да се изписва всеки вариант на ред, достатъчно е да се изброят размерите на варианта, които се появяват (V) и до него да се посочи броят на техните повторения ( п). такъв вариационен ред, в който вариантите са като че ли претеглени според броя на съответстващите им честоти, се нарича претеглена вариационна серия, а изчислената средна стойност е средноаритметичната претеглена.

Средноаритметичната претеглена стойност се определя по формулата: M= ∑Vp/n

където n е броят на наблюденията, равен на сбора от честоти - Σr.

Пример за изчисляване на средноаритметичната претеглена стойност.

Продължителността на инвалидността (в дни) при 35 пациенти с остри респираторни заболявания (ОРЗ), лекувани от местен лекар през първото тримесечие на текущата година е: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 дни .

Методиката за определяне на средната продължителност на инвалидността при пациенти с остри респираторни инфекции е както следва:

1. Нека изградим претеглена вариационна серия, т.к индивидуалните стойности на варианта се повтарят няколко пъти. За да направите това, можете да подредите всички опции във възходящ или низходящ ред със съответните им честоти.

В нашия случай опциите са във възходящ ред.

2. Изчислете средноаритметичната претеглена по формулата: M = ∑Vp/n = 233/35 = 6,7 дни

Разпределение на пациентите с остри респираторни инфекции по продължителност на инвалидността:

Продължителност на неработоспособност (V) Брой пациенти (p) vp
∑p = n = 35 ∑Vp = 233

Заключение. Продължителността на инвалидността при пациенти с остри респираторни заболявания е средно 6,7 дни.

Режимът (Mo) е най-често срещаният вариант в серията от вариации. За разпределението, представено в таблицата, режимът съответства на варианта, равен на 10, среща се по-често от други - 6 пъти.

Разпределение на пациентите по продължителност на престоя на болнично легло (в дни)

V
стр

Понякога е трудно да се определи точната стойност на режима, тъй като в изследваните данни може да има няколко наблюдения, които се срещат „най-често“.

Медиана (Me) е непараметричен индикатор, който разделя вариационните серии на две равни половини: един и същ брой опции е разположен от двете страни на медианата.

Например, за разпределението, показано в таблицата, медианата е 10, защото от двете страни на тази стойност се намира на 14-та опция, т.е. числото 10 заема централна позиция в тази серия и е нейната медиана.

Като се има предвид, че броят на наблюденията в този пример е четен (n=34), медианата може да се определи, както следва:

Аз = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Това означава, че средата на поредицата попада върху седемнадесетата опция, която съответства на медиана от 10. За разпределението, представено в таблицата, средноаритметичната стойност е:

M = ∑Vp/n = 334/34 = 10,1

И така, за 34 наблюдения от табл. 8, получаваме: Mo=10, Me=10, средноаритметичното (M) е 10,1. В нашия пример и трите индикатора се оказаха равни или близки един до друг, въпреки че са напълно различни.

Средноаритметичната е резултантната сума от всички влияния; в нейното формиране участват всички опции без изключение, включително екстремни, често нетипични за дадено явление или съвкупност.

Режимът и медианата, за разлика от средното аритметично, не зависят от стойността на всички отделни стойности на променливия атрибут (стойностите на екстремните варианти и степента на разсейване на серията). Средноаритметичната стойност характеризира цялата маса от наблюдения, модът и медианата характеризират по-голямата част

Нарича се група от числа, обединени от някакъв атрибут агрегат.

Както бе отбелязано по-горе, основният статистически спортен материал е група от различни числа, които не дават на треньора представа за същността на явлението или процеса. Предизвикателството е тази популация да се превърне в система и да се използват нейните показатели за получаване на необходимата информация.

Съставянето на вариационна серия е именно формиране на определен математически

Пример 2. 34 скиори записаха следното време за възстановяване на сърдечната честота след преминаване на разстоянието (в секунди):

81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

Както можете да видите, тази група от числа не носи никаква информация.

За да съставим вариационна серия, първо изпълняваме операцията класиране -подреждане на числата във възходящ или низходящ ред. Например, във възходящ ред, класирането води до следното;

78; 78; 78; 78; 78; 78;

81; 81; 81; 81; 81; 81; 81; 81; 81;

84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

В низходящ ред класирането води до тази група числа:

84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

81; 81; 81; 81; 8!; 81: 81; 81; 81;

78; 78; 78; 78; 78; 78;

След класирането става очевидна ирационалната форма на записване на тази група числа – едни и същи числа се повтарят многократно. Следователно възниква естествена мисъл записът да се трансформира по такъв начин, че да се посочи кое число колко пъти се повтаря. Например, като се има предвид класирането във възходящ ред:

Тук вляво е число, показващо времето за възстановяване на пулса на спортиста, вдясно е броят на повторенията на това отчитане в тази група от 34 атлети.

В съответствие с горните концепции на математически символиразглежданата група от измервания ще бъде обозначена с някаква буква, например x. Предвид нарастващия ред на числата в тази група: x 1 -74 s; х 2 - 78 s; х 3 - 81 s; х 4 - 84 s; х 5 - 85 s; x 6 -x n - 90 s, всяко разглеждано число може да бъде обозначено със символа X i .

Нека обозначим броя на повторенията на разглежданите измервания с буквата n. Тогава:

n 1 =4; n2 =6; n3 =9; n4=11; n 5 =3; n 6 =n n =1 и всеки брой повторения може да бъде обозначен като n i .

Общият брой на направените измервания, както следва от условието на примера, е 34. Това означава, че сумата от всички n е 34. Или в символичен израз:

Нека означим тази сума с една буква - n. Тогава изходните данни на разглеждания пример могат да бъдат записани в този вид (Таблица 1).

Получената група от числа е трансформирана серия от хаотично разпръснати показания, получени от обучаващия в началото на работата.

маса 1

x i n i
n=34

Такава група е определена система, чиито параметри характеризират измерванията. Извикват се числата, представляващи резултатите от измерванията (x i). настроики; н i - броят на техните повторения - се наричат честоти; n - сбор от всички честоти - да обема на агрегата.

Получената система се нарича вариационна серия.Понякога тези серии се наричат ​​емпирични или статистически.

Лесно е да се види, че е възможен специален случай на вариационна серия, когато всички честоти са равни на едно n i ==1, тоест всяко измерване в дадена група от числа се е случило само веднъж.

Получената вариационна серия, както всяка друга, може да бъде представена графично. За да начертаете получената серия, първо трябва да се споразумеете за мащаба на хоризонталната и вертикалната ос.

В тази задача върху хоризонталната ос ще начертаем стойностите на времето за възстановяване на импулса (x 1) по такъв начин, че единицата за дължина, избрана произволно, да съответства на стойността на една секунда. Ще започнем да отлагаме тези стойности от 70 секунди, като условно се оттеглим от пресечната точка на двете оси 0.

По вертикалната ос начертаваме стойностите на честотите на нашата серия (n i), като вземаме мащаба: единица дължина е равна на единица честота.

След като по този начин подготвихме условията за начертаване на графика, пристъпваме към работа с получената вариационна серия.

Първата двойка числа x 1 \u003d 74, n 1 \u003d 4 е нанесена на графиката, както следва: по оста x; намери х 1 =74 и възстановяваме перпендикуляра от тази точка, по оста n намираме n 1 =4 и начертаваме хоризонтална линия от него, докато се пресече с предварително възстановения перпендикуляр. И двете линии - вертикална и хоризонтална - са помощни линии и следователно се прилагат към чертежа с пунктирана линия. Точката на тяхното пресичане е в скалата на тази графика съотношението на X 1 =74 и n 1 =4.

Всички останали точки на графиката се изобразяват по същия начин. След това те са свързани с линейни сегменти. За да може графиката да има затворена форма, свързваме крайните точки със сегменти със съседни точки на хоризонталната ос.

Получената фигура е графика на нашата вариационна серия (фиг. 1).

Съвсем ясно е, че всяка вариационна серия е представена от своя собствена графика.

Ориз. 1. Графично представяне на вариационния ред.

На фиг. 1 се вижда:

1) от всички изследвани, най-голямата група се състои от спортисти, чието време за възстановяване на пулса е 84 s;

2) за много това време е 81 s;

3) най-малката група се състои от атлети с кратко време за възстановяване на пулса - 74 s и дълго - 90 s.

По този начин, след завършване на поредица от тестове, трябва да се класират получените числа и да се състави вариационна серия, която е определена математическа система. За по-голяма яснота, вариационните серии могат да бъдат илюстрирани с графика.

Горната серия от вариации също се нарича отделенследващ - такъв, в който всяка опция се изразява с едно число.

Нека да дадем още няколко примера за съставянето на вариационни серии.

Пример 3 12 стрелци, изпълняващи упражнение в легнало положение от 10 изстрела, показаха следните резултати (в точки):

94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

За да образуваме вариационна серия, ще класираме тези числа;

94; 94; 94; 94; 94;

След класиране съставяме вариационна серия (Таблица 3).

 


Прочети:


Нов

Как да възстановите менструалния цикъл след раждане:

Въведение в синастричната астрология

Въведение в синастричната астрология

Ако сте на някое социално събиране и се чудите защо онзи човек там се показва толкова отвратително и никой няма да го спре и дори как...

Алгоритъм как да започнете да печелите от знания!

Алгоритъм как да започнете да печелите от знания!

Сега стана много популярно получаването на допълнително образование, както в областта на професията, така и допълнително самообразование за възрастни и ...

Бизнес план на Учебен център: Необходими документи и калкулиране на разходите

Бизнес план на Учебен център: Необходими документи и калкулиране на разходите

* Изчисленията използват средни данни за Русия. Част първа: правни тънкости В момента психологията като наука и като специализация ...

Физиономия на убиеца или Как да разпознаем престъпника по външен вид!

Физиономия на убиеца или Как да разпознаем престъпника по външен вид!

Съдебно-медицинска идентификация на човек по признаци на външен вид Идентифицирането на човек е възможно не само чрез папиларни модели на ръцете, състав ...

изображение за подаване RSS