Главная - Коэльо Пауло
Дана выборка составить вариационный ряд. V. Вариационные ряды, средние величины, вариабельность признака. История разработки критерия корреляции
Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку.

Назначение сервиса . С помощью онлайн-калькулятора Вы сможете:

  • построить вариационный ряд , построить гистограмму и полигон;
  • найти показатели вариации (среднюю, моду (в т.ч. и графическим способом), медиану, размах вариации, квартили, децили, квартильный коэффициент дифференциации, коэффициент вариации и другие показатели);

Инструкция . Для группировки ряда необходимо выбрать вид получаемого вариационного ряда (дискретный или интервальный) и указать количество данных (количество строк). Полученное решение сохраняется в файле Word (см. пример группировки статистических данных).

Если группировка уже осуществлена и заданы дискретный вариационный ряд или интервальный ряд , то необходимо воспользоваться онлайн-калькулятором Показатели вариации . Проверка гипотезы о виде распределения производится с помощью сервиса Изучение формы распределения .

Виды статистических группировок

Вариационный ряд . В случае наблюдений дискретной случайной величины одно и то же значение можно встретить несколько раз. Такие значения x i случайной величины записывают с указанием n i числа раз его появления в n наблюдениях, это и есть частота данного значения.
В случае непрерывной случайной величины на практике применяют группировку.
  1. Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально–экономические типы, однородные группы единиц. Для построения данной группировки используйте параметр Дискретный вариационный ряд.
  2. Структурной называется группировка , в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому–либо варьирующему признаку. Для построения данной группировки используйте параметр Интервальный ряд.
  3. Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой (см. аналитическая группировка ряда).

Пример №1 . По данным таблицы 2 постройте ряды распределения по 40 коммерческим банкам РФ. По полученным рядам распределения определите: прибыль в среднем на один коммерческий банк, кредитные вложения в среднем на один коммерческий банк, модальное и медианное значение прибыли; квартили, децили, размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, коэффициент вариации.

Решение :
В разделе «Вид статистического ряда» выбираем Дискретный ряд. Нажимаем Вставить из Excel . Количество групп: по формуле Стэрджесса

Принципы построения статистических группировок

Ряд наблюдений, упорядоченных по возрастанию, называется вариационным рядом . Группировочным признаком называется признак, по которому производится разбивка совокупности на отдельные группы. Его называют основанием группировки. В основание группировки могут быть положены как количественные, так и качественные признаки.
После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.

При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта производится с помощью стандартных процедур.
Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:

k = 1+3,322*lg(N)

Где k – число групп, N – число единиц совокупности.

Длину частичных интервалов вычисляют как h=(x max -x min)/k

Затем подсчитывают числа попаданий наблюдений в эти интервалы, которые принимают за частоты n i . Малочисленные частоты, значения которых меньше 5 (n i < 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
В качестве новых значений вариант берут середины интервалов x i =(c i-1 +c i)/2.

Пример №3 . В результате 5%-ной собственно-случайной выборки получено следующее распределение изделий по содержанию влаги. Рассчитайте: 1) средний процент влажности; 2) показатели, характеризующие вариацию влажности.
Решение получено с помощью калькулятора : Пример №1

Построить вариационный ряд. По найденному ряду построить полигон распределения, гистограмму, кумуляту. Определить моду и медиану.
Скачать решение

Пример . По результатам выборочного наблюдения (выборка А приложение):
а) составьте вариационный ряд;
б) вычислите относительные частоты и накопленные относительные частоты;
в) постройте полигон;
г) составьте эмпирическую функцию распределения;
д) постройте график эмпирической функции распределения;
е) вычислите числовые характеристики: среднее арифметическое, дисперсию, среднее квадратическое отклонение. Решение

На основе данных, приведенных в Таблице 4 (Приложение 1) и соответствующих Вашему варианту, выполнить:

  1. На основе структурной группировки построить вариационный частотный и кумулятивный ряды распределения, используя равные закрытые интервалы, приняв число групп равным 6. Результаты представить в виде таблицы и изобразить графически.
  2. Проанализировать вариационный ряд распределения, вычислив:
    • среднее арифметическое значение признака;
    • моду, медиану, 1-ый квартиль, 1-ый и 9-тый дециль;
    • среднее квадратичное отклонение;
    • коэффициент вариации.
  3. Сделать выводы.

Требуется: ранжировать ряд, построить интервальный ряд распределения, вычислить среднее значение, колеблемость среднего значения, моду и медиану для ранжированного и интервального рядов.

На основе исходных данных построить дискретный вариационный ряд ; представить его в виде статистической таблицы и статистических графиков. 2). На основе исходных данных построить интервальный вариационный ряд с равными интервалами. Число интервалов выбрать самостоятельно и объяснить этот выбор. Представить полученный вариационный ряд в виде статистической таблицы и статистических графиков. Указать виды примененных таблиц и графиков.

С целью определения средней продолжительности обслуживания клиентов в пенсионном фонде, число клиентов которого очень велико, по схеме собственно-случайной бесповторной выборки проведено обследование 100 клиентов. Результаты обследования представлены в таблице. Найти:
а) границы, в которых с вероятностью 0.9946 заключено среднее время обслуживания всех клиентов пенсионного фонда;
б) вероятность того, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине);
в) объем повторной выборки, при котором с вероятностью 0.9907 можно утверждать, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине).
2. По данным задачи 1, используя X 2 критерий Пирсона, на уровне значимости α = 0,05 проверить гипотезу о том, что случайная величина Х – время обслуживания клиентов – распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
Скачать решение

Дана выборка из 100 элементов. Необходимо:

  1. Построить ранжированный вариационный ряд;
  2. Найти максимальный и минимальный члены ряда;
  3. Найти размах вариации и количество оптимальных промежутков для построения интервального ряда. Найти длину промежутка интервального ряда;
  4. Построить интервальный ряд. Найти частоты попадания элементов выборки в составленные промежутки. Найти средние точки каждого промежутка;
  5. Построить гистограмму и полигон частот. Сравнить с нормальным распределением (аналитически и графически);
  6. Построить график эмпирической функции распределения;
  7. Рассчитать выборочные числовые характеристики: выборочное среднее и центральный выборочный момент;
  8. Рассчитать приближенные значения среднего квадратического отклонения, асимметрии и эксцесса (пользуясь пакетом анализа MS Excel). Сравнить приближенные расчетные значения с точными (рассчитанные по формулам MS Excel);
  9. Сравнить выборочные графические характеристики с соответствующими теоретическими.
Скачать решение

Имеются следующие выборочные данные (выборка 10%-ная, механическая) о выпуске продукции и сумме прибыли, млн. руб. По исходным данным:
Задание 13.1.
13.1.1. Постройте статистический ряд распределения предприятий по сумме прибыли, образовав пять групп с равными интервалами. Постройте графики ряда распределения.
13.1.2. Рассчитайте числовые характеристики ряда распределения предприятий по сумме прибыли: среднюю арифметическую, среднее квадратическое отклонение, дисперсию, коэффициент вариации V. Сделайте выводы.
Задание 13.2.
13.2.1. Определите границы, в которых с вероятностью 0.997 заключена сумма прибыли одного предприятия в генеральной совокупности.
13.2.2. Используя x2-критерий Пирсона , при уровне значимости α проверить гипотезу о том, что случайная величина X – сумма прибыли – распределена по нормальному закону.
Задание 13.3.
13.3.1. Определите коэффициенты выборочного уравнения регрессии.
13.3.2. Установите наличие и характер корреляционной связи между стоимостью произведённой продукции (X) и суммой прибыли на одно предприятие (Y). Постройте диаграмму рассеяния и линию регрессии.
13.3.3. Рассчитайте линейный коэффициент корреляции. Используя t-критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами X и Y, используя шкалу Чеддока .
Методические рекомендации . Задание 13.3 выполняется с помощью этого сервиса .
Скачать решение

Задача . Следующие данные представляют собой затраты времени клиентов на заключение договоров. Построить интервальный вариационный ряд представленных данных, гистограмму, найти несмещенную оценку математического ожидания, смещенную и несмещенную оценку дисперсии.

Пример . По данным таблицы 2:
1) Постройте ряды распределения по 40 коммерческим банкам РФ:
А) по величине прибыли;
Б) по величине кредитных вложений.
2) По полученным рядам распределения определите:
А) прибыль в среднем на один коммерческий банк;
Б) кредитные вложения в среднем на один коммерческий банк;
В) модальное и медианное значение прибыли; квартили, децили;
Г) модальное и медианное значение кредитных вложений.
3) По полученным в п. 1 рядам распределения рассчитайте:
а) размах вариации;
б) среднее линейное отклонение;
в) среднее квадратическое отклонение;
г) коэффициент вариации.
Необходимые расчеты оформите в табличной форме. Результаты проанализируйте. Сделайте выводы.
Постройте графики полученных рядов распределения. Графически определите моду и медиану.

Решение:
Для построения группировка с равными интервалами воспользуемся сервисом Группировка статистических данных .

Рисунок 1 – Ввод параметров

Описание параметров
Количество строк : количество исходных данных. Если размерность ряда небольшая, укажите его количество. Если выборка достаточно объемная, то нажмите кнопку Вставить из Excel .
Количество групп : 0 – число групп будет определяться по формуле Стэрджесса.
Если задано конкретное число групп, укажите его (например, 5).
Вид ряда : Дискретный ряд.
Уровень значимости : например, 0.954 . Этот параметр задается для определения доверительного интервала среднего значения.
Выборка : Например, проведена 10% -ная механическая выборка. Указываем число 10 . Для наших данных указываем 100 .

Ряды, построенные по количественному признаку , называются вариационным .

Ряды распределений состоят из вариантов (значений признака) и частот (численности групп). Частоты, выраженные в виде относительных величин (долей, процентов) называются частостями . Сумма всех частот называется объёмом ряда распределения.

По виду ряды распределения делятся на дискретные (построены по прерывным значениям признака) и интервальные (построены на непрерывных значениях признака).

Вариационный ряд представляет собой две колонки (или строки); в одной из которых приводятся отдельные значения варьирующего признака, именуемые вариантами и обозначаемые Х; а в другой – абсолютные числа, показывающие сколько раз (как часто) встречается каждый вариант. Показатели второй колонки называются частотами и условно обозначают через f. Еще раз заметим, что во второй колонке могут использоваться и относительные показатели, характеризующие долю частоты отдельных вариантов в общей сумме частот. Эти относительные показатели именуются частостями и условно обозначают через ω Сумма всех частостей в этом случае равна единице. Однако частоты можно выражать и в процентах, и тогда сумма всех частостей дает 100%.

Если варианты вариационного ряда выражены в виде дискретных величин, то такой вариационный ряд именуют дискретным.

Для непрерывных признаков вариационные ряды строятся как интервальные , то есть значения признака в них выражаются «от… до …». При этом минимальны значения признака в таком интервале именуют нижней границей интервала, а максимальное – верхней границей.

Интервальные вариационные ряды строят и для дискретных признаков, варьирующих в большом диапазоне. Интервальные ряды могут быть с равными и неравными интервалами.

Рассмотрим как определяется величина равных интервалов. Введем следующие обозначения:

i – величина интервала;

- максимальное значение признака у единиц совокупности;

– минимальное значение признака у единиц совокупности;

n – число выделяемых групп.

, если n известно.

Если число выделяемых групп трудно заранее определить, то для расчета оптимальной величины интервала при достаточном объеме совокупности может быть рекомендована формула, предложенная Стерджессом в 1926 году:

n = 1+ 3.322 lg N, где N – число единиц в совокупности.

Величина неравных интервалов определяется в каждом отдельном случае с учетом особенностей объекта изучения.

Статистическим распределением выборки называют перечень ва­риант и соответствующих им частот (или относительных частот).

Статистическое распределение выборки можно задать в виде таблицы, в первой графе которой располагаются варианты, а во второй - соот­ветствующие этим вариантам частоты ni , или относительные частоты Pi .

Статистическое распределение выборки

Интервальными называются вариационные ряды, в которых значе­ния признаков, положенных в основу их образования, выражены в определенных пределах (интервалах). Частоты в этом случае относятся, не к отдельным значениям признака, а ко всему интервалу.

Интервальные ряды распределения строятся по непрерывным количе­ственным признакам, а также по дискретным признакам, варьирующим в значительных пределах.

Интервальный ряд можно представить статистическим распределени­ем выборки с указанием интервалов и соответствующих им частот. При этом в качестве частоты интервала принимают сумму частот вариант, по­павших в этот интервал.

При группировке по количественным непрерывным признакам важ­ное значение имеет определение размера интервала.

Кроме выборочной средней и выборочной дисперсии применяются и другие характеристики вариационного ряда.

Модой называют варианту, которая имеет наибольшую частоту.

Совокупность предметов или явлений, объединенных каким-либо общим признаком или свойством качественного или количественного характера, называется объектом наблюдения .

Всякий объект статистического наблюдения состоит из отдельных элементов - единиц наблюдения .

Результаты статистического наблюдения представляют собой числовую информацию - данные . Статистические данные - это сведения о том, какие значения принял интересующий исследователя признак в статистической совокупности.

Если значения признака выражаются числами, то признак называется количественным .

Если признак характеризует некоторое свойство или состояние элементов совокупности, то признак называется качественным .

Если исследованию подлежат все элементы совокупности (сплошное наблюдение), то статистическую совокупность называют генеральной.

Если исследованию подлежит часть элементов генеральной совокупности, то статистическую совокупность называют выборочной (выборкой) . Выборка из генеральной совокупности извлекается случайно, так чтобы каждый из n элементов выборки имел равные шансы быть отобранным.

Значения признака при переходе от одного элемента совокупности к другому изменяются (варьируют), поэтому в статистике различные значения признака также называют вариантами . Варианты обычно обозначаются малыми латинскими буквами x, y, z.

Порядковый номер варианта (значения признака) называется рангом . x 1 - 1-й вариант (1-е значение признака), x 2 - 2-й вариант (2-е значение признака), x i - i-й вариант (i-е значение признака).

Упорядоченный в порядке возрастания или убывания ряд значений признака (вариантов) с соответствующими им весами называется вариационным рядом (рядом распределения).

В качестве весов выступают частоты или частости.

Частота (m i) показывает сколько раз встречается тот или иной вариант (значение признака) в статистической совокупности.

Частость или относительная частота (w i) показывает, какая часть единиц совокупности имеет тот или иной вариант. Частость рассчитывается как отношение частоты того или иного варианта к сумме всех частот ряда.

. (6.1)

Сумма всех частостей равна 1.

. (6.2)

Вариационные ряды бывают дискретными и интервальными.

Дискретные вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторую конечную величину.

В дискретных вариационных рядах задаются точечные значения признака.

Общий вид дискретного вариационного ряда указан в таблице 6.1.

Таблица 6.1

где i = 1, 2, … , l.

В интервальных вариационных рядах в каждом интервале выделяют верхнюю и нижнюю границы интервала.

Разность между верхней и нижней границами интервала называют интервальной разностью или длиной (величиной) интервала .

Величина первого интервала k 1 определяется по формуле:

k 1 = а 2 - а 1 ;

второго: k 2 = а 3 - а 2 ; …

последнего: k l = a l - a l -1 .

В общем виде интервальная разность k i рассчитывается по формуле:

k i = x i (max) - x i (min) . (6.3)

Если интервал имеет обе границы, то его называют закрытым .

Первый и последний интервалы могут быть открытыми , т.е. иметь только одну границу.

Например, первый интервал может быть задан как "до 100", второй - "100-110", … , предпоследний - "190-200", последний - "200 и более". Очевидно, что первый интервал не имеет нижней границы, а последний - верхней, оба они - открытые.

Часто открытые интервалы приходится условно закрывать. Для этого обычно величину первого интервала принимают равной величине второго, а величину последнего - величине предпоследнего. В нашем примере величина второго интервала равна 110-100=10, следовательно, нижняя граница первого интервала условно составит 100-10=90; величина предпоследнего интервала равна 200-190=10, следовательно, верхняя граница последнего интервала условно составит 200+10=210.

Кроме этого, в интервальном вариационном ряде могут встречаются интервалы разной длины. Если интервалы в вариационном ряде имеют одинаковую длину (интервальную разность), их называют равновеликими , в противном случае - неравновеликими.

При построении интервального вариационного ряда часто встает проблема выбора величины интервалов (интервальной разности).

Для определения оптимальной величины интервалов (в том случае, если строится ряд с равными интервалами) применяют формулу Стэрджесса:

, (6.4)

где n - число единиц совокупности,

x (max) и x (min) - наибольшее и наименьшее значения вариантов ряда.

Для характеристики вариационного ряда наряду с частотами и частостями используются накопленные частоты и частости.

Накопленные частоты (частости) показывают сколько единиц совокупности (какая их часть) не превышают заданного значения (варианта) х.

Накопленные частоты (v i ) по данным дискретного ряда можно рассчитать по следующей формуле:

. (6.5)

Для интервального вариационного ряда - это сумма частот (частостей) всех интервалов, не превышающих данный.

Дискретный вариационный ряд графически можно представить с помощьюполигона распределения частот или частостей .

При построении полигона распределения по оси абсцисс откладываются значения признака (варианты), а по оси ординат - частоты или частости. На пересечении значений признака и соответствующих им частот (частостей) откладываются точки, которые, в свою очередь, соединяются отрезками. Получающаяся таким образом ломаная называется полигоном распределения частот (частостей).

x k
x 2
x 1 x i


Рис. 6.1.

Интервальные вариационные ряды графически можно представить с помощью гистограммы , т.е. столбчатой диаграммы.

При построении гистограммы по оси абсцисс откладываются значения изучаемого признака (границы интервалов).

В том случае, если интервалы - одинаковой величины, по оси ординат можно откладывать частоты или частости.

Если же интервалы имеют разную величину, по оси ординат необходимо откладывать значения абсолютной или относительной плотности распределения.

Абсолютная плотность - отношение частоты интервала к величине интервала:

; (6.6)

где: f(a) i - абсолютная плотность i-го интервала;

m i - частота i-го интервала;

k i - величина i-го интервала (интервальная разность).

Абсолютная плотность показывает, сколько единиц совокупности приходится на единицу интервала.

Относительная плотность - отношение частости интервала к величине интервала:

; (6.7)

где: f(о) i - относительная плотность i-го интервала;

w i - частость i-го интервала.

Относительная плотность показывает, какая часть единиц совокупности приходится на единицу интервала.

a l
a 1 x i
a 2

И дискретные и интервальные вариационные ряды графически можно представить в виде кумуляты и огивы.

При построении кумуляты по данным дискретного ряда по оси абсцисс откладываются значения признака (варианты), а по оси ординат - накопленные частоты или частости. На пересечении значений признака (вариантов) и соответствующих им накопленных частот (частостей) строятся точки, которые, в свою очередь, соединяются отрезками или кривой. Получающаяся таким образом ломаная (кривая) называется кумулятой (кумулятивной кривой).

При построении кумуляты по данным интервального ряда по оси абсцисс откладываются границы интервалов. Абсциссами точек являются верхние границы интервалов. Ординаты образуют накопленные частоты (частости) соответствующих интервалов. Часто добавляют еще одну точку, абсциссой которой является нижняя граница первого интервала, а ордината равна нулю. Соединяя точки отрезками или кривой, получим кумуляту.

Огива строится аналогично кумуляте с той лишь разницей, что на оси абсцисс наносятся точки, соответствующие накопленным частотам (частостям), а по оси ординат - значения признака (варианты).

Вариационные ряды: определение, виды, основные характеристики. Методика расчета
моды, медианы, средней арифметической в медико-статистических исследованиях
(показать на условном примере).

Вариационный ряд – это ряд числовых значений изучаемого признака, отличающихся друг от друга по своей величине и расположенных в определенной последовательности(в восходящем или убывающем порядке). Каждое числовое значение ряда называют вариантой (V), а числа, показывающие, как часто встречается та или иная варианта в составе данного ряда, называется частотой (р).

Общее число случаев наблюдений, из которых вариационный ряд состоит, обозначают буквой n. Различие в значении изучаемых признаков называется вариацией. В случае если варьирующий признак не имеет количественной меры, вариацию называют качественной, а ряд распределения – атрибутивным (например, распределение по исходу заболевания, по состоянию здоровья и т.д.).

Если варьирующий признак имеет количественное выражение, такую вариацию называют количественной, а ряд распределения – вариационным.

Вариационные ряды делятся на прерывные и непрерывные – по характеру количественного признака, простые и взвешенные – по частоте встречаемости вариант.

В простом вариационном ряду каждая варианта встречается только один раз (р=1), во взвешенном – одна и та же варианта встречается несколько раз (р>1). Примеры таких рядов будут рассмотрены далее по тексту. Если количественный признак носит непрерывный характер, т.е. между целыми величинами имеются промежуточные дробные величины, вариационный ряд называется непрерывным.

Например: 10,0 – 11,9

14,0 – 15,9 и т.д.

Если количественный признак носит прерывный характер, т.е. отдельные его значения (варианты) отличаются друг от друга на целое число и не имеют промежуточных дробных значений, вариационный ряд называют прерывным или дискретным.

Используя данные предыдущего примера о частоте пульса

у 21 студентов, построим вариационный ряд (табл. 1).

Таблица 1

Распределение студентов-медиков по частоте пульса (уд/мин)

Таким образом, построить вариационный ряд – означает имеющиеся числовые значения (варианты) систематизировать, упорядочить, т.е. расположить в определенной последовательности (в восходящем или убывающем порядке) с соответствующими им частотами. В рассматриваемом примере варианты расположены в восходящем порядке и выражены в виде целых прерывных (дискретных) чисел, каждая варианта встречается несколько раз, т.е. мы имеем дело со взвешенным, прерывным или дискретным вариационным рядом.

Как правило, если число наблюдений в изучаемой нами статистической совокупности не превышает 30, то достаточно все значения изучаемого признака расположить в вариационном ряду в нарастающем, как в табл. 1, или убывающем порядке.

При большом количестве наблюдений (n>30) число встречающихся вариант может быть очень большим, в этом случае составляется интервальный или сгруппированный вариационный ряд, в котором для упрощения последующей обработки и выяснения характера распределения варианты объединены в группы.

Обычно число групповых вариант колеблется от 8 до 15.

Их должно быть не меньше 5, т.к. иначе это будет слишком грубое, чрезмерное укрупнение, что искажает общую картину варьирования и сильно сказывается на точности средних величин. При числе групповых вариант более 20-25 увеличивается точность вычисления средних величин, но существенно искажаются особенности варьирования признака и усложняется математическая обработка.

При составлении сгруппированного ряда необходимо учесть,

− группы вариант должны располагаться в определенном порядке (в восходящем или нисходящем);

− интервалы в группах вариант должны быть одинаковыми;

− значения границ интервалов не должны совпадать, т.к. неясно будет, в какие группы относить отдельные варианты;

− необходимо учитывать качественные особенности собираемого материала при установлении пределов интервалов (например, при изучении веса взрослых людей интервал 3-4 кг допустим, а для детей первых месяцев жизни он не должен превышать 100 г.)

Построим сгруппированный (интервальный) ряд, характеризующий данные о частоте пульса (число ударов в минуту) у 55 студентов-медиков перед экзаменом: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Для построения сгруппированного ряда необходимо:

1. Определить величину интервала;

2. Определить середину, начало и конец групп вариант вариационного ряда.

● Величина интервала (i) определяется по числу предполагаемых групп (r), количество которых устанавливается в зависимости от числа наблюдений (n) по специальной таблице

Число групп в зависимости от числа наблюдений:

В нашем случае, для 55 студентов, можно составить от 8 до 10 групп.

Величина интервала (i) определяется по следующей формуле –

i = V max-V min/r

В нашем примере величина интервала равна 82- 58/8= 3.

Если величина интервала представляет собой дробное число, полученный результат следует округлить до целого числа.

Различают несколько видов средних величин:

средняя арифметическая,

● средняя геометрическая,

● средняя гармоническая,

● средняя квадратическая,

● средняя прогрессивная,

● медиана

В медицинской статистике наиболее часто пользуются средними арифметическими величинами.

Средняя арифметическая величина (М) является обобщающей величиной, которая определяет то типичное, что характерно для всей совокупности. Основными способами расчета М являются: среднеарифметический способ и способ моментов (условных отклонений).

Среднеарифметический способ применяется для вычисления средней арифметической простой и средней арифметической взвешенной. Выбор способа расчета средней арифметической величины зависит от вида вариационного ряда. В случае простого вариационного ряда, в котором каждая варианта встречается только один раз, определяется средняя арифметическая простая по формуле:

где: М – средняя арифметическая величина;

V – значение варьирующего признака (варианты);

Σ – указывает действие – суммирование;

n – общее число наблюдений.

Пример расчета средней арифметической простой. Частота дыхания (число дыхательных движений в минуту) у 9 мужчин в возрасте 35 лет: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Для определения среднего уровня частоты дыхания у мужчин в возрасте 35 лет необходимо:

1. Построить вариационный ряд, расположив все варианты в возрастающем или убывающем порядке Мы получили простой вариационный ряд, т.к. значения вариант встречаются только один раз.

M = ∑V/n = 171/9 = 19 дыхательных движений в минуту

Вывод. Частота дыхания у мужчин в возрасте 35 лет в среднем равна 19 дыхательным движениям в минуту.

Если отдельные значения вариант повторяются, незачем выписывать в линию каждую варианту, достаточно перечислить встречающиеся размеры вариант (V) и рядом указать число их повторений (р). такой вариационный ряд, в котором варианты как бы взвешиваются по числу соответствующих им частот, носит название – взвешенный вариационный ряд, а рассчитываемая средняя величина – средней арифметической взвешенной.

Средняя арифметическая взвешенная определяется по формуле: M= ∑Vp/n

где n – число наблюдений, равное сумме частот – Σр.

Пример расчета средней арифметической взвешенной.

Длительность нетрудоспособности (в днях) у 35 больных острыми респираторными заболеваниями (ОРЗ), лечившихся у участкового врача на протяжении I-го квартала текущего года составила: 6, 7, 5, 3, 9, 8, 7, 5, 6, 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6, 7 дней.

Методика определения средней длительности нетрудоспособности у больных с ОРЗ следующая:

1. Построим взвешенный вариационный ряд, т.к. отдельные значения вариант повторяются несколько раз. Для этого можно расположить все варианты в возрастающем или убывающем порядке с соответствующими им частотами.

В нашем случае варианты расположены в возрастающем порядке

2. Рассчитаем среднюю арифметическую взвешенную по формуле: M = ∑Vp/n = 233/35 = 6,7 дней

Распределение больных с ОРЗ по длительности нетрудоспособности:

Длительность нетрудоспособности (V) Число больных (p) Vp
∑p = n = 35 ∑Vp = 233

Вывод. Длительность нетрудоспособности у больных с острыми респираторными заболеваниями составила в среднем 6,7 дней.

Мода (Мо) – наиболее часто встречающаяся варианта в вариационном ряду. Для распределения, представленного в таблице, моде соответствует варианта, равная 10, она встречается чаще других – 6 раз.

Распределение больных по длительности пребывания на больничной койке (в днях)

V
p

Иногда точную величину моды установить трудно, поскольку в изучаемых данных может существовать несколько наблюдений, встречающихся «наиболее часто».

Медиана (Ме) – непараметрический показатель, делящий вариационный ряд на две равные половины: в обе стороны от медианы располагается одинаковое число вариант.

Например, для распределения, указанного в таблице, медиана равна 10, т.к. по обе стороны от этой величины располагается по 14 вариант, т.е. число 10 занимает центральное положение в этом ряду и является его медианой.

Учитывая, что число наблюдений в этом примере четное (n=34), медиану можно определить таким образом:

Me = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Это означает, что середина ряда приходится на семнадцатую по счету варианту, которой соответствует медиана, равная 10. Для распределения, представленного в таблице, средняя арифметическая равна:

M = ∑Vp/n = 334/34 = 10,1

Итак, для 34 наблюдений из табл. 8, мы получили: Мо=10, Ме=10, средняя арифметическая (М) равна 10,1. В нашем примере все три показателя оказались равными или близкими друг к другу, хотя они совершенно различны.

Средняя арифметическая является результативной суммой всех влияний, в формировании ее принимают участие все без исключения варианты, в том числе и крайние, часто нетипичные для данного явления или совокупности.

Мода и медиана, в отличие от средней арифметической, не зависят от величины всех индивидуальных значений варьирующего признака (значений крайних вариант и степени рассеяния ряда). Средняя арифметическая характеризует всю массу наблюдений, мода и медиана – основную массу

Группа чисел, объединяемая каким-либо признаком, называется совокупностью.

Как было отмечено выше, первичный статистический спортивный материал представляет собой группу разрозненных чисел, не дающих тренеру представления о существе явления или процесса. Задача заключается в том, чтобы превратить эту совокупность в систему и воспользоваться ее показателями для получения требуемой информации.

Составление вариационного ряда как раз и представляет собой формирование определенной математической

Пример 2. У 34 спортсменов-лыжников зарегистрировано такое время восстановления пульса после прохождения дистанции (в секундах):

81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

Как видно, данная группа цифр не несет никакой информации.

Для составления вариационного ряда вначале производим операцию ранжирования - расположения чисел в порядке возрастания или убывания. Например, в порядке возрастания ранжирование приводит к следующему;

78; 78; 78; 78; 78; 78;

81; 81; 81; 81; 81; 81; 81; 81; 81;

84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

В порядке убывания ранжирование приводит к такой группе чисел:

84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

81; 81; 81; 81; 8!; 81: 81; 81; 81;

78; 78; 78; 78; 78; 78;

После проведения ранжирования становится очевидной нерациональная форма записи данной группы чисел-одни и те же числа повторяются многократно. Поэтому возникает естественная мысль преобразовать запись таким образом, чтобы указать, какое число сколько раз повторяется. Например, учитывая ранжирование в порядке возрастания:

Здесь слева записано число, указывающее время восстановления пульса спортсмена, справа-число повторений этого показания в данной группе из 34 спортсменов.

В соответствии с приведенными выше понятиями о математических символах рассмотренную группу измерений обозначим какой-либо буквой, например х. Учитывая возрастающий порядок чисел в данной группе: х 1 -74 с; х 2 - 78 с; х 3 - 81 с; х 4 - 84 с; х 5 - 85 с; х 6 -х n - 90 с, каждое рассмотренное число можно обозначить символом X i .

Обозначим число повторений рассмотренных измерений буквой n. Тогда:

n 1 =4; n 2 =6; n 3 =9; n 4 =11; n 5 =3;n 6 =n n =1, а каждое число повторений можно обозначить как n i .

Общее число проведенных измерений, как следует из условия примера, есть 34. Это означает, что сумма всех n равна 34. Или в символическом выражении:

Обозначим эту сумму одной буквой - n. Тогда исходные данные рассматриваемого примера можно записать в таком виде (табл. 1).

Полученная группа чисел есть преобразованный ряд хаотически рассеянных показаний, полученных тренером в начале работы.

Таблица 1

х i n i
n=34

Такая группа представляет собой определенную систему, параметры которой характеризуют проведенные измерения. Числа, представляющие собой результаты измерений (х i), называют вариантами; n i - числа их повторений - называются частотами; n - сумма всех частот - есть объем совокупности.

Вся полученная система называется вариационным рядом. Иногда эти ряды называются эмпирическими или статистическими.

Нетрудно заметить, что возможен частный случай вариационного ряда, когда все частоты равны единице n i ==1, то есть каждое измерение в данной группе чисел встретилось только один раз.

Полученный вариационный ряд, как и всякий другой, можно представить графически. Для построения графика полученного ряда, необходимо прежде всего условиться о масштабе на горизонтальной и вертикальной оси.

В данной задаче на горизонтальной оси будем откладывать значения времени восстановления пульса (х 1) таким образом, что единице длины, избранной произвольно, соответствует значение одной секунды. Откладывать эти значения начнем с 70 секунд, условно отступая от места пересечения двух осей 0.

На вертикальной оси отложим значения частот нашего ряда (n i), принимая масштаб: единица длины равна единице частоты.

Подготовив таким образом условия для построения графика, приступаем к работе с полученным вариационным рядом.

Первую пару чисел х 1 =74, n 1 =4 наносим на график так: на оси х; находим х 1 =74 и восстанавливаем перпендикуляр из этой точки, на оси n находим n 1 =4 и проводим из нее горизонтальную линию до пересечения с восстановленным прежде перпендикуляром. Обе линии-вертикаль и горизонталь-являются линиями вспомогательными и потому наносятся на рисунок пунктиром. Точка их пересечения представляет собой в масштабе данного графика соотношение Х 1 =74 и n 1 =4.

Таким же образом наносятся все остальные точки графика. Затем они соединяются отрезками прямых. Для того чтобы график имел замкнутый вид, крайние точки соединяем отрезками с соседними точками горизонтальной оси.

Полученная фигура есть график нашего вариационного ряда (рис. 1).

Совершенно понятно, что каждый вариационный ряд представляется своим собственным графиком.

Рис. 1. Графическое представление вариационного ряда.

На рис. 1 видно:

1) из всех обследованных наибольшую группу составили спортсмены, время восстановления пульса у которых 84 с;

2) у многих это время 81 с;

3) наименьшую группу составили спортсмены с малым временем восстановления пульса - 74 с и большим - 90 с.

Таким образом, выполнив серию испытаний, следует ранжировать полученные числа и составить вариационный ряд, представляющий собой определенную математическую систему. Для наглядности вариационный ряд можно иллюстрировать графиком.

Приведенный выше вариационный ряд называется еще дискретным рядом - таким, у которого каждый вариант выражен одним числом.

Приведем еще несколько примеров на составление вариационных рядов.

Пример 3. 12 стрелков, выполняя упражнение лежа из 10 выстрелов, показали такие результаты (в очках):

94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

Для образования вариационного ряда произведем ранжирование данных чисел;

94; 94; 94; 94; 94;

После ранжирования составляем вариационный ряд (табл. 3).

 


Читайте:



Рыцарь брунсвик. Сказки старой праги. Как загадать желание

Рыцарь брунсвик. Сказки старой праги. Как загадать желание

Карлов мост - это одна из главных туристических жемчужин Чехии, самая запоминающаяся достопримечательность Праги. В этом городе, раскинувшемся по...

Мощные землетрясения в мире за последние пять лет (2004–2010)

Мощные землетрясения в мире за последние пять лет (2004–2010)

Предисловие В прошлом году, когда случилось землетрясении на Гаити, я собрала некоторые данные о нем и о землетрясениях, произошедших на Земле,...

Чем отличается круг от шара?

Чем отличается круг от шара?

На этом уроке мы рассмотрим понятия сферы и шара. Дадим их определения. Назовем некоторые из элементов сферы и шара. А также узнаем, как находят...

Примеры сильных и слабых кислот и оснований Сильным электролитом является co2 o2 h2s h2so4

Примеры сильных и слабых кислот и оснований Сильным электролитом является co2 o2 h2s h2so4

Степень электролитической диссоциации Поскольку электролитическая диссоциация - процесс обратимый, то в растворах электролитов наряду с их ионами...

feed-image RSS