Коэффициент корреляции между количеством сна и уровнем счастья равен нулю это
Корреляция и коэффициент корреляции
Корреляция — степень связи между 2-мя или несколькими независимыми явлениями.
Корреляция бывает положительной и отрицательной.
Положительная корреляция (прямая) возникает при одновременном изменении 2-х переменных величин в одинаковых направлениях (в положительном или отрицательном). Например, взаимосвязь между количеством пользователей, приходящих на сайт из поисковой выдачи и нагрузкой на сервер: чем больше пользователей, тем больше нагрузка.
Корреляция отрицательна (обратная), если изменение одной величины приводит противоположному изменению другой. Например, с увеличением налоговой нагрузки на компании уменьшается их прибыль. Чем больше налогов, тем меньше денег на развитие.
Типичные виды корреляции
Эффективность корреляции как статистического инструмента заключается в возможности выражения связи между двумя переменными при помощи коэффициента корреляции.
При значении КК равным 1, следует понимать, что при каждом изменении 1-й переменной происходит эквивалентное изменение 2-й переменной в том же направлении.
Положительная корреляция концентраций этанола в синовии и крови
Отрицательная корреляция между показателями результатов в беге на 100 м с барьерами и прыжками в длину
Значение | Интерпретация |
до 0,2 | Очень слабая |
до 0,5 | Слабая |
до 0,7 | Средняя |
до 0,9 | Высокая |
свыше 0,9 | Очень высокая корреляция |
Данный метод обработки статистической информации популярен в экономических, технических, социальных и других науках в виду простоты подсчета КК, простотой интерпретации результатов и отсутствия необходимости владения математикой на высоком уровне.
Корреляционная зависимость отражает только взаимосвязь между переменными и не говорит о причинно-следственных связях: положительная или отрицательная корреляция между 2-мя переменными не обязательно означает, что изменение одной переменной вызывает изменение другой.
Например, есть положительная корреляция между увеличением зарплаты менеджеров по продажам и качеством работы с клиентами (повышения качества обслуживания, работа с возражениями, знание положительных качеств продукта в сравнении с конкурентами) при соответствующей мотивации персонала. Увеличившийся объем продаж, а следовательно и зарплата менеджеров, вовсе не означает что менеджеры улучшили качество работы с клиентами. Вполне вероятно, что случайно поступили крупные заказы и были отгружены или отдел маркетинга увеличил рекламный бюджет или произошло еще что-то.
Возможно существует некая третья переменная, влияющая на причину наличия или отсутствия корреляции.
Коэффициент корреляции не рассчитывается:
Что означают положительный, отрицательный и нулевой коэффициенты корреляции?
Опубликовано 29.06.2021 · Обновлено 03.10.2021
Коэффициенты корреляции – это индикаторы силы линейной связи между двумя разными переменными x и y. Коэффициент линейной корреляции больше нуля указывает на положительную взаимосвязь. Значение меньше нуля означает отрицательную связь. Наконец, нулевое значение указывает на отсутствие связи между двумя переменными x и y. В этой статье объясняется значение коэффициента линейной корреляции для инвесторов, как рассчитать ковариацию для акций и как инвесторы могут использовать корреляцию для прогнозирования рынка.
Ключевые выводы:
Понимание корреляции
Коэффициент корреляции ( ρ ) – это мера, которая определяет степень, в которой связано движение двух разных переменных. Наиболее распространенный коэффициент корреляции, генерируемый корреляцией произведения-момента Пирсона, используется для измерения линейной связи между двумя переменными. Однако в нелинейной зависимости этот коэффициент корреляции не всегда может быть подходящей мерой зависимости.
Краткий обзор
При интерпретации корреляции важно помнить, что наличие корреляции между двумя переменными не означает, что одна вызывает другую.
Корреляция и финансовые рынки
На финансовых рынках коэффициент корреляции используется для измерения акции движутся в противоположных направлениях, коэффициент корреляции отрицательный.
Например, предположим, что цены на кофе и компьютеры наблюдаются и обнаруживают корреляцию +,0008. Это означает, что между двумя переменными нет корреляции или взаимосвязи.
Расчет ρ
Стандартное отклонение – это мера разброса данных от среднего значения. Ковариация – это мера того, как две переменные изменяются вместе. Однако его масштабы безграничны, поэтому его трудно интерпретировать. Нормализованная версия статистики вычисляется путем деления ковариации на произведение двух стандартных отклонений. Это коэффициент корреляции.
Положительное соотношение
Положительная корреляция – когда коэффициент корреляции больше 0 – означает, что обе переменные движутся в одном направлении. Когда ρ равно +1, это означает, что две сравниваемые переменные имеют идеальную положительную взаимосвязь; когда одна переменная движется выше или ниже, другая переменная движется в том же направлении с той же величиной.
Чем ближе значение ρ к +1, тем сильнее линейная зависимость. Например, предположим, что стоимость цен на нефть напрямую связана с ценами на авиабилеты с коэффициентом корреляции +0,95. Взаимосвязь между ценами на нефть и стоимостью авиабилетов имеет очень сильную положительную корреляцию, так как значение близко к +1. Таким образом, если цена на нефть снижается, цены на авиабилеты также уменьшаются, а если цена на нефть растет, то же самое происходит и с ценами на авиабилеты.
На приведенной ниже диаграмме мы сравниваем один из крупнейших банков США, JPMorgan Chase & Co. ( биржевым фондом Financial Select SPDR Exchange Traded Fund (ETF) (XLF ).1 Как вы понимаете, компания JPMorgan Chase & Co. должна иметь положительную корреляцию с банковской отраслью в целом. Мы видим, что коэффициент корреляции в настоящее время составляет 0,98, что свидетельствует о сильной положительной корреляции. Значение выше 0,50 обычно свидетельствует о положительной корреляции.
Понимание корреляции между двумя акциями (или одной акцией) и отраслью может помочь инвесторам оценить, как акции торгуются по сравнению с аналогами. Все типы ценных бумаг, включая облигации, сектора и ETF, можно сравнить с помощью коэффициента корреляции.
Отрицательная корреляция
Примеры отрицательной корреляции
Когда дело доходит до инвестирования, отрицательная корреляция не обязательно означает, что следует избегать ценных бумаг. Коэффициент корреляции может помочь инвесторам диверсифицировать свой портфель, включив в него набор инвестиций, имеющих отрицательную или низкую корреляцию с фондовым рынком. Короче говоря, при снижении риска волатильности в портфеле иногда все же привлекаются противоположности.
Коэффициент линейной корреляции
Даже для небольших наборов данных вычисления коэффициента линейной корреляции могут оказаться слишком длинными, чтобы их можно было выполнять вручную. Таким образом, данные часто загружаются в калькулятор или, что более вероятно, в компьютер или статистическую программу, чтобы найти коэффициент.
Коэффициент Пирсона
Простая линейная регрессия описывает линейную связь между переменной ответа (обозначенной y) и независимой переменной (обозначенной x) с использованием статистической модели. Статистические модели используются для прогнозов.
Краткий обзор
Упростите линейную регрессию, вычислив корреляцию с помощью такого программного обеспечения, как Excel.
В финансах, например, корреляция используется в нескольких анализах, включая расчет стандартного отклонения портфеля. Поскольку это требует много времени, корреляцию лучше всего рассчитать с помощью такого программного обеспечения, как Excel. Корреляция объединяет статистические концепции, а именно дисперсию и стандартное отклонение. Дисперсия – это дисперсия переменной вокруг среднего значения, а стандартное отклонение – это квадратный корень из дисперсии.
Поиск корреляции с помощью Excel
В Excel есть несколько методов расчета корреляции. Самый простой – получить два набора данных рядом и использовать встроенную формулу корреляции:
Если вы хотите создать корреляционную матрицу для ряда наборов данных, в Excel есть подключаемый модуль анализа данных, который находится на вкладке «Данные» в разделе «Анализ».
Выберите таблицу доходов. В этом случае наши столбцы имеют заголовки, поэтому мы хотим установить флажок «Ярлыки в первой строке», чтобы Excel обрабатывал их как заголовки. Затем вы можете выбрать вывод на том же листе или на новом листе.
Как только вы нажмете Enter, данные будут созданы автоматически. Вы можете добавить текст и условное форматирование, чтобы очистить результат.
Часто задаваемые вопросы о коэффициенте линейной корреляции
Что такое коэффициент линейной корреляции?
Коэффициент линейной корреляции – это число, вычисленное на основе заданных данных, которое измеряет силу линейной связи между двумя переменными, x и y.
Как найти коэффициент линейной корреляции?
Корреляция объединяет несколько важных и связанных статистических концепций, а именно дисперсию и стандартное отклонение. Дисперсия – это дисперсия переменной вокруг среднего значения, а стандартное отклонение – это квадратный корень из дисперсии.
Вычисления слишком длинные, чтобы их можно было выполнять вручную, и программное обеспечение, такое как Excel или статистическая программа, является инструментами, используемыми для вычисления коэффициента.
Что подразумевается под линейной корреляцией?
Как найти коэффициент линейной корреляции на калькуляторе?
Графический калькулятор необходим для расчета коэффициента корреляции.Следующие инструкции предоставлены Statology.
Шаг 1. Включите диагностику
Вам нужно будет сделать этот шаг на калькуляторе только один раз. После этого вы всегда можете начать с шага 2 ниже. Если вы этого не сделаете, r (коэффициент корреляции) не будет отображаться при запуске функции линейной регрессии.
Нажмите [2nd], а затем [0], чтобы войти в каталог вашего калькулятора. Прокрутите, пока не увидите «DiagnosticsOn».
Нажимайте Enter, пока на экране калькулятора не появится надпись «Готово».
Это важно повторить: вам никогда не придется делать это снова, если вы не перезагрузите калькулятор.
Шаг 2: введите данные
Введите свои данные в калькулятор, нажав [STAT], а затем выбрав 1: Edit. Чтобы упростить задачу, вы должны ввести все свои «данные x» в L1 и все «данные y» в L2.
После того, как вы введете свои данные, вы перейдете к [STAT], а затем к меню CALC вверху. Наконец, выберите 4: LinReg и нажмите Enter.
Это оно! Готово! Теперь вы можете просто считать коэффициент корреляции прямо с экрана (его r). Помните, что если r не отображается на вашем калькуляторе, необходимо включить диагностику. Это то же самое место на калькуляторе, где вы найдете уравнение линейной регрессии и коэффициент детерминации.
Коэффициент линейной корреляции может быть полезен при определении взаимосвязи между инвестициями и рынком в целом или другими ценными бумагами. Его часто используют для прогнозирования доходности фондового рынка. Это статистическое измерение полезно во многих отношениях, особенно в финансовой отрасли. Например, это может быть полезно для определения того, насколько хорошо взаимный фонд ведет себя по сравнению с его эталонным индексом, или его можно использовать для определения того, как взаимный фонд ведет себя по отношению к другому фонду или классу активов. Добавляя взаимный фонд с низкой или отрицательной корреляцией к существующему портфелю, можно получить преимущества диверсификации.
Коэффициент корреляции Пирсона: онлайн калькулятор
Характеристики распределений
Основная задача анализа вариационных рядов – это выявление подлинной закономерности распределения, которая достигается увеличением объема исследуемой совокупности при одновременном уменьшении интервала ряда.
Равномерное распределение
Графическое представление Функция плотности равномерного распределения Функция плотности равномерного распределения | Математическое ожидание: M[X] = (a+b)/2 Дисперсия: |
Нормальное распределение
Графическое представление Плотность распределения Плотность распределения | Математическое ожидание: M[X]=a Дисперсия: D[X] = σ 2 Дисперсия: D[X] = σ 2 Запись Х |
N( a ;>Х распределена по нормальному закону с параметрами a и σ.
Что такое корреляция
Корреляция – это связь. Но не любая. В чем же ее особенность? Рассмотрим на примере.
Представьте, что вы едете на автомобиле. Вы нажимаете педаль газа – машина едет быстрее. Вы сбавляете газ – авто замедляет ход. Даже не знакомый с устройством автомобиля человек скажет: «Между педалью газа и скоростью машины есть прямая связь: чем сильнее нажата педаль, тем скорость выше».
Это зависимость функциональная – скорость выступает прямой функцией педали газа. Специалист объяснит, что педаль управляет подачей топлива в цилиндры, где происходит сжигание смеси, что ведет к повышению мощности на вал и т.д. Это связь жесткая, детерминированная, не допускающая исключений (при условии, что машина исправна).
Теперь представьте, что вы директор фирмы, сотрудники которой продают товары. Вы решаете повысить продажи за счет повышения окладов работников. Вы повышаете зарплату на 10%, и продажи в среднем по фирме растут. Через время повышаете еще на 10%, и опять рост. Затем еще на 5%, и опять есть эффект. Напрашивается вывод – между продажами фирмы и окладом сотрудников есть прямая зависимость – чем выше оклады, тем выше продажи организации. Такая же это связь, как между педалью газа и скоростью авто? В чем ключевое отличие?
Правильно, между окладом и продажами заисимость не жесткая. Это значит, что у кого-то из сотрудников продажи могли даже снизиться, невзирая на рост оклада. У кого-то остаться неизменными. Но в среднем по фирме продажи выросли, и мы говорим – связь продаж и оклада сотрудников есть, и она корреляционная.
В основе функциональной связи (педаль газа – скорость) лежит физический закон. В основе корреляционной связи (продажи – оклад) находится простая согласованность изменения двух показателей. Никакого закона (в физическом понимании этого слова) за корреляцией нет. Есть лишь вероятностная (стохастическая) закономерность.
Численное выражение корреляционной зависимости
Итак, корреляционная связь отражает зависимость между явлениями. Если эти явления можно измерить, то она получает численное выражение.
Полученное число называется коэффициентом корреляции. Для его правильной интерпретации важно учитывать следующее:
Прямая и обратная
Знак плюс перед коэффициентом указывает на то, что связь между явлениями или показателями прямая. То есть, чем больше один показатель, тем больше и другой. Выше оклад – выше продажи. Такая корреляция называется прямой, или положительной.
Сильная и слабая
Чем ниже численное значение коэффициента, тем взаимосвязь между явлениями и показателями меньше.
Рассмотрим пример. Взяли 10 студентов и измерили у них уровень интеллекта (IQ) и успеваемость за семестр. Расположили эти данные в виде двух столбцов.
Испытуемый
Успеваемость (баллы)
Посмотрите внимательно на данные в таблице. От 1 до 10 испытуемого растет уровень IQ. Но также растет и уровень успеваемости. Из любых двух студентов успеваемость будет выше у того, у кого выше IQ. И никаких исключений из этого правила не будет.
Перед нами пример полного, 100%-но согласованного изменения двух показателей в группе. И это пример максимально возможной положительной взаимосвязи. То есть, корреляционная зависимость между интеллектом и успеваемостью равна 1.
Рассмотрим другой пример. У этих же 10-ти студентов с помощью опроса оценили, в какой мере они ощущают себя успешными в общении с противоположным полом (по шкале от 1 до 10).
Испытуемый
Успех в общении с противоположным полом (баллы)
Смотрим внимательно на данные в таблице. От 1 до 10 испытуемого растет уровень IQ. При этом в последнем столбце последовательно снижается уровень успешности общения с противоположным полом. Из любых двух студентов успех общения с противоположным полом будет выше у того, у кого IQ ниже. И никаких исключений из этого правила не будет.
А как понять смысл корреляции равной нулю (0)? Это значит, связи между показателями нет. Еще раз вернемся к нашим студентам и рассмотрим еще один измеренный у них показатель – длину прыжка с места.
Испытуемый
Длина прыжка с места (м)
Не наблюдается никакой согласованности между изменением IQ от человека к человеку и длинной прыжка. Это и свидетельствует об отсутствии корреляции. Коэффициент корреляции IQ и длины прыжка с места у студентов равен 0.
Мы рассмотрели крайние случаи. В реальных измерениях коэффициенты редко бывают равны точно 1 или 0. При этом принята следующая шкала:
Приведенная градация дает очень приблизительные оценки и в таком виде редко используются в исследованиях.
Чаще используются градации коэффициентов по уровням значимости. В этом случае реально полученный коэффициент может быть значимым или не значимым. Определить это можно, сравнив его значение с критическим значением коэффициента корреляции, взятым из специальной таблицы. Причем эти критические значения зависят от численности выборки (чем больше объем, тем ниже критическое значение).
Корреляционный анализ в психологии
Корреляционный метод выступает одним из основных в психологических исследованиях. И это не случайно, ведь психология стремится быть точной наукой. Получается ли?
В чем особенность законов в точных науках. Например, закон тяготения в физике действует без исключений: чем больше масса тела, тем сильнее оно притягивает другие тела. Этот физический закон отражает связь массы тела и силы притяжения.
В психологии иная ситуация. Например, психологи публикуют данные о связи теплых отношений в детстве с родителями и уровня креативности во взрослом возрасте. Означает ли это, что любой из испытуемых с очень теплыми отношениями с родителями в детстве будет иметь очень высокие творческие способности? Ответ однозначный – нет. Здесь нет закона, подобного физическому. Нет механизма влияния детского опыта на креативность взрослых. Это наши фантазии! Есть согласованность данных (отношения – креативность), но за ними нет закона. А есть лишь корреляционная связь. Психологи часто называют выявляемые взаимосвязи психологическими закономерностями, подчеркивая их вероятностный характер – не жесткость.
Пример исследования на студентах из предыдущего раздела хорошо иллюстрирует использование корреляций в психологии:
Вот как могли выглядеть краткие выводы по результатам придуманного исследования на студентах:
Таким образом, уровень интеллекта студентов выступает позитивным фактором их академической успеваемости, в то же время негативно сказываясь на отношениях с противоположным полом и не оказывая значимого влияния на спортивные успехи, в частности, способность к прыгать с места.
Как видим, интеллект помогает студентам учиться, но мешает строить отношения с противоположным полом. При этом не влияет на их спортивные успехи.
Неоднозначное влияние интеллекта на личность и деятельность студентов отражает сложность этого феномена в структуре личностных особенностей и важность продолжения исследований в этом направлении. В частности, представляется важным провести анализ взаимосвязей интеллекта с психологическими особенностями и деятельностью студентов с учетом их пола.
Как работает функция ПИРСОН в Excel?
Рассмотрим пример расчета корреляции Пирсона между двумя массивами данных при помощи функции PEARSON в MS EXCEL. Первый массив представляет собой значения температур, второй давление в определенный летний период. Пример заполненной таблицы изображен на рисунке:
Пример решения с функцией ПИРСОН при анализе в Excel
Для чего нужен коэффициент корреляции?
Случайные величины, связанные между собой, могут иметь совершенно разную природу этой связи. Не обязательно она будет функциональной, случай, когда прослеживается прямая зависимость между величинами. Чаще всего на обе величины действует целая совокупность разнообразных факторов, в случаях, когда они являются общими для обеих величин, наблюдается формирование связанных закономерностей.
Это значит, что доказанный статистически факт наличия связи между величинами не является подтверждением того, что установлена причина наблюдаемых изменений. Как правило, исследователь делает вывод о наличии двух взаимосвязанных следствий.
Свойства коэффициента корреляции
Этой статистической характеристике присущи следующие свойства:
Значения коэффициента корреляции
Охарактеризовать силу корреляционной связи можно прибегнув к шкале Челдока, в которой определенному числовому значению соответствует качественная характеристика.
В случае положительной корреляции при значении:
Шкала может использоваться и для отрицательной корреляции. В этом случае качественные характеристики заменяются на противоположные.
Можно воспользоваться упрощенной шкалой Челдока, в которой выделяется всего 3 градации силы корреляционной связи:
История разработки критерия корреляции
Критерий корреляции Пирсона был разработан командой британских ученых во главе с Карлом Пирсоном (1857-1936) в 90-х годах 19-го века, для упрощения анализа ковариации двух случайных величин. Помимо Карла Пирсона над критерием корреляции Пирсона работали также Фрэнсис Эджуорт и Рафаэль Уэлдон.
Для чего используется критерий корреляции Пирсона?
Критерий корреляции Пирсона позволяет определить, какова теснота (или сила) корреляционной связи между двумя показателями, измеренными в количественной шкале. При помощи дополнительных расчетов можно также определить, насколько статистически значима выявленная связь.
Например, при помощи критерия корреляции Пирсона можно ответить на вопрос о наличии связи между температурой тела и содержанием лейкоцитов в крови при острых респираторных инфекциях, между ростом и весом пациента, между содержанием в питьевой воде фтора и заболеваемостью населения кариесом.
Условия и ограничения применения критерия хи-квадрат Пирсона
Например, рост ребенка зависит от его возраста, то есть чем старше ребенок, тем он выше. Если мы возьмем двух детей разного возраста, то с высокой долей вероятности рост старшего ребенка будет больше, чем у младшего. Данное явление и называется зависимостью, подразумевающей причинно-следственную связь между показателями. Разумеется, между ними имеется и корреляционная связь, означающая, что изменения одного показателя сопровождаются изменениями другого показателя.
В другой ситуации рассмотрим связь роста ребенка и частоты сердечных сокращений (ЧСС). Как известно, обе эти величины напрямую зависят от возраста, поэтому в большинстве случаев дети большего роста (а значит и более старшего возраста) будут иметь меньшие значения ЧСС. То есть, корреляционная связь будет наблюдаться и может иметь достаточно высокую тесноту. Однако, если мы возьмем детей одного возраста, но разного роста, то, скорее всего, ЧСС у них будет различаться несущественно, в связи с чем можно сделать вывод о независимости ЧСС от роста.
Приведенный пример показывает, как важно различать фундаментальные в статистике понятия связи и зависимости показателей для построения верных выводов.
Выборочный коэффициент корреляции
Коэффициент корреляции обычно рассчитывают по выборке. Значит, у аналитика в распоряжении не истинное значение, а оценка, которая всегда ошибочна. Если выборка была репрезентативной, то истинное значение коэффициента корреляции находится где-то относительно недалеко от оценки. Насколько далеко, можно определить через доверительные интервалы.
Согласно Центральное Предельной Теореме распределение оценки любого показателя стремится к нормальному с ростом выборки. Но есть проблемка. Распределение коэффициента корреляции вблизи придельных значений не является симметричным. Ниже пример распределения при истинном коэффициенте корреляции ρ = 0,86.
В общем рассчитывать на свойства нормального распределения нельзя. Поэтому Фишер предложил провести преобразование выборочного коэффициента корреляции по формуле:
Распределение z для тех же r имеет следующий вид.
Намного ближе к нормальному. Стандартная ошибка z равна:
Далее исходя из свойств нормального распределения несложно найти верхнюю и нижнюю границы доверительного интервала для z. Определим квантиль стандартного нормального распределения для заданной доверительной вероятности, т.е. количество стандартных отклонений от центра распределения.
Теперь обратным преобразованием Фишера из z вернемся к r.
Нижняя граница r:
Это была теоретическая часть. Переходим к практике расчетов.
Как посчитать коэффициент корреляции в Excel
Корреляционный анализ в Excel лучше начинать с визуализации.
На диаграмме видна взаимосвязь двух переменных. Рассчитаем коэффициент парной корреляции с помощью функции Excel КОРРЕЛ. В аргументах нужно указать два диапазона.
Коэффициент корреляции 0,88 показывает довольно тесную взаимосвязь между двумя показателями. Но это лишь оценка, поэтому переходим к интервальному оцениванию.
Расчет доверительного интервала для коэффициента корреляции в Excel
— Делаем преобразование Фишера для r.
— На основе нормальной модели рассчитываем доверительный интервал для z.
— Делаем обратное преобразование Фишера из z в r.
Удивительно, но для преобразования Фишера в Excel есть специальная функция ФИШЕР.
Стандартная ошибка z легко подсчитывается с помощью формулы.
Значение 1,96 хорошо известно любому опытному аналитику. В пределах ±1,96σ от средней находится 95% нормально распределенных величин.
Используя z, стандартную ошибку и квантиль, легко определим доверительные границы z.
Последний шаг – обратное преобразование Фишера из z назад в r с помощью функции Excel ФИШЕРОБР. Получим доверительный интервал коэффициента корреляции.
Нижняя граница 95%-го доверительного интервала коэффициента корреляции – 0,724, верхняя граница – 0,953.
Надо пояснить, что значит значимая корреляция. Коэффициент корреляции статистически значим, если его доверительный интервал не включает 0, то есть истинное значение по генеральной совокупности наверняка имеет тот же знак, что и выборочная оценка.
Примеры расчета хи-квадрата Пирсона
Необходимо определить наличие влияния предшествующей степени нарушения кровообращения на исход комиссуротомии (хирургическое разделение спаек при стенозе клапанного отверстия сердца). Пациенты поступали на комиссуротомию с различными исходными уровнями нарушения кровообращения. После комиссуротомии пациенты были выписаны с различными исходами операции.
Таблица: наблюдаемые (Observed) частоты распределения влияния степени нарушения кровообращения на результаты операции комиссуротомии
Степень нарушения кровообращения | Всего больных | Выписан с хорошим результатом операции | Выписан с удовлетворительным результатом операции | Выписан с ухудшением |
II | 30 | 20 | 8 | 2 |
III | 80 | 43 | 20 | 17 |
IV | 60 | 10 | 40 | 10 |
Всего | 170 | 73 | 68 | 29 |
H0-гипотеза | 100% | 43% | 40% | 17% |
Первый этап
Расчет ожидаемых (Expected) величин (на основании групповых частот)
Второй этап
Сопоставление наблюдаемых и ожидаемых частот с нахождением их разницы (O-E)
Степень нарушения кровообращения | Выписан с хорошим результатом операции | Выписан с удовлетворительным результатом операции | Выписан с ухудшением |
II | +7 | -4 | -3 |
III | +9 | -12 | +3 |
IV | -16 | +16 | 0 |
Всего | 0 | 0 | 0 |
Третий этап
Рассчитываем сумму отношений квадрата разности значений и делим ожидаемые данные (хи-квадрат) (O-E) 2 /E
Степень нарушения кровообращения | Выписан с хорошим результатом операции | Выписан с удовлетворительным результатом операции | Выписан с ухудшением |
II | 49/13=3,77 | 16/12=1,33 | 9/5=1,80 |
III | 81/34=2,38 | 144/32=4,50 | 9/14=0,64 |
IV | 256/26=9,85 | 256/24=10,66 | 0/10*=0,10 |
Всего | 16 | 16,49 | 2,54 |
как видно из данной таблицы одно из ожидаемых значений равно 0, в данном случае будет подставлена 1, корректнее применить точный критерий Фишера (см. Условия применения хи-квадрата Пирсона)
Четвертый этап
Необходимо соотнести полученное значение хи-квадрата с критическим значением хи-квадрата.Возникает вопрос, откуда брать критическое значение? Критическое значение хи-квадрата, как и для большинства, статистических критериев зависит от степени свободы и уровня достоверности (alpha), который Вы выбираете.В нашем случае, наше количество степеней свободы равно (3-1)*(3-1)=4, уровень значимости, который мы хотим соблюсти равен 0,05Обратимся к таблице критических значение хи-квадрата:
Правильная интерпретация: Курение оказывает влияние на формирование повышенного артериального давления df=1, x 2 = 4,395, p