Сделай Сам Свою Работу на 5

По характеру связь может быть функциональной или корреляционной (статистической).





МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ

по дисциплине «Доказательная медицина»

К ПРАКТИЧЕСКОМУ ЗАНЯТИЮ № 6

ТЕМА: «Методы оценки связи между переменными»

 

 

Красноярск


Одной из задач большинства медико-биологических исследований, является выявление взаимной связи одного или нескольких явлений.

Свет в окне может означать (с той или иной вероятностью), что хозяева находятся дома, кашель с мокротой может означать заболевание хроническим бронхитом. Если в серии повторяющихся наблюдений один из признаков (или его часть) появляется одновременно с другим чаще, чем можно объяснить случайным стечением обстоятельств, то это служит основанием говорить о взаимосвязи, сопряженности появления этих признаков.

Постановка задачи в такого рода исследованиях обычно выглядит следующим образом: определить наличие и силу статистической связи какого-либо признака от одного или нескольких других признаков. Знание взаимосвязи отдельных признаков дает возможность решать одну из основных задач любого научного исследования: возможность предвидеть, прогнозировать развитие ситуации при изменении тех или иных известных характеристик объекта исследования.



Термин зависимость при статистической обработке медико-биологических исследований должен использоваться весьма осторожно. С помощью статистических методов можно дать только формальную оценку взаимосвязи. Попытки механически перенести данные статистических расчетов в объективную реальность могут привести к ошибочным выводам.

Например, утверждение: «Чем громче утром кричат воробьи, тем выше встает солнце», несмотря на явную несуразность, с точки зрения формальной статистики, вполне правомерно. Таким образом, термин «зависимость» в статистическом анализе подразумевает только статистическую оценку взаимосвязи.

 

Любые явления в окружающем нас мире могут быть связаны прямой или обратной связью. Эта характеристика называется направленностью связи.

По направленности связь может быть прямой или обратной.

Прямая (или положительная) связь характеризует зависимость, при которой увеличение или уменьшение значения одного признака ведет, соответственно, к увеличению или уменьшению – второго. Например, при увеличение температуры возрастает давление газа (при сохранении неизменным его объема). При уменьшении температуры – снижается и давление.



Обратная (или отрицательная) связь характеризуется такой зависимостью, когда при увеличении одного признака второй уменьшается или, наоборот, при уменьшении одного, второй – увеличивается. Обратная зависимость или обратная связь является основой нормального регулирования почти всех процессов жизнедеятельности любого организма.

По характеру связь может быть функциональной или корреляционной (статистической).

Функциональная зависимость – такой вид зависимости, когда каждому значению одного признака соответствует точное значение другого (зависимость может быть задана функцией). Например: взаимосвязь радиуса и длины окружности. Такую зависимость можно считать полной (исчерпывающей). Она полностью объясняет изменение одного признака изменением другого. Этот вид связи характерен для объектов, являющихся точкой приложения точных наук. В медико-биологических исследованиях сталкиваться с функциональной связью приходится крайне редко, поскольку объекты исследований имеют большую индивидуальную изменчивость. С другой стороны, характеристики биологических объектов зависят, как правило, от комплекса большого числа сложных взаимосвязей и не могут быть сведены к отношению двух или трех факторов.

Корреляционная зависимость – существует в том случае, когда при изменении величины одного признака наблюдается тенденция соответствующего изменения значений другого признака.



Например, при изменении роста человека меняется и масса тела. Однако, эта зависимость не является полной, т.е. функциональной. У людей с одинаковым ростом может быть разная масса тела, поскольку на нее влияют и многие другие факторы (питание, здоровье и т.п.). При оценке статистических связей можно говорить только о тенденции, когда возрастание одного признака вызывает тенденцию возрастания или уменьшения другого признака.

Корреляционная связь описывается с помощью различных статистических характеристик. Выбор характеристики для определения взаимосвязи обусловлен видом исследуемых признаков, способами их группировки и предполагаемым характером связи. Подчас, для выявления реально существующих взаимосвязей достаточно правильно составить статистическую таблицу распределения или построить наглядный график этого распределения.

 

Корреляционный анализ занимается измерением степени связи между двумя переменными (х и у). Вначале предполагаем, что как х, так и у — количественные величины, например, рост и вес.

Предположим, что есть пара величин (х, у), измеренных у каждого из пациентов в выборке. Мы можем отметить точку, соответствующую паре величин каждого пациента, на двухмерном графике рассеяния точек (рис 1,2,3). Обычно переменную х располагают на горизонтальной оси, а у — на вертикальной в той же диаграмме. Размещая точки для всех пациентов, получаем график рассеяния точек (корреляционное поле), который говорит о взаимосвязи между этими двумя переменными.

В результате могут возникнуть следующие ситуации:

Рисунок 1. Положительная (прямая) корреляционная связь

Рисунок 2. Отрицательная (обратная) корреляционная связь

 

Рисунок 3. Корреляционная связь отсутствует

 

Если на графике рассеяния точек построить прямую линию, наилучшим образом описывающую изображенные данные (расстояния от точек до прямой минимальны), то полученная прямая является линией регрессии. Расчет коэффициентов корреляции дает численную характеристику того, насколько близко находятся наблюдения к линии регрессии. Основными коэффициентами корреляции являются коэффициент корреляции Пирсона и коэффициент корреляции Спирмэна.

Свойства коэффициентов корреляции:

• Значения коэффициента корреляции изменяются в пределах от -1 до +1.

• Знак коэффициента корреляции показывает направление связи, увеличивается (положительный r, прямая связь) или уменьшается (отрицательный r, обратная связь) одна переменная, по мере того как увеличивается другая.

• Величина коэффициента корреляции указывает, как близко расположены точки к прямой линии. В частности, если r=+1 или r=-1, то имеется абсолютная (функциональная) корреляция по всем точкам, лежащим на линии (рис 1, рис. 2); если r=0, то линейной корреляции нет (рис. 3). Чем ближе r к крайним точкам (±1), тем больше степень линейной связи.

• Коэффициент корреляции безразмерен, т.е. не имеет единиц измерения.

• Величина коэффициента корреляции действительна только в диапазоне значений х и у в выборке. Невозможно заключить, что коэффициент будет иметь ту же величину при рассмотрении значений х или у, значительно больших, чем в выборке.

• Неважно, какой из признаков обозначить за х, а какой за у; х и у могут заменять друг друга, не влияя на величину r (rху~rух).

• Корреляция между х и у необязательно означает соотношение «причины и следствия».

Следует отметить, что в случае биологических факторов тот или иной характер связи сохраняется, как правило, только в определенном интервале изменений признаков. За пределами этого интервала связь может ослабнуть, стать прямо противоположной по направлению либо совсем исчезнуть.

Например, при увеличении возраста ребенка сила скелетной мускулатуры увеличивается. В зрелом возрасте такой связи уже нет. А в старших возрастных группах тенденция становится обратной.

 

Сила корреляционной связи между признаками оценивается по величине коэффициента корреляции согласно таблице 1:

Таблица 1

Распределение значений коэффициента линейной корреляции
Характеристики связи Прямая Обратная
Связи нет
Слабая от 0 до 0,3 от 0 до -0,3
Средняя от 0,3 до 0,7 от - 0,3 до -0,7
Сильная от 0,7 до 1 от - 0,7 до - 1
Полная (функциональная) + 1 -1

 

Случаи, в которых не следует рассчитывать коэффициент линейной корреляции:

• получено нелинейное соотношение между признаками, например, квадратичное соотношение (рис. 4, а);

• данные включают более одного наблюдения по каждому пациенту;

• присутствуют аномальные значения (рис. 4, б);

• данные содержат подгруппы пациентов, для которых средние уровни наблюдений, по крайней мере по одной из переменных, отличаются (рис. 4,в).

Рисунок 4. Диаграммы, показывающие, когда не следует рассчитывать коэффициент корреляции, (а) - соотношение нелинейно, (б) - при наличии выброса (выбросов), (в) - данные состоят из подгрупп.

 

Коэффициент корреляции Пирсона

Коэффициент корреляции Пирсона ( )определяет силу и направление связи только для количественных данных (x, y – значения исследуемых признаков, n –количество пар данных):

Условия для расчета коэффициента корреляции Пирсона:

· исследуемые признаки являются количественными;

· выборка состоит из независимых пар величин х и у;

· по крайней мере, одна из этих двух переменных нормально распределена.

Достоверность коэффициента корреляции устанавливается по величине средней ошибки. Поскольку коэффициент корреляции в клинических исследованиях рассчитывается обычно для ограниченного числа наблюдений, нередко возникает вопрос о надежности полученного коэффициента. С этой целью определяют среднюю ошибку коэффициента корреляции. При достаточно большом числе наблюдений (больше 100) средняя ошибка коэффициента корреляции ( ) вычисляется по формуле:

n – число наблюдений.

В том случае, если число наблюдений меньше 100 точнее определять среднюю ошибку коэффициента корреляции, по формуле:

С достаточной для медицинских исследований надежностью о наличии той или иной степени связи можно утверждать только тогда, когда величина коэффициента корреляции превышает или равняется величине трех своих ошибок (r ≥3mr). Обычно это отношение коэффициента корреляции (r) к его средней ошибке (mr) обозначают буквой tr:

Если tr≥3, то коэффициент корреляции является статистически значимым.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.