Коэффициент корреляции знаков фехнера онлайн. Коэффициент корреляции в Excel

Выводы:

Полученная величина коэффициента корреляции знаков равна нулю, так как число совпадений и число несовпадений знаков равны. Это основной недостаток данного показателя. По этому показателю можно предполагать, что взаимосвязь отсутствует.

Линейный коэффициент корреляции

Проверка существенности коэффициента корреляции:

Выводы:

Полученная величина линейного коэффициента корреляции указывает на то, что связь между долей в общем объеме поставок сжигаемых видов топлива и ожидаемой продолжительностью жизни при рождении умеренна, свидетельствует о наличии обратной зависимости.

Следовательно, с вероятностью 95% можно предположить, что корреляционная связь все же существенна.

Эмпирическое корреляционное отношение:

Проверка значимости эмпирического корреляционного отношения:

Выводы:

Полученное значение эмпирического корреляционного отношения свидетельствует о умеренной связи между исследуемыми признаками.

Следовательно, с вероятностью 95% можно сделать вывод о несущественности корреляционной связи между анализируемыми показателями.

Коэффициент корреляции рангов Спирмэна:

Выводы:

По результатам расчета коэффициента Спирмэна можно предположить о наличии слабой обратной зависимости между долей в общем объеме поставок сжигаемых видов топлива и ожидаемой продолжительностью жизни при рождении.

Коэффициент корреляции рангов Кендэла:

Выводы:

По рассчитанному коэффициенту корреляции рангов можно полагать о наличии слабой обратной зависимости между исследуемыми признаками.

· Проверка возможности использования линейной функции в качестве формы взаимосвязи

Считается возможным применять линейное уравнение корреляционной зависимости, но для проверки гипотезы о линейной зависимости более эффективно использовать величину .

Выводы:

Следовательно, гипотеза о линейности связи между долей в общем объеме поставок сжигаемых видов топлива и ожидаемой продолжительностью жизни при рождении верна.



Страны со средним уровнем развития человеческого потенциала

· Выявление факта наличия взаимосвязи между факторным и результативным признаком

Аналитическая группировка

Эмпирическая линия регрессии


Выводы:

Сравнив средние значения результативного признака по группам, можно увидеть следующую тенденцию: чем выше доля в общем объеме поставок сжигаемых видов топлива, тем больше ожидаемая продолжительность жизни при рождении (если не учитывать скачки, возможно обусловленные прочими факторами), т. е. можно предположить наличие прямой корреляционной зависимости между признаками.

Поле корреляции


Выводы:

Основная часть единиц формирует облако, располагающееся в основном из левого нижнего угла системы координат в правый верхний угол, можно предположить наличие прямой взаимосвязи между признаками.

Корреляционная таблица

При группировке по факторному признаку число групп равняется 6. При группировке по результативному признаку установим число групп, равное числу групп по факторному признаку, т. е. . Также исключим страны, по которым отсутствуют данные по факторному признаку, число стран сократилось до тридцати, т. е. .

Теперь составляем корреляционную таблицу:

Корреляционная таблица Средняя ожидаемая продолжительность жизни при рождении, лет
52,0-57,2 57,2-62,4 62,4-67,6 67,6-70,1 70,1-72,6 72,6-75,1 Итого
Доля в общем объеме поставок сжигаемых видов топлива, % 15-30
30-45
45-60
60-75
75-90
90-100
Итого

Выводы:

Затруднительно определить направление корреляционной связи, в основном частоты в корреляционной таблице расположены на диагонали из левого верхнего угла в правый нижний угол, т. е. большим значениям факторного признака соответствуют большие значения результативного, следовательно, можно предположить наличие прямой корреляционной зависимости между признаками.

· Показатели оценки степени тесноты взаимосвязи

Следует упомянуть коэффициент Фехнера, характеризующий элементарную степень тесноты связи, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации.

Он основан на сравнении поведения отклонений индивидуальных значений каждого признака ( и ) от своей средней величины. При этом во внимание принимаются не величины отклонений , а их знаки («+» или «-»). Определив знаки отклонения от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений () и несовпадений ().

Коэффициент Фехнера ()рассчитывается как отношение разности чисел пар совпадений и несовпадений знаков к их сумме, т.е. к общему числу наблюдаемых единиц:

. (9.12)

Очевидно, что если знаки всех отклонений по каждому признаку совпадают, то и тогда . Это характеризует наличие прямой связи. Если все знаки не совпадают, то , а , что характеризует обратную связь. Коэффициент Фехнера, как и любой другой показатель тесноты связи, может принимать значения от -1 до +1.

Пример 9.3 . Имеются следующие данные о росте восьми пар братьев и сестер (таблица 9.2).

Таблица 9.2 - Данные о росте восьми пар братьев и сестер

Рост брата, см Рост сестры, см


Определить тесноту зависимости между ростом братьев и сестер на основе:

а) коэффициента Фехнера;

б) коэффициентов корреляции рангов Спирмэна и Кендэла.

Решение:

а) Рассчитаем средние величины и :

Определив знаки отклонения от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений () и несовпадений ():

.

Коэффициент Фехнера ()рассчитывается по формуле 9.8:

.

По величине коэффициента Фехнера () можно сделать вывод о весьма тесной зависимости между и .

б) По уже имеющимся данным (графы 1-2 таблицы 9.2) для нахождения коэффициентов корреляции рангов Спирмэна и Кендэла построим таблицу 9.3.

Таблица 9.3 – Расчетные значения, необходимые для исчисления коэффициентов корреляции рангов Спирмэна и Кендэла

Подсчет баллов
«+» «-»
6,5 6,5 1,5 1,5 6,5 6,5 -0,5 -1 -2 2,5 -0,5 -1,5 0,25 6,25 0,25 2,25 - -

В данном примере отдельные значения и повторяются. При ранжировании повторяющихся значений, им присваивается ранг, рассчитанный как средняя арифметическая из суммы мест, которые они занимают по возрастанию.

Расчет рангов показан в графах 3 и 4.

Для случая повторяющихся рангов есть особые скорректированные формулы и для коэффициента Спирмэна, и для коэффициента Кендэла. Однако на практике часто пользуются приведенной ранее формулой Спирмэна и для случая повторяющихся рангов, поскольку ошибку она дает весьма малую:

.

Формула коэффициента Кендэла для повторяющихся рангов имеет вид:

,

где , как и раньше, a и -показатели, корректирующие максимальную сумму баллов и определяемые по формуле , где - число повторяющихся рангов в соответствующем ряду и :

Так как значения рангов идут строго в возрастающем порядке, то следим лишь за поведением . После первой пары значений рангов, где в шести случаях идут значения и ни одного случая, где . Это означает, что в графу 7 мы ставим число «6», а в графу 8число «0». Далее после второй пары значений рангов, где в четырех случаях идут значения и ни одного случая, где . Это означает, что в графу 7 мы ставим число «4», а в графу 8число «0». ». В случае, если бы после второй пары значений рангов, где в трех случаях шли бы значения и два случая, где - это означало бы, что в графу 7 мы ставим число «3», а в графу 8число «2» и т.д.

Расчет и показан в графах 7 и 8. По результатам подсчетов .

Отсюда коэффициент корреляции рангов Кендэла:

По величине коэффициента () можно сделать вывод о весьма тесной зависимости между и , т.е. рост сестры весьма зависим от роста её брата.

Говоря о расчете коэффициента Кендэла, следует еще раз подчеркнуть, что если наблюдаемые единицы совокупности записаны неупорядоченно по одному из признаков (таблица 9.2.), то после ранжирования значений и , ранги одного из признаков, например , следует переписать, расположив их строго в порядке возрастания (или убывания), а для второго признака сохранить значения рангов, соответствующие значениям каждого в исходных данных (таблица 9.3).

Коэффициент конкордации

Корреляция рангов ()может определяться не только для двух, но и для большего числа показателей (факторов). Исчисляемый в этом случае показатель именуется коэффициентом конкордации ()и рассчитывается по формуле:

, (9.13)

где - количество коррелируемых факторов;

Число наблюдений;

- сумма квадратов отклонений суммы рангов по факторам от их средней арифметической, т.е.

а) или, что по значению тоже самое, (9.14)

б) где - ранг -го показателя. (9.15)

Коэффициент конкордации часто используется в экспертных оценках для определения согласованности мнений экспертов в распределение мест (рангов) между исследуемыми факторами или объектами по их приоритетности.

Пример 9.4. Пусть имеются следующие данные по пяти фирмам (графы 1-4 таблицы 9.4).

Таблица 9.4 – Исходные данные и промежуточные расчеты коэффициентов конкордации

Фирма Прибыль, тыс. руб. Стоимость оборотных средств, млн. руб. Затраты на 100 руб. продукции, руб. Ранги факторов Сумма рангов Квадрат суммы рангов
2,0 2,5 1,8 2,2 2,4
Σ

Определить тесноту зависимости между с помощью коэффициента конкордации.

Решение:

1. Ранжираем каждый и трех показателей (графы 5-7).

2. Находим сумму рангов по каждой строке (графа 8) и общую сумму пяти строк

3. Возводим в квадрат сумму рангов в каждой строке и находим сумму пяти строк (графа 9):

.

4. Находим , используя формулу 9.11:

.

5. Рассчитаем коэффициент конкордации:

Учитывая малое значение коэффициента конкордации, можно сказать, что зависимость между рассматриваемыми показателями весьма незначительна.

Существуют и другие коэффициенты для измерения тесноты зависимости (коэффициенты ассоциации и контингенции ; коэффициент взаимной сопряженности Пирсона ; коэффициент Чупрова ), которые применяются достаточно редко.

Непараметрические методы

Применение корреляционного и регрессионного анализа требует, чтобы все признаки были количественно измеренными. Построение аналитических группировок предполагает, что количественным должен быть результативный признак. Параметрические методы основаны на использовании основных количественных параметров распределения (средних величин и дисперсий).

Вместе с тем в статистике применяются также непараметрические методы , с помощью которых устанавливается связь между качественными (атрибутивными) признаками . Сфера их применения шире, чем параметрических, поскольку не требуется соблюдения условия нормальности распределения зависимой переменной, однако при этом снижается глубина исследования связей. При изучении зависимости между качественными признаками не ставится задача представления ее уравнением. Здесь речь идет только об установлении наличия связи и измерении ее тесноты.

В практике статистических исследований приходится иногда анализировать связи между альтернативными признаками , представленными только группами с противоположными (взаимоисключающими) характеристиками. Тесноту связи в этом случае можно оценить, вычислив коэффициент ассоциации.

Для расчета коэффициента ассоциации строится четырехклеточная корреляционная таблица, которая носит название таблицы «четырех полей» и имеет следующий вид:

a b a+b
c d c+d
a+c b+d a+b+c+d

Применительно к таблице «четырех полей» с частотами и коэффициент ассоциации выражается формулой:

. (9.16)

Коэффициент ассоциации изменяется от -1 до +1; чем ближе к +1 или -1, тем сильнее связаны между собой изучаемые признаки.

Если не менее 0,3, то это свидетельствует о наличии связи между качественными признаками.

Пример 9.5 . Имеющиеся данные о росте отцов и сыновей представлены в таблице 9.5.

Таблица 9.5 - Распределение отцов и сыновей по росту, чел.

Рост сына Рост отца Всего
Ниже среднего Выше среднего
Ниже среднего
Выше среднего
Итого

Подсчитаем коэффициент ассоциации по данным таблицы 9.5:

Поскольку , между ростом отцов и сыновей существует корреляционная связь.

Если по каждому из взаимосвязанных признаков выделяется число групп более двух, то для подобного рода таблиц теснота связи между качественными признаками может быть измерена с помощью показателя взаимной сопряженности А.A. Чупрова:

(9.17)

где - число возможных значений первой статистической величины (число групп по столбцам);

Число возможных значений второй статистической величины (число групп по строкам);

Показатель взаимной сопряженности (определяется как сумма отношений квадратов частот клетки таблицы распределения к произведению итоговых частот соответствующего столбца и строки).

Вычтя из этой суммы единицу, получим .

Коэффициент взаимной сопряженности А.А. Чупрова изменяется от 0 до 1, но уже при значении 0,3 можно говорить о тесной связи между вариацией изучаемых признаков.

Пример 9.6. Данные об уровне образования членов 100 семей приведены в таблице 9.6.

Таблица 9.6- Распределение семей по уровню образования мужа и жены

Примечание: частоты - верхние строки; их квадраты (в скобках) - средние строки; квадраты частот, деленные на суммы частот по столбцу - нижние строки; в итоговых столбцах - сумма частот, сумма результатов деления (А), а также результат деления нижнего числа на верхнее - последний столбец (В).

Тогда , .

Коэффициент взаимной сопряженности А.А. Чупрова:

.

Его значение показывает заметную связь между уровнями образования мужа и жены при формировании семьи.

  • Ранговый коэффициент корреляции Кендалла.
    Расчетная формула имеет вид: Ранжируем все элементы по признаку х^, по ряду другого признака х 10 ): где иа/2 - квантиль, определяемый по таблице нормального распределения для выбранного уровня значимости а (например, для а = 0,05 получим иа/2 = 1,96). Если п 10, то рассчитывают...
    (Многомерные статистические методы в экономике)
  • Коэффициенты корреляции показателей состояния региональных подсистем с показателем инвестиций
    Коэффициент рождаемости -0,08 (р = 0,768) 0,10 (р = 0,707) Коэффициент смертности -0,36 (р = 0,158) -0,65 (р = 0,004) Коэффициент младенческой смертности -0,13 (р = 0,619) -0,40 (р = 0,113) Численность населения 0,98 (р = 0,000) 0,62 (р = 0,008) Ожидаемая продолжительность жизни при рождении, лет 0,20...
    (Развитие регионов: диагностика региональных различий)
  • Коэффициенты корреляции показателей состояния региональных подсистем с показателем инвестиций
    Коэффициент рождаемости -0,08 (р = 0,768) 0,10 (р = 0,707) Коэффициент смертности -0,36 (р = 0,158) -0,65 (р = 0,004) Коэффициент младенческой смертности -0,13 (р = 0,619) -0,40 (р = 0,113) Численность населения 0,98 (р = 0,000) 0,62 (р = 0,008) Ожидаемая продолжительность жизни при рождении, лет 0,20...
    (Развитие регионов: диагностика региональных различий)
  • Коэффициент корреляции рангов Спирмэна
    Данный коэффициент относится к ранговым, т. е. коррелируются не сами значения факторного и результативного признаков, а их ранги (номера их мест, занимаемых в каждом ряду значений по возрастанию или убыванию). Коэффициент корреляции рангов Спирмэна основан на рассмотрении разности рангов значений факторного...
    (Общая теория статистики)

Краткая теория

К простейшим показателям тесноты связи относят коэффициент корреляции знаков, который был предложен немецким ученым Г.Фехнером. Этот показатель основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Для его расчета вычисляют средние значения результативного и факторного признаков, а затем проставляют знаки отклонений для всех значений взаимосвязанных пар признаков.

Если ввести обозначения: – число совпадений знаков отклонений индивидуальных величин от средней, – число несовпадений знаков отклонений, то коэффициент Фехнера можно записать таким образом:

Коэффициент Фехнера может принимать различные значения в пределах от -1 до +1. Если знаки всех отклонений совпадут, то и тогда показатель будет равен 1, что свидетельствует о возможном наличии прямой связи. Если же знаки всех отклонений будут разными, тогда и коэффициент Фехнера будет равен -1, что дает основание предположить наличие обратной связи.

Пример решения задачи

Условие задачи

Имеются данные о поголовье крупного рогатого скота по 12 сельхозпредприятиям на 1 января и среднегодовом надое молока на одну корову. Определите частоту связи между этими факторами, используя коэффициент корреляции Фехнера.

№ п/п сельскохозяйственных предприятий 1 1.2 35.8 2 1.6 30.0 3 2.8 34.8 4 1.8 31.3 5 2.9 36.9 6 3 37.1 7 1.6 27.9 8 1.7 30.0 9 2.6 35.8 10 1.3 32.1 11 2 29.1 12 3.3 34.3

Решение задачи

Составим расчетную таблицу:

№ п/п сельскохозяйственных предприятий Поголовье крупного рогатого скота на 1 января, тыс.голов Среднегодовой надой на одну корову, кг 1 1.2 35.8 1.44 1281.64 42.96 2 1.6 30 2.56 900 48 3 2.8 34.8 7.84 1211.04 97.44 4 1.8 31.3 3.24 979.69 56.34 5 2.9 36.9 8.41 1361.61 107.01 6 3 37.1 9 1376.41 111.3 7 1.6 27.9 2.56 778.41 44.64 8 1.7 30 2.89 900 51 9 2.6 35.8 6.76 1281.64 93.08 10 1.3 32.1 1.69 1030.41 41.73 11 2 29.1 4 846.81 58.2 12 3.3 34.3 10.89 1176.49 113.19 Итого 25.8 395.1 61.28 13124.15 864.89

Коэффициент Фехнера можно вычислить по формуле:

Число совпадений знаков отклонений индивидуальных величин от средней, , - число несовпадений знаков отклонений

1.2 35.8 1.6 30 2.8 34.8 1.8 31.3 2.9 36.9 3 37.1 1.6 27.9 1.7 30 2.6 35.8 1.3 32.1 2 29.1 3.3 34.3
Знаки отклонений от средней Совпадение ( или несовпадение знаков 1 - + b 2 - - a 3 + + a 4 - - a 5 + + a 6 + + a 7 - - a 8 - - a 9 + + a 10 - - a 11 - - a 12 + + a

Обычно такое значение показателя тесноты связи характеризует сильную зависимость, однако, следует иметь в виду, что поскольку коэффициент зависит только от знаков и не учитывает величину самих отклонений и от их средних величин, то он практически характеризует не столько тесноту связи, сколько ее наличие и направление.

На цену сильно влияет срочность решения (от суток до нескольких часов). Онлайн-помощь на экзамене/зачете осуществляется по предварительной записи.

Заявку можно оставить прямо в чате, предварительно скинув условие задач и сообщив необходимые вам сроки решения. Время ответа - несколько минут.

Коэффициент корреляции, предложенный во II–й половине XIX века Г. Т. Фехнером, является наиболее простой мерой связи между двумя переменными. Он основан на сопоставлении двух психологических признаков x i и y i , измеренных на одной и той же выборке, по сопоставлению знаков отклонений индивидуальных значений от среднего: и
. Вывод о корреляции между двумя переменными делается на основании подсчета числа совпадений и несовпадений этих знаков.

Пример

Пусть x i и y i – два признака, измеренные на одной и той же выборке испытуемых. Для вычисления коэффициента Фехнера необходимо вычислить средние значения для каждого признака, а также для каждого значения переменной – знак отклонения от среднего (табл. 8.1):

Таблица 8.1

x i

y i

Обозначение

В таблице: а – совпадения знаков, b – несовпадения знаков; n a – число совпадений, n b – число несовпадений (в данном случае n a = 4, n b = 6).

Коэффициент корреляции Фехнера вычисляется по формуле:

(8.1)

В рассматриваемом случае:

Вывод

Между исследуемыми переменными существует слабая отрицательная связь.

Необходимо отметить, что коэффициент корреляции Фехнера не является достаточно строгим критерием, поэтому его можно использовать лишь на начальном этапе обработки данных и для формулировки предварительных выводов.

8. 4. Коэффициент корреляции Пирсона

Исходный принцип коэффициента корреляции Пирсона – использование произведения моментов (отклонений значения переменной от среднего значения):

Если сумма произведений моментов велика и положительна, то х и у связаны прямой зависимостью; если сумма велика и отрицательна, то х и у сильно связаны обратной зависимостью; наконец, в случае отсутствия связи между x и у сумма произведений моментов близка к нулю.

Для того чтобы статистика не зависела от объема выборки, берется не сумма произведений моментов, а среднее значение. Однако деление производится не на объем выборки, а на число степеней свободы n - 1.

Величина
является мерой связи междух и у и называется ковариацией х и у .

Во многих задачах естественных и технических наук ковариация является вполне удовлетворительной мерой связи. Ее недостатком является то, что диапазон ее значений не фиксирован, т. е. она может варьировать в неопределенных пределах.

Для того чтобы стандартизировать меру связи, необходимо избавить ковариацию от влияния стандартных отклонений. Для этого надо разделить S xy на s x и s y:

(8.3)

где r xy - коэффициент корреляции, или произведение моментов Пирсона.

Общая формула для вычисления коэффициента корреляции выглядит следующим образом:

(некоторые преобразования)

(8.4)

Влияние преобразования данных на r xy:

1. Линейные преобразования x и y типа bx + a и dy + c не изменят величину корреляции между x и y .

2. Линейные преобразования x и y при b < 0, d > 0, а также при b > 0 и d < 0 изменяют знак коэффициента корреляции, не меняя его величины.

Достоверность (или, иначе, статистическая значимость) коэффициента корреляции Пирсона может быть определена разными способами:

По таблицам критических значений коэффициентов корреляции Пирсона и Спирмена (см. Приложение, табл. XIII). Если полученное в расчетах значение r xy превышает критическое (табличное) значение для данной выборки, коэффициент Пирсона считается статистически значимым. Число степеней свободы в данном случае соответствует n – 2, где n – число пар сравниваемых значений (объем выборки).

По таблице XV Приложений, которая озаглавлена «Количество пар значений, необходимое для статистической значимости коэффициента корреляции». В данном случае необходимо ориентироваться на коэффициент корреляции, полученный в вычислениях. Он считается статистически значимым, если объем выборки равен или превышает табличное число пар значений для данного коэффициента.

По коэффициенту Стьюдента, который вычисляется как отношение коэффициента корреляции к его ошибке:

(8.5)

Ошибка коэффициента корреляции вычисляется по следующей формуле:

где m r - ошибка коэффициента корреляции, r - коэффициент корреляции; n - число сравниваемых пар.

Рассмотрим порядок вычислений и определение статистической значимости коэффициента корреляции Пирсона на примере решения следующей задачи.

Условие задачи

22 старшеклассника были протестированы по двум тестам: УСК (уровень субъективного контроля) и МкУ (мотивация к успеху). Получены следующие результаты (табл. 8.2):

Таблица 8.2

УСК (x i )

МкУ (y i )

УСК (x i )

МкУ (y i )

Задание

Проверить гипотезу о том, что для людей с высоким уровнем интернальности (балл УСК) характерен высокий уровень мотивации к успеху.

Решение

1. Используем коэффициент корреляции Пирсона в следующей модификации (см. формулу 8.4):

Для удобства обработки данных на микрокалькуляторе (в случае отсутствия необходимой компьютерной программы) рекомендуется оформление промежуточной рабочей таблицы следующего вида (табл. 8.3):

Таблица 8.3

x i y i

x 1 y 1

x 2 y 2

x 3 y 3

x n y n

Σx i y i

2. Проводим вычисления и подставляем значения в формулу:

3. Определяем статистическую значимость коэффициента корреляции Пирсона тремя способами:

1-й способ:

В табл. XIII Приложений находим критические значения коэффициента для 1-го и 2-го уровней значимости: r кр. = 0,42; 0,54 (ν = n – 2 = 20).

Делаем вывод о том, r xy > r кр . , т. е. корреляция является статистически значимой для обоих уровней.

2-й способ:

Воспользуемся табл. XV, в которой определяем число пар значений (число испытуемых), достаточное для статистической значимости коэффициента корреляции Пирсона, равного 0,58: для 1-го, 2-го и 3-го уровней значимости оно составляет, соответственно, 12, 18 и 28.

Отсюда мы делаем вывод о том, что коэффициент корреляции является значимым для 1-го и 2-го уровня, но «не дотягивает» до 3-го уровня значимости.

3-й способ:

Вычисляем ошибку коэффициента корреляции и коэффициент Стьюдента как отношение коэффициента Пирсона к ошибке:

В табл. X находим стандартные значения коэффициента Стьюдента для 1-го, 2-го и 3-го уровней значимости при числе степеней свободы ν = n – 2 = 20: t кр. = 2,09; 2,85; 3,85.

Общий вывод

Корреляция между показателями тестов УСК и МкУ является статистически значимой для 1-го и 2-го уровней значимости.

Примечание:

При интерпретации коэффициента корреляции Пирсона необходимо учитывать следующие моменты:

    Коэффициент Пирсона может использоваться для различных шкал (шкала отношений, интервальная или порядковая) за исключением дихотомической шкалы.

    Корреляционная связь далеко не всегда означает связь причинно-следственную. Другими словами, если мы нашли, предположим, положительную корреляцию между ростом и весом у группы испытуемых, то это вовсе не означает, что рост зависит от веса или наоборот (оба этих признака зависят от третьей (внешней) переменной, каковая в данном случае связана с генетическими конституциональными особенностями человека).

    r xu » 0 может наблюдаться не только при отсутствии связи между x и y , но и в случае сильной нелинейной связи (рис. 8.2 а). В данном случае отрицательная и положительная корреляции уравновешиваются и в результате создается иллюзия отсутствия связи.

    r xy может быть достаточно мал, если сильная связь между х и у наблюдается в более узком диапазоне значений, чем исследуемый (рис. 8.2 б).

    Объединение выборок с различными средними значениями может создавать иллюзию достаточно высокой корреляции (рис. 8.2 в).

y i y i y i

+ + . .

x i x i x i

Рис. 8.2. Возможные источники ошибок при интерпретации величины коэффициента корреляции (объяснения в тексте (пункты 3 – 5 примечания))


Top