Слуцкий А.А. НЕПАРАМЕТРИЧЕСКИЙ КРИТЕРИЙ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ РЕЗУЛЬТАТА ОЦЕНКИ – КОЭФФИЦИЕНТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА

Введение

 

Потребность в непараметрическом критерии значимости результата оценки диктуется двумя обстоятельствами [1]

  1. принципиальной невозможностью достоверного тестирования ошибок расчётной регрессионной модели на нормальность распределения при малом – 15 и менее – числе наблюдений, что, по нашему опыту, является типичной ситуацией оценки;
  2. отрицательным результатом тестирования на нормальность распределения в случае большего числа наблюдений, принципиально позволяющих такое тестирование осуществить с применение стандартизированных тестов.

В этих условиях единственным выходом подтвердить не случайный, объективный характер результата оценки является рассмотрение имеющейся картины в рамках непараметрической статистики, игнорирующей требование к нормальному распределению – при рассмотрении в рамках непараметрической статистики наличие какого бы то ни было распределения данных либо полностью игнорируется, либо предполагается, что оно может быть любым.

Сразу отметим, что игнорирование наличия нормального распределения в непараметрической статистике возможно потребует определённой «платы» в виде увеличения числа наблюдений, минимально требуемых для подтверждения статистической значимости результата оценки. Однако, это ужесточение происходит не всегда, напротив, в случаях относительно слабой корреляции и относительно большого числа влияющих факторов непараметрическое рассмотрение может быть более «мягким», «лояльным».

 

Коэффициент ранговой корреляции Спирмена

 

Коэффициент ранговой корреляции Спирмена – это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых наблюдений и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента [2], [3].

Данный критерий был разработан и предложен для проведения корреляционного анализа в 1904 году Чарльзом Эдвардом Спирменом, английским психологом, профессором Лондонского и Честерфилдского университетов.

В принципе, коэффициент Спирмена в непараметрической статистике выполняет ту же роль, что и коэффициент корреляции Пирсона (r), квадратом которого является широко известный коэффициент детерминации (R2), в параметрической статистике.

Однако, для подтверждения статистической значимости на основании коэффициента корреляций Пирсона (F – критерий, критерий Фишера) данные должны быть распределены нормально, и/или выборка должна быть достаточно большой. Для корреляций Спирмена данные могут быть любыми.

При одном и том же объёме выборки и наличии подтверждённой нормальности распределения данных корреляция Пирсона дают более достоверный результат о взаимосвязях показателей, чем корреляция Спирмена.

Соответственно, для обеспечения одинаковой достоверности результата корреляция Спирмена естественным образом требует большего объёма выборки.

В то же время, если коэффициент Пирсона более чувствителен к случайным выбросам показателей, реагируя на наличие выбросов резким снижением, то на расчет коэффициента Спирмена такого рода выбросы не оказывают заметного влияния, поскольку то, на сколько именно из общей массы выделяется наблюдение, значения не имеет. Значение имеет только его численный ранг среди остальных наблюдений. Тем не менее, проверка однородности выборки данных – проверка на отсутствие выбросов и их удаление из выборки при обнаружении – является обязательной по чисто оценочным требованиям, поскольку выбросы в оценке – единичные объекты, имеющие иное ценообразование, нежели все остальные объекты в выборке – аналоги для объекта оценки.

Одним из важных свойств коэффициента Спирмена является возможность его применения малыми и относительно малыми размерами выборок — для оценки данных необходима выборка от 5 до 40 парных наблюдений [4], что делает его применение в оценке чрезвычайно актуальным. При этом, никаких альтернатив коэффициенту Спирмена в интервале числа наблюдении 15 и менее нам не известно [5].

Ещё одним существенным преимуществом критерия Спирмена является отсутствие требования линейности связи между исследуемыми параметрами. Однако, имеется ограничение, связанное с монотонностью изменения переменных.

Величина коэффициента корреляции Спирмена лежит в интервале +1 и -1. Он, как и коэффициент Пирсона, может быть положительным и отрицательным, характеризуя направленность связи между двумя признаками, измеренными в ранговой шкале.

[1] Слуцкий А.А. (2021), «На пороге» регрессионного анализа в оценке: Требования к объёму выборки и нормальности распределения ошибок, Теория, методология и практика оценки, 22.03.2021, http://tmpo.su/sluckij-a-a-na-poroge-regressionnogo-analiza-v-ocenke-trebovaniya-k-obyomu-vyborki-i-normalnosti-raspredeleniya-oshibok/

[2] Ермолаева О.Ю. (2003), Математическая статистика для психологов. Учебник, М.: Издательство Флинта, http://ich.tsu.ru/~ptara/course/stat-psih/ermolaev.pdf, MedStatistic.ru, Критерий Спирмена, https://medstatistic.ru/methods/methods9.html . Обучающий видеоролик: Корреляционный анализ Спирмена. Коэффициент корреляции Спирмена, https://www.youtube.com/watch?v=Vbt0nAuklng

[3] У критерия Спирмена есть ещё одно важное применение – в регрессионном анализе он используется в тесте на гомоскедастичность / не значимость гетероскедастичности используемых данных. Однако, это (асимптотическое) применение коэффициента Спирмена возможно только на больших размерах выборок. См., например, Тест ранговой корреляции Спирмена. Материал из Википедии – свободной энциклопедии, https://ru.wikipedia.org/wiki/Тест_ранговой_корреляции_Спирмена

[4] math.semestr.ru, Коэффициент ранговой корреляции Спирмена, https://math.semestr.ru/corel/spirmen.php

[5] Применение F – теста или t – теста (критерий Стьюдента) в этом случае связано с принятием нереалистичного предположения о нормальности распределения данных

Скачать полностью Непарметрический Критерий Значимости Результата Оценки