КОРРЕЛЯЦИЯ

КОРРЕЛЯЦИЯ (от франц. correlation— соотношение) в статистике понимается как взаимоотношение между изучаемыми статистическими величинами, рядами и группами; для определения наличия или отсутствия К. статистика пользуется особым методом. Метод К. применяется для определения параллелизма—прямого или обратного—в изменениях чисел в сравниваемых рядах. Путем отыскания коефициента корреляции статистика подходит к измерению самой меры или степени параллелизма между явлениями. Но внутренние причинные связи между разными факторами таким путем не отыскиваются, т. к. вопрос о причинности не разрешается одними лишь выкладками и приемами абстрактного статистического метода. Задача статистики не столько обнаруживать причинные зависимости, сколько помогать в обнаружении этих зависимостей другим наукам. «Статистик должен довольствоваться выявлением числовых соотношений—и только, предоставив объяснение этих различий и соотношений физиологии, метеорологии и другим специальным отраслям знания» (Wes-tergaard). Но если сама по себе статистика не в состоянии устанавливать причинность связей, то статистические группировки и построения значительно облегчают возможность установления причинных зависимостей: благодаря числовому выражению явлений и фактов для представителей специального знания открывается более легкая возможность всяких сравнений и сопоставлений (С. А. Новосельский). Коефициент К. был введен Гальтоном и Пирсоном (Galton, Pearson) в учение о вариациях и наследственности при учетах связей антропологических признаков у отдельных индивидуумов и родственников (цвет глаз и волос, плодородие матери и дочерей и т. п.). Далее метод К. получает применение при изучении явлений физ. развития человека (размеры роста, веса, окружности груди и т. д.). Наконец он распространяется и на области изучения социально-экономических явлений (соц. положение и смертность, плодовитость, брачность, туберкулез—возрасты и занятия и т. д.). Школой Пирсона и его последователями производится широ-разработка теории корреляции и ее математических обоснований. Надо заметить однако, что в среде некоторых видных специалистов-статистиков существует неко- торый скептицизм относительно перспектив метода К. в области сложных явлений соц. порядка. «Большой труд, который сопрягается с вычислениями К. для многочисленных рядов, не оправдывается результатами, т. к. то же достигается простыми сопоставлениями рядов при правильном распределении материала» (Westergaard).— Во всяком случае всеми признается, что установление и измерение параллелизма изучаемых явлений, даваемое методами К., представляет само по себе большую научную ценность. Оно содействует специальному исследованию в области изучения законов причинности и связи явлений в многоразличных областях научного исследования. Правда, при обнаружении параллелизма в рядах чисел необходим еще предварительный анализ для выяснения, не является ли этот параллелизм случайным результатом сосуществования событий при отсутствии действительной связи между ними. Логика и знакомство с изучаемыми явлениями дают возможность избегать ошибочных выводов в этом направлении. Логический анализ в этих случаях выступает на первое решающее место; статистический же метод помогает в оценке фактов связи (Новосельский) . Метод К. Основной материал для определения коефициента К. дается в виде статистических рядов, выражающих показания сопоставляемых факторов на протяжении времени, места и т. д. Задача—проследить изменчивость этих рядов и их взаимную связь в этой изменчивости: в какой мере нарастание чисел одного ряда сопровождается аналогичным нарастанием другого ряда или, наоборот, сопровождается убыванием другого ряда, или вообще никакой связанности рядов не наблюдается, или она наблюдается в слабой степени. Ясно, что в основу таких определений должна быть положена оценка отклонений от нек-рой нормы членов сравниваемых числовых рядов. Должны быть использованы отклонения от средней арифметической величины и квадратические отклонения в необходимых сочетаниях. Метод этот можно проверить на простом примере.—Дается задача: в г. Вене наблюдается значительное распространение перенаселенных жилищ, и в то же время среди населения распространен tbc. Существует ли корреляционная связь между этими двумя факторами (компонентами)? Если существует, то в какой мере? В городе 19 округов; в каждом из них известен процент перенаселенных жилищ (помещения с количеством 4 и более живущих на 1 комнату) и показатели смертности от tbc (на тысячу жителей). Расположение основного материала и процедура определения К. для разрешения задачи представлены в таблице (ст. 783—784) (Ф. Принцинг—«Методы сан. статистики»). Все городские округа располагаются на табличке в убывающем порядке по высоте показателя перенаселенности; соответственно округам располагаются числа туб. смертности. Уже простое сопоставление этих рядов (2 и 3) обнаруживает явственный параллелизм между ними (особенно наглядно, Процент Отклонения от средней Квадраты Округа города перенаселенных Смертность от величины Произведение отклонений отклонении Вены гкилищ (X) tbc (у) Dx D» Dxy.By л| к ' 8,9 5,1 + 4,6 + 1,4 +6,44 21,16 1,96 8,8 5,4 + 4,5 + 1,7 + 7,65 20,25 2,89 8,3 4,8 + 4,0 + 1,1 + 4,40 16;00 1,21 7,2 5,3 + 2,9 + 1,6 + 4,64 8,41 2,56 6,6 4,7 +2,3 + 1,0 + 2,30 5,29 1,00 6,3 4,6 + 2,0 + 0,9 + 1,80 4,00 0,81 5,8 3,3 + 1,5 -0,4 т0,60 2,25 0,16 5,1 4,0 + 0,8 + 0,3 + 0,24 0,64 0,00 5,0 3,0 + 0,7 -0,7 -0,49 0,49 0,49 4,1 3,4 -0,2 -0,3 + 0,06 0,04 0,09 3,9 3,6 -0,4 -0,1 + 0,04 0,16 0,01 3,4 3,6 -0,9 -0,1 + 0,09 0,81 0,01 2,5 3,7 -1,8 0,0 0,00 3,24 0,00 1,8 2,7 -2,5 -1,0 + 2,50 6,25 1,00 1,6 3,0 -2,7 -0,7 + 1,89 7,29 0,49 1,2 2,7 -3,1 -1,0 + 3,10 9,61 1,00 1Д 2,4 -3,2 -1,3 + 4,16 10,24 1,69 0,9 2,6 -3,4 -1,1 + 3,74 11,56 1,21 0,8 1Д -3,5 -2,6 +9,10 12,25 6,76 Среднее 4,3% Среднее 3,7%0 52,15 1,09 51,06 139,94 23,43 если эти данные нанести на график). Для обоих рядов отыскиваются средние арифметические величины (сумма всех чисел ряда делится на число членов); величины эти (4,3% для первого и 3,7°/00 Для второго ряда) кладутся в основание определения отклонений для членов каждого ряда. Отклонения эти (со знаком + в случаях превышения над средней и со знаком — в случаях недостижения среднего уровня) изображены на двух следующих вертикальных рядах таблицы (4 и 5). Далее производится для каждого члена ряда перемножение этих двух величин: в произведениях оба фактора вступают, так сказать, во взаимную связь (6 ряд); определяется сумма всех произведений (51,06). В последних рядах отклонения возводятся во 2-ю степень (D|, _D$) в целях получения квадратических отклонений (ряды 7 и 8) (см. Вариационная статистика). Все эти манипуляции имеют своей целью поставить в числовую связь показания обоих компонентов — перенаселенности и туберкулезной смертности по всем округам города. Самое определение коефициен-т а К. производится по формуле, предложенной для этой цели математиком Браве (Bravais, 1846): 2(Da;.D«) f =-----------------■L- . N.ox.oy Числитель дроби соответствует произведению отклонений обоих рядов, взятых в их сумме; знаменатель—произведению квадратических отклонений обоих рядов, помноженному на число членов ряда. Подставляя в эту формулу числовые значения нашей примерной таблицы, получаем: Числитель: V(Dx.Dy)= +51,06 Знаменатель: JV= 19 > (табл. ряд 6) ЛГ гву _/"2з74Т . л ЛЛГг 0^У ~ir=y -i9-= + 1'110a + 2,7139 (ряд 7) (ряд 8). Отсюда искомый коефициент К. равен + 51,06________ „ oq^ о 19x2,7139x1,1105-U'0yiD- Таков простой путь для определения кое-фициента К., к-рый в этом случае равняется дроби, близкой к единице. Величина этого коефициента вообще колеблется между 0 и ±1. В случаях, когда он равняется 0, между сопоставляемыми рядами не существует К., когда он равен +1 или —1, между рядами имеется полная положительная или отрицательная К. Для промежуточных величин может быть принята следующая условная шкала, предложенная Чеддоком (R. E. Chaddock): Величина г                Степень корреляции Менее 0,3.........            слабая 0,3—0,5...........            умеренная 0,5—0,7...........            заметная 0,7—0,9 ..........            высокая Более 0,9.........            весьма высокая Согласно этой схеме во взятом примере соотношений между перенаселенностью жилищ и туб. смертностью в Вене статистика устанавливает высокую степень корреляционной связи. С соц.-гиг. точки зрения это положение несомненно должно быть истолковано в том смысле, что сложный комплекс тяжелых условий жизни и быта, обычно сопрягающийся с перенаселенным и нездоровым жилищем, с недостаточным питанием, чрезмерным трудом, безработицей и т. д., является фактором, благоприятствующим высокой туберкулезной смертности в экс-плоатируемых классах населения. Таков способ решения задачи определения К. при простейших условиях (2 компонента); механизм усложняется при большем числе сопоставляемых рядов.-—Необходимо сделать еще одно примечание: определение коефициента К. нуждается в дополнении его вычислением средней ошибки (проверка); формула средней ошибки (г) при коефициенте г и числе членов ряда N такова: s = + —— • ~ V N ' в нашем случае мы будем иметь: 1-0,89162 i/i9 = ±0,047. Прибавление к вычисленному коефициен-ту К. утроенной средней ошибки и вычитание из него той же величины определяют пределы его возможных значений; положение это требует, чтобы коефициент К. превышал соответствующую ему среднюю ошибку по меньшей мере в ;i раза, иначе он теряет значение; в нашем примере это превышение ДОХОДИТ ПОЧТИ ДО 20 раз.                   П. Куркин. Корреляция в психологии применяется во многих случаях. 1. Для определения связи между различными псих, функциями. Так напр. если путем психологических исследований доказана К. между наблюдательностью и вниманием, то наличие наблюдательности дает основание ожидать у данного лица существование внимания. 2. Для определения связи между псих. функциями и соматическими, конституциональными и физиологич. признаками: изучение соматических конституций Кречме-ра доказало К. между ними и известными псих, чертами, и поэтому по соматическо- му status'у можно судить о характере данного человека. Так например пикническая конституция позволяет предположить у данного субъекта определенный характер. То же и по отношению к двигательной конституции: известный тип движений может характеризовать до известной степени характер данного лица. 3. Для определения связи между результатами тестовых испытаний и практическими достижениями, для характеристики отдельных тестов в отношении их надежности: если при исследовании известных псих, качеств при помощи тестов между ними получается значительная К., то этот тест может считаться надежным для выявления у других этого качества, что мы видим при профессиональном отборе. Лит.: Принцинг Ф., Методы санитарной статистики, Москва, 1925; Ритц Г., Математические методы в статистике, Москва, 1927; Романовский В., Элементы теории корреляции, Ташкент, 1928; Уиппль Дж. и Новосельский С, Основы демографической и санитарной статистики, гл. IV, М., 1929; Ч у п р о в А., Основные проблемы теории корреляции, Л., 1926. Корреляция в психологии.—Б еляев-Башки-р о в Б., Статистический метод в психологии и педологии, М., 1927; Бетц, Проблема корреляции в психологии, М., 1923.
Смотрите также:
  • КОРСАКОВ Сергей Сергеевич (1854— 1900), выдающийся психиатр; один из творцов современной русской психиатрии. По окончании в 1875 г. мед. факультета Моск. ун-та ...
  • КОРСЕТЫ, ортопедические аппараты, назначаемые как при заболеваниях, так и при искривлениях позвоночника. Цель корсета—фиксировать позвоночник в требуемом для лечения положении или завершить (закрепить) результаты, достигнутые другими методами. При помощи К. ...
  • КОРТИЕВ ОРГАН (КбHiker), названный по имени итальянского гистолога Корти (Corti), впервые подробно описавшего его [синоним papilla acustica basilaris (G. Retzi-us)], представляет собой концевой аппарат улитковой ветви слухового нерва (ram. ■cochlearis ...
  • КОРТИКО - НУКЛЕАРНЫЕ, -СПИНАЛЬНЫЕ ПУТИ, см. Пирамидные пути.
  • КОРЧАК - ЧЕПУРКОВСКИЙ Авксентий Васильевич (род. в 1857 г.), видный гигиенист-эпидемиолог, один из пионеров земского медико-сан. строительства, проф. Высшей мед. школы в Киеве, действительный член Всеукраинской академии наук (с 1921 г.), ...