Пример за корелационен коефициент на Фехнер. Корелационен и регресионен анализ. Коефициент на рангова корелация на Kendall

Когато има корелация, заедно с изследвания фактор или няколко фактора в случай на множествена корелация, полученият знак се влияе от други фактори, които не се вземат предвид или не могат да бъдат точно взети предвид. В този случай тяхното действие може да бъде насочено както към повишаване на ефективната характеристика, така и към нейното намаляване. Така че изследването на връзката се извършва в условия, при които тази връзка е в по-голяма или по-малка степен затъмнена от противоречивото действие на други причини. Следователно една от задачите на корелационния анализ е да се определи близостта на връзката между характеристиките, да се определи силата на влиянието на изследвания фактор (фактори) върху получената характеристика.

Близостта на връзката в корелационния анализ се характеризира с помощта на специален относителен показател, който се нарича коефициент на корелация.

При двойна линейна зависимост плътността на връзката се определя с помощта на линейния корелационен коефициент

Коефициентът на корелация варира от 0 Да се±1. c Ако коефициентът на корелация е нула, тогава няма връзка, а ако е единица, тогава връзката е функционална. Знакът на коефициента на корелация показва посоката на връзката ("+" - прав"-" - обратен). Колкото по-близък е коефициентът на корелация до единица, толкова по-тясна е връзката между характеристиките.

Квадратът на корелационния коефициент се нарича коефициент на детерминация (r2). Той показва каква част от общата вариация на получената характеристика се определя от изследвания фактор. Ако коефициентът на детерминация е изразен като процент, тогава той трябва да се чете по следния начин: вариацията (флуктуациите) на зависимата променлива с толкова много проценти се дължи на вариацията на фактора.

Между коефициента на линейна корелация (r) и коефициента на пълна регресияб) Връзка:

Следователно, знаейки коефициента на корелация (r) и стойностите на стандартните отклонения зах ИVможете да определите коефициента на регресия (b) и обратно, като знаете коефициента на регресия (b) и съответните стандартни отклонения, можете да изчислите коефициента на корелация (r).

При сдвоена линейна зависимост коефициентът на корелация и пълният коефициент на регресия имат еднакви знаци (плюс, минус).

Коефициентът на линейна корелация е предназначен да оцени степента на близост на връзката с линейна връзка. За случаите на нелинейна зависимост между характеристиките се използва друга формула за коефициента на корелация, която следва от правилото за добавяне на дисперсии:

От горното равенство става ясно, че колкото по-голямо е влиянието на даден фактор върху ефективния атрибут, толкова повече неговата стойност на дисперсията („m.gr) се доближава до стойността на общата дисперсия на ефективния атрибут.

Съответно, колкото повече "м.гри по-малко ае.гртолкова по-тясна е връзката между характеристиките и обратно. Следователно съотношението на междугруповите (факториални) и общите дисперсии се използва за оценка на силата на връзката между характеристиките. Формулата на коефициента на корелация е:

Като се има предвид, че шосг2я = о-а-огля!>, формулата за корелационния коефициент може да бъде представена като

И двете формули на коефициента на корелация се използват за изчисляване на силата на връзката за всяка форма на връзка.

От правилото за добавяне на дисперсии става ясно, че стойността на корелационния коефициент варира от 0 до 1. Знакът на корелационния коефициент не се извежда от формулата. Ако се изследва връзката между две характеристики (проста корелация по двойки), тогава посоката на връзката (знакът пред r) се определя непосредствено след знака преди регресионния коефициент на линейното уравнение.

При сдвоена криволинейна зависимост близостта на връзката с линейна зависимост се определя с помощта на специален индикатор, подобен на корелационния коефициент r, разгледан по-горе.

Този индикатор (за да се подчертае принадлежността му към криволинейна връзка) се обозначава със символа u и се нарича корелационен индекс:

Числената стойност на индекса на корелация е подобна на коефициента на корелация: ако ig= 1 - връзката е функционална, ако ig= 0 - няма връзка; Колкото u е по-близо до единицата, толкова по-тясна е връзката между характеристиките.

Ако коефициентите на регресия на уравнението на комуникацията са известни, тогава индексът на корелация може да се определи с помощта на друга, по-проста формула. По този начин, с параболична зависимост, формулата на индекса на корелация може да бъде представена като

Силата на връзката при множествена корелация се определя с помощта на коефициента на множествена корелация (ee) и коефициент на множествена детерминация (її2).По съдържание те са подобни на коефициентите на корелация и детерминация при комуникация по двойки. техните изчисления се основават на сравнение на междугрупови (факториални) и общи дисперсии:

Тази формула може да се приложи за определяне на плътността на връзката за всяка форма на връзка.

RF стойност варира от 0 до 1 и се счита за положителен, тъй като при множество зависимости връзката на получената характеристика с някои фактори може да бъде положителна, а с други - отрицателна.

В случай на зависимост на получената характеристика от два фактора, формулата за коефициента на множествена корелация има формата

където Gi са сдвоени коефициенти на линейна корелация.

Дадената формула се използва за определяне на плътността на връзката за линейна връзка.

За да се определи тясността на връзката между ефективната характеристика и всеки фактор, когато се изключи влиянието на други фактори, се определят частични коефициенти на корелация, които характеризират „чистото“ влияние на фактора върху ефективната характеристика. За изчисляването им се използват сдвоени коефициенти на корелация.

В случай на зависимост на получената характеристика от два фактора (x1 и x2), могат да се изчислят три частични коефициента на корелация:

1) между Vи x1 с изключение на влиянието на x2:

Коефициентите на корелация за сдвоени и множество връзки, както и индексът на корелация, са относителни стойности, така че могат да се използват за сравняване на силата на връзките за няколко явления, които се анализират.

Трябва да се има предвид, че показателите за близостта на връзката зависят от обхвата на вариация на изследваните характеристики. Колкото по-голяма е вариацията на променливите, толкова по-висока е стойността на показателите за близостта на връзката.

Нека определим близостта на връзката между изследваните характеристики за нашия пример. Тъй като има линейна връзка между продуктивността на кравите и нивото на хранене, ще определим близостта на връзката с помощта на линейния корелационен коефициент

Коефициентът на корелация показва, че има тясна (силна) връзка между продуктивността на кравите и нивото на хранене.

Коефициентът на детерминация r2 = 0,93442 = 0,8731 показва, че 87,31% от общата вариация в продуктивността на кравите се дължи на разликите в нивото на хранене, а останалите 12,69% (100 - 87,31) се дължат на други фактори, които не са в това случай беше взет под внимание.

Коефициентът на корелация може да се намери с помощта на други формули.

И някои коефициенти за класиране

В допълнение към тези, обсъдени в подт. 10.2 коефициент на кор-

Връзка, коефициент на детерминация, корелация

Носене, има и други коефициенти за оценка

Степента на близост на корелацията между изследваните

Феномени и формулата за намирането им е достатъчна

просто. Нека да разгледаме някои от тези коефициенти.

Коефициент на корелация на знака на Фехнер

Този коефициент е най-простият показател

Степента на близост на връзката е предложена от немски учен

Г. Фехнер. Този показател се основава на оценка на степента

Съгласуваност на посоките на отделните отклонения

Стойностите на фактора и произтичащите характеристики от съответните

Съответни средни стойности. За да го определите, изчислете

Показани са средните стойности на резултата () и факториела ().

признаци, а след това намерете признаци на отклонения от средното за

Всички стойности на резултатните и факторните характеристики. Ако

сравняваната стойност е по-голяма от средната, след което се поставя знак „+“,

и ако е по-малко - знакът "-". Съвпадение на знаци за индивидуално

серийни стойности хи y означава последователна вариация и техните

Непоследователността е нарушение на последователността.

Коефициентът на Фехнер се намира по следната формула:

, (10.40)

Където СЪС- брой съвпадения на отделни знаци за отклонение

Нови стойности от средната стойност;

N е броят на несъответствията в признаците на отклонения на индивида

Нови стойности от средната стойност.

Обърнете внимание, че -1 ≤ Kf≤ 1. Когато Kf= ±1 имаме пълна директна

взаимна или обратна съгласуваност. При Kf= 0 - връзка между

Няма редове от наблюдения.

Използвайки първоначалните данни от пример 10.1, изчисляваме коефициента

Ент Фехнер. Необходимите данни за определяне на местоположението му са

тим в таблицата. 10.4.

От масата 10.4 намираме това СЪС= 6; н= 0, следователно според формата-

le (10.40) получаваме: , т.е. пълна пряка зависимост

между кражби на оръжия ( х) и въоръжени престъпници

ями ( г). Получена стойност Kfпотвърждава направения извод

След изчисляване на коефициента на корелация става ясно, че

Между редовете x и y има доста близка права линия

Линейна зависимост.

Таблица 10.4

кражба

оръжия, х

въоръжен

престъпления, г

Признаци на отклонение от средното

773 4481 − −

1130 9549 − −

1138 8873 − −

1336 12160 + +

1352 18059 + +

1396 19154 + +

Коефициент на рангова корелация на Спирман

Този коефициент се отнася до класирането, т.е. корелацията

Не се определят стойностите на фактора и самите резултантни стойности;

Знаци и техните рангове (номера на техните места, заети във всеки ред

Стойности във възходящ или низходящ ред). Кор-

Ранговите отношения на Spearman се основават на отчитане на разликата

Ранове на стойностите на факторните и резултантни характеристики. За

за да го намерите, се използва следната формула:

, (10.41)

Къде е квадратът на разликата в ранга.

Нека изчислим коефициента на Спирман въз основа на данните

Пример 10.1. Тъй като стойността на разпознаването на факторите

ка хпървоначално ги подредихме във възходящ ред, след това серията хизбяга-

няма нужда от угояване. Класираме (от най-малката към най-голямата) серията г.

Всички необходими данни за изчислението са поставени в таблицата. 10.5.

Таблица 10.5

рангове Rgxред хрангове Ргиред г|ди| = |RgxiRgyi|

Сега, използвайки формула (10.41), получаваме

Обърнете внимание, че -1 ≤ ρ ° С≤ 1, т.е. получената стойност показва

Ясно е, че между кражбата на оръжие и въоръжената престъпност

Общо разбиране на корелационно-регресионния анализ

Формите и видовете връзки, които съществуват между явленията, са много разнообразни в своята класификация. са само тези, които имат количествен характер и се изследват с помощта на количествени методи. Нека разгледаме метода на корелационно-регресионния анализ, който е основен в изследването на връзките между явленията.

Този метод съдържа двете му съставни части— корелационен анализ и регресионен анализ. Корелационен анализе количествен метод за определяне на силата и посоката на връзката между променливите на извадката. Регресионен анализе количествен метод за определяне на вида на математическата функция в причинно-следствената връзка между променливите.

За оценка на силата на връзката в корелационната теория се използва скалата на английския статистик Чадок: слаба - от 0,1 до 0,3; умерено - от 0,3 до 0,5; забележимо - от 0,5 до 0,7; високо - от 0,7 до 0,9; много висока (силна) - от 0,9 до 1,0. Използва се по-нататък в примери по темата.

Линейна корелация

Тази корелация характеризира линейна връзка в вариациите на променливите. Тя може да бъде сдвоена (две корелирани променливи) или множествена (повече от две променливи), пряка или обратна – положителна или отрицателна, когато променливите варират съответно в една и съща или в различни посоки.

Ако променливите са количествени и еквивалентни в своите независими наблюдения с общия им брой, тогава най-важните емпирични мерки за близостта на тяхната линейна връзка са коефициентът на пряка корелация на признаците на австрийския психолог G.T.Fechner (1801-1887) и коефициенти на сдвоена, чиста (частна) и множествена (кумулативна) корелация на английския статистик-биометрик К. Пиърсън (1857-1936).

Корелационен коефициент на двойка знаци на Фехнеропределя последователността на посоките в отделните отклонения на променливите от техните средни стойности и . Тя е равна на съотношението на разликата между сумите на съвпадащи () и несъвпадащи () двойки знаци в отклонения и на сумата от тези суми:

величина Kfварира от -1 до +1. Сумирането в (1) се прави върху наблюдения, които не са изброени в сумите с цел опростяване. Ако има едно отклонение или , тогава то не се включва в изчислението. Ако и двете отклонения са нула наведнъж: , тогава се счита, че такъв случай има еднакви знаци и се включва в . В таблица 12.1. е показана подготовката на данни за изчисление (1).

Таблица 12.1 Данни за изчисляване на коефициента на Фехнер.

Брой служители, хиляди души

Търговски оборот, в.у.

Отклонение от средното

Сравнение на знаци и

съвпадение
(От до)

несъответствие (N k)

По (1) имаме K f = (3 - 2)/(3 + 2) = 0,20. Посоката на връзката във вариациите!!Среден брой служители|брой служители]] и е положителна (права): знаците в отклоненията и и в по-голямата част (в 3 случая от 5) съвпадат един с друг. Близостта на връзката между променливите по скалата на Chaddock е слаба.

Двойката на Пиърсън, чистите (частични) и множествените (общи) линейни коефициенти на корелация, за разлика от коефициента на Фехнер, отчитат не само знаците, но и величините на отклоненията на променливите. За изчисляването им се използват различни методи. По този начин, според метода на директно преброяване за негрупирани данни, коефициентът на корелация на двойката на Пиърсън има формата:

Този коефициент също варира от -1 до +1. Ако има няколко променливи, се изчислява коефициентът на множествена (кумулативна) линейна корелация на Pearson. За три променливи x, y, zизглежда като

Този коефициент варира от 0 до 1. Ако елиминираме (напълно изключим или фиксираме на постоянно ниво) влиянието върху и , тогава тяхната „обща“ връзка ще се превърне в „чиста“, образувайки чиста (частична) линейна корелация на Пиърсън коефициент:

Този коефициент варира от -1 до +1. Квадратите на корелационните коефициенти (2)-(4) се наричат ​​коефициенти (индекси) на детерминация - съответно двойка, чиста (частна), множествена (обща):

Всеки от коефициентите на детерминация варира от 0 до 1 и оценява степента на вариационна сигурност в линейната връзка на променливите, показвайки съотношението на вариацията в една променлива (y) поради вариацията на другата (другите) - x и y . Многовариантният случай на повече от три променливи не се разглежда тук.

Според разработките на английския статистик Р.Е. Фишър (1890-1962), статистическата значимост на сдвоени и чисти (частични) коефициенти на корелация на Пиърсън се проверява дали тяхното разпределение е нормално, въз основа на разпределението на английския статистик V.S. Госет (псевдоним "Студент"; 1876-1937) с дадено ниво на вероятностна значимост и налична степен на свобода, където е броят на връзките (факторни променливи). За сдвоен коефициент имаме неговата средна квадратична грешка и действителната стойност на t-теста на Стюдънт:

За чист коефициент на корелация при изчисляването му вместо (n-2) е необходимо да се вземе , т.к. в този случай има m=2 (две факторни променливи x и z). За голямо число n>100, вместо (n-2) или (n-3) в (6), можете да вземете n, пренебрегвайки точността на изчислението.

Ако t r > t таблица, тогава коефициентът на двойка корелация - общ или чист - е статистически значим и когато t r ≤ t табл.- незначителен.

Значимостта на коефициента на множествена корелация R се проверява чрез Е— Критерий на Fisher чрез изчисляване на действителната му стойност

При F R > раздел F.коефициентът R се счита за значим с дадено ниво на значимост a и наличните степени на свобода и , и с F r ≤ F таблица- незначителен.

В популации с голям обем n > 100 нормалният закон за разпределение (табулирана функция на Лаплас-Шепард) се използва директно за оценка на значимостта на всички коефициенти на Pearson вместо t и F тестовете.

И накрая, ако коефициентите на Пиърсън не се подчиняват на нормалния закон, тогава Z се използва като критерий за тяхната значимост - тест на Фишер, който не се разглежда тук.

Пример за условно изчисление(2) - (7) е дадено в табл. 12.2, където първоначалните данни от таблица 12.1 са взети с добавяне на трета променлива z - размерът на общата площ на магазина (100 кв. М).

Таблица 12.2.Подготовка на данни за изчисляване на коефициентите на корелация на Pearson

Индикатори

Съгласно (2) - (5), коефициентите на линейна корелация на Пиърсън са равни на:

Връзка на променливите хИ ге положителен, но не близък, възлизащ на величина, базирана на техния сдвоен коефициент на корелация, и величина, базирана на чистия коефициент на корелация, и беше оценен по скалата на Chaddock съответно като „забележим“ и „слаб“.

Коефициенти на определяне d xy =0,354И dxy. z = 0,0037показват, че вариацията при(оборот) се дължи на линейна вариация х(брой служители) от 35,4% в тяхната обща взаимовръзка и в чиста взаимовръзка – само на 0,37% . Тази ситуация се дължи на значителното въздействие върху хИ гтрета променлива z— обща площ, заета от магазини. Близостта на връзката му с тях е респ. r xz =0,677 и r yz =0,844.

Множественият (кумулативен) коефициент на корелация на три променливи показва, че близостта на линейната връзка хИ z° С гвъзлиза на R = 0,844, оценен по скалата на Chaddock като „висок“, а коефициентът на множествена детерминация е стойността D=0,713, което показва, че 71,3 % цялата вариация при(търговски оборот) се определят от кумулативното влияние на променливите върху него хИ z. Почивка 28,7% поради въздействието върху гдруги фактори или криволинейна връзка на променливите y, x, z.

За да оценим значимостта на коефициентите на корелация, вземаме нивото на значимост. Според първоначалните данни имаме степени на свобода за и за . Според теоретичната таблица намираме съответно t таблица 1. = 3,182 и t таблица 2. = 4,303. За F-теста имаме и и от таблицата намираме F таблица. = 19,0. Действителните стойности на всеки критерий съгласно (6) и (7) са равни на:

Всички изчислени критерии са по-малки от техните таблични стойности: всички корелационни коефициенти на Pearson са статистически незначими.

Коефициентът на корелация, предложен през втората половина на 19 век от G. T. Fechner, е най-простата мярка за връзката между две променливи. Основава се на сравнение на две психологически характеристики х iИ г i, измерени на една и съща проба, чрез сравняване на признаците на отклонения на отделните стойности от средните: и
. Заключението за корелацията между две променливи се прави въз основа на преброяването на броя на съвпаденията и несъответствията на тези знаци.

Пример

Позволявам х iИ г i– две черти, измерени върху една и съща извадка от субекти. За да се изчисли коефициентът на Фехнер, е необходимо да се изчислят средните стойности за всяка характеристика, както и за всяка стойност на променливата - знакът на отклонението от средната (Таблица 8.1):

Таблица 8.1

х i

г i

Обозначаване

На масата: А– съвпадение на знаци, b– несъответствие на знаци; н a – брой съвпадения, н b – брой несъответствия (в този случай на = 4, н b = 6).

Корелационният коефициент на Фехнер се изчислява по формулата:

(8.1)

В такъв случай:

Заключение

Има слаба отрицателна връзка между изследваните променливи.

Трябва да се отбележи, че коефициентът на корелация на Фехнер не е достатъчно строг критерий, така че може да се използва само в началния етап на обработка на данните и за формулиране на предварителни заключения.

8. 4. Коефициент на корелация на Пиърсън

Първоначалният принцип на корелационния коефициент на Пиърсън е използването на произведението на моментите (отклонения на стойността на променлива от средната стойност):

Ако сумата от продуктите на моментите е голяма и положителна, тогава хИ приса пряко свързани; ако сумата е голяма и отрицателна, тогава хИ присилно обратна връзка; накрая, ако няма връзка между хИ присумата от произведенията на моментите е близка до нула.

За да се гарантира, че статистическите данни не зависят от размера на извадката, се взема средната стойност, а не сумата от продуктите на моментите. Разделението обаче се прави не по размера на извадката, а по броя на степените на свобода н - 1.

величина
е мярка за връзката между хИ прии се нарича ковариация хИ при.

В много проблеми в природните и техническите науки ковариацията е напълно задоволителна мярка за връзка. Недостатъкът му е, че обхватът на стойностите му не е фиксиран, т.е. може да варира в неопределени граници.

За да се стандартизира мярка за асоцииране, е необходимо да се освободи ковариацията от влиянието на стандартните отклонения. За да направите това, трябва да разделите С xyНа с x и с y:

(8.3)

Където r xy- коефициент на корелация или произведение на моментите на Пиърсън.

Общата формула за изчисляване на коефициента на корелация е следната:

(някои реализации)

(8.4)

Влияние на преобразуването на данни върху r xy:

1. Линейни трансформации хИ гТип bx + аИ dy + ° Сняма да промени величината на корелацията между хИ г.

2. Линейни трансформации хИ гпри b < 0, д> 0, а също и когато b> 0 и д < 0 изменяют знак коэффициента корреляции, не меняя его величины.

Надеждността (или в противен случай статистическата значимост) на коефициента на корелация на Pearson може да се определи по различни начини:

Според таблиците на критичните стойности на коефициентите на корелация на Pearson и Spearman (виж Приложение, Таблица XIII). Ако стойността, получена при изчисленията r xy надвишава критичната (таблична) стойност за дадена проба, коефициентът на Пиърсън се счита за статистически значим. Броят на степените на свобода в този случай съответства на н– 2, където н– брой двойки сравнявани стойности (размер на извадката).

Съгласно таблица XV ​​от приложението, което е озаглавено „Броят на двойките стойности, необходими за статистическата значимост на коефициента на корелация.“ В този случай е необходимо да се съсредоточите върху коефициента на корелация, получен при изчисленията. Счита се за статистически значимо, ако размерът на извадката е равен или по-голям от табличния брой двойки стойности за даден коефициент.

Според коефициента на Стюдънт, който се изчислява като съотношението на коефициента на корелация към неговата грешка:

(8.5)

Грешка на коефициента на корелация изчислено по следната формула:

Където м r - грешка на коефициента на корелация, r- коефициент на корелация; н- брой сравнявани двойки.

Нека разгледаме процедурата за изчисления и определяне на статистическата значимост на коефициента на корелация на Pearson, като използваме примера за решаване на следния проблем.

Задачата

22 гимназисти бяха тествани по два теста: USK (ниво на субективен контрол) и MkU (мотивация за успех). Бяха получени следните резултати (Таблица 8.2):

Таблица 8.2

USK ( х i)

MkU ( г i)

USK ( х i)

MkU ( г i)

Упражнение

Да се ​​провери хипотезата, че хората с високо ниво на интерналност (USC резултат) се характеризират с високо ниво на мотивация за успех.

Решение

1. Използваме коефициента на корелация на Pearson в следната модификация (вижте формула 8.4):

За удобство на обработката на данни на микрокалкулатор (при липса на необходимата компютърна програма) се препоръчва да се създаде междинна работна таблица със следната форма (Таблица 8.3):

Таблица 8.3

х i г i

х 1 г 1

х 2 г 2

х 3 г 3

хн гн

Σ х i г i

2. Извършваме изчисления и заместваме стойностите във формулата:

3. Определяме статистическата значимост на корелационния коефициент на Pearson по три начина:

1-ви метод:

В табл XIII Приложение намираме критичните стойности на коефициента за 1-во и 2-ро ниво на значимост: r кр.= 0,42; 0,54 (ν = н – 2 = 20).

Ние заключаваме, че r xy > rкр . , т.е. корелацията е статистически значима и за двете нива.

2-ри метод:

Да използваме таблицата. XV, в който определяме броя на двойките стойности (брой субекти), достатъчни за статистическата значимост на корелационния коефициент на Pearson, равен на 0,58: за 1-во, 2-ро и 3-то ниво на значимост е 12, 18 и 28, съответно .

Оттук стигаме до извода, че коефициентът на корелация е значим за 1-во и 2-ро ниво, но „не достига” до 3-то ниво на значимост.

3-ти метод:

Изчисляваме грешката на коефициента на корелация и коефициента на Стюдънт като отношение на коефициента на Пиърсън към грешката:

В табл X намираме стандартните стойности на коефициента на Студент за 1-во, 2-ро и 3-то ниво на значимост с броя на степените на свобода ν = н – 2 = 20: T кр. = 2,09; 2,85; 3,85.

Общо заключение

Корелацията между показателите на тестовете USC и MkU е статистически значима за 1-во и 2-ро ниво на значимост.

Забележка:

При тълкуването на коефициента на корелация на Pearson трябва да се имат предвид следните точки:

    Коефициентът на Пиърсън може да се използва за различни скали (съотношение, интервал или порядък) с изключение на дихотомичната скала.

    Корелацията не винаги означава причинно-следствена връзка. С други думи, ако установим, да речем, положителна корелация между височината и теглото в група субекти, това не означава, че височината зависи от теглото или обратното (и двете характеристики зависят от трета (външна) променлива, която в този случай се свързва с генетични конституционални характеристики на човек).

    r xu » 0 може да се наблюдава не само при липса на връзка между хИ г, но и при силна нелинейна връзка (фиг. 8.2 а). В този случай отрицателните и положителните корелации са балансирани, което води до илюзията за липса на връзка.

    r xyможе да бъде доста малък, ако има силна връзка между хИ присе наблюдава в по-тесен диапазон от стойности от изследвания (фиг. 8.2 b).

    Комбинирането на проби с различни средства може да създаде илюзията за доста висока корелация (фиг. 8.2 c).

г i г i г i

+ + . .

х i х i х i

Ориз. 8.2. Възможни източници на грешки при интерпретиране на стойността на коефициента на корелация (пояснения в текста (точки 3 – 5 забележки))

Най-простите индикатори за близостта на връзката включват коефициента на корелация на знака - коефициента на Фехнер. Този показател се основава на оценка на степента на последователност на посоките на отклонения на индивидуалните стойности на факторните и произтичащи характеристики от съответните средни стойности. За да се изчисли, се изчисляват средните стойности на резултантните и факторните характеристики и след това знаците за отклонение се присвояват за всички стойности на връзката между двойки характеристики.

Където Kf е коефициентът на Фехнер; na е броят на двойките, в които признаците на отклонения на стойностите от техните средни стойности съвпадат; nв е броят на двойките, чиито признаци на отклонения на стойностите от техните средни не съвпадат.

Коефициентът на Fechner може да приема различни стойности, вариращи от -1 до +1. Ако коефициентът е близо до +1, тогава можем да приемем наличието на директна връзка, ако -1, тогава наличието на обратна връзка.

Резултатите от изчисляването на коефициента на Фехнер за работилници са представени в табл. 6.

Таблица 6

Номер на работилница

Коефициент на Фехнер

Други материали

Анализ на производствено-стопанската дейност на предприятието
Въвеждащата практика е задължителна част от учебния процес за подготовка на специалисти по икономика. Практиката се проведе в предприятието Ural Steel OJSC, в отдела за финансово планиране. Ръководител на...

Статистическо изследване на социално-икономическите явления
Понастоящем терминът „статистика” има няколко значения: ¨ статистиката се отнася до планираното и систематично регистриране на масови социални явления, което се извършва от статистическите органи; ¨ статистиката е...