If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Пример: Какво представлява корелационният коефициент

Сал обяснява какво представляват корелационните коефициенти и решава задача, при която свързва коефициентите на корелация с точкови диаграми.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Заснех няколко упражнения от Кан Академия, свързани с разглеждането на корелационния коефициент. Дадени са ни няколко корелационни коефициента и ние трябва да ги свържем с различните точкови диаграми в упражнението. Има възможност да ги местим наоколо в таблица, за да ги свържем с различните точкови диаграми. Целта не е да намерим как точно да ги изчислим, ще правим това по-нататък, а всъщност да добием представа за това какво се опитваме да измерим. Основната идея е, че корелационните коефициенти се опитват да измерят колко добре един линеен модел може да опише зависимостта между две променливи. Например, ако имам... ще начертая тук координатни оси. Нека кажем, че това е едната променлива. Това е променливата у и нека кажем, че това е променливата х. Нека кажем, че когато х е разположено ниско, у също е ниско. Когато х е малко по-високо, у е също малко по-високо. Когато х е още малко по-високо, у е също по-високо. Когато х е наистина високо, у е дори по-високо. Един линеен модел би описал това много, много добре. Много е лесно да начертаем права, която да минава през тези точки. Така че нещо подобно би имало коефициент r = 1. Един линеен модел идеално го описва и имаме положителна корелация. Когато едното нараства, когато едната променлива става по-голяма, тогава и другата променлива е по-голяма. Когато едната променлива е по-малка, тогава и другата променлива е по-малка и обратното. Как би изглеждало това при r = –1. Отново това ще бъде ситуация, при която един линеен модел ще свърши доста добра работа, но когато едната променлива отива нагоре, другата се придвижва надолу и обратното. Нека начертая отново координатните оси. Ще се опитам да начертая множество от данни, при които r ще бъде –1. Може би когато у е високо, х ще бъде много ниско. Когато у става по-ниско, х става по-високо. Когато у става доста по-ниско, х става доста по-високо. Още веднъж, когато у намалява, х нараства или когато х нараства, у намалява. Те се движат в противоположни посоки, но тук можеш много лесно да начертаеш права. Правата ще изглежда по подобен начин. Ще имаме r равно на –1, а при r равно на 0 ще имаме данни, при които една права няма изобщо да съвпада добре. Ще го направя наистина малко, тъй като няма много място тук. r равно на 0 може да изглежда по подобен начин. Може би имам точка с данни тук, може би имам точка с данни тук и може би имам една там. Там, там. Като това няма непременно да бъде толкова добре организирано, но ще ти даде представа за нещата. Как всъщност ще се опиташ да начертаеш права тук? Можеш да нагодиш дадена права, която да изглежда ето така или права, която изглежда по този начин, или права която изглежда ето така. Един линеен модел наистина не описва зависимостта между двете променливи толкова добре, ето тук. Това тук е пример. Нека видим, дали можем да се справим с тези точкови диаграми. Начинът, по който ще го направя, е да се опитам да преценя на око как може да изглежда даден линеен модел. Има различни методи да се опитаме да нагодим един линеен модел към множество от данни, което не е идеално. Начертал съм доста идеални случаи, поне за r = –1 и r = 1, защото точно така всъщност изглежда реалността. Много рядко нещата ще се намират точно на една права. При точкова диаграма А, ако се опитам да начертая права, тя ще изглежда по подобен начин. Ако се опитам да минимизирам разстоянията от точките до правата, ще видя основната тенденция, ако разгледам тези точки с данни ето тук, когато у е високо, х е ниско. Когато х е по-голямо, у е по-малко. Изглежда, че r ще бъде по-малко от 0 и достатъчно малко по-малко от 0. То ще клони към това нещо тук. Ако разгледам отговорите, няма да имаме r = 0,65. Тези са положителни, така че няма да използвам този или този коефициент. А тук нямаме почти никаква корелация. r = –0,02 е доста близо до нулата. Чувствам се уверен в r = –0,72. Искам да съм ясен. Ако нямах тези отговори тук, нямаше да мога просто така да кажа, само като гледам тези точки с данни, без да мога да направя някакви изчисления, че r е равно на –0,72. Основавам се само на логиката, че имаме отрицателна корелация, която изглежда доста силна. Зависимостта един вид просто ти изниква насреща, че когато у е голямо, х е малко. Когато х е голямо, у е малко. Така че ми трябва нещо, което клони към r = –1. Вече използвах този коефициент. Сега при точкова диаграма В, ако трябваше просто да я преценя на око, това отново ще бъде неточно. Но тенденцията, ако трябваше да се опитам да начертая права, тя би изглеждала по подобен начин. Щеше да изглежда, че една права пасва доста добре. Има няколко точки, които ще бъде трудно да паснат. Те ще са доста далеч от правата. Но изглежда, че имаме положителна корелация. Когато у е малко, х е относително малко и обратното. Когато х расте, у расте и когато у расте, х расте. Това ще бъде положителна корелация и изглежда, че ще бъде доста положителна. Тук имам два отговора. Не знам кой от тях ще бъде. Ще имаме или r = 0,65 или r = 0,84. Имам също и точкова диаграма С, тази с точки навсякъде. Тя прилича на това, което направихме тук. Как ще изглежда правата? Можеш да си представиш почти всичко. Ще изглежда ли така? Ще изглежда ли правата по този начин? Няма никаква посока, за която може да кажеш: "Когато х нараства, може би у нараства или намалява." Тук няма никаква логика, така че изглежда много некорелативно. Така че това е доста близо до 0. Сигурен съм, че това е r = –0,02. Всъщност, ако пробваме с възможно най-добрата права, това щеше да съвпада, щеше да бъде тази с малък отрицателен наклон. Може да изглежда по подобен начин. И забележи, че дори ако се опитаме да начертаем права, има всякакви видове точки, които се намират на разстояние от правата. Така че линейният модел не пасва толкова добре. r е равно на –0,02. Така че ще използваме този отговор. Сега имаме точкова диаграма D. Ще използваме една от другите положителни корелации, като наистина изглежда, че тук имаме положителна корелация. Когато у е ниско, х е ниско. Когато х е високо, у е високо и обратното. Можем да опитаме да нагодим права, която изглежда по подобен начин. Но няма да е добра колкото тази. Можеш да видиш от точките, които се опитваме да обхванем, че има няколко точки, които са доста далеч от модела. Моделът не съвпада толкова добре, така че бих казал, че точкова диаграма В съвпада по-добре. Един линеен модел пасва повече на точкова диаграма В, отколкото на точкова диаграма D. Ще дам по-голямото r на точкова диаграма В и по-малкото r или r = 0,65 на точкова диаграма D. r е равно на 0,65. Още веднъж, това е така, защото с даден линеен модел изглежда, че тук имаме някаква тенденция, но има няколко точки, които са на по-голямо разстояние от правата при точкова диаграма D, отколкото в случая с точкова диаграма В. Има няколко, които са все още на разстояние от правата, но тези са много по-отдалечени от правата при D.