If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Квадратична грешка на линията на регресия

Запознаване с идеята, че може да се намери права, която свежда до минимум квадратите на разстоянията до точките. Създадено от Сал Кан.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

В следващите няколко клипа ще обсъдим нещо, от което ще изведем формула, доста проста за прилагане. А и в повечето часове по статистика ще видиш това, което ще изведем. Всъщност искам да ти покажа как се стига до нея. Но сега искам и да те предупредя нещо. Ще има много претрупани сметки, повечето от които ще са алгебрични. И след това, като наближим края, ще трябва да решим малко задачи по висша математика. Ще трябва да намерим няколко частични производни. Така че, ако нещо от материала ти звучи стряскащо, или някак обезсърчаващо, не е задължително да гледаш. Може да прескочиш до края и само да вземеш формулата, която ще изведем. Но аз смятам, че извеждането ѝ е доста удовлетворяващо. Сега ще разгледаме случай, в който имаме n точки в една координатна система. И не е задължително всички те да са в първия квадрант. Но за да опростим онагледяването, ще ги нанеса всичките в първия квадрант. Та да кажем, имам тази точка тук. Ще ги оцветя в различни цветове. Точка с координати (х1; у1). И след това, да кажем, имам една друга точка тук. Тук координатите са (х2; у2). И мога да продължа да прибавям точки. Както и да продължа да ги чертая. Просто ще имаме един тон точки. Там, и там, и там. И така продължаваме, докато стигнем n-тата точка. Може би тя е тук. А тези координати ще означим просто като (xn; yn). Така че тук имаме n точки. Не съм нанесъл всички налични точки. Това, което искам да направя, е да намеря права, която минимизира сумата от квадратите на отклоненията от правата на тези различни точки. Та нека помислим за това. Нека за малко си представим нагледно тази права. И така, ще има някаква права. Ще се опитам да начертая една права, която по някакъв начин приблизително показва какво правят тези точки. Ще начертая тази права. Може би правата изглежда така. Ще направя всичко възможно да покажа приблизително как изглежда тя. Всъщност ще я начертая по различен начин. Може би изглежда така. В момента дори не знам какво представлява. И искам да минимизираме квадратите на отклоненията на всяка една от тези точки до правата. Да помислим какво означава това. Нека уравнението на тази права тук е у = mx + b. А това го знаем още от Алгебра 1. Това е наклонът на правата, а това е пресечната точка с оста у. Това всъщност е точка (0; b). Целта ми е да направя... и на тази тема ще бъдат посветени следващите няколко клипа – искам да намеря стойностите на m и b. Искам да намеря тези двете, които дефинират тази права. Така че да минимизираме отклоненията. Първо да определя каква е отклонението. За всяка от тези точки отклонението между точката и правата представлява вертикалната разлика. Т.е. това тук можем да го наречем отклонение едно. И сетне това тук ще е отклонение две. Тя ще е вертикалното разстояние между тази точка и правата. Или можем да го считаме за стойността на у за тази точка и у-стойността за правата. И така продължаваме все нататък, докато стигнем крайната точка между у- стойността за тази точка и у-стойността за точката от правата. И това отклонение тук, отклонение едно, ако го погледнем, то представлява тази стойност тук, тази у-стойност... То е равно на у1 минус тази у-стойност. И така, каква ще е тази у-стойност? Тук имаме, че х е равно на х1. А тази точка е точката m x1 плюс b. Вземаме х1 в това уравнение на правата и ще получим тази точка тук. Така че буквално това ще е равно на m x1 плюс b. Това е първото отклонение. И можем да продължим да правим това с всички точки. Това отклонение тук ще бъде у2 минус (m x2 + b). И тогава тази точка тук е (m x2 + b). Стойността е тази, когато проектираме х2 на тази права. И изминаваме всичкия път, докато стигнем n-тата точка. Това отклонение тук ще е yn минус (m xn + b). Ако искаме да вземем директно сбора на всички отклонения, можем просто да съберем тези неща. Но целта ни е да минимизираме квадрата на отклоненията на всяка от тези точки, всяка от тези n-точки спрямо правата. Така че нека дефинирам квадратичното отклонение спрямо тази права като равно на сбора от квадратите на тези отклонения. Това отклонение тук, или както го нарекохме отклонение едно, е у1 минус (m x1 + b). Ще го повдигнем на квадрат. И това е отклонение едно на квадрат. Нека отидем на отклонение две на квадрат. Повдигаме на квадрат отклонение две, което е у2 минус (m x2 + b). И след това ще повдигнем на квадрат това отклонение. И продължаваме така, и ще отидем до n места, или, да кажем n точки. И т.н. по целия път, докато стигнем това n-то отклонение. n-тото отклонение е равно на yn минус (m xn + b). След което ще го повдигнем на квадрат. Та това е квадратичното отклонение (или квадратичната грешка) на правата. И в следващите няколко клипа искам да намеря m и b, които минимизират сумата от квадратите на отклоненията от тази права. Ако разглеждаме това като най-добрата оценка за това колко е добра и подходяща една права, ще се опитаме да намерим правата, която съответства най-добре на тези точки. И ще продължа следващия път. Понеже разбирам, че с тези супер претрупани математически задачи е добре е да разглеждаме нещата едно по едно. Това също намалява вероятността да допусна грешка.