If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Доказателство (част 4) за свеждането до минимум на квадратичната грешка на линията на регресия

Доказателство (част 4) за свеждането до минимум на квадратичната грешка на линията на регресия. Създадено от Сал Кан.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Ако стигна дотук, то вече гледа няколко клипа, за да стигнем до оптималната права, която минимизира квадратичното отклонение до всички тези точки. И да се захващаме с работата. Да намерим оптималните m и b. Въз основа на това, което направихме в миналите клипове, има два начина да направим това. Всъщност сега знаем две точки, които се намират на тази права. Така че можем буквално да намерим наклона на тази права, след което ординатата на пресечната точка с оста у, ето това b. Или просто можем да кажем, че това е решението на тази система уравнения. И те всъщност са математически равносилни. Нека най-напред намерим m. Ако искаме да намерим m, целта ни е да се освободим от тези b. Така че ще препиша това уравнение горе, точно по начина, по който е написано тук. Имаме m, умножено по средната стойност от квадратите на х плюс b, умножено по средната стойност на... Всъщност, дори можем да го направим по по-добър начин от този. Една идея по-добър начин от това, основано на работата, която свършихме миналия път, можем просто да извадим това уравнение долу от уравнението горе. Ще го извадя. Или да прибавим тези със знак минус. Ако направя това отрицателно, това е отрицателно. Това е отрицателно. Какво получаваме? Получаваме m, умножено по средната стойност на хиксовете, минус средната стойност от квадратите на хиксовете, върху средната стойност на х. Плюс b и минус b се унищожават. Това е равно на средната стойност на игреците минус средната стойност на членовете ху, върху средната стойност на хиксовете. И тогава можем да разделим двете страни на уравнението на този израз. И получаваме, че m е равно на средната стойност на игреците минус тази на членовете ху, върху средната стойност на хиксовете върху това. Средната стойност на хиксовете минус средната стойност на квадратите им върху средната стойност на хиксовете. И забележи, че това е точно същото, което ще получим, ако намерим наклона между тези две точки тук. Има промяна в у, значи разликата между това у и това у, е тази, която виждаме там. При промяната на хиксовете. Промяната в този х минус онзи х се вижда тук. Така, за да опростим, можем да умножим числителя и знаменателя по средната стойност на хиксовете. Правя това, за да нямаме това в знаменателя, на двете места. Та ако умножим числителя по средната стойност на хиксовете, получаваме пак тяхната средна стойност, умножена по тази на игреците минус, това и това ще се унищожат, минус средната стойност на тези ху. Всичко това върху средната стойност на хиксовете, умножена по средната стойност на хиксовете, което ще даде средната стойност на хиксовете на квадрат, минус... тук имаме средната стойност на х квадрат. И това е, което получаваме за m. Ако искаме да намерим b, буквално тук можем да заместим в едното уравнение, но това уравнение тук е по-просто. И ако искаме тук да намерим b, можем да го намерим чрез m. Само заместваме m пъти по средната стойност на хиксовете от двете страни. Получаваме, че b е равно на средната стойност на игреците минус m пъти по средната стойност на хиксовете. Така че това, което правим, е че вземаме точките данни, намираме средната стойност на хиксовете, средната стойност на тези ху, и тази на квадратите на х. Намираме нашето m. Намерим ли m, тогава можем да заместим тук и намираме нашето b. Идва ред на въпросната оптимална права. И сме готови. Та това са двата основни извода за нашата оптимална права. Това, което ще направа в следващия клип, е – и всеки, който е пропуснал последните клипове, в следващия клип ще може да се включи отново, защото ще използваме същите неща, защото всъщност ще използваме тези формули за най-подходящата права. Поне когато измерваме грешката чрез квадратите на отклоненията на точките. Ще използваме тези формули, за да намерим най-добрата права за няколко данни.