Текущ час:0:00Обща продължителност:9:54

Доказателство (част 2) за свеждането до минимум на квадратичната грешка на линията на регресия

Видео транскрипция

Целта ни е да опростим този израз заради квадратната грешка между тези n точки. Само да си припомним какво правим, имаме тези n точки. И вземаме предвид сумата от квадратната грешка между всяка от тези n точки и настоящата ни ос, у, тя е равна на mx плюс b. Получаваме този израз тук, който опростявам от два клипа насам. Ще се опитаме да опростим този израз колкото се може повече. И тогава, ще се опитаме да сведем до минимум стойността на този израз. Или да намерим стойностите на m и b, които го свеждат до минимум. Или предполагам, че можем да го наречем най-добрата съвпадаща ос. Та за да направим това, изглежда, че правим сметките все по-заплетени и по-заплетени. Но тази следваща стъпка доста добре ще опрости нещата. И за да ви покажа, че ако искам да визирам средната стойност на всички стойности на у, повдигнати на квадрат - ще направим следното. Това ще е у1 на квадрат, плюс у2 на квадрат, плюс т.н. докато стигнем yn на кварат. И сумирах n -стойностите, стойностите за n на квадрат. След това искам да разделя полученото на n, след като тук има n стойности. И това е средната стойност на тези у на квадрат. Ето как можем да означим това, по този начин. Или, ако умножим двете страни на това уравнение по n, получаваме у1 на квадрат, плюс у2 на квадрат, плюс и т.н. докато стигнем до yn на квадрат, това е равно на n пъти по средната стойност от повдигнатите на квадрат стойности на у. И забележете, това е точно същото, което имаме тук. То е n пъти по средната стойност на повдигнатите на квадрат стойности на у. Или средната стойност на всички у на квадрат. И можем да направим това с всеки от тези членове. Това, което дава х1у1 плюс х2у2 плюс ... xnyn. Ами, ако вземем целия този сбор, и го разделим на n члена, ще получим средната стойност на израза х, умножено по у. За всяка от тези точки умножаваме х по у. И намираме средната стойност от всички тези произведения. Това представлява даденият израз. И, пак да кажем, умножаваме двете страни от това уравнение по n, като получаваме х1у1 плюс х2у2 плюс... т.н. докато xnyn стане равно на n, умножено по средната стойност на всички членове ху. Мисля, че се вижда накъде отива това. Този член тук ще е равен на n пъти по средната стойност от произведенията на ху. Този член тук е равен на n пъти по средната стойност на у-стойностите. И тогава, този член тук дава n пъти по средната стойност от квадратните стойности на х. Този член тук е средната стойност от произведенията на всички х и n. Ако разделим това на n, ще получим средната стойност. Тъй като не го делим на n, това е средната стойност, умножено по n. И после това е очевидно, че не опростяваме нищо. Така че нека препишем всичко, като използваме нашата символика, знаейки, че това са средните стойности на у на квадрат от ху, и всичко това. И нашата квадратна грешка откъм оста, от сумата на квадратната грешка откъм оста, чрез n точките, ще е равна на - този член тук е равен на n пъти по средната стойност от стойностите на у на квадрат. Този член тук е равен на минус 2m. Tова там. Умножено n пъти по средната стойност на стойностите ху, аритметичната средна стойност. И след това имаме този член тук. Мисля, че можем да оценим факта, че така правим едно хубаво алгебрично опростяване на израза. Този член тук ще е минус 2bn, умножено по средната стойност от у- стойностите. И след това имаме плюс m на квадрат, умножено по n, умножено по средната стойност от стойностите на х на квадрат. И тогава имаме - почти сме тук, едно хубаво разтягане - имаме това тук, което е плюс 2mb, умножено по n пъти средната стойност на х-стойностите. И накрая, имаме плюс nb на квадрат. Така реално, в последните два- три клипа, всичко, което направихме, е че опростихме израза за сумата на квадратните разлики от онези n точки откъм тази ос, у е равно на mx плюс b. И приключваме с този мъчен етап от сметки. В следващия етап, всъщност искаме да оптимизираме този. Може би по-добрият начин да говорим за това е като поискаме да намалим стойността на този израз тук. Искаме да намерим m и b стойностите, които го намаляват. А за да помогнем с визирането му, тук ще започнем да раздробяваме нещата на дребна триизмерна начална висша математика. Но има надежда да не е толкова объркващо. Ако частично сте се занимавали с производни, няма да е трудно. Това е една повърхност. Ако я разгледаме, виждаме х и у точките данни, всичко тук е константно, с изключение на членовете m и членовете b. Приемаме, че стойностите на х и у са дадени. Така че можем да намерим средната стойност от квадратните у, средната стойност от ху произведението, средната стойност от всички у, средната стойност от тези х на квадрат. Приемаме, че тези числа тук са реални. Така че този израз тук, всъщност той ще представлява повърхност в три измерения. Та човек може да си представи, тази линия тук, тя е оста m. А тази тук е оста b. Toгава можем да приемем, че ординатната ос представлява квадратната грешка. Това е квадратната грешка на линейната ос. И за всяка комбинация от m и b, ако сме в равнината на m и b, избираме някаква комбинация между тях двете. Поставяме я в този израз за квадратната грешка на оста. Ще ви дам един пример. Ако направим това за всички комбинации от членове m и b, ще имаме дадена повърхност. И тази повърхност ще изглежда по следния начин. Ще направя всичко възможно да я изобразя. Ще изглежда така. Можем да си я представим и като вид купичка. Или дори като една триизмерна парабола. Ако искаме така да я приемем. Вместо парабола, ще имаме нещо такова. Ако малко го повъртим и го поизкривим, ще получим нещо, което прилича на купичка, на напръстник или тем подобни. И така, това, което искаме да направим, е да намерим стойностите на m и b, които намаляват. Забележете, че това е една триизмерна повърхност. Не знам колко е достоверна. Та можем да си представим една триизмерна повърхност, която изглежда така. Това е обратната страна, която не виждаме. Така че виждаме вътрешността на нашата триизмерна повърхност. Искаме да намерим стойностите на m и b, които намаляват стойността на повърхността. Така че тук имаме някакви m и b стойности, които намаляват тази стойност. Всъщност изчисленията ще ги направя следващия път. Но за да са успешни те, тук ще намерим частичната производна по отношение на m. Ще намерим частичната производна по отношение на b, като и двата израза изравним с 0. Понеже в тази минимална точка, мисля, можем да кажем в три измерения, тази минимална точка на повърхността ще се появи, когато кривата, по отношение на m и тази по отношение на b, клони към 0. И в това отношение, частичната производна на нашата квадратна грешка по отношение на m ще е равна на 0. Частичната производна на квадратната грешка по отношение на b също ще е равна на 0. Така че всичко, което ще направим следващия път, ще вземем частичната производна от този израз, по отношение на m, като го приравним към 0. И частичната производна тук, по отношение на b, прави приравняване към 0. И след това сме готови да намерим решение откъм m и b. Или конкретните стойности на m и b.