If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:4:52

Видео транскрипция

"Вера отдава велосипеди под наем на туристи. Тя записала височината в сантиметри на всеки клиент и дължината на рамката в сантиметри на колелото, което клиентът е наел. След това направила диаграма на резултатите и забелязала, че връзката между двете променливи е доста линейна. Тя използвала данните, за да пресметне следното регресионно уравнение с използване на най-малките квадрати и да предскаже големината на рамката на колелото според ръста на клиента." Това е уравнението. Преди дори да погледнем въпроса, нека помислим какво е направила тя. Тя и имала няколко клиенти и е записала, при даден ръст на клиента, каква е била рамката на колелото, което този човек е наел. Тя може да е имала нещо подобно, при което по хоризонталната ос имаш ръста, измерен в сантиметри, а по вертикалната ос имаш големината на рамката, която също е измерена в сантиметри. Може да е имало някой, който е с ръст от 100 сантиметра и взима рамка от 25 сантиметра. Не знам дали това е разумно, или не, експертите по велосипеди ще кажат, но нека се задоволим с това. Тя би го поставила тук. Може да е имало друг човек с ръст от 100 сантиметра, който е взел рамка, която е била малко по-дълга, а тя го е поставила тук. После тя е съставила регресионно уравнение с метода на най-малките квадрати. Една регресия с модела на най-малките квадрати опитва да напасне линия към тези данни. Често ще използваш електронна таблица или ще използваш компютър. Тази линия се стреми да минимизира квадратите на разстоянията между тези точки. Регресията с метода на най-малките квадрати ще изглежда нещо подобно, а това е просто грубото ѝ изчисление. Може да изглежда – нека извадя линийката си – като нещо подобно. Може да изглежда и като това. Нека я поставя. Това ще е линията. Нашата линия на регресия, у с шапчица, е равно на 1/3 плюс 1/3 х. Можеш да гледаш на това като начин за прогнозиране или начин за моделиране на зависимостта, или прогнозиране, че ако дойде нов човек, можем да вземем ръста му и да го поставим като "х", и да намерим рамка с каква големина вероятно ще наеме. Но нас ни питат: "Каква е остатъчната стойност за един клиент с ръст от 155 сантиметра, който наема колело с рамка от 51 сантиметра?" Как ще помислим върху това? Остатъчната стойност ще бъде разликата между това, което реално се случва и това, което нашата регресионна линия предвижда. Можем да кажем, че – нека го запиша така – остатъчната стойност ще е реалната стойност минус прогнозираната стойност. Ако прогнозираната е по-голяма от реалната, това ще е отрицателно число. Ако я прогнозирам по-малка от реалната, това ще е положително число. Знаем реалната стойност. Те ни я казват. Казват ни, че човек с ръст от 155 сантиметра наема колело с рамка от 51 сантиметра, така че това е 51 сантиметра. Но каква ще е прогнозираната стойност? Тук можем да използваме уравнението за регресията, което Вера е измислила. Ще направя това в оранжево – прогнозираната стойност ще е равна на 1/3 плюс 1/3 по ръста на човека. Ръстът е 155. Това е предсказаната стойност – Y с шапчица е това, което линейната ни регресия прогнозира или линията ни прогнозира. Колко ще е това? Това ще е равно на 1/3 + 155, върху три, което е равно на 156/3, а това е 52. Прогнозираната стойност от нашата линия е 52. Този човек е 155, можем да го поставим ето тук, 155. Той е малко под линията. Малко под линията ето тук и това разстояние, което е – можем да видим, че е под линията – разстоянието ще е... в този случай остатъчната стойност ще е отрицателна. Това ще е отрицателно. Ако увеличим ето тук, не можеш да го видиш добре, но нека го нарисувам. Нека кажем, че увеличим линията и това изглежда така. Нашата точка информация е точно тук. Знаем, че сме под линията и това ще е отрицателна остатъчна стойност. Големината на тази остатъчна стойност на казва колко далеч под линията сме. В този случай тя е отрицателна. Това е нашата остатъчна стойност. Това е реалната информация минус това, което е било предсказано от линията ни на регресия.