If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Стандартно отклонение на остатъчни стойности или средно квадратично отклонение

Стандартното отклонение на остътаците е оценка на това колко добре регресионната права пасва на данните. Познато е още като средно квадратично отклонение и средна квадратична грешка.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Интересува ни проучването на връзката между количеството учене за теста и резултатите от теста, където резултатът е между нула и шест. Ще разгледаме хора, които са решили теста, ще поставим на графика за всеки човек колко е учил и получения резултат. Например тази точка данни съответства на някой, който е учил един час и е получил едно на теста. После ще напаснем права на регресия и тази синя права на регресия е реалната права на регресия за тези четири точки данни, а тук е уравнението на тази права на регресия. Има няколко неща, които да помним. Обикновено, когато правиш този вид анализ, ще го правиш с далеч повече от четири точки данни. Причината да ги оставя четири е понеже ще изчислим колко добро напасване е тази права на регресия на ръка, а обикновено не го правиш на ръка, имаме компютри за тази цел. Начинът, по който ще измерим колко добро напасване е тази права на регресия към данните, има няколко имена. Едното име е стандартно отклонение на остатъчните стойности, а друго име е средно квадратично отклонение, понякога съкращавано на RMSD, понякога се нарича средна квадратична грешка. За всяка точка ще изчислим остатъчната стойност ще я повдигнем на квадрат, а после ще съберем сбора от повдигнатите на квадрат остатъчни стойности, ще вземем сбора на квадратите на остатъчните стойности и после ще разделим това на броя точки данни, които имаме, минус 2. В бъдещи видеа ще говорим или когато учиш статистика в по-горен клас, защо се дели на две, но ще кажа, че е свързано с идеята, че изчисляваме статистически данни и опитваме да изчислим реален параметър колкото се може по-добре, за тази цел n - 2 ни свършва тази работа. Но за да изчислим средното квадратично отклонение ще намерим корен квадратен от това. Може би ще забележиш прилика между това и как изчислявахме стандартното отклонение на извадката по-рано в уроците по статистиката и те окуражавам да помислиш за това. Но нека го изчислим на ръка, както споменах по-рано в това видео, за да видим как ще се развият нещата. За да направим това, ще направя малка таблица. Да кажем, че това е нашата стойност на х в тази колонка. Нека това да е стойността у. Да направим това у с шапка, което ще е равно на 2,5х - 2. После ще направим това остатъчната стойност на квадрат, което ще е стойността ни за у минус стойността на у с шапка, реалната минус изчислената стойност за това дадено х, на квадрат, а после ще ги съберем, ще разделим на (n - 2) и ще вземем корен квадратен. Първо да го направим за тази точка информация. Това е точката (1; 1). (1; 1). Какво е изчислението от правата на регресия? За тази стойност, когато х е равно на 1, това ще е 2,5 по 1, минус 2, така че ще е 2,5 по 1, минус 2, което е равно на 0,5. Остатъчната ни стойност ще е 1 - 0,5... (1 - 0,5) на квадрат, което е равно на – това ще е 0,5^2, което ще е 0,25. Да направим следващата точка информация. Имаме тази тук. Това е (2; 2). Изчислението ни от правата на регресия, когато х е равно на две, ще е равно на 2,5 по х стойността, по 2, минус 2, което ще е равно на 3 и остатъчната стойност на квадрат ще е 2 минус 3, на квадрат, което е -1^2, което дава 1. После можем да преминем към тази точка, точката (2; 3). Изчислението ни от правата на регресия ще е 2,5 по стойността на х, значи по 2, минус 2, което е равно на 3. Остатъчната стойност тук е нула, защото както виждаш, тази точка лежи на правата на регресия, така че това ще е 3 - 3, (3 - 3) на квадрат, което е равно на нула. Последно, но не и по важност, имаме тази точка тук, където х е три, стойността на у – този човек е учил три часа и е получил шест на теста, така че у е равно на шест, а изчислението от правата на регресия, можеш да видиш какво ще очакваш да получиш въз основа на правата на регресия – 2,5 по х стойността, по 3, минус 2, е равно на 5,5. Остатъчната стойност на квадрат е шест минус 5,5, на квадрат, това е (6 - 5,5)^2. Това е 0,5^2, което е 0,25. Следващата стъпка. Събирам всички тези повдигнати на квадрат остатъчни стойности, това е, нека го запиша така, ще го направя така... Сборът от остатъчните стойности, остатъчните стойности на квадрат, е равен на, ако просто събера всички тези, това дава 1,5. После ако разделя това на n - 2, това ще е равно на... имам четири точки данни, така че ще разделя на четири минус две, значи делим на две. После искам да намеря корен квадратен от това, после ще взема корен квадратен от това и това ще ни даде... 1,5 върху 2 е същото нещо като 3/4, така че това е корен квадратен от 3/4 или корен квадратен от 3 върху 2. Можеш да използваш калкулатор, за да изчислиш колко е това като десетична дроб, но това ни дава представа колко добро напасване е тази права на регресия. Колкото по-близко е това до нула, толкова по-добро напасване дава правата на регресия. Колкото по-далеч е от нула, толкова по-лошо е напасването. Какви ще са мерните единици на средно квадратичното отклонение? Това ще зависи от единиците върху оста у. В този случай ще са резултати на теста и това е една от другите стойности на изчислението, на коренуването на сбора на квадратите на остатъчните стойности, делени на n - 2. Голямата картинка, този корен квадратен от 3 върху 2, може да бъде разгледана като приблизителния размер на типична или средна грешка на прогнозиране между тези точки и това, което правата на регресия би прогнозирала, или можеш да го приемеш като приблизителния размер на типична или средна остатъчна стойност.