If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:7:06

Стандартно отклонение на остатъчни стойности или средно квадратично отклонение

Видео транскрипция

Интересува ни проучването на връзката между количеството учене за теста и резултатите от теста, където резултатът е между нула и шест. И ще разгледаме хора, които са решили теста, ще поставим на графика за всеки човек колко у ечил и резултата. Например, тази точка данни е някой, който е учил един час и е получил едно на теста. А после ще напаснем права на регресия и тази синя права на регресия е реалната права на регресия за тези четири точки данни, а тук е уравнението за тази права на регресия. Има няколко неща, които да помним. Обикновено, когато правиш този вид анализ ще го правиш с далеч повече от четири точки данни. Причината да ги оставя четири е понеже ще изчислим колко добро напасване е тази права на регресия на ръка и обикновено не го правиш на ръка, имаме компютри за тази цел. Начинът, по който ще измерим колко добро напасване е тази права на регресия към данните, има няколко имена. Едното име е стандартно отклонение на остатъчните стойности, а друго име е корен квадратно средно отклонение, понякога съкращавано на RMSD, понякога се нарича корен квадратна средна грешка. За всяка точка ще изчислим остатъчната стойност ще я повдигнем на квадрат, а после ще съберем сбора от повдигнатите на квадрат остатъчни стойности, ще вземем сбора от остатъчните стойности на квадрат и после ще разделим това на броя точки данни, които имаме, минус 2 и в бъдещи видеа ще говорим или в по-напреднал клас по статистика защо се дели на две, но е свързано с идеята, че изчисляваме статистически данни и опитваме да изчислим реален параметър колкото се може по-добре и n - 2 ни свършва тази работа. Но за да изчислим корен квадратното средно отклонение ще вземем корен квадратен от това и някои от вас може да разпознаят силни паралели между това и как изчислихме стандартното отклонение на извадката по-рано в кариерите си в статистиката и те окуражавам да помислиш за това. Но нека го изчислим на ръка, както споменах по-рано в това видео, за да видим как ще се развият нещата. За да направим това ще поставя малка таблица. Да кажем, че това е нашата х стойност в тази колонка. Нека направим това у стойността. Да направим това у с шапка, което ще е равно на 2,5х - 2 и после ще направим това остатъчната стойност на квадрат, което ще е у стойността ни минус у с шапка стойността, реалната минус изчислената стойност за това дадено х на квадрат, а после ще ги съберем, ще разделим на n - 2 и ще вземем корен квадратен. Първо нека направим тази точка информация. Това е точката (1; 1). (1; 1). Какво е изчислението от правата на регресия? За тази стойност, когато х е равно на 1, това ще е 2,5 по 1 минус 2, така че ще е 2,5 по 1 - 2, което е равно на 0,5 и остатъчната ни стойност ще е 1 - 0,5... 1 - 0,5 на квадрат, което е равно на, това ще е 0,5^2, което ще е 0,25. Добре, да направим следващата точка информация. Имаме тази тук. Това е (2; 2). Изчислението ни от правата на регресия, когато х е равно на две,ще е равно на 2,5 по х стойността по 2 минус 2, което ще е равно на 3 и остатъчната ни стойност на квадрат ще е 2 минус 3 на квадрат, което е -1^2, което ще е равно на 1. После можем да преминем към тази точка, точката (2; 3). Изчислението ни от правата на регресия ще е 2,5 по х стойността по 2 минус 2, което ще е равно на 3 и остатъчната стойност тук ще е нула и можеш да видиш, че тази точка седи на правата на регресия, така че това ще е 3 - 3, 3 - 3 на квадрат, което е равно на нула. И, последно, но не и по важност, маме тази точка тук, където х е три, у стойността ни... този човек е учил три часа и е получил шест на теста, така че у е равно на шест, а изчислението от правата на регресия, можеш да видиш какво ще очакваш да получиш въз основа на правата на регресия – 2,5 по х стойността, по 3 минус 2 е равно на 5,5 и остатъчната стойност на квадрат е шест минус 5,5 на квадрат, това е 5,5^2. Това е 0,5^2, което е 0,25. Следващата стъпка. Нека взема сбора от всички тези повдигнати на квадрат остатъчни стойности, това е, нека го запиша така, да го направя така... Сборът от остатъчните стойности, остатъчните стойности на квадрат, е равен на, ако просто събера всичко това, това ще е 1,5, 1,5 и после ако разделя това на n - 2, ако разделя на n - 2, това ще е равно на... имам четири точки данни, така че ще разделя на четири минус две, така че ще разделя на две, а после ще искам да взема корен квадратен от това, после ще взема корен квадратен от това и това ще ни даде... 1,5 върху 2 е същото нещо като 3/4, така че това е корен квадратен от 3/4 или корен квадратен от 3 върху 2 и можеш да изполваш калкулатор, за да изчислиш колко е това, за да изчислиш колко е това като десетична дроб, но това ни дава представа колко добро напасване е тази права на регресия. Колкото по-близко е това до нула, толкова по-добро напасване е правата на регресия. Колкото по-далеч е от нула, толкова по-лошо напасване е. И какви ще са мерните единици са корен квадатното средно отклонение? Това ще е спрямо каквито единици имаш на оста у. В този случай ще са резултат на теста и това е една от другите стойности на изчислението, на взимането на корен квадратен от сбора на квадратите на остатъчните стойности делени на n - 2. Голямата картинка, този корен квадратен от 3 върху 2, може да бъде разгледана като приблизителния размер на типична или средна грешка на прогнозиране между тези точки и това, което правата на регресия би прогнозирала, или можеш да го гледаш като приблизителния размер на типична или средна остатъчна стойност.
Кан Академия – на български благодарение на сдружение "Образование без раници".