If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:6:12

Видео транскрипция

В това видео ще говорим за идеята за диаграма на остатъчни стойности за дадена регресия и информацията, която тя опитва да обясни. Ето тук имаме проста регресия, определена по метода на най-малките квадрати. Опитваме се да напаснем четири точки. В предишни видеа разглеждахме уравнението на регресионно права, получена с метода на най-малките квадрати. Сега ще нанеса остатъчните стойности за всяка от тези точки. Какво е остатъчна стойност? Просто за напомняне, остатъчната стойност за дадена точка е равна на реалната стойност минус прогнозираната. Как да направя това по-реално? Каква е остатъчната стойност за тази точка тук? При тази точка тук, реалната "у", когато "х" е равно на едно, е едно, но прогнозираната, когато "х" е равно на едно за тази линия на регресия по метода на най-малките квадрати, е 2,5 по едно минус две, като това ще е 0,5. Така че нашата остатъчна стойност е едно минус 0,5. Имаме положителна стойност, имаме положителна остатъчна стойност от 0,5. Тук, за тази точка, имаме остатъчна стойност от нула. Реалната стойност съвпада с прогнозираната. За тази точка тук, когато "х" е равно на две, реалната стойност "у" е две, но прогнозираната стойност е три. Нашата остатъчна стойност тук, отново, реалната е "у" е равно на две, при "х" равно на две. Прогнозираната стойност е две по 2,5 минус две, което е три, така че това ще е две минус три, което е равно на остатъчна стойност от -1. И тук нашата остатъчна стойност е реална. Когато "х" е равно на три, "у" е шест, а нашата прогнозирана стойност, когато "х" е три, е 5,5. Шест минус 5,5 е положително 0,5. Това са остатъчните стойности, но как да ги нанесем на графиката? Ще начертая осите. Нека го направя тук. Едно, две и три. Да видим, максималната остатъчна стойност тук е +0,5. Минималната е -1. Да видим, това може да е 0,5, едно, минус 0,5 и минус едно. Това е минус едно. Това е плюс едно. Каква беше остатъчната стойност, когато "х" е равно на едно? Реалната беше едно, а прогнозираната беше 0,5. Едно минус 0,5 е 0,5. Можем да я поставим ето тук. Остатъчната стойност е 0,5. Когато "х" е равно на две, имаме две точки информация. Първо, ще направя тази. При точката (2; 3) остатъчната стойност е нула. Остатъчната стойност за тази е нула. Остатъчната стойност за другата е –1. Нека го направя в различен цвят. Остатъчната стойност за другата е минус едно, така че ще я поставим ето тук. После е последната точка, като остатъчната стойност е +0,5. Ето така. Това, което създадох, е точно. При него виждаме, че за всяко "х", при което имаме съответна точка, поставяме точката над или под линията, въз основа на остатъчните стойности. Това се нарича диаграма на остатъчните стойности. Защо хората изобщо се тормозят да създават такава диаграма на остатъчните стойности? Отговорът е: без значение дали регресионната права е с възходящ наклон или с низходящ наклон, това ти дава идея колко добре тя изглажда данните и дали линията добре обяснява връзката между променливите. Общата идея е, че ако видиш, че точките са доста равномерно разпръснати или случайно разпръснати над и под тази линия, не различаваш някаква закономерност тук, тогава правата вероятно добре описва данните. Но ако видиш някаква тенденция, ако остатъчните стойности имат нарастващи стойности или създават крива нагоре-надолу, или имат намаляващи стойности, тогава ще разбереш, че правата не е добър избор и вероятно трябва да направиш нелинеен модел. Какви примери има за други видове диаграми на остатъчни стойности? Нека опитаме да ги анализираме. Тук имаш регресионна права и съответстващата ѝ диаграма на остатъчните стойности. Отново виждаш, че тук остатъчната стойност е леко положителна. Реалната стойност е малко над линията и, виждаш ето тук, е малко положителна. Тази е още повече положителна, както виждаш тук. Но както при примера, който току-що разгледахме, изглежда тези остатъчни стойности са доста равномерно разпределени над и под линията. Няма някаква отличаваща се тенденция. Така че бих казал, че за тези данни линейният модел и, в частност, регресионната права, е добър модел. Но, ако видим нещо такова, изниква различна картина. Когато погледна само диаграмата на остатъчните стойности, те не изглеждат равномерно разпръснати. Изглежда тук има някаква зависимост. Слизам надолу, но после се връщам нагоре. Когато видиш нещо такова, при което отиваш под х-оста на диаграмата на остатъчните стойности и после над нея, това може да означава, че вероятно линейният модел не е подходящ, за разлика от, може би, някакъв вид нелинеен модел. Някой вид нелинейна крива може да е по-добре да се нагоди към данните. Или – взаимовръзката между "у" и "х" е нелинейна. Друг начин да си представиш това е, когато имаш много остатъчни стойности, които са доста далеч от оста х на диаграмата на остатъчните стойности, можеш също да кажеш, че тази линия не се нагажда толкова добре към данните. Ако пресметнеш R стойността тук, тя ще е само леко положителна, но няма да е близка до едно.