Текущ час:0:00Обща продължителност:7:48

Видео транскрипция

. В това видео искам да ти дам пример какво означава да представим база данни приблизително с права. Вместо да правя моето традиционно видео, използвайки моя малък таблет, ще го направя направо в Ексел, така че да можеш да видиш как да го направиш самостоятелно, ако имаш Ексел или някакъв друг тип програма за електронни таблици. Няма да използваме неговите изчисления. Аз наистина искам само да добиеш обща представа за това какво означава да приспособиш данните към права или да направиш линейна регресия. Така че нека просто прочетем задачата. Следната таблица показва средния семеен доход в Калифорния... запомни, че това е средното, среден доход в Калифорния, от 1995 до 2002 г., както е докладвано от американското Бюро за преброяване на населението. Начертай точкова диаграма и намери уравнението. Колко очакваш да бъде средният годишен доход на едно калифорнийско семейство през 2010 година? Какъв е смисълът на наклона и точката на пресичане с Оу в тази задача? Първото нещо, което трябва да направим... просто копирах и поставих това изображение... трябва да получим данните във вид, който електронната таблица да може да разчете. Така че нека да направим няколко таблици тук. Да речем, годините от 1995. Нека направим това една колона. Ще направя това малко по-широко. След това нека поставя средния доход. Това е средният доход в Калифорния за едно семейство. И така, започваме с 1 година, или 0 години от 1995 насам, 0, 1, 2, 3, 4. Всъщност това ще определи тенденцията, ако просто продължиш да вървиш надолу. То ще покаже, че просто увеличаваш с 1. След това доходът, само ще копирам тези числа там. Така че, това е 53 807 долара, 55 217 долара, 55 209 долара, 55 415 долара, 63 100 долара, 63 206 долара, 63 761 долара и след това имаме 65 766 долара. Нямам нужда от тези тук. Така че ще се отърва от тях. Мога да ги изтрия. Нека се уверя, че имам достатъчно записи. Тези са 1, 2, 3, 4, 5, 6, 7, 8, и имам 1, 2, 3, 4, 5, 6, 7, 8 записа. Искам да се уверя, че имам правилните данни. 53 807 долара, 55 217 долара, 55 209 долара, 415, 100, 206, 761, 766. Добре, започваме. Сега ще откриеш, че в Ексел това е невероятно лесно, ако знаеш къде да натиснеш. Първо, постави тези данни, създай точкова диаграма или още по-добре, създай регресия на тези данни. Всичко, което трябва да направиш, е да избереш данните. След това ще направим точкова диаграма. След това можеш да избираш различни видове линейни диаграми. Аз просто искам да начертая данните. Ето. Това постави за мен данните. Ето. Ако сложиш това да е фактическият доход и това да е годината от 1995 г. И така, това е 1995 г. Тя беше с 53 807 долара. През 1996 г. доходът е 55 217 долара. Така че това изобрази всички данни. Сега искам да намеря една права, това не е точно права, но нека да видим... Ако приемем, че една права може да представи тези данни добре, аз ще накарам Ексел да я намери вместо мен. Това, което мога да направя, е да използвам всички тези опции тук горе за различни начини да образувам права, всички тези различни опции. Аз ще избера тази тук. Може да нямаш възможност да я видиш. Изглежда сякаш има права между точките. Има също и fx, което ми показва, че ще ми покаже уравнението на правата. Така че ако щракна върху това, ето го. Не само че я образува, ами постави отново същите данни на различна графика. Нека я направя малко по-голяма. Нека я направя малко по-.... Не, не искам това. Нека я направя малко по-голяма. Можем да закрием данните сега, просто защото мисля, че знаем какво се случва. Така че нека ги закрия ето така. И така, програмата не само постави различните точки от данни, тя действително образува права към тези данни и ми даде уравнението на тази права. Това казва, че уравнението на тази права е у... Нека да видим, дали мога да направя това малко по-голямо. Нека видя дали мога да го... Ще го преместя отвън, така че да можеш поне да го прочетеш. Това ми казва точно тук, че уравнението за тази права е y = 1 882,3х + 52 847. Така че, ако си спомняш какво знаем за наклона и пресечната точка с Оу, ординатата на пресечната точка с Оу е 52 847, което е, ако използваш тази права като твоя мярка, това е където тази права пресича година 0, или през 1995 г. Ако използваш тази права като модел, през 1995 г. правата ти показва, че средният доход е 52 847 долара. Актуалните данни бяха малко по-различни от това. Те бяха малко по-високи, 53 807 долара. Те бяха малко по-високи. Но ние се опитваме да получим една права, която се доближава колкото се може повече до всички тези данни. Това всъщност се опитва да сведе до минимум разстоянието, квадрата на разстоянието, между всяка една от тези точки и правата. Няма да правим изчисления там. Но това ни дава това хубаво уравнение. Сега можем да използваме това хубаво уравнение, за да предвидим нещата. Ако кажем, че това е добър модел за данните – нека придвижа това малко надолу – нека се опитаме да отговорим на нашия въпрос. И така, ние направихме точкова диаграма – всъщност Ексел го направи за нас. Намерихме уравнението там. И ни питат в условието: "Какъв очаквате да бъде средният годишен доход на едно калифорнийско семейство през 2010 година?" Тук просто можем да използваме уравнението, което ни е дадено. Това точно тук беше 2002 г. Така че аз мога да напиша годината. Това беше 2002 година. 2010 година е след още 8 години. Нека направя малка колона тук. Нека направя малка колона тук. Това е годината, 1995, 1996. След това Ексел ще може да ги намери, ако избера тези и отида до това малко квадратче на дъното вдясно и превъртам надолу, Ексел всъщност ще разбере, че аз искам да увеличавам с 1 година всеки път. Ако кажа годините от 1995 г.... още веднъж, мога просто да продължа тази тенденция тук. 2010 е след 15 години. Можем просто да приложим това уравнение. Бихме могли да кажем, че ще бъде равно на... според тази права... просто ще го напечатам, надявайки се да можеш да прочетеш, това което казвам - 1 882,3 по x. x тук е годината от 1995 г. насам. Мога просто да избера тази клетка или мога да напиша вътре числото 15. Това означава, умножено по тази клетка, по 15. След това плюс 52 847, плюс това там. Щракваш върху Въведи и той прогнозира 81 081,50 долара. Ако просто продължиш тази права за още 8 или така нататък години, това прогнозира, че средният доход в Калифорния за едно семейство ще бъде 81 000 долара. Както и да е, надявам се, че това ти беше интересно. Електронните таблици са много полезни инструменти за обработка на данни. Това ще ти даде представа защо линейните модели са интересни, защо правите са интересни и как можеш всъщност да използваш тези инструменти, за да интерпретираш данни и може би дори да екстраполираш някакъв тип прогнози. Това тук е екстраполация с използване на тази линейна регресия. .