If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Локална линеаризация

Локална линеаризация е обобщението на функциите на допирателните равнини; тя може да се използва при функции с произволен брой променливи. Създадено от Грант Сандерсън.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

В последните няколко видео клипа ти показах как можеш да вземеш една функция, просто някаква функция на две променливи, и да намериш допирателна равнина към нейната графика, като начинът, по който направихме това, е първо да намерим една точка, някаква входна точка, която е – ще я запиша абстрактно като (х0; у0). Виждаш къде се намира тази точка върху графиката, и търсиш нова функция, която означаваме с L, може би е по-добре да бъде L с индекс f, която също е функция от х и от у. Искаш графиката на тази функция да е допирателна равнина към графиката на първоначалната функция. Този процес често се нарича по друг начин. Това се нарича локална линеаризация – това е доста дълга дума – линеаризация. Това означава, че: наричаме я локална, защото разглеждаме конкретна входна точка. В този случай, специфичната входна точка е (х0; у0). Идеята на линеаризацията е, че апроксимираме функцията с нещо по-просто, с някаква линейна фукция, и ще ти кажа какво имам предвид под линейна само след минутка. Основната идея тук е, че по същество нас не ни интересуват самите допирателни равнини в някакво абстрактно тримерно пространство към някаква графика. Причината да правим това е, че това е един много добър метод за апроксимиране на функция, която евентуално е една много сложна функция, като я апроксимираме с нещо много по-просто, с функция, която има константни частни производни. Целта ми в това видео е да ти покажа как можем да запишем тази локална линеаризация във векторен вид, защото така ще бъде едновременно по-кратка, и, надявам се, по-лесна за запомняне, както и ще бъде много по-обща. Тя ще е приложима за неща, които имат повече от две променливи, както в този случай. Само да си припомним докъде стигнахме, и какво получихме в последните няколко видеа – като този път ще го запиша малко по-абстрактно, вместо да използвам конкретен пример. Начинът, по който правим лолкална линеаризация е първо да намерим частната производна на f по отношение на х, която ще запиша като f с индекс х и я изчисляваме за (х0; у0) или х нулево, у нулево. Разглеждаме в точката, в която апроксимираме, и тогава умножаваме това по х минус тази константа х0. Единствената променлива тук, всичко друго са константи, а единствената променлива част тук е това х. После към него добавяме – принципно правим същото с у. Намираме частната производна на f по отношение на у, изчисляваме я в тази входна точка (х0; у0), точката, в която правим линеаризацията, и след това я умножаваме по (у – у0). След това към всичко дотук, понеже искаме да сме сигурни, че когато изчисляваме функцията в самата входна точка, досещаш се, когато заместим х нулево и у нулево, тези членове стават нули, защото х0 минус х0 е нула, този член става нула, и това е причината да използваме тези членове и да подредим константите по този начин. Така ни остава само да добавим стойността на самата функция в тази точка. Това ще ни гарантира, че нашата линеаризация всъщност е равна на самата функция в тази локална точка. Защото, надявам се, ако апроксимираме функцията около някаква точка, тогава в тази точка функцията трябва да е равна на собствената си стойност. А защо я наричаме линейна? Линейността е формулирана много точно, особено в линейната алгебра, и честно казано, това реално не е линейна функция в прекия смисъл на думата. Тук това означава най-общо, и затова хората я наричат линейна, означа, че този член х, членът с тази променлива, не съдържа нищо особено. Тук променливата просто е умножена по една константа, както и в този член у просто е умножен по константа. Не повдигаме на квадрат, няма квадратни корени, няма повдигане на степен или нещо друго от сорта. И въпреки че терминът линейно има по-точна формулировка, тук това значение ни е напълно достатъчно. Това е всичко, което трябва да знаем. Всяка променлива просто е умножена по някаква константа. Може да срещнеш това и в по-сложен вид, или поне така изглежда, когато се използват вектори. Първо да помислим как можем да опишем всичко това, което се случва тук, с вектори. Входната стойност, вместо да я разглеждаме като двойка стойности, можем да кажем, че това е някакъв вектор, който има тези стойности като компоненти, като искаме да използваме всичко това, и искаме да му дадем име. Донякъде за съжаление, името, което му даваме, е съвсем обикновено – наричаме го просто х, може да е удебелено х, което е много по-лесно за записване или печатане, така че аз просто ще опитам да удебеля това х, равно на този вектор, което е малко объркващо, защото това х вече присъства като входна променлива, където е просто число. Но ще се опитам да го удебеля, просто ще го повторя. Ще го срещаш често записано по този начин. х е този входен вектор, а после по същия начин определяме входната точка, в която апроксимираме, която ще направя като едно хубаво, удебелено х нулево. Поставяме индекс нула, за да покажем, че това е някаква константа. Всъщност това е вектор, който съдържа две числа, [х0; у0]. Така започваме да пишем нещата във вид на вектори, като удобството е в това, че когато работим с функция, която има три входни променливи, или четири, или сто, можем просто да запишем това удебелено х, което означава, че имаме вектор с много повече компоненти. Сега да разгледаме първите два члена на нашата линеаризация. Можем да я разглеждаме като скаларно произведение. Само първо ще преместя това, за да не ни пречи и да имаме повече място. Премествам го тук горе, това е същото нещо, и сега искам да запиша другия член тук като скаларно произведение. Това ще изглежда така, че имаме двете частни производни f спрямо х и f спрямо у, записвам ги с индекси, което показва, че това са частните производни по отношение на х и на у, като всяка от тях е определена. Да видим, ще направя това... ще ги определя за нашето удебелено х нулево, а после тази частна производна също ще определя за това удебелено х нулево. Можеш да си представиш това като вектор, който съдържа две различни променливи. Просто ги включваш и двете в един символ, и скаларното произведение е – отново, досещаш се, първият компонент е х минус х нулево, така че ще го запиша като х минус х нулево, което е число, а после, по същия начин, у минус... да видим, ще използвам същия цвят, минус у нулево, което е число. Можем да напишем и всяко от тези в по-компактен вид, защото този вектор, който съдържа частните производни, това е градиентът – ако това понятие ти е непознато, можеш да се върнеш и да гледаш видео уроците за градиент – но този целият вектор по същество ни казва: вземи градиента и го изчисли за този входен вектор, досещаш се, за х нулево. Вторият компонент тук ни казва, че имаме х и у минус х нулево и у нулево. Това, което правим по същество, е да вземем тази удебелена входна стойност, променливият вектор х, и после изваждаме х нулево, като х нулево е някаква константа. Така че това тук, това е просто един векторен член, където си представяме това като вектор с два компонента, и това е вектор с два компонента, но ако функцията ни е нещо по-сложно, ако тя има например сто променливи, ние пак записваме същото нещо. Просто трябва да знаем, че когато развием това, тогава ще има сто различни компонента на този вектор. Ето така изглежда линейният член изразен чрез вектори, защото скаларното произведение означава, че всички тези компоненти на този удебелен вектор х, който се развива като – досещаш се, неудебелени х, у, z и докъдето още трябва. Всички тези компоненти са умножени по някаква константа. Така че взимаме всичко това, това е начинът да опростим първите няколко члена ето тук, и, разбира се, просто добавяме стойността на самата функция. Така че можеш да вземеш този линеен член... не, искам да го сложа най-отпред, всъщност, когато разглеждаш добавянето на самата функция и изчисляването ѝ ето тук, тази константна входна стойност х нулево, защото по този начин можеш един вид да разглеждаш това като константен член, това като константен член, а после останалото тук е линейният член. Защото по-нататък, ако започнем да добавяме други членове, например квадратни членове, или някакви по-сложни неща, можем да ги добавяме накрая. Така че това ето тук, е изразът, който ще виждаш най-често за локална линеаризация. Единственото място, на което има променлива, векторната променлива, е ето тук, ето този член. Защото, знаеш, когато изчисляваме тази функция f за даден аргумент, това е просто константа. Когато изчисляваме градиента за този аргумент, това е просто константа. И изваждаме това, този конкретен аргумент, който е просто константа. Така че това е единственото място, където виждаме нашата променлива. След като кажем и направим всичко, след като свършим с изчисленията, това остава една много проста функция. Важният момент е, че това е една много по-проста функция от самата функция f, което ни позволява да изчисляваме много по-бързо, например, ако пишем някаква програма, която използва някаква сложна функция, но скоростта на програмата е много важна, или ако е функция, която не ни е известна, но можем да апроксимираме нейната стойност в дадена точка, и да апроксимираме нейния градиент. Това ни позволява да апроксимираме функцията като цяло около тази точка. Пак повтарям, това може би ти изглежда много абстрактно, но ако разгледаш внимателно всичко и се върнеш обратно там, откъдето то идва, и разгледаш някакъв конкретен пример за допирателна равнина, надявам се, че всичко това ще ти се стори много по-логично и ще осъзнаеш, че това наистина е възможно най-простата функция, която дава същата стойност като f, когато я изчислим в същата точка, и чиито частни производни са равни на частните производни на f, ако ги изчислим в същата конкретна точка. Ако искаш да видиш още примери за това, как изглежда и как можеш да го използваш, за да апроксимираш дадени функции, имаме специална статия по темата, която можеш да видиш, като ще е най-добре да си приготвиш лист хартия и да решиш самостоятелно дадените примери, докато разглеждаш статията. Това е всичко засега. До скоро!