If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Курс: Анализ на функции на много променливи > Раздел 2

Урок 5: Правило за диференциране на сложна функция на много променливи

Формално доказателство на правилото за диференциране на сложна функция на много променливи

Как изглежда правилото за диференциране на сложна функция на много променливи в контекста на определенията за граници на различните видове производни. Създадено от Грант Сандерсън.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Привет! За това видео бих казал, че е само препоръчително. В последните няколко урока разгледахме правилото за диференциране на сложна функция на много променливи и разгледахме едно доказателство на това правило, но това беше едно доста повърхностно доказателство. Многократно намирах производни по отношение на t, които после умножавах по едно малко количество dt, и си представяхме, че съкращаваме тези dt. Обаче може да се възрази, че това всъщност не е обикновена дроб, а това е производна, това е оператор за производна, така че нямаме право да съкращаваме по този начин. Но въпреки че това е точно така, логиката, на която стъпваме, за да направим това, всъщност доста добре пасва на формалното доказателство. Сега искам да разгледаме самото формално доказателство на правилото за диференциране на сложна функция на много променливи. Само да си припомним откъде тръгваме. Разглеждаме функцията v като векторна функция, така че това е една функция, в която въвеждаме входната стойност t, като t лежи на една числова ос, а после функцията v я изобразява в едно многомерно пространство. Най-простият случай, за който можеш да се сетиш, е това да е едно двумерно пространство, но може да е и тримерно пространство, може да е стомерно пространство. Не е задължително да си го представяш. После нашата функция f някак превръща това стомерно пространство, или двумерно, или тримерно пространство, каквото и да е то, функцията го изобразява върху една числова ос. Крайният резултат на тази сложна функция е просто да изобрази едно реално число в реално число, така че това е функция на една променлива. Тук намираме тази обикновена производна, това не е частна производна или градиент, не е нищо от този сорт. Но понеже се преминава междинно през многомерно пространство, имаме това междинно многомерно пространство, затова използваме градиент и и векторна производна. При формалното доказателство първото нещо, което може да направим, е просто да запишем формалното определение за производна. В този случай това е една граница. Дефинициите на производни винаги представляват един вид граница, когато променливата клони към нула. Така че тук грубо можем да си представим, че h е dt. Можем да напишем делта t, но е прието да използваме h, просто защото това можем да използваме за произволно диференциално количество. Така че това е в знаменателя, защото го разглеждаме като dt. В числителя е промяната на цялата функция, когато имаме малка промяна на аргумента t. Това, което имам предвид, е, че взимаме това f от v, но не от t, това е t плюс h, това е получената след промяната изходна стойност, и търсим по какво се различава от f от v от t – от първоначалната стойност v от t. Ето това се случва, когато просто приложим формалното определение за производна – за обикновена производна – към нашата сложна функция. А сега какво трябва да направим, за да намерим на какво е равно това? Можем да започнем с това – да видим досегашната логика, която използвахме за правилото за диференциране на сложна функция от много променливи. Представи си, че имаме малка промяна на входната стойност с някакво dt, някаква малка промяна, и тогава казваме, че това предизвиква промяна в междинното пространство, която е – досещаш се – можем да я означим с dv, което е промяната на вектора. Начинът, по който разсъждаваме, е че намираме векторната производна, умножаваме я по dt, което е коефициентът на пропорционалност на големината на промяната на аргумента и на получения вектор. Грубо казано, можеш да си представиш, че тeзи dt се съкращават, все едно че работим с обикновени дроби. Всъщност това няма значение. После казваме: "Какво предизвиква тази промяна?" Тази промяна с dv причинява промяна на f, като по определение предизвиканата промяна на изходните стойности на f е производната по направление на функцията f в посоката на нашия вектор на промяната. Това е приблизителната логика, и докъде ни отвежда това при формалното разглеждане? Казваме, че в това междинно пространство разглеждаме векторната производна на v. Така че може би е добра идея просто да запишем това определение, нали? Да запишем факта, че определението за векторната производна на v – пак повтарям – изглежда почти идентично. Всички тези определения за производни наистина изглеждат почти еднакви, защото това, което правим, е да намерим границата, когато h клони към нула, като това h го приемаме за dt. То стои един вид в знаменателя. Но тук ни интересува просто как се изменя векторът. Разликата, въпреки че един вид записваме това по един и същ начин, и като начин на записване това изглежда почти идентично, това, което е в числителя тук, това v от t плюс h и това v от t – и двете са вектори. Това един вид е вектор минус вектор. Когато намерим тази граница, получаваме векторът на границата, който се намира в нашето многомерно пространство. Това не е просто едно число. Друг начин да запишем това, който е много полезен, много по-удобен за преобразуване, е да кажем не че е равно на границата на тази стойност, аз просто ще копирам тази част, поставям я тук долу – и казвам, че стойността на нашата производна по същество е равна на това, като тук допускаме същата грешка, която ще запиша като Е от h, един вид функция на грешката – функция от h. Това, което трябва да отбележим, е, че стойността на тази функция клони към нула, когато h клони към нула. Сега просто записваме нещата по такъв начин, че да можем да преобразуваме малко по-лесно. Ще направя малко място ето тук. Сега можем да умножим двете страни по h. Това е нашата векторна производна, само я преписвам. Умножаваме по h. Това h си го представяме като dt, така че може би подсъзнателно ти се иска да съкратим това dt и това h. Това, на което е равно, този числител ето тук, който е v от t плюс h, минус v от t. Може би подсъзнателно си мислиш, че цялото това нещо представлява dv – промяната на v. Така че да съкратим това dt и това h всъщност изглежда правилно тук. Но разликата между по-повърхностното доказателство преди, където съкратихме тези двете, и това, което правим сега, е, че сега ние приемаме това като функция на грешката. В настоящия случай умножаваме по h, защото във функцията на грешката всичко се умножава по h. Има и друг начин, по който да запиша това. В математическия анализ е прието нещо, което е много удобно, където можем нещо като това да го заменим с малко о от h. Това по същество не е функция. Това е просто нещо, което ни показва, когато включва някаква функция, че е изпълнено свойството, че когато вземем тази функция и я разделим на h, това частно клони към нула, когато h клони към нула. Което е вярно, защото можеш да си представиш, че ако разделим това на h, тогава ще получим, че тези h се съкращават и получаваме функцията на грешката, която клони към нула. Сега ще използвам целия този израз, за да запиша това v от t плюс h. Причината да направя това е – ако се върнем тук горе – понеже виждаме, че v от t плюс h се появява в оригиналното определение, което ни интересува. Това е просто един начин да се захванем с това малко по-сериозно. Тук бих написал, че това v от t плюс h – тази изменена изходна стойност е равна на първоначалната стойност v от t, плюс – тук ще бъде плюс тази производна, като можем да разглеждаме това почти като полином на Тейлър, в който това е членът от първа степен. Изчисляваме го за произволна стойност на t, но го умножаваме по стойността на това малко изменение, по този линеен член. После всичко останало е някакво малко о от h. Може би трябва да се запитаме дали не е нужно да извадим това малко о от h. То по същество не е функция. То представя всичко, което се смалява. Може би трябва да кажа, че това е абсолютната стойност, например дължината, защото в този случай това е едно векторно количество. Досещаш се, тази грешка е вектор. Така че дължината на този вектор, разделена на големината на h клони към нула. Така че това е основният инструмент, който ще използваме. Това е начинът да представим v от t плюс h. И ако сега се върнем към първоначалното определение на векторната производна, ще копирам това и ще копирам това. Тук останаха някакви неща. Копирам първоначалното определение за обикновената производна на сложна функция, и сега, когато записвам нещата съгласно всички преобразувания, които току-що направих, това по същество пак е граница, защото h клони към нула. Но това, което ще запишем вътре, то е f от... сега вместо да запиша v от t плюс h, ще запиша всичко това, което направих ето тук горе. Това е стойността на v от t, плюс производната в някаква точка по големината на h. Пак повтарям, това прилича на полином на Тейлър. Това е линейният член, а после имаме плюс нещо, което не ни интересува, нещо, което ще е много малко, когато h става много малко, и е наистина много по-малко от h, което е още по-важно. От това изваждаме f от v от t. Почти излиза от дробната черта. Винаги не успявам да събера нещата. Всичко това е разделено на h. Идеята тук е, че когато разглеждаме това като граница, понеже го взимаме, когато h клони към нула, ние по същество можем да игнорираме този компонент о от h, понеже h клони към нула, и това е много, много малко в сравнение с h. Така че всичко, което е тук вътре, (огражда го със синьо) по същество е просто v от t, плюс стойността на този вектор, нали? Това е h по някакъв вектор. Но ако си спомняш, имахме урок, посветен на формалното определение на производна по направление. Ако си спомняш, или ако се върнеш и го гледаш сега, това е съвсем същото формално определение на производната по направление. Казваме, че h клони към нула, това, по което го умножаваме, е някакво векторно количество. Този вектор е малката промяна на нашата първоначална стойност, а после делим всичко на h. Така че по определение цялото това нещо е производната по направление, като тя е в направлението на производната на функцията от t. Записвам v прим от t, вместо да пиша цялото dv, dt тук отдолу. И цялото това о от f за каква стойност го изчисляваме? Мястото, откъдето тръгваме, е просто v от t, значи това е v от t. И това е отговорът. Защото, когато изчисляваме производната по направление, начинът, по който го правим, е да вземем градиента на функцията f, да го изчислим за точката, от която тръгваме, в този случай това е изходната стойност на v от t, и след това намираме скаларното произведение на това и на векторната производна... Искам да кажа скаларното произведение на това и на нашия вектор, какъвто и да е той, който в този случай е векторната производна на v, и получаваме правилото за диференциране на сложна функция на много променливи. Ако се върнеш и разгледаш разсъжденията ни, всичко това действително съответства на представата за малка промяна и определянето на резултата от тази малка промяна, нали? Понеже, причината да използваме тази векторна производна беше точно тази логика на разсъжденията. Причината за всички преобразувания, които направих, е понеже исках да мога да изразя каква е промяната на входната стойност на функцията v. А тази промяна представлява първоначалната стойност плюс определен вектор ето тук. Това е получената промяна в междинното пространство. Исках да изразя това по формален начин. Затова използвахме члена о от h, който представлява нещо, което много бързо намалява, но след като го изразихме по този начин, накрая получихме определението за производна по направление. Надявам се, че това доказателство те удовлетворява, ако предпочиташ нещата да бъдат изразени по-прецизно, за това какво представлява правилото за диференциране на сложна функция на много променливи. Може би трябва да спомена, че има и още по-обобщен вид на правилото за диференциране на сложна векторна функция на много променливи. Ще го разгледаме от друга гледна точка, когато разглеждаме връзките между анализа на функции на много променливи и линейната алгебра. Засега това е всичко, което ти е необходимо да знаеш за правилото за диференциране на сложна функция на много променливи, когато цялостната функция е просто от реално число към друго реално число. До скоро!