If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Курс: Анализ на функции на много променливи > Раздел 3

Урок 3: Оптимизация на функции на много променливи

Седлови точки

Само защото допирателната равнина към графиката на една функция на много променливи няма наклон не означава, че тази точка е локален минимум или максимум. Съществува и трета възможност, която се появява в анализа на функции на много променливи, и тя се нарича "седлова точка". Създадено от Грант Сандерсън.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

В последното видео разгледахме как можем да максимизираме или минимизираме една функция на много променливи. Представи си нейната графика. В този случай това е функция само на две променливи. Да разгледаме графиката ѝ. Търсим точките, в които допирателната равнина няма никакъв наклон. Един начин да изобразим това е като си представим хоризонтална равнина, която съответства на постоянна стойност на z, т.е. имаме постоянна изходна стойност на функцията. Ако я придвижим нагоре или надолу, гледаме точката, където тя едва докосва графиката отгоре, преди да се отдели от нея, което означава, че няма стойности на функцията, които са по-големи от стойността в тази точка. Така че гледаме къде се допира, къде можем да намерим допирателна равнина с наклон нула. Това ще ти даде някои други точки, като например този локален максимум ето тук, хълмче, в което стойността на функцията в тази точка е по-висока от всички съседни стойности. Досещаш се, че ако тръгнеш в която и да е посока, слизаш надолу, така че съществуват други места, които може да намерим случайно, когато търсим къде тази допирателна равнина е без наклон, но също така има и една много интересна нова възможност, която се появява, когато разглеждаме функции на много променливи. И това е така наречената "седлова точка". Ще покажа друга графика. Функцията, която разглеждаме, ще я запиша – функцията, чиято графика виждаме, е f от (х; у) равно на х на квадрат минус у на квадрат. Сега да помислим коя ще бъде допирателната равнина за тази графика в началната точка на тази координатна система. Допирателната равнина към тази графика в началото на координатата система всъщност е без наклон. Тя изглежда ето така. За да се убедиш в това, можем да изчислим частните производни на функцията и да ги пресметнем в началната точка на координатната система. Частната производна по отношение на х – х на квадрат е единственият член, в който виждаме х, така че производната е 2 по х. Другата частна производна по отношение на у – намираме производната на това минус у на квадрат, игнорираме х, защото в случая го приемаме като константа, когато диференцираме относно у. Производната е минус 2 по у. Ако заместим стойностите в началната точка на координатата система в тези две частни производни, заместваме с точката (х; у) = (0; 0). Тогава какво ще получим? В горната производна заместваме х равно на нула, стойността и става нула. По същия начин, когато у е нула, другата производна също е нула. Значи и двете частни производни са нули. Това означава, че ако се намираме в началната точка на координатната система и тръгнем в произволна посока, не наблюдаваме никакъв наклон при това движение. Един начин да се убедим в това е да разрежем графиката. Представи си, че я разрежем с една равнина, която представлява постоянна стойност на х, така че един вид срязваме графиката ето тук. Това, което ще видим – ще махна допирателната равнина. Това, което ще видим е кривата, в която тази равнина пресича графиката. Ще я покажа ето тук – кривата, която се получава при пресичането на графиката има локален максимум в началото на координатната система. Допирателната права към кривата в тази точка по посока у няма наклон, което се дължи на това, че от тази гледна точка това изглежда като локален максимум. Сега да си представим, че срязваме графиката в друга посока. Вместо това... имаме същата графика и вместо да я срежем за постоянна стойност на х, ще я срежем за постоянна стойност на у. В този случай разглеждаме кривата, и ако очертаем тази крива, в която тази равнина у равно на константа пресича графиката на функцията... да видим как изглежда тази крива. Тя има параболична форма. Отново допирателната права няма наклон, защото това изглежда като локален минимум на кривата. Понеже няма наклон в едната посока, и няма наклон в другата посока, допирателната равнина към графиката като цяло също няма да има наклон. Но обърни внимание, че това не е нито локалем максимум, нито локален минимум, защото в едната посока изглежда като локален максимум... ще махна това тук – в едната посока изглежда като локален максимум, когато разгледаме тази крива, но в другата посока, когато срежем графиката по другия начин, изглежда като локален минимум. И ако разгледаме уравненията, това изглежда логично, защото когато разглеждаме само преместване по посока х, тогава цялата функция изглежда като х на квадрат плюс някаква константа. Така че графиката на тази функция ще има формата на парабола, както функцията х на квадрат, в която има локален минимум, но ако разглеждаме движение само в посока у, ако се фокусираме само на компонента минус у на квадрат, тогава графиката на минус у на квадрат ще изглежда като обърната парабола. Ще я начертая още веднъж. Ще изглежда като обърната наобратно парабола, в която има локален максимум. Така че един вид посоките х и у са в противоречие в тази точка по въпроса дали допирателната равнина с нулев наклон тук е локален максимум или е локален минимум. Това е нещо ново, което се появява в анализа на функции на много променливи, нещо, което не наблюдаваме при анализа на функции на една променлива, защото, когато разглеждаме графиката на една функция, когато имаме някаква графика, ако допирателната права е с нулев наклон, ако допирателната права е напълно без наклон в някаква точка, това може да е или локален максимум, или локален минимум. Тя не може да е в противоречие, защото имаме само една входна променлива. Имаме единствено х като входна променлива на функцията. Но когато имаме две променливи, е възможно да се стигне до противоречие. Точка като тази си има специално име и това име донякъде отразява тази графика, която разглеждаме в момента – нарича се "седлова точка". Седлова точка. Това е един от редките случаи, в които харесвам термина, който са избрали математиците. Защото графиката изглежда като седло, това нещо, което се поставя на гърба на коня, за да седне на него ездачът. Едно от нещата, което означава това, е че ще опитаме да намерим начини, по които да определяме абсолютния максимум или минимум на една функция, като се опитаме да оптимизираме функцията, която може да представлява например печалбата на една компания или функцията за разходите на процеса на обучение на машини, или нещо подобно – ние трябва да можем да разпознаваме дали една точка е седлова точка. Ако просто разглеждаме графиката, това се вижда добре. Можем да определим визуално, но понякога, ако имаме само формулата на функцията, която е някаква много сложна формула – без да ползваме графиката, как бихме могли да определим само чрез аналитично изследване на функцията дали имаме или не седлова точка? Тук ще ни послужи така нареченият критерий на втората частна производна, за който ще говорим в следващите няколко урока. До скоро!