If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Максимуми, минимуми и седлови точки

Как изглеждат локалните максимуми и минимуми на функция на няколко променливи

Основни идеи

  • Интуитивно, локалният максимум е "връх" в графиката на дадена функция, точно като при функциите на една променлива.
  • В точките на локален максимум на функция на много променливи градиентът е равен на нулевия вектор, а допирателната равнина към графиката на функцията е хоризонтална.
  • Формално, локалният максимум е такава точка в дефиниционната област на функцията f, че съществува околност на тази точка, в която стойностите на функцията във всичко останали точки са по-малки от стойността ѝ в точката на локален максимум.

Оптимизиране в по-високи измерения

Едно от най-важните приложения на математическия анализ е намирането на максимуми и минимуми на функции.
  • Например, ако управителят на дадена фирма иска да намери максималната възможна печалба при определени заплати, производствени цени и т.н.
  • Или в дизайна на автомобили често търсим минималното съпротивление на въздуха при дадена форма на колата.
  • В сферата на изкуствения интелект компютърната програма се "учи" как да изпълнява дадена задача като търси минимума на дадена "оценъчна функция".

Локални максимуми и минимуми, визуално представяне

Нека първо разгледаме функции, които можем да визуализираме удобно чрез графика. Например
f(x;y)=cos(x)cos(y)ex2y2
Тази функция има много върхове и издатини, всяка една от които наричаме локален максимум (мн.ч. локални максимуми).
Върхове
  • Точката (x0;y0) в равнината xy, съответстваща на такъв връх, се нарича точка на локален максимум.
  • Стойността на самата функция в тази точка е самият локален максимум.
Използваме думата "локален", за да направим разграничение от термина глобален максимум. Разликата между двете е, че ако се намираме на върха на някоя планина, това е локален максимум. Само когато върхът е Еверест, този максимум е глобален.
В края на урока ще видим формалната дефиниция на локален максимум. Интуицията обаче е следната: намираме се в локален максимум, когато малко изместване в която и да е посока намалява стойността на функцията.
Аналогично, ако графиката има вдлъбнатина в дадена точка (x;y), точката наричаме точка на локален минимум, а съответстващата ѝ стойност на функцията - локален минимум. В такава точка всяко малко отместване в произволна посока води до нарастване на функцията.
Вдлъбнатини

Критични точки при функции на една променлива (преговор)

Допирателните имат наклон 0 в точки на локален екстремум
Допирателните имат наклон 0 в точки на локален екстремум
Следва набързо да си припомним как се намират локалните максимуми и минимуми на функции на една променлива. Да разгледаме следната задача:
Упражнение: За коя стойност на x функцията f(x)=(x2)2+5 има най-голяма стойност? На колко е равна тази стойност?
x=
Максималната стойност на f е

Локалните максимуми и минимуми на функцията f са стойностите на a, за които f(a)=0. Това е така, понеже за функция, която е непрекъсната и диференцируема, допирателната към графиката ѝ в тези точки е хоризонтална, т.е. има наклон 0.
Тези стойности на a имат няколко различни имена:
  • Неподвижна точка
  • Стационарна точка
  • Критична точка (у нас е прието да се използва термина критична точка)
Всички тези термини означават едно и също: f(a)=0
В тази дефиниция условието f да е непрекъсната и диференцируема е важно, тъй като например при прекъсната функция точката на прекъсване може да е локален максимум:
Ако функцията f е непрекъсната, но не е диференцируема, можем да имаме локален максимум, изглеждащ така:
Във всеки от тези случаи допирателната към графиката в тези максимуми не е дефинирана.
Обаче, дори когато f е навсякъде непрекъсната и диференцируема, не е достатъчно производната да е 0, тъй като това се случва не само в локалните екстремуми, а и в инфлексните точки на функцията:
Допирателна в инфлексна точка
Това означава, че намирането на критичните точки е само първата стъпка в търсенето на максимума на функцията.

Критични точки при функции на две променливи

Ситуацията с функциите на няколко променливи е аналогична на познатите ни едномерни функции. Когато функцията е непрекъсната и диференцируема, в точката на локален максимум или минимум всичките ѝ частни производни са равни на 0.
fx(x0;y0;)Частна производна спрямо x=0fy(x0;y0;)Частна производна спрямо y=0
По отношение на графиката на функцията това означава, че допирателната равнина в точки на локален максимум или минимум е хоризонтална. Например ето как изглежда една графика с няколко локални екстремума и съответните им допирателни равнини:
Видео плейър на видеоклиповете в Кан Академия
Всички частни производни в дадена точка са равни на нула тогава и само тогава, когато градиентът в тази точка е равен на нулевия вектор:
=f(x0;y0;)=[fx(x0;y0;)fy(x0;y0;)]=[00]
Можем да запишем този израз по-компактно по следния начин:
f(x0)=0
Припомняме, че удебелените променливи са вектори. x0 е векторът от аргументи на функцията (x0;y0;), а 0 е нулевият вектор.
Точките x0, които изпълняват това условие, наричаме по същия начин като критичните точки при наличието само на една променлива:
  • Неподвижна точка
  • Стационарна точка
  • Критична точка
Използваме термините "неподвижна точка" и "стационарна точка", тъй като стойността на функцията се променя необичайно бавно в околността на такива точки. Терминът "критична точка" винаги ми се е струвал прекалено драматичен, все едно функцията я грози някаква опасност около тази точка.
Както и при скаларните функции, нулевият градиент не е достатъчно условие за локален екстремум. Точката също може да е нещо като инфлексна:
инфлексна точка в 3D
Обаче имаме и съвсем нова възможност, която не се среща при функции на една променлива.

Седлови точки

Нека разгледаме функцията f(x;y)=x2y2. Да видим какво се случва около началната точка (0;0).
  • Двете първи производни са 0:
x(x2y2)=2x2(0)=0y(x2y2)=2y2(0)=0
Следователно (0;0) е критична точка.
  • Когато оставим само x като променлива, дадената функция се свежда до f(x;0)=x202=x2. Тази функция има локален минимум в точката x=0.
  • Когато оставим само y като променлива, дадената функция се свежда до f(0;y)=02y2=y2. Тази функция има локален максимум в точката y=0.
С други думи, променливите x и y дават различна информация за вида на критичната точка (0;0). Тя не е нито минимум, нито максимум, нито инфлексна точка!
Ето как изглежда графиката на тази функция:
Видео плейър на видеоклиповете в Кан Академия
Околността на точката (0;0;0) прилича много на конско седло.
Буквално, седло.
Заради визуалната си прилика със седло такава критична точка наричаме седлова точка. По дефиниция седловата точка е критична точка, която е максимум в една посока и минимум в друга.

Максимум или минимум

"Добре,"
мислим си,
"значи градиент 0 не е достатъчен за екстремум, понеже може да имаме инфлексни точки или седлови точки. Но как можем да разпознаем дали дадена критична точка е локален максимум или минимум?"
Това е темата на следващата статия върху критерия за определяне на вида на критичните точки. Засега ще завършим с кратка дефиниция на локален максимум.

Формална дефиниция

Дори и когато имаме интуитивна идея за значението на дадена математическа дефиниция, винаги е полезно да обърнем внимание и на формалната ѝ форма. Това е важно, тъй като в математиката често се налага да превеждаме интуиция в прецизни твърдения, и обратно.
За да дефинираме понятието локален максимум, ще означим с вектори, например с x, аргументите на дадените функции.
Дефиниция на локален максимум: Дадена скаларна функция f има локален максимум в точката x0 ако съществува положителна константа r>0, такава че:
f(x)f(x0) за всички стойности на x, за които ||xx0||<r
Нека разясним за какво става въпрос:
Изразът "||xx0||<r" означава, че променливата x е на разстояние r от максимума x0. Например, когато векторът x е двумерен, това означава, че x лежи във вътрешността на кръга с радиус r и център x0.
Изображение на условието ||xx0||<r
В по-общия случай, когато векторът x е n-мерен, множеството от всички вектори x, такива че ||xx0||<r, е n-мерна сфера с радиус r и център x0.
3D сфера
Можем да преведем тази дефиниция от математически език на български по следния начин:
  • x0 е локален максимум на f ако съществува малък (кръгъл) регион около точката x0, такъв че максималната стойност на f измежду всички точки в региона е в точката x0.
Упражнение: Запиши формалната дефиниция за локален минимум, като внимателно обмислиш (докато се убедиш, че разбираш) всяка част от нея.

Обобщение

  • Интуитивно, локалният максимум е "връх" в графиката на дадена функция, точно като при функциите на една променлива.
  • В точките на локален максимум на функция на много променливи градиентът е равен на нулевия вектор, а допирателната равнина към графиката на функцията е хоризонтална.
  • Формално, локалният максимум е такава точка в дефиниционната област на функцията f, че съществува околност на тази точка, в която стойностите на функцията във всичко останали точки са по-малки от стойността ѝ в точката на локален максимум.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.