Основно съдържание
Курс: Анализ на функции на много променливи > Раздел 3
Урок 4: Оптимизиране на функции на много променливи (статии)- Максимуми, минимуми и седлови точки
- Критерий на вторите частни производни за определяне на вида на критичните точки
- Критерий на вторите частни производни, доказателство
- Примери: Критерий на вторите частни производни
- Градиентно спускане
© 2024 Khan AcademyУсловия за ползванеДекларация за поверителностПолитика за Бисквитки
Максимуми, минимуми и седлови точки
Как изглеждат локалните максимуми и минимуми на функция на няколко променливи
Основни идеи
- Интуитивно, локалният максимум е "връх" в графиката на дадена функция, точно като при функциите на една променлива.
- В точките на локален максимум на функция на много променливи градиентът е равен на нулевия вектор, а допирателната равнина към графиката на функцията е хоризонтална.
- Формално, локалният максимум е такава точка в дефиниционната област на функцията
, че съществува околност на тази точка, в която стойностите на функцията във всичко останали точки са по-малки от стойността ѝ в точката на локален максимум.
Оптимизиране в по-високи измерения
Едно от най-важните приложения на математическия анализ е намирането на максимуми и минимуми на функции.
- Например, ако управителят на дадена фирма иска да намери максималната възможна печалба при определени заплати, производствени цени и т.н.
- Или в дизайна на автомобили често търсим минималното съпротивление на въздуха при дадена форма на колата.
- В сферата на изкуствения интелект компютърната програма се "учи" как да изпълнява дадена задача като търси минимума на дадена "оценъчна функция".
Локални максимуми и минимуми, визуално представяне
Нека първо разгледаме функции, които можем да визуализираме удобно чрез графика. Например
Тази функция има много върхове и издатини, всяка една от които наричаме локален максимум (мн.ч. локални максимуми).
- Точката
в равнината , съответстваща на такъв връх, се нарича точка на локален максимум. - Стойността на самата функция в тази точка е самият локален максимум.
Използваме думата "локален", за да направим разграничение от термина глобален максимум. Разликата между двете е, че ако се намираме на върха на някоя планина, това е локален максимум. Само когато върхът е Еверест, този максимум е глобален.
В края на урока ще видим формалната дефиниция на локален максимум. Интуицията обаче е следната: намираме се в локален максимум, когато малко изместване в която и да е посока намалява стойността на функцията.
Аналогично, ако графиката има вдлъбнатина в дадена точка , точката наричаме точка на локален минимум, а съответстващата ѝ стойност на функцията - локален минимум. В такава точка всяко малко отместване в произволна посока води до нарастване на функцията.
Критични точки при функции на една променлива (преговор)
Следва набързо да си припомним как се намират локалните максимуми и минимуми на функции на една променлива. Да разгледаме следната задача:
Упражнение: За коя стойност на функцията има най-голяма стойност? На колко е равна тази стойност?
Локалните максимуми и минимуми на функцията са стойностите на , за които . Това е така, понеже за функция, която е непрекъсната и диференцируема, допирателната към графиката ѝ в тези точки е хоризонтална, т.е. има наклон .
Тези стойности на имат няколко различни имена:
- Неподвижна точка
- Стационарна точка
- Критична точка (у нас е прието да се използва термина критична точка)
Всички тези термини означават едно и също:
В тази дефиниция условието да е непрекъсната и диференцируема е важно, тъй като например при прекъсната функция точката на прекъсване може да е локален максимум:
Ако функцията е непрекъсната, но не е диференцируема, можем да имаме локален максимум, изглеждащ така:
Във всеки от тези случаи допирателната към графиката в тези максимуми не е дефинирана.
Обаче, дори когато е навсякъде непрекъсната и диференцируема, не е достатъчно производната да е , тъй като това се случва не само в локалните екстремуми, а и в инфлексните точки на функцията:
Това означава, че намирането на критичните точки е само първата стъпка в търсенето на максимума на функцията.
Критични точки при функции на две променливи
Ситуацията с функциите на няколко променливи е аналогична на познатите ни едномерни функции. Когато функцията е непрекъсната и диференцируема, в точката на локален максимум или минимум всичките ѝ частни производни са равни на .
По отношение на графиката на функцията това означава, че допирателната равнина в точки на локален максимум или минимум е хоризонтална. Например ето как изглежда една графика с няколко локални екстремума и съответните им допирателни равнини:
Всички частни производни в дадена точка са равни на нула тогава и само тогава, когато градиентът в тази точка е равен на нулевия вектор:
Можем да запишем този израз по-компактно по следния начин:
Припомняме, че удебелените променливи са вектори. е векторът от аргументи на функцията , а е нулевият вектор.
Точките , които изпълняват това условие, наричаме по същия начин като критичните точки при наличието само на една променлива:
- Неподвижна точка
- Стационарна точка
- Критична точка
Използваме термините "неподвижна точка" и "стационарна точка", тъй като стойността на функцията се променя необичайно бавно в околността на такива точки. Терминът "критична точка" винаги ми се е струвал прекалено драматичен, все едно функцията я грози някаква опасност около тази точка.
Както и при скаларните функции, нулевият градиент не е достатъчно условие за локален екстремум. Точката също може да е нещо като инфлексна:
Обаче имаме и съвсем нова възможност, която не се среща при функции на една променлива.
Седлови точки
Нека разгледаме функцията . Да видим какво се случва около началната точка .
- Двете първи производни са
:
Следователно е критична точка.
- Когато оставим само
като променлива, дадената функция се свежда до . Тази функция има локален минимум в точката . - Когато оставим само
като променлива, дадената функция се свежда до . Тази функция има локален максимум в точката .
С други думи, променливите и дават различна информация за вида на критичната точка . Тя не е нито минимум, нито максимум, нито инфлексна точка!
Ето как изглежда графиката на тази функция:
Околността на точката прилича много на конско седло.
Заради визуалната си прилика със седло такава критична точка наричаме седлова точка. По дефиниция седловата точка е критична точка, която е максимум в една посока и минимум в друга.
Максимум или минимум
"Добре,"
мислим си,
"значи градиент не е достатъчен за екстремум, понеже може да имаме инфлексни точки или седлови точки. Но как можем да разпознаем дали дадена критична точка е локален максимум или минимум?"
Това е темата на следващата статия върху критерия за определяне на вида на критичните точки. Засега ще завършим с кратка дефиниция на локален максимум.
Формална дефиниция
Дори и когато имаме интуитивна идея за значението на дадена математическа дефиниция, винаги е полезно да обърнем внимание и на формалната ѝ форма. Това е важно, тъй като в математиката често се налага да превеждаме интуиция в прецизни твърдения, и обратно.
За да дефинираме понятието локален максимум, ще означим с вектори, например с , аргументите на дадените функции.
Дефиниция на локален максимум: Дадена скаларна функция има локален максимум в точката ако съществува положителна константа , такава че:
Нека разясним за какво става въпрос:
Изразът " " означава, че променливата е на разстояние от максимума . Например, когато векторът е двумерен, това означава, че лежи във вътрешността на кръга с радиус и център .
В по-общия случай, когато векторът е -мерен, множеството от всички вектори , такива че , е -мерна сфера с радиус и център .
Можем да преведем тази дефиниция от математически език на български по следния начин:
е локален максимум на ако съществува малък (кръгъл) регион около точката , такъв че максималната стойност на измежду всички точки в региона е в точката .
Упражнение: Запиши формалната дефиниция за локален минимум, като внимателно обмислиш (докато се убедиш, че разбираш) всяка част от нея.
Обобщение
- Интуитивно, локалният максимум е "връх" в графиката на дадена функция, точно като при функциите на една променлива.
- В точките на локален максимум на функция на много променливи градиентът е равен на нулевия вектор, а допирателната равнина към графиката на функцията е хоризонтална.
- Формално, локалният максимум е такава точка в дефиниционната област на функцията
, че съществува околност на тази точка, в която стойностите на функцията във всичко останали точки са по-малки от стойността ѝ в точката на локален максимум.
Искаш ли да се присъединиш към разговора?
Все още няма публикации.