Основно съдържание
Курс: Анализ на функции на много променливи > Раздел 3
Урок 6: Оптимизация с ограничение (статии)Множители на Лагранж (въведение)
Множителите на Лагранж са метод за решаване на оптимизационни задачи при наличие на ограничения. Полезно!
Основни идеи
- С помощта на множителите на Лагранж можем да намираме минимум или максимум на дадена функция
при наличие на ограничения върху аргументите. - Ограниченията изглеждат така:Където
е друга функция със същия брой аргументи като , а е константа. - Основната идея е да разгледаме точките, в които контурните линии на
и се допират. - С други думи, търсим точките, в които градиентите на
и са успоредни. - Този процес е еквивалентен на това да приравним градиента на една специална функция, наречена лагранжиан, на нулевия вектор.
Мотивиращ пример
Ако искаме да намерим максимума на следната функция:
но освен това стойностите на трябва да изпълняват следното условие:
С други думи търсим за коя точка върху стойността на израза е най-голяма.
Такива задачи наричаме оптимизационни задачи с ограничение. Условието за евентуалните решения се нарича "ограничение", а е функцията, чийто максимум или минимум ще търсим.
Нека визуализираме задачата по следния начин. Първо чертаем графиката на , която е наклонена равнина, тъй като функцията е линейна. След това проектираме вертикално окръжността от равнината върху графиката на . Търсеният максимум съответства на най-високата точка върху проекцията на окръжността.
В общ вид
В този раздел ще формулираме общия вид на оптимизационна задача с ограничение. За начало, искаме да намерим максимума или минимума на дадена функция на няколко променливи:
В този контекст функцията е скаларна, тъй като понятието "максимум" има значение само в едно измерение.
Ограничението, което ще разгледаме, е от вида = дадена константа . По-късно ще научим как да решаваме такива задачи с помощта на множители на Лагранж.
Тъй като ограничението важи за аргументите на , то функцията трябва да приема същия брой агументи като . Например в задачата по-горе двете функции са
Контурни карти (графики)
Подходящ метод за изобразяване на са т. нар. контурни карти.
Припомняме, че контурна линия на графиката на функцията наричаме множеството от точки, за които за дадена константа . Динамичната графика, изобразена по-долу, показва движението на тази контурна линия (в синьо) при промяна на . Окръжността е показана в червено. Опитай да намериш най-малката и най-голямата стойност на , за която контурната линия на пресича окръжността.
Упражнение: Какво означава за дадена стойност на контурната линия, представяща функцията да не пресича червената окръжност с уравнение ?
Окръжността е всъщност контурна линия на функцията . В такъв случай можем да забележим следното:
Ключово наблюдение: Максималните и минималните стойности на при дадено условие съответстват на контурните линии на , които допират контура .
Ако функцията не беше линейна, както е в нашия пример за линейна функция , контурните ѝ линии нямаше да са прави. Например,
,
Контурните линии на тази функция изглеждат така:
Но и тук горното наблюдение важи: когато е максимум или минимум на при дадено ограничение, контурните линии съответстващи на допират тези на .
Ролята на градиента
Какво e математическото значение на това, че две контурни линии се допират?
За да отговорим на този въпрос, трябва да разгледаме градиента . В този урок ще използваме свойството, че градиентът на в точката е вектор, перпендикулярен на контурната линия, минаваща през тази точка.
Това означава, че когато контурните линии на две функции и се допират, техните градиенти в допирната точка са успоредни. Ето как изглеждат те за две произволни функции и :
Фактът, че контурните линии се допират, не ни дава информация за отношението на дължините на двата успоредни градиента. Нека е точката, в която контурите на и на се допират. Тогава за градиентите им имаме следната зависимост:
където е константа, изразяваща отношението на дължините на двата градиента. Някои автори използват отрицателна константа , но в тази и в следващите статии ще използваме .
Нека се върнем към примера и . Градиентът на е равен на
и градиентът на е
Следователно условието за допиране на двете контурни линии изглежда така:
Обратно към нашия пример
Търсим точки със следните свойства
, тоест за някоя константа , тоест;
Получихме три уравнения за три неизвестни величини, което означава, че можем да ги решим еднозначно.
Лагранжиáнът
През 18. век математикът Джоузеф Луис Лагранж прекарал голяма част от живота си, занимавайки се с подобни оптимизационни задачи, и чрез работата си намерил начин да събере всички условия, които получихме при разсъжденията по-горе, в едно единствено уравнение.
В общия случай търсим константи , и , такива че:
- Ограничението:
- Допиращи се контури:
.
Можем да разбием това уравнение на две части по следния начин:
Лагранж успял да обедини тези три уравнения в едно (векторно) уравнение за друга функция, която приема същите аргументи като и , заедно с третия аргумент .
Например в нашия пример имаме
и новата функция ще изглежда така:
Обърни внимание, че частната производна на по е :
Тогава условието е еквивалентно на
Нещо повече, ако приравним на нула и другите две частни производни на тази функция, получаваме
Това е едно от условията, които изведохме! Аналогично уравнението е еквивалентно на
Трите условия заедно са еквивалентни на
Следователно трите уравнения, които трябва да решим, за да получим решенията за и , са уравнения за частните производни на . Тоест, търсим за кои стойности градиентът на е равен на :
Например в частния случай, с който започнахме, имаме
Функцията наричаме "лагранжиáн" на името на Лагранж, и новата променлива наричаме "множител на Лагранж".
Забележка: Някои автори записват с отрицателен знак:
Тази малка промяна не променя решенията, които получаваме, тъй като стойността на множителя на Лагранж може да е отрицателна.
Обобщение
За да намерим локалните екстремуми на функцията при наличие на дадено ограничение , изпълняваме следните стъпки:
- Стъпка 1: Въвеждаме нова променлива
(гръцката буква ламбда) и дефинираме функцията по следния начин:Функцията се нарича "лагранжиан", а новата променлива се нарича "множител на Лагранж" - Стъпка 2: Приравняваме градиента на
на нулевия вектор.С други думи, търсим критичните точки на . - Стъпка 3: За всяка критична точка
, заместваме съответните стойности в (всички координати без , тъй като няма аргумент ). Точката, която даде най-голяма (или най-малка) стойност на , е максимумът (или минимумът), който търсим.
Искаш ли да се присъединиш към разговора?
Все още няма публикации.