If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Множители на Лагранж (въведение)

Множителите на Лагранж са метод за решаване на оптимизационни задачи при наличие на ограничения. Полезно!

Основни идеи

  • С помощта на множителите на Лагранж можем да намираме минимум или максимум на дадена функция f(x;y;) при наличие на ограничения върху аргументите.
  • Ограниченията изглеждат така:
    g(x;y;)=c
    Където g е друга функция със същия брой аргументи като f, а c е константа.
  • Основната идея е да разгледаме точките, в които контурните линии на f и g се допират.
  • С други думи, търсим точките, в които градиентите на f и g са успоредни.
  • Този процес е еквивалентен на това да приравним градиента на една специална функция, наречена лагранжиан, на нулевия вектор.

Мотивиращ пример

Ако искаме да намерим максимума на следната функция:
f(x;y)=2x+y
Чертаем графиката на функцията f(x;y)=2x+y
Чертаем графиката на функцията f(x;y)=2x+y
но освен това стойностите на (x;y) трябва да изпълняват следното условие:
x2+y2=1
Единична окръжност
Всички точки (x;y), за които x2+y2=1, наричаме единична окръжност.
С други думи търсим за коя точка (x;y) върху единичната окръжност стойността на израза 2x+y е най-голяма.
Такива задачи наричаме оптимизационни задачи с ограничение. Условието x2+y2=1 за евентуалните решения се нарича "ограничение", а f(x;y)=2x+y е функцията, чийто максимум или минимум ще търсим.
Нека визуализираме задачата по следния начин. Първо чертаем графиката на f(x;y), която е наклонена равнина, тъй като функцията f е линейна. След това проектираме вертикално окръжността x2+y2=1 от равнината xy върху графиката на f. Търсеният максимум съответства на най-високата точка върху проекцията на окръжността.
Видео плейър на видеоклиповете в Кан Академия

В общ вид

В този раздел ще формулираме общия вид на оптимизационна задача с ограничение. За начало, искаме да намерим максимума или минимума на дадена функция на няколко променливи:
f(x;y;z;)
В този контекст функцията е скаларна, тъй като понятието "максимум" има значение само в едно измерение.
Ограничението, което ще разгледаме, е от вида g(x;y;z;) = дадена константа c. По-късно ще научим как да решаваме такива задачи с помощта на множители на Лагранж.
g(x;y;z;)=c
Тъй като ограничението важи за аргументите на f, то функцията g трябва да приема същия брой агументи като f. Например в задачата по-горе двете функции са
f(x;y)=2x+y
g(x;y)=x2+y2
c=1

Контурни карти (графики)

Подходящ метод за изобразяване на f са т. нар. контурни карти.
Припомняме, че контурна линия на графиката на функцията f(x;y) наричаме множеството от точки, за които f(x;y)=k за дадена константа k. Динамичната графика, изобразена по-долу, показва движението на тази контурна линия (в синьо) при промяна на k. Окръжността g(x;y)=1 е показана в червено. Опитай да намериш най-малката и най-голямата стойност на k, за която контурната линия на f пресича окръжността.
Упражнение: Какво означава за дадена стойност на k контурната линия, представяща функцията f(x;y)=k да не пресича червената окръжност с уравнение g(x;y)=1?
Избери един отговор:

Окръжността g(x;y)=1 е всъщност контурна линия на функцията g. В такъв случай можем да забележим следното:
Ключово наблюдение: Максималните и минималните стойности на f при дадено условие g(x;y)=1 съответстват на контурните линии на f, които допират контура g(x;y)=1.
Ограничените екстремуми се допират.
Ако функцията f не беше линейна, както е в нашия пример за линейна функция f, контурните ѝ линии нямаше да са прави. Например,
f(x;y)=2x2+5y,
Контурните линии на тази функция изглеждат така:
Но и тук горното наблюдение важи: когато k е максимум или минимум на f при дадено ограничение, контурните линии съответстващи на f(x;y)=k допират тези на g(x;y)=1.

Ролята на градиента

Какво e математическото значение на това, че две контурни линии се допират?
За да отговорим на този въпрос, трябва да разгледаме градиента f. В този урок ще използваме свойството, че градиентът на f в точката (x0;y0) е вектор, перпендикулярен на контурната линия, минаваща през тази точка.
Градиентът е перпендикулярен на контурната крива.
Това означава, че когато контурните линии на две функции f и g се допират, техните градиенти в допирната точка са успоредни. Ето как изглеждат те за две произволни функции f и g:
Изображение на допиращи се контурни линии (от Wikipedia)
Фактът, че контурните линии се допират, не ни дава информация за отношението на дължините на двата успоредни градиента. Нека (x0;y0) е точката, в която контурите на f и на g се допират. Тогава за градиентите им имаме следната зависимост:
f(x0;y0)=λ0g(x0;y0)
където λ0 е константа, изразяваща отношението на дължините на двата градиента. Някои автори използват отрицателна константа λ0, но в тази и в следващите статии ще използваме λ0.
Нека се върнем към примера f(x;y)=2x+y и g(x;y)=x2+y2. Градиентът на f е равен на
f(x;y)=[x(2x+y)y(2x+y)]=[21]
и градиентът на g е
g(x;y)=[x(x2+y21)y(x2+y21)]=[2x2y]
Следователно условието за допиране на двете контурни линии изглежда така:
[21]=λ0[2x02y0]

Обратно към нашия пример

Търсим точки (x0;y0) със следните свойства
  • g(x0;y0)=1, тоест
    x02+y02=1
  • f(x0;y0)=λ0g(x0;y0) за някоя константа λ0, тоест;
    2=2λ0x01=2λ0y0
Получихме три уравнения за три неизвестни величини, което означава, че можем да ги решим еднозначно.

Лагранжиáнът

Как изглежда Лагранж
Джоузеф Луис Лагранж, спокоен, сдържан и сънлив по едно и също време. Wikimedia Commons
През 18. век математикът Джоузеф Луис Лагранж прекарал голяма част от живота си, занимавайки се с подобни оптимизационни задачи, и чрез работата си намерил начин да събере всички условия, които получихме при разсъжденията по-горе, в едно единствено уравнение.
В общия случай търсим константи x0, y0 и λ0, такива че:
  • Ограничението:
    g(x0;y0)=c
  • Допиращи се контури:
    f(x0;y0)=λ0g(x0;y0).
Можем да разбием това уравнение на две части по следния начин:
  • fx(x0;y0)=λ0gx(x0;y0)
  • fy(x0;y0)=λ0gy(x0;y0)
Лагранж успял да обедини тези три уравнения в едно (векторно) уравнение за друга функция, която приема същите аргументи като f и g, заедно с третия аргумент λ.
L(x;y;λ)=f(x;y)λ(g(x;y)c)
Например в нашия пример имаме
f(x;y)=2x+yg(x;y)=x2+y2c=1
и новата функция ще изглежда така:
L(x;y;λ)=2x+yλ(x2+y21).
Обърни внимание, че частната производна на L по λ е (g(x;y)c):
Lλ(x;y;λ)=λ(f(x,y)λ(g(x;y)c)=0(g(x;y)c)
Тогава условието g(x;y)=c е еквивалентно на
Lλ(x;y;λ)=g(x;y)+c=0
Нещо повече, ако приравним на нула и другите две частни производни на тази функция, получаваме
Lx(x;y;λ)=0x(f(x;y)λ(g(x;y)c))=0fx(x;y)λgx(x;y)=0fx(x;y)=λgx(x;y)
Това е едно от условията, които изведохме! Аналогично уравнението Ly(x;y;λ)=0 е еквивалентно на
fy(x;y)=λgy(x;y)
Трите условия заедно са еквивалентни на
f(x;y)=λg(x;y)
Следователно трите уравнения, които трябва да решим, за да получим решенията за x,y и λ, са уравнения за частните производни на L. Тоест, търсим за кои стойности градиентът на L е равен на 0:
L=0
Например в частния случай, с който започнахме, имаме
L=[x(2x+yλ(x2+y21))y(2x+yλ(x2+y21))λ(2x+yλ(x2+y21))]=[22λx12λyx2y2+1]=[000]
Функцията L наричаме "лагранжиáн" на името на Лагранж, и новата променлива λ наричаме "множител на Лагранж".
Забележка: Някои автори записват λ с отрицателен знак:
L(x;y;λ)=f(x;y)+λ(g(x;y)c)
Тази малка промяна не променя решенията, които получаваме, тъй като стойността на множителя на Лагранж може да е отрицателна.

Обобщение

Оптимизация с ограничение
Фигура: Nexcis (автор) [публичен домейн], от Wikimedia Commons
За да намерим локалните екстремуми на функцията f(x;y;) при наличие на дадено ограничение g(x;y;)=c, изпълняваме следните стъпки:
  • Стъпка 1: Въвеждаме нова променлива λ (гръцката буква ламбда) и дефинираме функцията L по следния начин:
    L(x;y;,λ)=f(x;y;)λ(g(x;y;)c)
    Функцията L се нарича "лагранжиан", а новата променлива λ се нарича "множител на Лагранж"
  • Стъпка 2: Приравняваме градиента на L на нулевия вектор.
    L(x;y;,λ)=0нулев вектор
    С други думи, търсим критичните точки на L.
  • Стъпка 3: За всяка критична точка (x0;y0;;λ0), заместваме съответните стойности в f (всички координати без λ0, тъй като f няма аргумент λ ). Точката, която даде най-голяма (или най-малка) стойност на f, е максимумът (или минимумът), който търсим.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.