Основно съдържание
Анализ на функции на много променливи
Курс: Анализ на функции на много променливи > Раздел 3
Урок 2: Квадратична апроксимация- Какво представлява квадратичната апроксимация
- Формула за квадратична апроксимация, част 1
- Формула за квадратична апроксимация, част 2
- Пример за квадратична апроксимация
- Матрица на Хесе
- Матрица на Хесе
- Представяне на квадратична форма с матрица
- Векторна форма на квадратичната апроксимация на функция на много променливи
- Хесиан (матрица на Хесе)
- Квадратична апроксимация
© 2023 Khan AcademyУсловия за ползванеДекларация за поверителностПолитика за Бисквитки
Представяне на квадратична форма с матрица
Как да запишем израз от вида ax^2 + bxy + cy^2 чрез матрици и вектори. Създадено от Грант Сандерсън.
Искаш ли да се присъединиш към разговора?
Все още няма публикации.
Видео транскрипция
Привет! Искам да разгледаме още нещо, преди да опишем векторния вид на квадратичната апроксимация на
функции на много променливи, което е така трудно за произнасяне. Да кажем, че имаме някакъв израз, например 'а' по х на квадрат, като х е променлива, по b по х по у, като у е друга променлива, плюс с по у на квадрат. а, b и се са константи, а х и у са променливи. Този израз има интересно име. Той се нарича квадратична форма. Това винаги ме е шокирало. Винаги съм се чудил какво означава това "форма"? Знам какво представлява
квадратен израз, където "квадратен" обикновено означава,
че нещо е на втора степен, или ако имаме произведение
на две променливи, но защо го наричат "форма"? Принципно това означава,
че всичко тук е квадратно. . Тук нямаме х, което си стои самичко, или някаква константа като 2, когато събираме всички тези, а вместо това имаме
само членове от втора степен, а, разбира се, математиците
не искат да го нарекат просто квадратен израз, а вместо това са му дали
това засукано име, така че изглежда по-страшно,
отколкото е всъщност. Но както и да е –
имаме тази квадратична форма, а въпросът е как можем да я представим
във векторен вид. По аналогия, ако
разгледаме линейните членове, когато имаме, например,
а по х плюс b по у – ще добавя още една променлива – друга константа по следващата
променлива z. Когато видиш нещо такова, когато всяка променлива
просто е умножена по константа, и когато съберем тези членове,
както в този случай, можем лесно да изразим
това чрез вектори, където събираме всички
константи в техен отделен вектор, вектор, който съдържа а, b и с, и можеш да си представиш
скаларното произведение на този вектор и на вектора, който съдържа всички променливи
компоненти х, у и z. Удобството е, че тук можем
да използваме само един символ, например V, който да представя вектора,
съдържащ константите, а после можем да запишем, можем да намерим скаларното
произведение на този вектор и другия вектор, като
използваме друг символ, удебелено х, който представлява вектор,
който съдържа всички променливи, и при този начин на записване
всичко изглежда като произведение на
константа и вектор, точно както при функциите
на една променлива, когато умножаваме число-константа
по число-променлива, това е все едно да умножим
един константен вектор по един променлив вектор. Важността да запишем
нещата по този начин е в това, че V може да е вектор, който съдържа не само
три числа, а стотици числа, а х може да съдържа
сто съответни променливи, а тогава записването става
много сложно. По този начин можем да
го обобщим за повече измерения. Въпросът е можем ли да направим нещо такова с квадратичната форма? Защото, досещаш се, да кажем, че въведем
променливата z, тогава ако трябва
да имаме още един член, някаква друга константа
по квадратния член х по z, и после някаква друга константа по z на квадрат – пак квадратен член – и друг за квадратния член у по z, и това излиза от контрол, а ако започнеш да
разглеждаш случаи със сто променливи, това наистина сериозно
излиза извън контрол, защото има много
различни квадратни членове, така че ни е нужен добър
начин да ги изразим. Сега ще ти покажа как го правим и после ще го разнищим,
за да видим какъв е смисълът. Обикновено, вместо
да разглеждаме b по х по у, ние всъщност разглеждаме
това като 2 по някаква константа, по х по у, а това няма никакво значение. Просто променяме стойността на b, но ще видиш защо това е
по-удобно по този начин само след малко. Начинът да опишем квадратичната форма
като тази чрез вектори е да съставим матрица две по две, тъй като тук имаме две измерения, като а и с са в единия диагонал, а b е в другия диагонал, понеже тези матрици
винаги са симетрични, така че, ако си представиш
как изобразяваме цялата матрица симетрично спрямо тази ос, ще получим същото число, така че е важно това, че
тук имаме някаква симетрия. Това, което правим сега,
е да умножим вектора, променливия вектор, който
съдържа х и у, от дясната страна на тази матрица а после го умножаваме отново, но го обръщаме настрани, така че вместо да е
вертикален вектор, го транспонираме до
хоризонтален вектор от другата страна. Това е донякъде аналогично на това да умножим двете променливи. Умножаваме по два вектора,
но от двете страни на матрицата. Това, между другото,
е подходящ момент, ако не си наясно с умножението
на матрици, да поставиш на пауза това видео и да намериш видео уроците
за умножение на матрици и да си припомниш или
да научиш как става, защото, когато продължим напред, аз ще приема, че това е нещо, което ти знаеш. Относно изчисляването на това, първо да извършим
умножението отдясно. Имаме произведение
на матрица с вектор. Първият компонент, който
получаваме, е като умножим горния ред по всеки от компонентите на вектора, значи това е а по х, плюс b по у. Плюс b по втория компонент у. Аналогично постъпваме за долния елемент – взимаме долния ред и го умножаваме по съответните членове, значи b по х, плюс с по у. Ето това получаваме, когато умножим отдясно, и, разбира се, запазваме
нашия транспониран вектор ето тук отдясно, ето тук отляво. Сега имаме – това е просто вектор 2 по 1, а този е 1 по 2. Можеш да си го представиш
като хоризонтален вектор, или като матрица 1 по 2, но когато умножаваме тези тук, просто подравняваме
съответните членове. Имаме х по целия този
израз отгоре, така че х по (а по х плюс b по у). После прибавяме това към
втория член у, умножен по втория компонент
на този вектор, което е b по х плюс с по у. Значи умножаваме у по
b по х плюс с по у. Всичко това са числа,
така че можем да опростим, след като разкрием първите скоби, имаме х по а по х, което дава а по х на квадрат. После, следващият член,
е х по b по у, значи става b по х по у. После тук имаме у по b по х, така че това е същото като b по х по у, следователно тук имаме, можем тук да напишем 2, защото това следва логично
от нашето развиване на израза. Последният член е у по с по у, което е с по у на квадрат. Връщам се към първоначалната
квадратична форма, която искахме да получим. а по х на квадрат, плюс 2 по b по х, по у,
плюс с по у на квадрат. Ето как развихме този член. Когато го направим, получаваме същия
квадратен израз. Квадратичната форма е удобна, защото се записва с матрица като тази, и дава възможност да направим
всичко по един по-обобщен начин, и вместо да запишем
цялата матрица, можем просто да запишем буква,
например М, която да представлява цялата матрица, а после векторът, който
представлява променливата, можем да запишем като удебелено х, и след това умножаваме отдясно, а после транспонираме вектора
и го умножаваме отляво, така че това показва, че... като сложим едно Т
като горен индекс, което показва, че това е
х транспонирано, умножено по матрицата отляво, и този израз, това е начинът, по който изглежда
квадратичната форма във векторен вид, а удобството е същото, както в линейния случай. Точно както V може
да представлява нещо, което съдържа
сто различни константи, а х може да е сто
различни променливи, можем да направим нещо
подобно и тук, като напишем същия израз, дори когато матрицата
М е супер голяма. Да видим как ще изглежда това, когато имаме три измерения, но тук ми трябва повече място, защото ще пиша още по-надолу. Значи имаме х транспонирано,
умножено по матрицата, умножено по удебелено х, и да кажем, че това
представлява, сега имаме х, у и z, нашият транспониран вектор, а после нашата матрица, нашата матрица нека да е
а, b, с, d, е, f – и понеже трябва да има
симетрия, който член се намира на това място, трябва да имаме същия
и ето тук, все едно имаме осева
симетрия спрямо този диагонал. По същия начин за с, тук
ще имаме същия член с, а 'е' ще бъде ето тук. Така че реално имаме
само шест свободни члена, но те запълват цялата матрица, а после отдясно ще умножим това по вектор [х; у; z]. Няма да решавам това
в този видео клип, но вероятно се досещаш, че
когато умножим тази матрица по този вектор, а после умножим съответния
вектор, който получим, по този транспониран вектор, ще получим някаква
квадратична форма с три променливи. Идеята е, че това
ще стане много сложно, но всъщност можем да изразим
нещата много по-просто по този начин. Така с този инструмент в следващото видео ще ти покажа как можем
да използваме този начин на записване, за да изразим квадратична
апроксимация на функция на много променливи. До скоро!