Основно съдържание
Линейна алгебра
Курс: Линейна алгебра > Раздел 2
Урок 4: Обратни функции и трансформации- Запознаване с понятието обратна функция на дадена функция
- Доказателство: една функция е обратима, ако съществува единствено решение на f(x)=y
- Сюрективни (върху) и инективни (1-1) функции
- Връзка между обратимост на функция и сюрективност и инективност на функцията
- Определяне дали една трансформация е "върху"
- Изследване на решението на Ax = b
- Условия една трансформация да бъде едно-към-едно
- Обобщение на условията за обратимост
- Доказване, че обратната трансформация също е линейна
© 2023 Khan AcademyУсловия за ползванеДекларация за поверителностПолитика за Бисквитки
Определяне дали една трансформация е "върху"
Определяне дали една трансформация е "върху" Създадено от Сал Кан.
Искаш ли да се присъединиш към разговора?
Все още няма публикации.
Видео транскрипция
Дадена е една линейна
трансформация Т, която изобразява от Rn в Rm. Знаем, че можем да представим
тази линейна трансформация като произведение на матрици. Можем да кажем, че Т(х) –
трансформацията Т – ще пиша по-високо, за да спестя място –
можем да кажем, че тази трансформация Т,
приложена към някакъв вектор х е равна на някаква матрица
по вектора х. Тази матрица, тъй като
това е изобразяване от Rn в Rm, матрицата ще е с размери m x n, защото всеки от тези
елементи ще има n компонента, те принадлежат на Rn,
а ето тук ще имаме n вектор-стълба, за да
може да е дефинирано произведението на
матрицата с вектор. Можем да се върнем към
това, за което говорим сега. В последните няколко
урока разгледахме обратимост на
функция, което можем да приложим към
тези трансформации, защото трансформациите са
просто функции. Просто използваме думата
трансформация, когато говорим за изобразяване между
векторни пространства или между множества от вектори, но реално
те са едно и също нещо. Всичко, което направихме
в последните два урока, всъщност е много общо. Никога не сме уточнявали
множеството на първообразите или множеството на образите
какво съдържат. Сега тук имаме вектори,
така че можем да приложим същите идеи. Значи Т е изобразяване
ето тук от Rn в Rm. Ако вземем някакъв вектор х
ето тук, трансформацията Т ще го изобрази в друг вектор в Rm. Ще нарека това Ах. Ако вземем това произведение
на матрица с вектор и това е изобразяването Т
ето тук. Ще задам няколко въпроса
за Т, които задаваме по принцип
за функциите. Т обратима ли е? Научихме в последните уроци, че
има две условия за обратимост. Трансформацията Т трябва да е върху,
или казано по друг начин – трябва да е сюрективна. Това е едното условие
за обратимост. След това Т трябва
да е едно-към-едно. Засуканата дума за това
е инективна, ето така. В това видео ще се фокусирам
само на първата част. Няма да доказвам дали
Т е обратима. Само ще се опитаме
да видим дали Т е върху, т.е. дали е сюрективна. Само да си припомним какво означава
функция върху или сюрективна функция. Това означава, че за всеки
произволен елемент на Rm, на всеки елемент от множеството
на образите – нека това да е
елемента b, той ще е вектор – всъщност, ако Т е сюрективна
функция, или ако Т е върху, това означава, че за произволен вектор b
от множеството на образите съществува винаги някакъв вектор,
поне един вектор в множеството на първообразите, и ако приложим трансформацията
към този вектор, то ще получим вектор b. Друг начин да разглеждаме
това е, че образът на нашата трансформация е
цялото множество Rm. Можем да стигнем до
всеки от тези вектори. Да поразсъждаваме
какво означава това. Знаем, че трансформацията
е равна на матрицата А по вектор х. Значи това е някаква
матрица А. Трансформацията на вектор х –
ще го препиша – е равна на някаква матрица А,
която е матрица m х n, по вектора х. За да бъде Т фунция върху, това
означава, че А по х, това произведение на матрица с вектор трябва да е
равно на произволен член на нашето множество на образите, който
може да бъде достигнат като умножим матрицата А по някакъв вектор от
множеството на първообразите. Има ли друг начин
да формулираме това? Друг начин да разглеждаме това
е за всеки вектор b – значи върху означава, че за произволен вектор b,
който принадлежи на Rm – значи произволен вектор b –
съществува поне едно решение на А по х равно на b, където вектор х принадлежи
на Rn. Това е само друг начин
да кажем същото, което казваме в първата част
на това видео. Ако ми дадеш произволен вектор b
в това множество, то трябва да има, ако предположим, че Т е върху,
или за да бъде Т върху, трябва да има поне едно решение
на А по х равно на b. Тук трябва да има поне един вектор х,
който, ако го умножим по матрицата А, ще ни
даде вектор b. И това трябва да е вярно за
произволен – може би трябва да кажем за всеки, а не за произволен – но това е същото нещо. За всеки вектор b в Rm
можем да намерим поне един вектор х,
за когото това е вярно. Какво означава това? Това означава, че А по х
трябва да е равно на – трябва да можем да конструираме
всеки член на Rm като умножим А по х, като х принадлежи на Rn,
принадлежи ето тук. А какво е това? Ако х е произволен член
на Rn – ще го напиша по следния начин – знаем, че матрицата
А ще изглежда ето така. Тя съдържа вектор-стълбове. а1, а2 и така нататък,
n стълба, и изглежда ето така. Така изглежда матрицата А. Казваме, че ако извършим
това умножение, тогава трябва да можем да получим
всеки вектор, който принадлежи на Rm. Как ще изглежда това произведение,
ако при това умножение вместо да пишем х тук,
можем да напишем х ето така. х1, х2 и така нататък до xn. Значи това произведение
ще стане х1 по първия вектор-стълб на матрицата А, плюс х2
по втория вектор-стълб на А, и така нататък до плюс xn
по n-ия вектор-стълб на А. Ето това ще е това произведение. За да може Т да бъде върху,
тази комбинация трябва да бъде равна на произволен
вектор в Rm. Какво означава това? Това са просто линейни
комбинации на вектор-стълбовете на А. Друг начин да го формулираме е,
че за да бъде Т върху, т.е. за да бъде Т сюрективна или върху,
вектор-стълбовете на А трябва да представляват линейната
обвивка на Rm, на множеството на образите. Трябва да представляват
линейната обвивка на това тук. Трябва да можем да получим
всеки вектор тук чрез линейна комбинация
на тези. Нали? Линейната комбинация е
възможна, защото коефициентите са просто произволни елементи
от множеството на реалните числа. Тези вектор е просто куп
произволни реални числа. Значи за да бъде Т върху,
линейната обвивка на а1, а2... an трябва да е равна на Rm, трябва
да съвпада с множеството на образите. Това означава просто, че можем
да достигнем всеки вектор в множеството на образите чрез
линейна комбинация на вектор-стълбовете на
тази матрица. Каква е линейната обвивка
на вектор-стълбовете на една матрица? По определение това е
векторното пространство на матрицата. Можем да кажем, че това означава, че
линейната обвивка на тези вектори трябва да е Rn, или друг начин
е, че векторното пространство на матрицата А – ще сменя цветовете –
векторното пространство на матрицата А трябва да е равно на Rm. Но как разбираме, че
векторното пространство на един вектор е равно на Rm? Тук може би е полезно
да помислим за това кога може да не намерим решения
на равенството А по х равно на b? Когато срещнем такова
равенство, какво правим тогава? Можем да направим разширена
матрица, която изглежда ето така, където поставяме А от едната страна, а после поставяме вектор b
в дясната страна. След това извършваме
операции по редове. Трябва да преобразуваме
всички редове и на двете страни, което сме правили много пъти. Целта ни е да редуцираме
отляво матрицата в ешелонна форма по редове. Затова искаме, евентуално,
да получим разширената матрица в този вид, в който лявата страна е –
ще дефинирам R, главно R, което е редуцираната
ешелонна форма на А. Има много видео уроци
за това. Това е просто, имаме матрица,
в която има водещи елементи, и водещите елементи са тези, които
са различни от нула в съответния стълб. Не е задължително
всеки стълб да има водещ елемент. Може да имаме свободен стълб,
или неводещ стълб, а после тук може да има само нули. Може би тук има
водещ елемент. Това трябва да е 0, ако
тук има водещ елемент. Това трябва да е 0,
и така нататък. Може би следващият
водещ елемент е ето тук. Тези трябва да са 0,
разбираш идеята. Може да има няколко стълба,
в които няма водещи елементи, но винаги, когато има
водещ елемент, останалите елементи в стълба
трябва да са нули. Това е редуцирана
ешелонна форма. Това, което правим с произволна
матрица, е да извършим тези преобразувания по редове,
така че евентуално да преобразуваме в редуцирана ешелонна
форма. И правейки това, ние
извършваме същите операции в дясната страна. Извършваме ги с
цял ред на тази разширена матрица. Значи този вектор b ето тук, предполагам,
че мога да го напиша като вектор, той евентуално ще стане
друг вектор с ето тук. Знаеш, ако това е [1;2;3], може би
ще извърша различни операции и това ще стане [3;2;1] или нещо подобно. А кога няма решение? Преговорихме това
по-рано. Единственият случай, в
който няма решение, спомни си, има три случая: може да имаме
множество решения – това е, когато
имаме свободни променливи. Обсъждахме това по-рано. Имаме случай, в който
имаме само едно единствено решение, това е другият случай. И остава последният случай, когато няма решения. Кога няма решения? Какво трябва да се случи,
за да няма решение? За да няма решение, когато
извършваме тези операции по редове, трябва евентуално да получим
матрица, която изглежда ето така. Не знам какво са всички тези,
може ти това са 1 тук, различни неща. Тук има 1, тук има 0. Но ако получим цял ред,
поне един ред от 0, в който имаме
само 0, ето така, а ето тук има нещо,
което е различно от нула, това е единственият случай,
когато няма решение. Да си припомним защо
изобщо обсъждаме това. Казваме, че нашата
трансформация е върху, ако вектор-стълбовете или
векторното ѝ пространство е линейна обвивка на Rm. Сега се опитвам да
установя как мога да разбера, че
линейната обвивка е Rm. За да бъде линейната обвивка Rm,
можеш да ми дадеш произволен вектор b, произволно b, което принадлежи
на Rm, и аз трябва да мога да получа решение. Зададохме си въпроса: кога не получаваме решение? Определено не получаваме
решение, когато имаме нули в един ред. А после тук имаме нещо,
което е различно от 0. Това определено няма
да е решение. Другият случай е, когато
имаме нули тук, това е другият случай,
в който имаме някакви решения, които са валидни само
за определени вектори b. Това е случаят, когато –
ще го начертая по този начин. Ще започна ето така. Имам матрицата А,
и имам векторите b1, b2 и така нататък до bm. Спомни си, че това
принадлежи на Rm. Преобразуваме в
редуцирана ешелонна форма тази разширена матрица,
и тогава А ще се редуцира
до ешелонна форма. Да кажем, че в тази редуцирана ешелонна
форма имаме ред с 0 накрая. Значи тук има ред с нули. Всичко друго изглежда
съвсем стандартно, имаме единици и нули. Но в последния ред,
да кажем, има само нули. Извършваме операциите по редове на този общ случай на член на Rm,
този последен ред има някаква функция. Може да е изглежда като
2 по b1 плюс 3 по b2 – използвам някакъв конкретен пример,
не винаги ще е същото – минус b3. На практика ще е
някаква функция на всички b. Ще го запиша по този начин – това тук е конкретен пример,
може би не трябваше да давам конкретен пример. Това ще е някаква функция
от b1, b2...bm. Очевидно, ако това
е различно от нула, няма да има решение. Ако нямаме решение
за някакъв случай на b, тогава определено линейната
обвивка няма да е Rm. Ще запиша това. Ако за някое b нямаме
решение, тогава линейната обвивка
не е Rm. Не знам дали не повтарям нещо,
което е очевидно за теб, но наистина искам
да съм сигурен, че разбираш това. Всеки път, когато искаш да решиш
равенството А по х равно на b – спомни си, че искаме да
се уверим, че това може да е изпълнено за всяко b,
което изберем – и тогава ние просто съставяме разширена матрица
по този начин и извършваме операции по редове, докато
преобразуваме матрицата А в редуцирана ешелонна форма. Докато правим това, отдясно
ще има куп функции на b. Може би първият ред
ще бъде b1 минус b2 плюс b4, или нещо подобно. После следващият ред
ще бъде нещо такова. Виждали сме примери на това
по-рано. И ако накрая получиш редуцирана ешелонна форма,
в която има ред с нули, единственият начин
да имаш решение е ако вектор b, ако неговите
елементи удовлетворяват тази функция отдясно, така че
това да е равно на 0. Така че това ще е вярно
само за определени b. И ако това има решение
само за определени b, за които е равно на 0,
тогава определено линейната обвивка не е
цялото пространство Rm. Ще го покажа нагледно. Значи ако това е Rm,
ако вземем... ако тук има само 0 за някои b, за някакъв
брой b, тогава тези ще са единствените,
до които можем да стигнем, като умножим матрицата А
по някакви вектори в Rm. И определено линейната обвивка
не е цялото Rm. За да бъде линейната обвивка
цялото Rm, когато преобразуваме в ешелонна форма, трябва
винаги да намерим решение. Единственият начин, по който
винаги ще намерим решение, е ако го няма това условие,
което води до ред с нули. Защото, когато имаме ред с 0,
тогава трябва да поставим ограничение, че това
тук отдясно трябва да е 0. Коя е единствената ешелонна
форма, в която нямаме ред с нули на края? Всеки ред в редуцираната
ешелонна форма има или само 0, или има
водещ елемент във всеки ред. Значи единственият начин
линейната обвивка – за да бъде Т върху – е тогава и само тогава, когато векторното
пространство на трансформиращия вектор е равно на Rm. Линейната обвивка на
вектор-стълбовете му е цялото Rm. Единственият начин това
да се случи е ако ешелонната форма на А има
водещ елемент във всеки ред. А колко реда има? Това е матрица m х n. Има m реда и n стълба. Значи има водещ елемент
във всеки ред. Това означава, че има
m водещи елемента, ето тук. По какъв друг начин можем
да си представим това? Спомни си, няколко урока по-рано
ние разсъждавахме за това как да определим – това
може малко да обърка нещата – как да определим базиса на нашето векторно пространство. Значи базисът на векторното
пространство на една матрица, и това е един вид
преговор. Ние казахме, че ако
вземем матрицата и я преобразуваме в
ешелонна форма, тогава... ще го начертая малко
по-различно тук – значи я преобразуваме
в ешелонна форма. Да кажем, че това е
ешелонната форма. И търсим в кои стълбове
имаме водещи елементи. Съответните стълбове
в първоначалната матрица, матрицата в началото,
образуват базиса на векторното простронство. Ще го начертая. Ще дам конкретен пример. Да кажем, че имаме
вектор-стълбове а1, а2...an. Така изглежда матрицата А. Когато я преобразуваме
в ешелонна форма, да кажем, че ето този стълб тук има
водещ елемент. Този стълб има водещ елемент. Да кажем, че този
тук няма водещ елемент. Да кажем, че тук
има 2. Избирам някакви
примерни числа. Да кажем, че тук е 3. Да кажем, че всички тези
не са водещи елементи, тогава последният елемент
n е водещ елемент. Тук ама нули, а после 1, ето така. Как определяме кои
са базисните вектори на векторното пространство. Очевидно, векторното
пространство е всичко, което е линейната обвивка
на тези вектори. Но кое е минималното множество,
което ни е нужно, за да имаме същата
линейна обвивка? Гледаме кои имат
еднакви водещи елементи или водещи стълбове. Казваме: тук имаме
водещ стълб, и тук имаме водещ стълб. Значи базисът на векторното
пространство трябва да е този стълб в оригиналната матрица и
този стълб в оригиналната матрица. А как определяме размерите
на векторното пространство? . Просто преброяваме
броя на векторите, които са нужни за базиса и наричаме
това ранг на матрицата А. Всичко това е преговор. Рангът на А е равен на размерите
на векторното пространство на А, които са равни на броя
на базисните вектори на векторното пространство. По този начин го определяме. На практика определяш
колко водещи стълбове има, броят на водещите стълбове
е броят на базисните вектори, и това е рангът на матрицата А. Причината да
разглеждам това е, че току-що казахме, че трансформацията Т
е върху тогава и само тогава, когато векторното пространство е Rm,
което е случаят, когато има има водещ елемент във всеки ред
на редуцираната ешелонна форма. Или, понеже има m реда,
трябва да има m водещи елемента. Значи за всеки ред имаме
водещ елемент, но всеки водещ елемент съответства
на водещ стълб. Ако имаме m водещи елементи,
ще имаме m водещи стълбове, което означава, че ако трябва
да направим това упражнение тук, трябва да имаме
m базисни вектори на векторното пространство, или че
матрицата трябва да има ранг m. Цялото това видео беше
един дълъг път да кажем, че Т е върху. Друг начин да кажем това е,
че ако имаме тук нашето множество на първообразите, което е Rn,
и ако имаме множеството на образите, което е Rm, тогава всеки член
на Rm може да бъде достигнат чрез Т от някакъв член на Rn. Всеки елемент тук, тук винаги
ще има поне един елемент, ако приложим Т към него,
ще дойдем ето тук. Може да има повече
от един член. Ние още не говорим
за "едно-към-едно". Казваме, че Т е върху тогава
и само тогава, когато рангът на матрицата на трансформацията А
е равен на m. Това е големият извод,
до който стигаме в това видео. Хайде просто да направим
един пример, защото понякога когато нещата са само абстрактни,
изглежда малко объркващо, когато видиш нещо конкретно. Да дефинираме някаква
трансформация S. Да кажем, че трансформацията
S е изобразяване от R2 в R3. Да кажем, че S, приложена
на някакъв вектор х е равна на матрицата [1;2;3;4;5;6]
по някакъв вектор х. Очевидно това е
матрица 3х2. Да видим дали
трансформацията S е върху. Въз основа на това, което
току-що направихме, просто трябва да преобразуваме това
в ешелонна форма по редове. Да го направим. Ако преобразувам тази матрица
в ешелонна форма... да запазим...
значи [1;2;3;4;5;6]. Да оставим първия
ред непроменен, това е 1;2. Да заменим втория ред
с втория ред минус 3 по първия ред. Всъщност да заместим
с 3 по първия ред, минус втория ред. Значи 3 по 1 минус 3 е 0. 3 по 2 минус 4,
това е 6 минус 4, което е 2. Сега да заместим третия ред
с 5 по първия ред минус третия ред. 5 по 1 минус 5 е 0. 5 по 2 е 10,
минус 6 е 4. Сега да видим можем ли
да получим 1 тук. Ще запазя средния
ред същия. Всъщност да разделим
средния ред на 2, или да го умножим по 1/2,
получаваме 0; 1, после имаме 0; 4; 1; 2. Сега да опитаме
да направим тези 0, да получиш
ешелонната фома. Ще запазя средния
ред същия: 0; 1. Ще заменя горния ред с
горния ред минус 2 по втория ред. Става 1, минус 2 по 0,
това е 1. 2, минус 2 по 1,
това е 0. Сега да заместим последния ред
с последния ред минус 4 по този ред. Получаваме 0, минус 4 по това,
това е 0. 4, минус 4 по 1, това е 0. Обърни внимание, че
получихме ред с нули. Имаме два водещи елемента
или два реда с водещи елементи, като имаме и два
водещи стълба. Търсим ранга на матрицата
[1;2;3;4;5;6] Рангът е равен на 2, което не е равно на множеството
на образите. Не е равен на 3. Не е равен на R3, следователно
S не е върху, не е сюрективна функция. Не е изпълнено е едно от
двете условия за обратимост. Определено знаем, че
S не е обратима. Надявам се, че това
ти беше полезно. В следващото видео
ще се фокусираме върху второто условие за обратимост,
това да е "едно-към-едно".