If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Стандартно отклонение на извадката и изместване

Сал показва пример за изчисляване на стандартно отклонение и изместване. Създадено от Сал Кан.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Да кажем, че си фермер, който отглежда дини и искаш да проучиш колко нагъсто са семките в динята ти. Вероятно искаш да направиш това, понеже с времето опитваш да отгледаш дини, които имат по-малко семки и трябва да видиш дали имаш напредък. Не искаш да разрежеш всяка диня във фермата си за дини или както там се казва, понеже искаш да продадеш повечето. Искаш да извадиш няколко дини и да вземеш извадки от тези дини, за да откриеш колко нагъсто са семките и да се надяваш, че можеш да пресметнеш статистиките на тези извадки, които са достоверни оценки на параметрите за генералната съвкупност. Нека започнем. Да кажем, че изваждаш тези малки парчета по кубичен инч от произволна извадка от дините ти. След това преброяваш броя семки в тях. Имаш 8 такива извадки. В една от тях намираш 4 семки. В следващите намираш 3, 5, 7, 2, 9, 11 и 7. Това е просто пример, просто , за да сме сигурни, че го визуализираме правилно. Ако това е генералната съвкупност от всяко от парчетата – предполагам, че можем да гледаме на това като на кубичен инч – от парчетата по кубичен инч всяко в цялата ми ферма за дини, изваждам много малка извадка от тях. Може би мога да имам милион ето тук. Може да съм произвел милиони дини във фермата си, но правя само извадка – тоест, главно N ще е 1 милион, а малко n ще е равно на 8. Отново, може да искаш повече извадки, но това ще улесни пресмятането ни. Да помислим за статистиките, които можем да измерим. Първата, която често пресмятаме, е мярката на централната тенденция. Това е аритметичната средна стойност. Но тук се опитваме да изчислим средната стойност на генералната съвкупност, като изчислим средната стойност на извадката. Каква ще е средната стойност на извадката? Трябва да съберем тези точки, да съберем тези измервания и после да разделим на броя измервания, които имаме. Нека извадим калкулатора си. Всъщност, може да не ми е нужен калкулатор. Да видим. 4 плюс 3 е 7. 7 плюс 5 е 12. 12 плюс 7 е 19. 19 плюс 2 е 21, плюс 9 е 30, плюс 11 е 41, плюс 7 е 48. Ще получа 48 върху 8 точки информация. Това се получи доста добре. 48 разделено на 8 е равно на 6. Средната стойност на нашата извадка е 6. Това може да бъде приблизителна оценка на средната стойност на генералната съвкупност. Но също искаме да помислим какво разсейване има в в нашата генерална съвкупност, която искаме да оценим, или как варират нашите измервания около тази средна стойност. Можем да опитаме да изчислим дисперсията на генералната съвкупност като пресметнем дисперсията на извадката. Ще пресметнем неизместената оценка на дисперсия на извадката. Да се надяваме, че до този момент сме достатъчно убедени защо делим на n минус 1. Ще пресметнем неизместената оценка на дисперсията на извадката. Какво ще получим, ако го направим? Ще го направя в различен цвят. Това ще е (4 минус 6) на квадрат, плюс (3 минус 6) на квадрат, плюс (5 минус 6) на квадрат, плюс (7 минус 6) на квадрат, плюс (2 минус 6) на квадрат, плюс (9 минус 6) на квадрат, плюс (11 минус 6) на квадрат, плюс (7 минус 6) на квадрат, всичко това делено на – не на 8. Помни, искаме неизместена оценка на дисперсията на извадката. Ще делим на 8 минус 1. Тоест, ще делим на 7. Нека си дам малко повече място. Неизместена оценка на дисперсията на извадката – мога дори да го означа с това, за да поясня, че делим на малко n минус 1 – това ще е равно на...да видим. 4 минус 6 е –2. Това на квадрат е +4. Пресметнах това. 3 минус 6 е –3. Това на квадрат ще е 9. (5 минус 6) на квадрат е 1 на квадрат, което е 1. 7 минус 6 отново е 1 на квадрат, което е 1. 2 минус 6 е –4, на квадрат е 16. (9 минус 6) на квадрат, това ще е 9. (11 – 6) на квадрат, това е 25. Накрая, (7 – 6) на квадрат, това отново е 1. И ще разделим на 7. Да видим дали можем да пресметнем наум. 4 плюс 9 е 13, плюс 1 е 14, 15, 31, 40, 65, 66. На колко е равно 66 върху 7? Можем ли да го разделим – получаваме 9 и 3/7. Можем да запишем това като 9 и 3/7. Или, ако искаме да го запишем като десетична дроб, 66 разделено на 7 ни дава 9 цяло и – ще закръгля... Това е приблизително 9,43. Това е нашата неизместена дисперсия на извадката. Как можем да изчислим стандартното отклонение на извадката? Искаме да получим допълнителна оценка какво може да е стандартното отклонение на генералната съвкупност. Логиката, предполагам, с право казва, че това е неизместената оценка на дисперсията на генералната съвкупност. Това е най-доброто изчисление за реалната дисперсия на генералната съвкупност. Когато мислим за параметри на генерална съвкупност, за да получим стандартното отклонение на генералната съвкупност, взимаме корен квадратен от дисперсията на генералната съвкупност. Ако искаме да получим оценка на стандартното отклонение на извадката, защо просто не вземем корен квадратен от неизместената оценка на дисперсия на извадката? Това ще направим. Ще го дефинираме по този начин. Ще го наречем стандартно отклонение на извадката. Ще го дефинираме като равно на корен квадратен от неизместената оценка на дисперсия на генералната съвкупност. Това ще е корен квадратен от тази величина и можем да извадим калкулатора си. Ще е корен квадратен от това, което точно написах. Мога да отида на 2-ри отговор. Ще бъде последното въведено. Корен квадратен от това е – и ще закръгля. Равно е на приблизително 3,07. Сега ще ти кажа нещо много нелогично. Или поне в началото е нелогично, но да се надявам, че ще го оцениш с времето. Вече говорихме за това в малко подробности. Хората дори са създали симулации, за да покажат, че когато делим на n минус 1 получаваме неизместена оценка на дисперсия на генералната съвкупност,. Това е добра начална точка, ако ще взимаме корен квадратен от каквото и да е. Но се оказва, че понеже функцията на корен квадратен е нелинейна, това стандартно отклонение на извадката – така, по принцип се дефинира – стандартно отклонение на извадката, стандартното отклонение на извадката, което е корен квадратен от дисперсията на извадката, тоест за точките с индекс i от 1 до n, от нашата неизместена оценка на дисперсия на генералната съвкупност, разделено на n минус 1. Това е буквално деление за нашето стандартно отклонение на извадката (виж екрана). Понеже функцията на корен квадратен е нелинейна, оказва се, че това не е неизместена оценка на реалното стандартно отклонение на генералната съвкупност. Окуражавам хората да правят симулации на това, ако им е интересно. Тогава можеш да си кажем, че преминахме през много трудности да разделим на n минус 1 тук, за да получим неизместена оценка на дисперсията на генералната съвкупност. Защо не преминем през подобни трудности и някак да открием формула за неизместена оценка на стандартното отклонение на генералната съвкупност? Причината това да е трудно е, че за да направим оценката на дисперсията на генералната съвкупност неизместена, трябваше да разделим на n минус 1, вместо на n. Това би работило за всяко вероятностно разпределение за нашата генерална съвкупност. Оказва се, че да направим същото нещо за стандартното отклонение не е толкова лесно. Всъщност, това зависи от разпределението на тази генерална съвкупност. В статистиката просто дефинираме стандартно отклонение на генералната съвкупност. Това, което обикновено използваме, е основано на корен квадратен от неизместената оценка на дисперсия на генералната съвкупност. Но когато вземеш този корен квадратен, това ти дава изместен резултат, когато опитваш да използваш това, за да изчислиш стандартното отклонение на генералната съвкупност. Но това е най-простият и най-добрият инструмент, който имаме.