If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:4:30

Симулация, предоставяща доказателство, че (n-1) ни дава безпристрастна оценка

Видео транскрипция

Това е една симулация, създадена от потребителя на Кан Академия TETF. Предполагам, че това се произнася като тет ф. Това ни позволява да открием логиката в това защо делим на n минус 1, когато пресмятаме дисперсията на извадката си и защо това ни дава неизместена оценка на дисперсията на генералната съвкупност. Това започва с... окуражавам те да опиташ това самостоятелно – така че можеш да създадеш разпределение. Казано е: "Създай генерална съвкупност, като кликнеш в синята област." Тук всъщност създаваме генерална съвкупност. Всеки път, когато кликна, то увеличава големината на генералната съвкупност. Просто правя това произволно и те окуражавам да отидеш в този бележник – това е на Кан Академия, Компютърни Науки – и да опиташ да го направиш самостоятелно. Тук мога да спра в един момент. Създадох генерална съвкупност. Мога да поставя няколко случайни точки тук. Това е нашата генерална съвкупност и, както видя, докато правех това, симулацията пресмяташе параметрите за генералната съвкупност. Пресметна средната стойност на генералната съвкупност като 204,9 и също така пресметна стандартното отклонение на генералната съвкупност, което се получава от дисперсията на генералната съвкупност. Това е корен квадратен от дисперсията на генералната съвкупност, което е равно на 63,8. Също така нанася дисперсията на генералната съвкупност тук долу. Виждаш 63,8 и това е стандартното отклонение, и е малко трудно да се види, но се казва, че е на квадрат. Това е тази стойност на квадрат. Тоест, 63,8 на квадрат е дисперсията на генералната съвкупност. Това, само по себе си, е интересно, но досега не ни казва много за това защо делим на n минус 1. Това е интересната част. Сега можем да започнем да взимаме извадки и можем да решим с каква големина искаме да са извадките. Ще започна с тези малки извадки, най-малката възможна извадка, която има някакъв смисъл. Ще започна с много малка извадка. Симулацията, всеки път, когато взема извадка, ще пресметне дисперсията. Числителят ще е сборът от всяка точка информация в моята извадка, минус средната стойност на извадката и ще повдигна това на квадрат. После ще разделя на n плюс а и ще променям това "а". Ще разделя на всички стойности между n плюс –3, тоест, n минус 3, чак до n плюс а. Ще го направим много, много, много пъти. Ще вземем средната стойност на тези отклонения за всяко "а" и ще открием кое ни дава най-добрата оценка. Ако генерирам една извадка ето тук, можем да видим тази крива и, когато имаме високи стойности на "а", подценяваме дисперсията. Когато имаме ниски стойности на "а", тогава надценяваме дисперсията на популацията, но това беше само за една извадка, така че не е толкова значимо. Това е една извадка с големина две. Нека генерираме няколко извадки и после да ги усредним. Когато погледнеш много, много, много, много, много извадки, се случва нещо интересно. Когато погледнеш средната стойност на тези извадки, когато усредниш тези криви от всички тези извадки, виждаш, че най-добрата оценка е, когато "а" е доста близо до –1, когато това е n плюс –1 или n минус 1. Всичко по-малко от –1, ако е –n минус 1,05 или n минус 1,5... тогава започваме да надценяваме дисперсията. При всичко по-голямо от –1, тоест, ако имаме n плюс 0, ако разделим на n или ако имаме n плюс 0,05... или каквото и да е друго, започваме да подценяваме дисперсията на генералната съвкупност. Можеш да направиш това с извадки с различна големина. Нека опитам извадка с големина 6. Тук, отново, като натискам бутона "Generate Sample" (Създай извадка), докато генерираме още и още извадки, за всяко "а" взимаме средната стойност на дисперсията за тези извадки, в зависимост от това как пресмятаме. Отново ще видиш, че най-добрата ни оценка е много близо до а = –1. Ако генерираш милиони извадки, ще видиш, че най-добрата оценка е, когато "а" е –1 или когато делиш на n минус 1. Отново, благодарим на TETF, тет ф, за това. Мисля, че това е много интересен начин да помислим защо делим на n минус 1.