If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:3:14

Намиране на приблизителна стойност на средно аритметичното за генерална съвкупност

Видео транскрипция

В предишното видео говорихме за опита да изчислим средна стойност на генерална съвкупност чрез средна стойност на извадка и после за построяване на доверителен интервал за средната стойност на тази извадка. И говорихме за различни сценарии. Можем да използваме z-таблица плюс реалното стандартно отклонение на генералната съвкупност и това ще даде доста достоверни доверителни интервали, но проблемът е, че не знаеш стандартното отклонение на генералната съвкупност. И може да пробваш да използваш z-таблица, за да намериш критичните стойности плюс стандартното отклонение на извадката, но както вече говорихме, това не винаги върши добра работа за изчисляването на доверителните интервали. Ще наблюдаваме това експериментално след няколко секунди. Вместо това имаме нещо, наречено t-критерий (критерий на Стюдънт), при който, ако искаме критична стойност, използваме t-таблица, вместо z-таблица. И използваме това, заедно със стандартното отклонение на извадката, и така изведнъж ще получим доста добри доверителни интервали. За да направим това малко по-реално, нека погледнем една симулация. Това е бележник в Кан Академия, направен от потребителя на Кан Академия Шарлот Алън (Charlotte Allen). Идеята тук е да видим как изглеждат доверителните ни интервали с тези различни сценарии. Да кажем, че имаме реална средна стойност на генералната съвкупност от 2,0, което да кажем, че е средният брой ябълки, които хората ядат на ден. Реалната средна стойност на генералната съвкупност е 2, тя изглежда висока. Но може би става дума за страна, в която има много ябълки. И да кажем, че знаем че стандартното отклонение на генералната съвкупност е 0,5. И ще създадем доверителни интервали с цел да имаме 95% ниво на значимост, като ще вземем извадки с размер 12. Първо можем да построим доверителните си интервали като използваме z и сигма, което е правилен начин да направим това. И нека просто вземем няколко извадки тук. И виждаме, че изглежда това е приблизително 95%. Когато продължаваме да взимаме тези извадки и да построяваме тези доверителни интервали, в 95% от случаите тези доверителни интервали съдържат реалната средна стойност на генералната съвкупност. Тези изглеждат като добри доверителни интервали, но говорихме, че обикновено, когато вършиш това, този вид статистическа дедукция, не знаеш стандартното отклонение на генералната съвкупност. Не знаеш сигма. Така че вместо това може да ти се иска да използваш z със стандартните отклонения на извадката. Но ако погледнеш това за същите тези извадки, които пресметнахме, забележи, когато го направихме отново и отново – направихме го 625 пъти – в този сценарий, където продължаваме да пресмятаме доверителните интервали със z и s, реалната средна стойност на генералната съвкупност се съдържа в интервалите само в 92,2% от случаите. Сега можем да продължим. Имаме много по-ниска степен на попадение, отколкото се надявахме да имаме, ако използвахме z и сигма. Хубавото тук, ако използваме t-таблица, е, че това се доближава много повече! Понеже с t-таблица – и понякога можем да получим от стандартното отклонение на извадката – успяхме доста да се доближим до степента на попадение, която бихме имали, ако знаехме стандартното отклонение на генералната съвкупност. Това е ценността на t и t-критерия, и ще дадем много повече примери, включително за използване на t-таблица, в бъдещи видеа.