If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:4:26

Намиране на приблизителна стойност на средно аритметичното за генерална съвкупност

Видео транскрипция

Вече много пъти сме виждали ситуация, при която има някакъв показател, свързан с една генерална съвкупност, може би част на генерална съвкупност, която подкрепя даден кандидат, може би е средната стойност на една генерална съвкупност. Средната височина на всички хора в града. И сме определили, че това не е приложимо или няма как да знаем истинския показател за генерална съвкупност. Но можем да опитаме да го изчислим, като вземем неговата стойност от една извадка. Взимаме n-мерна извадка и въз основа на това после пресмятаме дадена статистическа характеристика. Виждали сме също, че не само можем да изчислим характеристиката, която опитва да оцени този показател, но можем да построим доверителен интервал за тази характеристика, въз основа на някакво ниво на значимост. И този доверителен интервал ще изглежда подобно на това. Той ще е стойността на характеристиката, която току-що пресметнахме, плюс или минус някаква допустима грешка. И често ще казваме, че тази критична стойност z, и това ще е базирано на броя стандартни отклонения, които искаме да преминем над и под тази статистическа характеристика. После ще умножим това по стандартното отклонение от извадковото разпределение на тази характеристика. Ще видим, че често не знаем това. За да направиш това, често дори трябва да знаеш този показател. Например в ситуацията, където показателят, който се опитваме да изчислим и да построим доверителни интервали, е, да кажем, част от генералната съвкупност. Какъв процент от генералната съвкупност подкрепя определен кандидат? В този случай за характеристика се използва процентът от извадката. Ще имаме процента от извадката плюс или минус z* по – е, не можем да изчислим това, освен ако не знаем процента от генералната съвкупност, така че вместо това го изчисляваме със стандартна грешка на характеристиката, която, в този случай, е р с шапка по 1 минус р с шапка. Частта от извадката по (1 минус частта от извадката) върху размера на извадката. Ако показателят, който опитваме да изчислим, е средната стойност на генералната съвкупност, характеристиката ни ще е средната стойност на извадката. В този сценарий ще гледаме... характеристиката ни е средната стойност на извадката плюс или минус z*. Ако знаехме стандартното отклонение на тази генерална съвкупност, щяхме да знаем какво е стандартното отклонение на извадковото разпределение на нашата характеристика. То щеше да е равно на стандартното отклонение на генералната ни съвкупност по корен квадратен от размера на извадката. Но често няма да знаем това. Всъщност никак не е необичайно да не знаем това. Така че понякога ще си кажеш, ако не знаем това, нека просто намерим стандартно отклонение на нашата извадка тук. Вместо това ще решим да вземем средната стойност на извадката плюс или минус z* по стандартното отклонение на извадката, което можем да пресметнем, делено на корен квадратен от n. Това може да изглежда доста добре, ако опитваме да построим доверителен интервал за нашата извадка, за нашата средна стойност, но се оказва, че това не е толкова добре, понеже се оказва, че това ето тук ще подцени реалния интервал – реалната допустима грешка, която ти трябва за нивото на значимост. Ето защо статистиците са измислили друга статистическа характеристика. Вместо да използват z, те я наричат t, и вместо да използват z-таблица, те използват t-таблица. Ще видим това в бъдещи видеа. Ако опитваш да построиш доверителен интервал за средната стойност на някаква извадка и не знаеш истинското стандартно отклонение на генералната си съвкупност, което е обикновено е така, вместо да правиш това, в този случай ще вземем средната стойност на извадката си плюс или минус и критичната стойност – ще наричаме това t* по стандартното отклонение на извадката, което можем да изчислим, делено на корен квадратен от n. Функционалната разлика е, че това реално ще ни даде доверителния интервал, който има нивото на значимост, което искаме. Ако искаме 95% ниво на значимост, ако продължим да пресмятаме това отново и отново за множество извадки, приблизително 95% от всички случаи този интервал ще съдържа реалната средна стойност на генералната съвкупност. И за да направиш това – ще го направим в бъдещи видеа – трябва да имаш t-таблица, вместо z-таблица.