If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Курс: Статистика и вероятности > Раздел 11

Урок 2: Намиране на приблизителна стойност на средно аритметичното за генерална съвкупност

Доверителен интервал за средно аритметично с двойки данни

Доверителен интервал за разлика на средно аритметичното за двойки данни.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

"Група приятели се чудели колко по-бързо могат да щракат с пръстите на едната си ръка, отколкото с другата ръка." Много важен житейски въпрос. "Всеки човек щракал с пръстите на доминантната си ръка за 10 секунди и с недоминантната си ръка за 10 секунди." Ако пишеш с дясната си ръка, дясната ти ръка ще е доминантната ти ръка. Ако пишеш с лявата си ръка, лявата ти ръка ще е доминантната ти ръка. "Всеки участник хвърлил монета, за да определи коя ръка ще използва първо." Понеже ако винаги използваш първо доминантната си ръка, може би ще се умориш, докато дойде ред за недоминантната ти ръка или има нещо друго. Тук коя ръка ще използваш първо се избира случайно. "Това са данните за колко щракания са изпълнили с всяка ръка, разликата за всеки участник и обобщителни статистически характеристики." И това е реална информация от екипът по съдържанието на Кан Академия, и виждаш за всеки от участниците – за Джеф ето тук, той е успял да направи 44 щракания за 10 секунди с доминантната си ръка, което е впечатляващо, повече отколкото мисля, че аз мога да направя, и е успял да направи 35 с недоминантната си ръка, и разликата на доминантната ръка минус недоминантната ръка, е била 9. После са направили таблица с тези данни за всичките петима участници. Те също са пресметнали обобщителните характеристики, но това тук е най-интересното нещо. Това е разликата между доминантната и недоминантната ръка, така че тук средната стойност на разликата... те са взели този ред ето тук и са изчислили средната стойност на 6,8 и после са изчислили стандартното отклонение на тези разлики ето тук, което са получили, че е приблизително 1,64. И после искат от нас: "Създай и интерпретирай 95%-ен доверителен интервал за средната стойност на разликата в броя на щракания за тези участници." Спри видеото. Виж дали можеш да направиш някакъв напредък. Виж дали можеш да се сетиш как да подходим към това. Интересното тук е че не се опитваме да построим доверителен интервал за средната стойност на броя щракания с доминантната ръка или средната стойност на броя щракания с недоминантната ръка, построяваме 95%-ен доверителен интервал за средната стойност на разликата. Може да си кажеш: "Чакай, имам две различни извадки тук и после тази трета група данни някак е построена от другите две." Но един начин да помислим за това е дизайн със съвпадащи двойки. При дизайн със съвпадащи двойки за всеки участник, за всеки член в извадката, ще направиш контролна и експериментална група. Например можеш да направиш контролна група за колко щракания могат да направят с доминантната си ръка за 10 секунди, а експерименталната е колко могат да направят с недоминантната си ръка, а дизайнът със съвпадащи двойки... интересува те разликата, така че можеш да гледаш на това като все едно имаш само една извадка с размер 5, за която пресмяташ разликата за всеки член от тази извадка и стандартното отклонение на цялата извадка. Преди да изчислим доверителния интервал, нека си припомним някои от условията, за които мислим, когато построяваме доверителни интервали. Първото условие, за което мислим, е дали извадката ни е случайна., Ако се опитваме да направим някакъв вид преценка за всички хора и умението им да щракат с пръсти, това няма да е случайна извадка. Всички тези хора работят в Кан Академия. Може би някак в процеса на интервюиране избираме хора, които щракат доста добре с пръсти, но каквито и заключения да правим, можем да кажем, че това е сравнително вярно за тази група приятели. Следващото условие, за което искаме да помислим, е условието за нормалност. Има два начина да помислиш за това. Ако имахме извадка с размер 30 или повече, централната гранична теорема казва, че извадковото разпределение ще е приблизително нормално, извадковото разпределение на средните стойности на извадката, но очевидно извадката ни е с много по-малък размер. Един начин да помислим за това... Можем просто да поставим точките си информация и да видиш дали изглеждат изкривени в някоя посока, и ако направим една диаграма тук, можем да кажем... Да видим, 0, 1, 2, 3, 4, 5, 6, 7, 8 и 9. Имаме една точка информация, където разликата е била 9, една точка информация, където разликата е била 5; една точка информация, където разликата е 8; една точка, където разликата е 6; и още една точка, където разликата е 6; и това не изглежда силно изкривено в която и да е посока. Средната стойност на разликата ни е ето тук. Тя е около 6,8. Изглежда приблизително симетрично. Така че можем да сме сигурни в нормалното разпределение. Това не е най-доброто проучване, което човек може да проведе. Това очевидно е извадка с малък размер. Не е случайно взета от цялата генерална съвкупност, но може би можем да се примирим с това. Също така, когато мислиш за биологични процеси, като колко добре някой щрака с пръсти, което е резултат от много неща, случващи се в човешкото тяло, и е резултат от много, много процеси. Тези неща също по принцип имат приблизително нормално разпределение, но няма да задълбавам прекалено, но всички тези неща, отново, това не е супер добро проучване, но е интересно нещо, което да направят група приятели, ако нямат какво друго да правят. Добре. Третото е независимост. В това можем да сме доста сигурни, понеже разликата на Джеф не би трябвало да повлияе на разликата на Дейвид, нито разликата на Дейвид би трябвало да повлияе на разликата на Ким, особено, ако не се наблюдават един друг. И нека просто, за целта на аргумента, да кажем, че всички са направили това независимо в затворена стая с независим наблюдател, така че не са се опитвали да се състезават или нещо подобно, но не е нужно да казваме, че това не е супер добро проучване, но все пак можем да изчислим 95%-ов доверителен интервал. Как да направим това? Правили сме го много пъти, доверителният ни интервал ще е средната стойност на извадката, така че това ще е средната стойност на нашата разлика, средната стойност на разликата плюс или минус... Не знаем стандартното отклонение на генералната съвкупност, така че ще използваме стандартното отклонение на извадката и ако използваш стандартно отклонение на извадката, и този доверителен интервал се отнася до средната стойност, и критичната ни стойност тук ще е базирана на t-таблица за t-критерий (t-статистическа характеристика), и ще умножим това по стандартното отклонение на разликите на извадката, делено на корен квадратен от размера на извадката, делено на корен квадратен от 5. Знаем по-голямата част от данните тук, нека ги запиша тук долу. Знаем средната стойност на извадката тук, тя е 6,8. Така че това ще е 6,8 плюс или минус... и колко ще е критичната ни стойност? Искаме да имаме 95%-ен доверителен интервал, и колко са степените ни на свобода? Те са с 1 по-малко от размера на извадката ни, така че степените ни на свобода тук са равни на 4. И сме готови да използваме t-таблица. Това тук е съкратена t-таблица, която мога да побера на екрана си, и има два начина да помислим за това. Тук ни дават нивото на значимост и причината това да съответства на остатъчната вероятност от 0,025 е, че ако вземеш средните 95% от едно разпределение, тогава ще имаш 2,5% във всеки край. Това ще е остатъчната вероятност, така че това е всичко, което става тук. Ние ще сме в тази колона и кои степени на свобода използваме? Това ще са 4 степени на свобода. Размерът на извадката ни е 5. 5 – 1 е 4, така че това ще е критичната ни стойност, тя е 2,776. Имаме 2,776 като критична стойност, а после това по стандартното отклонение на извадката. Стандартното отклонение на извадката за нашата разлика е ето тук – то е 1,64 и после ще разделим това на корен квадратен от размера на извадката ни. Корен квадратен от размера на извадката ни, като вече записах 5 тук. Понякога просто ще пиша n на това място. И на колко ще е равно това? Първо нека пресметнем риска от грешка тук, като това ще е 2,776 по 1,64 делено на корен квадратен от 5, и получаваме риск от грешка от приблизително 2,036. Така че това ще е 6,8 +/– 2,036. Това е приблизително равно на това, където това е рискът ни за грешка, а ако искаме да запишем интервала, можем просто да вземем 6,8 минус това и 6,8 плюс това, така че нека го направим с калкулатор. 6,8 – 2,036 е равно на 4,764. Доверителният ни интервал започва приблизително при 4,764 и преминава до...да видим. Мога да направя това наум, ако събера 2,036 със 6,8 това ще е 8,836. Как ще интерпретираме този доверителен интервал тук? Един начин да интерпретираме това е да кажем, че сме уверени на 95%, че този интервал включва реалната средна стойност на разликата щракания с пръсти за тези приятели. Можем също да кажем, че изглежда има разлика в средната стойност на броя щракания, след като 0 не влиза в този интервал и след като целият интервал е над 0. 0 не влиза тук и това е над 0, изглежда че тази група ето тук... тази група приятели в Кан Академия могат да щракат по-бързо с пръстите на доминантната си ръка.