If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Статистика и вероятности

Курс: Статистика и вероятности > Раздел 12

Урок 4: Тест за средното на генералната съвкупност

Пример за въпрос със свободен отговор: Тест за значимост за средно аритметично

Въпрос със свободен отговор относно тест за значимост за средно аритметично.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Наредбите изискват продуктовите надписи върху опаковки на храни, които са допуснати за продажба на пазара точно да посочват количеството храна в тях. По-специално, ако на опаковките за мляко пише, че съдържат 128 унции и средното количество мляко в опаковката е най-малко 128, се счита, че производителят спазва изискванията. Машините за напълване могат да се настроят да пълнят зададеното количество. Променливостта в процеса на напълване е причина реалното съдържание на мляко в опаковките да бъде нормално разпределено. Произволна извадка от 12 опаковки с мляко е изтеглена от линията за преработка на мляко в завод и количеството мляко във всяка една е записано. Средната стойност и стандартното отклонение на извадката от 12 опаковки с мляко е 127,2 унции и съответно 2,1 унции. Има ли достатъчно доказателства, за да се заключи че опаковъчното предприятие не е в съответствие с изискванията? Представи статистическа обосновка за твоя отговор. Спри видеото и виж дали ще се справиш без помощ. Добре, сега нека го направим заедно. Нека първо определим за какво говорим. Нека да дефинирам мю. И това ще бъде средното количество мляко в генералната съвкупност от опаковки в завода, които ни интересуват. И сега можем да направим нашите хипотези. Нулевата ни хипотеза ще бъде, че сме в съответствие с изискванията. Може да кажем, че средната стойност за генералната съвкупност от опаковки е 128. Това е минимумът, за да сме в съответствие. Тогава нашата алтернативна хипотеза ще бъде, че не сме в съответствие. Тоест, че средната стойност на генералната съвкупност е по-малко от 128 течни унции. Това е ситуацията, когато не сме в съответствие, това е алтернативната хипотеза. Ако правим проверка на хипотези, трябва да определим предварително нивото на значимост. Нека го направим тук. Ниво на значимост. Ако не забелязваш, това което правя в това видео е същото, което се очаква от теб на контролно. Това е реален въпрос от изпит. Нивото на значимост тук ще бъде 0,05, избирам го просто така, защото това е обичайна стойност. Тъй като няма зададено ниво в условието е важно да определим едно още в началото. Сега трябва да проверим условията, които са нужни, за да направим статистически извод. Нека напиша това тук. Условия за извод. Това служи, за да сме сигурни, че извадката, която ползваме, за да изведем нашето заключение, да направим проверка на хипотези, е достатъчно надеждна, за да правим изводи от нея. И така, първото условие е за случайност. Трябва ли ни това? Е, тук е казано, че извадката е случайна, взета от 12 опаковки за мляко. Ако бях на изпит, щях да го опиша тук. Бих написал, че в условието се казва че извадката е случайна, с големина 12. Бих написал, че това отговаря на условието. Следващото условие, което ни вълнува, е условието за нормалност. То ни трябва, за да бъдем уверени, че разпределението на извадката ни е близко до нормалното. Има няколко начина, по които можем да направим това. Един вариант е извадката да бъде по-голяма от 30 или по-голяма или равна на 30. Тогава бихме могли да заключим, че разпределението на извадката е близко до нормалното. Но в нашият случай размерът на извадката е N = 12. Така че в размерът на извадката N е по-малък от 30. Но има и друг начин да спазим условието за нормалност. Трябва изходните данни да бъдат нормално разпределени. А това е казано точно тук в условието. Променливостта в процеса на напълване е причина реалното количество мляко да бъде с нормално разпределение. Можем да напишем, че в условието... Тук мога просто да цитирам какво пише горе. Реалното съдържание ... е нормално разпределено. Значи това отговаря на условието. Последното условие, което ще разгледаме, е условието за независимост. Независимост. Това условие ни дава увереност, че единиците в нашата извадка може да се считат за относително независими. Един начин би бил, ако извадката се прави с подмяна, което не е случаят тук. Изглежда, че са взели всички 12 опаковки наведнъж. Друг вариант е, ако извадката е по-малко от 10% от генералната съвкупност. Тогава ще може да се приеме, че са относително независими. И така, можем да напишем, че извадката е без замяна но приемаме, че 12 е под 10% от генералната съвкупност. И в този случай ще отговаря на условието. И в този случай ще отговаря на условието. Изглежда, че изпълнихме тези три условия, които са нужни, за да направим статистически извод, или можем да приемем, че сме го направили. Нямаме информация, която да е противоречива. Това, което можем да направим, е да изчислим t-статистика и след това, чрез нея, да изчислим нашата P-стойност, да я сравним с нивото на значимост и да видим какви заключения можем да си извадим. И така нашата t-статистика тук... Нека напомня, че ако чувстваш вдъхновение можеш винаги да пробваш да го довършиш самостоятелно. Нашата t-статистика ще бъде средна стойност на извадката минус приетата средна стойност от нулевата хипотеза. Тъй като въвеждам този запис - долен индекс 0, ще напиша, че това е приетата средна стойност от моята нулева хипотеза. Така че ще направя това и тогава ще разделя, в идеалния случай, ако правя z-статистика, ще се разделя на стандартното отклонение за разпределението на средната стойност на извадката, което често се нарича стандартна грешка на средната стойност. Причината, поради която правя t-статистика е, че мога да изчисля приблизително стандартното отклонение на извадковото разпределение на средната стойност на извадката, използвайки стандартното отклонение на извадката, разделено на корен квадратен от n. Да повторим, винаги е добре, ако правите това на тест, да опишете какво е n и какви са другите означения. Ако използвате стандартни означения, проверяващите може да приемат, че са описани, но ако имаш време на изпит, е добре да описваш по-подробно какви са тези променливи, които използваш. В този случай, това ще бъде 127,2, което е средната стойност на нашата извадка, минус възприетата средна стойност от нулевата хипотеза, т.е. 128. Цялото това е върху стандартното отклонение на извадката, което е 2,1, разделено на корен квадратен от 12. И така, това ще бъде приблизително равно на... Нека извадя калкулатора. И така, имаме в числителя 127,2 минус 128. Това ще разделим на... Ще отворя нова скоба. Вътре имаме 2,1 делено на корен квадратен от 12. Накрая ще затворя скобите. Въведох ли го правилно? Да, това изглежда вярно. Щракам върху "Приеми". Получи се отрицателно число. Ще кажа, че е приблизително –1,32. Значи –1.32. И сега можем да намерим нашата P-стойност. Нашата P-стойност, която е равна на вероятността да получим t-статистика с такава стойност или по-ниска. Можем да кажем, че t е по-малко или равно на –1,32. Това ще бъде равно на... Нека извадя калкулатора отново. Това, което ще използвам тук, е функцията за кумулативно разпределение на t-статистика. Ето я тук. Интересувам се от лявата страна. Затова ще разгледам площта под кривата от минус безкрайност до, включително, –1,32. Нека да въведем –1,32. И тогава степените на свобода ще бъдат равни на размера на извадката минус едно. Размерът на извадката е 12, минус едно ще е 11. И сега прикачам израза. И така, имам функцията tcdf от минус Е 99 до –1,32 запетая 11. И всъщност би било добре да го запишеш, когато си на изпит, за да може проверяващите да знаят откъде е взето. И така, това е равно на 0,107. Нека да го напиша. Това е приблизително 0,107. Важно е да се напише как сме го изчислили. Използвахме tcdf и отидохме от минус едно, умножено по 10 на 99-та степен. Стигнахме до –1,32, и имахме 11 степени на свобода, за да получим този резултат тук. Добра практика е също да начертаем t-разпределението си тук. Това е нашето t-разпределение. Това е средната стойност на нашето разпределение. Обозначаваме, че това е областта, която ни интересува. Значи това е точно тази част тук. Пишем го, за да се разбере, че знаем за какво говорим. И сега сме готови да направим извод. Можем да направим сравнение с нивото на значимост. Можем да напишем, че щом 0,107 е по-голямо от нивото на значимост или 0,05, което е алфа, не можем да отхвърлим да отхвърлим нулевата хипотеза. И така, нека се уверим още веднъж, че сме разбрали въпроса правилно. Има ли достатъчно доказателства, за да се заключи, че опаковъчният завод не е в съответствие с правилата? Казано по друг начин, няма достатъчно... ще преместя малко надолу. Опитах се да напиша всичко на страницата, но ще трябва да сляза надолу. ...няма достатъчно доказателства, за да заключим ... за да заключим, че фабриката не е в съответствие с изискванията. И с това сме готови.