Основно съдържание
Курс: Статистика и вероятности > Раздел 11
Урок 1: Приблизително намиране на съотношенията (частите, на които се дели) в генералната съвкупност- Доверителен интервал пример
- Допустима грешка 1
- Допустима грешка 2
- Условия за намиране на валидни доверителни интервали
- Решени примери за условия за определяне на доверителни интервали
- Условия за извеждане на статистически изводи за част от генералната съвкупност
- Условия за определяне на z-интервал за част от генералната съвкупност
- Критична стойност (z*) за даден доверителен интервал
- Намиране на критична стойност (z*) за желан доверителен интервал
- Пример за определяне и тълкуване на доверителен интервал за p
- Намиране на z-интервал за част от генералната съвкупност
- Тълкуване на z-интервал за част от генералната съвкупност
- Определяне на размера на извадката на база на доверителността и ограниченията за грешката
- Размер на извадката и допустима грешка при z-интервал за р
© 2024 Khan AcademyУсловия за ползванеДекларация за поверителностПолитика за Бисквитки
Условия за извеждане на статистически изводи за част от генералната съвкупност
Когато искаме да изведем заключения относно съотношенията (частите, на които се дели), да зададем доверителен интервал или да направим проверка за значимост, точността на методите зависи от няколко условия. Преди да извършим същинските изчисления за интервала или проверката, е важно да проверим дали тези условия са изпълнени, иначе нашите изчисления и изводи може да се окажат неверни.
Условията, които са необходими, за да направим заключение за едно съотношение, са:
- Случайност: Данните трябва да са от случайна извадка от рандомизирано проучване.
- Нормалност: Извадковото разпределение на
трябва да бъде приблизително нормално — необходими са поне очаквани положителни изхода и очаквани отрицателни изхода. - Независимост: Отделните наблюдения трябва да бъдат независими. Ако извадката е без заместване, размерът на извадката трябва да бъде по-голям от
от генералната съвкупност.
Нека разгледаме всяко от тези условия малко по-задълбочено.
Условие за случайност
Случайните извадки ни дават обективни данни за генералната съвкупност. Когато извадките не се избират на случаен принцип, данните обикновено имат някакво изкривяване, така че използването на данни, които не са случайно избрани, за да се правят заключения за генералната съвкупност, е рисковано и необективно.
По-точно, съотношенията в извадката са обективни оценители на съотношенията в генералната съвкупност. Например, ако имаме пакет с бонбони, където от бонбоните са оранжеви, и вземем случайни извадки от пакета, някои от тях ще имат повече от оранжеви бонбони, а други ще имат по-малко. Но средно делът на оранжевите бонбони във всяка извадка ще е . Това свойство се записва като , което е вярно само тогава, когато извадката е случайна.
Това обаче не е задължително да се случи, ако нашата извадка не е избрана случайно. Изкривени извадки водят до неточни резултати, така че те не трябва да се използват за намиране на доверителни интервали или извършване на проверки за значимост.
Условие за нормалност
Извадковото разпределение на е приблизително нормално, когато очакваният брой на положителни и отрицателни резултати е поне и за двете. Това е възможно, когато размерът на извадката е достатъчно голям. Доказателството за това е извън границите на настоящия курс по статистика, но урокът за извадково разпределение ще разкрие донякъде логиката и ще потвърди, че това условие работи.
Необходими са ни:
Ако определяме доверителен интервал, нямаме стойност за , с която да заместим, затова преброяваме наблюдавания брой на положителни и отрицателни резултати в данните от извадката, за да се уверим, че и двата са поне . Ако правим проверка за значимост, използваме размерът на извадката и допускаме някаква стойност за , за да изчислим очаквания брой на положителни и отрицателни резултати.
Условие за независимост
За да използваме формулата за стандартно отклонение на , е необходимо отделните наблюдения да бъдат независими. При извадки без заместване, отделните наблюдения технически не са независими, тъй като изваждането на отделен елемент променя генералната съвкупност.
Но правилото за -те процента казва, че ако извадката съдържа или по-малко от генералната съвкупност, можем да разглеждаме отделните наблюдения като независими, тъй като изваждането на отделните елементи не променя съществено генералната съвкупност по време на изследването. Например, ако размерът на извадката е , трябва да има поне елемента в генералната съвкупност.
Това ни позволява да използваме формулата за стандартното отклонение на :
При тест за значимост използваме размера на извадката и правим допускане за стойността на .
Ако определяме доверителен интервал за , ние всъщност не знаем колко е , затова заместваме с приблизителна стойност за . Когато правим това, го наричаме стандартна грешка на , за да го отличим от стандартното отклонение.
Така нашата формула за стандартната грешка на е
Искаш ли да се присъединиш към разговора?
Все още няма публикации.