Основно съдържание
Курс: Статистика и вероятности > Раздел 11
Урок 2: Намиране на приблизителна стойност на средно аритметичното за генерална съвкупност- Запознаване с t-критерии
- Симулация, показваща стойността на t-критерий
- Условия за определяне на валидни t-интервали
- Условия за статистически изводи относно средно аритметична стойност
- Условия за t-интервал за средно аритметична стойност
- Пример за намиране на критична стойност
- Намиране на критичната стойност t* за желан доверителен интервал
- Пример за определяне на t-интервал за средно аритметично
- Определяне на t-интервал за средно аритметично
- Доверителен интервал за средно аритметично с двойки данни
- Съставяне на t-интервал за двойки данни
- Тълкуване на доверителен интервал за средно аритметично
- Размер на извадката за даден марж на грешката за средно аритметично
- Размер на извадката, необходима за постигане на необходимия марж на грешката в доверителния интервал за средно аритметично.
© 2024 Khan AcademyУсловия за ползванеДекларация за поверителностПолитика за Бисквитки
Съставяне на t-интервал за двойки данни
В някои проучвания правим две наблюдения за един и същи индивид. Например може да разгледаме резултатите на всеки ученик от курса преди и след теста. В други проучвания може да направим наблюдения за всеки от два подобни индивида. Например някои проучвания на лекарства включват съчетаване на два подобни субекта, така че единият да получи лекарството, а другият да получи плацебо.
И в двата вида проучвания работим с двойка статистически величини, а винаги, когато работим с двойки статистически величини, обикновено се интересуваме от разликата във всяка двойка. Например разликата в данните преди теста и след теста или разликата в данните при използване на лекарство и плацебо.
Ако имаме съответствие с няколко условия, може да се построи интервал, за да се определи средната стойност на тези разлики и да се направят изводи.
В този урок ще разгледаме два примера за построяване на интервал за двойки статистически величини. Важно е, че ще имаш възможност да работиш самостоятелно по втория пример, за да провериш дали си усвоил/а основните понятия.
Пример 1
В редакцията на едно списание искат да направят ревю на два часовника – часовник А и часовник В – които използват глобалната позиционна система (GPS), за да изчислят разстоянието, което някой пробягва. Те забелязали, че часовниците определено не показвали едно и също изминато разстояние при даден пробег.
От списанието взели случайна извадка от абонати и поискали от тях да пробягат -километров маршрут, като носят и двата часовника по едно и също време (всички те се съгласили да участват). В края на пробега участниците записали разстоянието, което всеки часовник е показвал, че са пробягали. Това са данните (всички разстояния са в километри):
Бегач | |||||
---|---|---|---|---|---|
Часовник A | |||||
Часовник B |
Построй доверителен интервал, за да изчислиш средната разлика в разстоянието, показано от тези часовници. Предполага ли интервалът, че има разлика между двата часовника?
Стъпка 1: Изчисли разликите
Въпреки че изглежда, че имаме два набора данни – часовник А и часовник В – тези данни не са дошли от две независими извадки. От списанието взели единична извадка от бегачи и всеки бегач носил и двата часовника, така че това е дизайн със съчетани двойки. Единият набор данни, който ни интересува, е разликата между часовник А и часовник В за всеки бегач. Нека определим тази променлива като и да изчислим разликата за всеки бегач:
Бегач | |||||
---|---|---|---|---|---|
Часовник А | |||||
Часовник B | |||||
Разлика |
Основна идея: Когато работим с двойки статистически величини, се интересуваме най-вече от разпределението на разликите.
Стъпка 2: Провери условията
Искаме да използваме тези разлики, за да построим доверителен интервал за средната разлика. След като не знаем стандартното отклонение на разликите на генералната съвкупност, ще трябва да използваме стандартното отклонение на извадката вместо това. Това прави подходящо използването на интервал вместо интервал, за да изчислим средната разлика. Нека проверим условията за създаване на интервал.
- Случайност: От списанието взели случайна извадка от абонатите си.
- Нормалност: След като извадката ни от
бегача е малка, трябва да направим графика на данните. Разликите са приблизително симетрични без отдалечени стойности, така че би трябвало да е безопасно да продължим.
- Независимост: Логично е да приемем независимост между измерванията на всеки бегач. Те са били случайно избрани и не би трябвало да влияят върху резултатите на другите.
Стъпка 3: Построй интервала
Това са данните:
Бегач | |||||
---|---|---|---|---|---|
Часовник A | |||||
Часовник B | |||||
Разлика |
Това са обобщителните статистически характеристики:
Средна стойност | Стандартно отклонение | |
---|---|---|
Часовник A | ||
Часовник B | ||
Разлика |
След като искаме да построим доверителен интервал за средната разлика, трябват ни само обобщителните статистически характеристики за разликите.
Ще използваме формулата за интервал от една извадка за средна стойност:
Компоненти на формулата:
Статистическата ни характеристика е средната стойност на извадката .
Размерът на извадката ни е бегачи.
Стандартното отклонение на извадката ни е .
Степените ни на свобода са , тоест за доверителен интервал критичната ни стойност е .
Изчисления:
Интервал
Стъпка 4: Интерпретирай интервала
Предполага ли интервалът, че има разлика между двата часовника?
Ние сме сигурни, че интервалът улавя средната разлика между разстоянията (в километри), посочени от часовниците при това бягане. Забележи, че интервалът съдържа – което представлява липса на разлика – така че е правдоподобно да няма разлика между разстоянията, посочени от Часовник А и Часовник В.
Ако целият интервал беше над (всички стойности - положителни), или ако беше изцяло под (всички стойности - отрицателни), тогава това щеше да предположи, че има разлика между двата часовника.
Пример 2 – Опитай!
Един образователен уебсайт предлага практическа програма за теста за прием в юридически специалности (LSAT). Потребителите на програмата полагат предварителен и краен тест. Това са резултатите и увеличението в случайна извадка от потребителя:
Потребител | ||||||
---|---|---|---|---|---|---|
Предварителен | ||||||
Краен | ||||||
Увеличение |
Това са обобщителните статистически характеристики:
Средна стойност | Стандартно отклонение | |
---|---|---|
Предварителен | ||
Краен | ||
Увеличение |
Създателите на уебсайта казват, че този интервал предоставя солидни доказателства, че използването на тяхната програма ще доведе до увеличение на LSAT резултата на потребителя.
Искаш ли да се присъединиш към разговора?
Все още няма публикации.