If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Курс: Статистика и вероятности > Раздел 11

Урок 2: Намиране на приблизителна стойност на средно аритметичното за генерална съвкупност

Съставяне на t-интервал за двойки данни

В някои проучвания правим две наблюдения за един и същи индивид. Например може да разгледаме резултатите на всеки ученик от курса преди и след теста. В други проучвания може да направим наблюдения за всеки от два подобни индивида. Например някои проучвания на лекарства включват съчетаване на два подобни субекта, така че единият да получи лекарството, а другият да получи плацебо.
И в двата вида проучвания работим с двойка статистически величини, а винаги, когато работим с двойки статистически величини, обикновено се интересуваме от разликата във всяка двойка. Например разликата в данните преди теста и след теста или разликата в данните при използване на лекарство и плацебо.
Ако имаме съответствие с няколко условия, може да се построи t интервал, за да се определи средната стойност на тези разлики и да се направят изводи.
В този урок ще разгледаме два примера за построяване на t интервал за двойки статистически величини. Важно е, че ще имаш възможност да работиш самостоятелно по втория пример, за да провериш дали си усвоил/а основните понятия.

Пример 1

В редакцията на едно списание искат да направят ревю на два часовника – часовник А и часовник В – които използват глобалната позиционна система (GPS), за да изчислят разстоянието, което някой пробягва. Те забелязали, че часовниците определено не показвали едно и също изминато разстояние при даден пробег.
От списанието взели случайна извадка от 5 абонати и поискали от тях да пробягат 10-километров маршрут, като носят и двата часовника по едно и също време (всички те се съгласили да участват). В края на пробега участниците записали разстоянието, което всеки часовник е показвал, че са пробягали. Това са данните (всички разстояния са в километри):
Бегач12345
Часовник A9,89,810,110,110,2
Часовник B10,11010,29,910,1
Построй 95% доверителен интервал, за да изчислиш средната разлика в разстоянието, показано от тези часовници. Предполага ли интервалът, че има разлика между двата часовника?

Стъпка 1: Изчисли разликите

Въпреки че изглежда, че имаме два набора данни – часовник А и часовник В – тези данни не са дошли от две независими извадки. От списанието взели единична извадка от 5 бегачи и всеки бегач носил и двата часовника, така че това е дизайн със съчетани двойки. Единият набор данни, който ни интересува, е разликата между часовник А и часовник В за всеки бегач. Нека определим тази променлива като разлика=BA и да изчислим разликата за всеки бегач:
Бегач12345
Часовник А9,89,810,110,110,2
Часовник B10,11010,29,910,1
Разлика (BA)0,30,20,10,20,1
Основна идея: Когато работим с двойки статистически величини, се интересуваме най-вече от разпределението на разликите.

Стъпка 2: Провери условията

Искаме да използваме тези n=5 разлики, за да построим доверителен интервал за средната разлика. След като не знаем стандартното отклонение на разликите на генералната съвкупност, ще трябва да използваме стандартното отклонение на извадката вместо това. Това прави подходящо използването на t интервал вместо z интервал, за да изчислим средната разлика. Нека проверим условията за създаване на t интервал.
  • Случайност: От списанието взели случайна извадка от абонатите си.
  • Нормалност: След като извадката ни от n=5 бегача е малка, трябва да направим графика на данните. Разликите са приблизително симетрични без отдалечени стойности, така че би трябвало да е безопасно да продължим.
  • Независимост: Логично е да приемем независимост между измерванията на всеки бегач. Те са били случайно избрани и не би трябвало да влияят върху резултатите на другите.

Стъпка 3: Построй интервала

Това са данните:
Бегач12345
Часовник A9,89,810,110,110,2
Часовник B10,110,010,29,910,1
Разлика (BA)0,30,20,10,20,1
Това са обобщителните статистически характеристики:
Средна стойностСтандартно отклонение
Часовник Ax¯A=10,00sA0,19
Часовник Bx¯B=10,06sB0,11
Разлика (BA)x¯Diff=0,06sDiff0,21
След като искаме да построим доверителен интервал за средната разлика, трябват ни само обобщителните статистически характеристики за разликите.
Ще използваме формулата за t интервал от една извадка за средна стойност:
(статистическа характеристика)±(критичнастойност)(стандартно отклонениена статистическата характеристика)x¯разл± tsразлn
Компоненти на формулата:
Статистическата ни характеристика е средната стойност на извадката x¯разл=0,06 км.
Размерът на извадката ни е n=5 бегачи.
Стандартното отклонение на извадката ни е sразл=0,21 км.
Степените ни на свобода са df=51=4, тоест за 95% доверителен интервал критичната ни стойност е t=2,776.
Изчисления:
x¯разл± tsразлn0,06±2,7760,2150,06±(2,776)(0,094)0,06±0,2610,060,261=0,2010,06+0,261=0,321
Интервал (0,20;0,32)

Стъпка 4: Интерпретирай интервала

Предполага ли интервалът, че има разлика между двата часовника?
Ние сме 95% сигурни, че интервалът (0,20;0,32) улавя средната разлика между разстоянията (в километри), посочени от часовниците при това бягане. Забележи, че интервалът съдържа 0 км – което представлява липса на разлика – така че е правдоподобно да няма разлика между разстоянията, посочени от Часовник А и Часовник В.
Ако целият интервал беше над 0 (всички стойности - положителни), или ако беше изцяло под 0 (всички стойности - отрицателни), тогава това щеше да предположи, че има разлика между двата часовника.

Пример 2 – Опитай!

Един образователен уебсайт предлага практическа програма за теста за прием в юридически специалности (LSAT). Потребителите на програмата полагат предварителен и краен тест. Това са резултатите и увеличението в случайна извадка от 6 потребителя:
Потребител123456
Предварителен140152153159150146
Краен150159170164148166
Увеличение (краенпредварителен)107175220
Това са обобщителните статистически характеристики:
Средна стойностСтандартно отклонение
Предварителенx¯pre=150spre6,48
Краенx¯post=159,5spost8,89
Увеличение (краенпредварителен)x¯увеличение=9,5sgain8,07
Задача A (пример 2)
Въз основа на тази извадка, какъв е 95% доверителен интервал за средното повишение на точките на потребителите на тази програма?
Избери един отговор:

Задача Б (пример 2)
Правдоподобно ли е потребителите на тази програма да нямат средно увеличение на точките?
Избери един отговор:

Създателите на уебсайта казват, че този интервал предоставя солидни доказателства, че използването на тяхната програма ще доведе до увеличение на LSAT резултата на потребителя.
Задача В (пример 2)
Валидно заключение ли е това?
Избери един отговор:

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.