Основно съдържание

Курс: Статистика и вероятности > Раздел 11

Урок 2: Намиране на приблизителна стойност на средно аритметичното за генерална съвкупност

Съставяне на t-интервал за двойки данни

В някои проучвания правим две наблюдения за един и същи индивид. Например може да разгледаме резултатите на всеки ученик от курса преди и след теста. В други проучвания може да направим наблюдения за всеки от два подобни индивида. Например някои проучвания на лекарства включват съчетаване на два подобни субекта, така че единият да получи лекарството, а другият да получи плацебо.

И в двата вида проучвания работим с двойка статистически величини, а винаги, когато работим с двойки статистически величини, обикновено се интересуваме от разликата във всяка двойка. Например разликата в данните преди теста и след теста или разликата в данните при използване на лекарство и плацебо.

Ако имаме съответствие с няколко условия, може да се построи

t

интервал, за да се определи средната стойност на тези разлики и да се направят изводи.

В този урок ще разгледаме два примера за построяване на

t

интервал за двойки статистически величини. Важно е, че ще имаш възможност да работиш самостоятелно по втория пример, за да провериш дали си усвоил/а основните понятия.

Пример 1

В редакцията на едно списание искат да направят ревю на два часовника – часовник А и часовник В – които използват глобалната позиционна система (GPS), за да изчислят разстоянието, което някой пробягва. Те забелязали, че часовниците определено не показвали едно и също изминато разстояние при даден пробег.

От списанието взели случайна извадка от

5

абонати и поискали от тях да пробягат

10

-километров маршрут, като носят и двата часовника по едно и също време (всички те се съгласили да участват). В края на пробега участниците записали разстоянието, което всеки часовник е показвал, че са пробягали. Това са данните (всички разстояния са в километри):

Бегач	$1$ ‍	$2$ ‍	$3$ ‍	$4$ ‍	$5$ ‍
Часовник A	$9, 8$ ‍	$9, 8$ ‍	$10, 1$ ‍	$10, 1$ ‍	$10, 2$ ‍
Часовник B	$10, 1$ ‍	$10$ ‍	$10, 2$ ‍	$9, 9$ ‍	$10, 1$ ‍

Построй $95 %$ ‍ доверителен интервал, за да изчислиш средната разлика в разстоянието, показано от тези часовници. Предполага ли интервалът, че има разлика между двата часовника?

Стъпка 1: Изчисли разликите

Въпреки че изглежда, че имаме два набора данни – часовник А и часовник В – тези данни не са дошли от две независими извадки. От списанието взели единична извадка от

5

бегачи и всеки бегач носил и двата часовника, така че това е дизайн със съчетани двойки. Единият набор данни, който ни интересува, е разликата между часовник А и часовник В за всеки бегач. Нека определим тази променлива като

разлика = B - A

и да изчислим разликата за всеки бегач:

Бегач	$1$ ‍	$2$ ‍	$3$ ‍	$4$ ‍	$5$ ‍
Часовник А	$9, 8$ ‍	$9, 8$ ‍	$10, 1$ ‍	$10, 1$ ‍	$10, 2$ ‍
Часовник B	$10, 1$ ‍	$10$ ‍	$10, 2$ ‍	$9, 9$ ‍	$10, 1$ ‍
Разлика $(B - A)$ ‍	$0, 3$ ‍	$0, 2$ ‍	$0, 1$ ‍	$- 0, 2$ ‍	$- 0, 1$ ‍

Основна идея: Когато работим с двойки статистически величини, се интересуваме най-вече от разпределението на разликите.

Стъпка 2: Провери условията

Искаме да използваме тези

n = 5

разлики, за да построим доверителен интервал за средната разлика. След като не знаем стандартното отклонение на разликите на генералната съвкупност, ще трябва да използваме стандартното отклонение на извадката вместо това. Това прави подходящо използването на

t

интервал вместо

z

интервал, за да изчислим средната разлика. Нека проверим условията за създаване на

t

интервал.

Случайност: От списанието взели случайна извадка от абонатите си.
Нормалност: След като извадката ни от $n = 5$ ‍ бегача е малка, трябва да направим графика на данните. Разликите са приблизително симетрични без отдалечени стойности, така че би трябвало да е безопасно да продължим.

Независимост: Логично е да приемем независимост между измерванията на всеки бегач. Те са били случайно избрани и не би трябвало да влияят върху резултатите на другите.

Стъпка 3: Построй интервала

Това са данните:

Бегач	$1$ ‍	$2$ ‍	$3$ ‍	$4$ ‍	$5$ ‍
Часовник A	$9, 8$ ‍	$9, 8$ ‍	$10, 1$ ‍	$10, 1$ ‍	$10, 2$ ‍
Часовник B	$10, 1$ ‍	$10, 0$ ‍	$10, 2$ ‍	$9, 9$ ‍	$10, 1$ ‍
Разлика $(B - A)$ ‍	$0, 3$ ‍	$0, 2$ ‍	$0, 1$ ‍	$- 0, 2$ ‍	$- 0, 1$ ‍

Това са обобщителните статистически характеристики:

	Средна стойност	Стандартно отклонение
Часовник A	${\bar{x}}_{A} = 10, 00$ ‍	$s_{A} \approx 0, 19$ ‍
Часовник B	${\bar{x}}_{B} = 10, 06$ ‍	$s_{B} \approx 0, 11$ ‍
Разлика $(B - A)$ ‍	${\bar{x}}_{Diff} = 0, 06$ ‍	$s_{Diff} \approx 0, 21$ ‍

След като искаме да построим доверителен интервал за средната разлика, трябват ни само обобщителните статистически характеристики за разликите.

Ще използваме формулата за

t

интервал от една извадка за средна стойност:

\begin{aligned} (статистическа характеристика) & \pm (\binom{критична}{стойност}) (\binom{стандартно отклонение}{на статистическата характеристика}) \\ {\bar{x}}_{разл} & \pm t^{*} \cdot \frac{s_{разл}}{\sqrt{n}} \end{aligned}

Компоненти на формулата:

Статистическата ни характеристика е средната стойност на извадката

{\bar{x}}_{разл} = 0, 06 км

Размерът на извадката ни е

n = 5

бегачи.

Стандартното отклонение на извадката ни е

s_{разл} = 0, 21 км

Степените ни на свобода са

df = 5 - 1 = 4

, тоест за

95 %

доверителен интервал критичната ни стойност е

t^{*} = 2,776

Използване на калкулатор:

Можем да използваме обратната

t

функция, за да намерим стойността, съответна на площ на опашката от

0,025

\begin{aligned} invT \\ площ: 0,025 \\ df : 4 \\ = - 2,776 45 \end{aligned}

Използване на $t$ ‍ таблица:

Можем да използваме

t

таблица, за да намерим стойността, съответна на площ от

0,025

със

df = 4

Тоест

t^{*} = 2,776

Изчисления:

\begin{aligned} {\bar{x}}_{разл} & \pm t^{*} \cdot \frac{s_{разл}}{\sqrt{n}} \\ 0, 06 & \pm 2,776 \cdot \frac{0, 21}{\sqrt{5}} \\ 0, 06 & \pm (2,776) (0,094) \\ 0, 06 & \pm 0,261 \\ 0, 06 & - 0,261 = - 0,201 \\ 0, 06 & + 0,261 = 0,321 \end{aligned}

Интервал

\approx (- 0, 20; 0, 32)

Стъпка 4: Интерпретирай интервала

Предполага ли интервалът, че има разлика между двата часовника?

Ние сме

95 %

сигурни, че интервалът

(- 0, 20; 0, 32)

улавя средната разлика между разстоянията (в километри), посочени от часовниците при това бягане. Забележи, че интервалът съдържа

0 км

– което представлява липса на разлика – така че е правдоподобно да няма разлика между разстоянията, посочени от Часовник А и Часовник В.

Ако целият интервал беше над

0

(всички стойности - положителни), или ако беше изцяло под

0

(всички стойности - отрицателни), тогава това щеше да предположи, че има разлика между двата часовника.

Пример 2 – Опитай!

Един образователен уебсайт предлага практическа програма за теста за прием в юридически специалности (LSAT). Потребителите на програмата полагат предварителен и краен тест. Това са резултатите и увеличението в случайна извадка от

6

потребителя:

Потребител	$1$ ‍	$2$ ‍	$3$ ‍	$4$ ‍	$5$ ‍	$6$ ‍
Предварителен	$140$ ‍	$152$ ‍	$153$ ‍	$159$ ‍	$150$ ‍	$146$ ‍
Краен	$150$ ‍	$159$ ‍	$170$ ‍	$164$ ‍	$148$ ‍	$166$ ‍
Увеличение $(краен - предварителен)$ ‍	$10$ ‍	$7$ ‍	$17$ ‍	$5$ ‍	$- 2$ ‍	$20$ ‍

Това са обобщителните статистически характеристики:

	Средна стойност	Стандартно отклонение
Предварителен	${\bar{x}}_{pre} = 150$ ‍	$s_{pre} \approx 6, 48$ ‍
Краен	${\bar{x}}_{post} = 159, 5$ ‍	$s_{post} \approx 8, 89$ ‍
Увеличение $(краен - предварителен)$ ‍	${\bar{x}}_{увеличение} = 9, 5$ ‍	$s_{gain} \approx 8, 07$ ‍

Задача A (пример 2)

Въз основа на тази извадка, какъв е $95 %$ ‍ доверителен интервал за средното повишение на точките на потребителите на тази програма?

Задача Б (пример 2)

Правдоподобно ли е потребителите на тази програма да нямат средно увеличение на точките?

(Избор А)
Да, след като $0$ ‍ се съдържа в този интервал.
(Избор Б)
Да, след като $0$ ‍ не се съдържа в интервала.
(Избор В)
Не, след като $0$ ‍ се съдържа в интервала.
(Избор Г)
Не, след като $0$ ‍ не се съдържа в интервала.

Създателите на уебсайта казват, че този интервал предоставя солидни доказателства, че използването на тяхната програма ще доведе до увеличение на LSAT резултата на потребителя.

Задача В (пример 2)

Валидно заключение ли е това?

Искаш ли да се присъединиш към разговора?

Вписване в профила

Сортирай по:

Все още няма публикации.

Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.