If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Курс: 12. клас (България) Профилирана подготовка Модул 4 Вероятности и анализ на данни > Раздел 5

Урок 1: Статистически изводи с модел нормално разпределение върху данни от измерване при конкретен експеримент

Примери за отклонение (изместване) в проучванията

Примери за отклонение (изместване) в проучванията.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Казват ни: "Дейвид е водещ на радиопредаване и е любопитен колко от слушателите му харесват неговото шоу. Той решава да направи онлайн анкета. Моли слушателите си да посетят уебсайта му и да участват в анкета. Анкетата показва, че 89% от около 200 отговорили, че "обичат" шоуто му. Кой е най-същественият източник на изкривяване в този сценарии?" Както винаги, спри видеото и виж дали можеш да го решиш самостоятелно и после ще го решим заедно. Нека помислим какво става. Той има генерална съвкупност от слушатели, нали? Ще приема, че броят на слушателите е повече от 200. Той си казва: "Искам да намеря извадка и не мога да питам всичките си слушатели." Кой знае, може би той има 10 000 слушатели, това не ни го казват, но да кажем, че има 10 000 слушатели. Той казва: "Искам да получа индикация какъв процент от тях харесват шоуто ми. Трябва ми извадка." Но вместо да вземе наистина случайна извадка, той ги приканва да попълнят анкетата доброволно. Моли слушателите си да посетят уебсайта му. Това е класическа извадка с доброволен отговор. Тя не е случайна извадка, понеже хората решават дали да влязат в уебсайта и да слушат какво той е казал, и зависи дори от това кой има достъп до компютър. Това не е случайна извадка. Хората, които е по-вероятно да направят това, са тези хора от всички 10 000, това са 200-те отговорили, които са решили да го направят. По-вероятно е те да са хората, които вече харесват Дейвид или им харесва да слушат това, което им казва да направят. Хората, слушателите, които не харесват Дейвид, или не искат да направят това, което им казва, вероятно няма да кажат: "Не харесвам Дейвид и не ми харесва той да ми казва какво да правя, но ще посетя уебсайта му и ще попълня анкетата." Това е по-малко вероятно. Или може да има екстремни ситуации, хора, които не го харесват, може да си кажат: "Определено ще посетя това." Но, в този случай, бих казал, че е по-вероятно феновете ти да направят това, което ги молиш да направят, да влязат в уебсайта ти и да прекарат известно време в него. Поради това 89% вероятно е надценено. 89% вероятно е надценяване на броя на слушателите, които наистина обичат шоуто му. Понеже е по-вероятно тези, които го обичат, да се появят и да попълнят анкетата. Това са други форми на изкривяване. Пристрастност на отговора има, когато питаш нещо, на което хората не е задължително да искат да отговорят с истина или начинът, по който това е формулирано, може да накара някого да отговори по пристрастен начин. Класически примери за това са: "Лъга ли родителите си през предишната седмица?" Или "Изневерявал ли си на съпруга/съпругата си?" Понякога дори: "Пушиш ли?" Всички тези неща, на които хората може да не искат да отговорят напълно искрено или може да крият от света, те може да не искат да отговорят на това искрено при проучване. Така че ще имаш пристрастност на отговора. Но това тук не е така. "Недостатъчна представителност" е, когато начинът, по който правиш извадка, определено изпуска важна група от отговарящи. "Доброволен отговор" – вероятно изпускаме някои важни отговарящи, някои хора, които може да не влязат в уебсайта ти, но "недостатъчна представителност" е малко по-ясно, че това се случва. Нека направим друг пример, може би алтернативна реалност, при която Дейвид пак се опитва да намери това, пак излъчва предаване, все още е любопитен колко слушателите му харесват шоуто му, но опитва да направи различна извадка. В този случай решава да направи анкета на следващите 100 слушатели, които му изпращат имейли от фенове. Не всички отговарят, но 94 от 97-те проучени слушатели казват, че "обичат" шоуто му. "Кой е най-същественият източник на изкривяване в този сценарии?" Това е класическото: "Хей, имам една група, имам извадка, която стои точно пред мен, това са входящите писма в имейла ми, нека питам тях." Не е ли удобно това? Това е класическа "удобна извадка". Това не е просто: "Това са първите 100 човека, които влязат през вратата." В много случаи можеш да спориш защо това може да не е толкова случайно, но това са следващите 100 слушатели, които му пращат имейли от фенове. Това е "удобна извадка" и извадката, която използваш за удобство ще е много изкривена по посока на тези, които те харесват. Отново, това е надценяване на процента слушатели, които обичат шоуто му. "Липса на отговор" е, когато питаш определен брой от хора да попълнят проучване или да отговорят на въпросник, и по някаква причина, някакъв процент от тях не го попълнят. Тогава си казваш: "Кои са тези хора? Може би биха казали нещо важно и може би тяхната гледна точка не е правилно представена в общия брой на тези, които са го попълнили." Тук има малко "липса на отговор". Той пита 100 човека, които му пращат имейли, да попълнят проучването, за да кажат дали го обичат или не, а 97 го попълват. Има трима души, които не са попълнили проучването. Има някаква "липса на отговор", която би била източник на изкривяване, но не е най-сериозната. Тук ни питат да отговорим: "Кой е най-сериозният източник на изкривяване?" и "удобната извадка" определено е най-големият проблем тук. Има трима души, които не са отговорили, но това не е голям проблем. Извадка с доброволен отговор. Е, той не е питал хората, както в предишния пример: "Можеш ли да влезеш тук и да попълниш това?" Предполагам, че има някаква част доброволен отговор тук, когато пита тези 100 души дали ще отговорят. Имаш 97-те души, които са избрали да отговорят. Това може да е източник на изкривяване, но повечето от 100-те, 97, отговарят и, отново, най-същественото нещо е извадката от удобство, която отново, въз основа на тази извадка, която той използва от удобство, ще е много значително надценяване, що се отнася до представяне на цялата генерална съвкупност на слушателите му.