If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:9:13

Техники за взимане на случайни извадки и избягване на отклонението (изместването)

Видео транскрипция

Да кажем, че управляваме училище и в това училище има генерална съвкупност от ученици – ето тук. Това е нашата генерална съвкупност. Искаме да разберем какво мислят тези ученици за качеството на обучението по математика в училището, така че създаваме проучване и просто трябва да решим кого ще изберем да отговори на проучването. Една опция е просто да вземем всеки член от генералната съвкупност, но да кажем, че това е много голямо училище. Да кажем, че сме в колеж и в този колеж има 10 000 души. Казваме си, че не можем просто да говорим с всекиго. Вместо това решаваме да вземем извадка от тази генерална съвкупност, за да получим индикация за това какво мисли цялото училище. Ще направим извадка. Ще направим извадка от тази генерална съвкупност. За да избегнем пристрастността в нашия отговор, за да има той най-добрият шанс да бъде индикативен за цялата генерална съвкупност, искаме извадката ни да бъде случайна. Нашата извадка може или да е случайна, или да не е случайна. Неслучайна. Отначало може да изглежда доста лесно да се направи случайна извадка, но когато стигнеш дотам, не винаги е толкова лесно, колкото си мислиш. Един вид случайна извадка е проста случайна извадка. Проста случайна извадка, като това е просто асоцииране на всеки човек в училището с число, може би те вече имат студентски номер, и ще взема един компютър, генератор на случайни числа, за да генерирам 100-те души, 100-те ученици, така че, да кажем, има извадка от 100 ученици, сред които ще направя проучването, така че това ще е проста случайна извадка. Ще вземем тази цяла генерална съвкупност и случайно – нека нарисувам това. Това е генералната съвкупност, ние просто случайно избираме хора и знаем, че това е случайно, благодарение на генератора на случайни числа или имаме поредица от числа, или нещо такова, което ни позволява да изберем учениците. Това е доста добре, не е вероятно да имаш пристрастност при тази извадка, но има вероятност, че, просто по случайност, генераторът на случайни числа ще избере непропорционален брой от момчета срещу момичета, или непропорционален брой деветокласници, или непропорционален брой от ученици по инженерство срещу ученици по английски, като това е възможно. Въпреки че взимаш проста случайна извадка, която е наистина случайна, отново, има вероятност, че няма да е индикативна за цялата генерална съвкупност. За да смекчим това, има други техники на наше разположение. Една техника е стратифицирана извадка. Стратифицирана. Това е идеята да вземем цялата генерална съвкупност и да я стратифицираме. Да кажем, че искаме да вземем същата тази генерална съвкупност – тук ще я нарисувам като квадрат, за да ни е по-удобно, и ще я стратифицираме, като, да кажем, сме загрижени да получим подходяща извадка от деветокласници, десетокласници, единадесетокласници и дванайсетокласници. Ще я стратифицираме на деветокласници, десетокласници, единадесетокласници и дванадесетокласници и после ще вземем извадка от 25 от всяка от тези групи. Това са стратификациите. Това са деветокласници, десетокласници, единадесетокласници и дванадесетокласници и, вместо просто да вземем извадка от 100 от цялата съвкупност, ще вземем извадка от 25 от всяко от тези. Ето така. Това ни дава сигурност, че ще получиш индикативни отговори от всички различни възрастови групи или нива в университета ви. Може да има друг проблем, при който ще те е грижа повече да имаме точно представяне на мъже и жени в училището, има някаква вероятност – ако имаш 100 случайни души, вероятно е да е близо до 50/50 – но има някакъв шанс, просто случайно, че ще има непропорционален брой мъже или непропорционален брой жени. Това е възможно дори и при стратифицирания случай. Можеш да се запиташ: "Какво ще направя?" Има техника, наречена групирана извадка. Нека запиша това – групирана извадка – правим извадки на групи. Уверени сме, че във всяка от тези групи има добър баланс от мъже и жени. Например може, вместо да взимаме извадки от отделни личности от цялата генерална съвкупност, можем да си кажем: "Нали знаеш, във вторниците и четвъртъците, въпреки че, както можеш да кажеш, това не е нещо тривиално..." – да кажем, че можем да разделим нашата генерална съвкупност в групи, може би дори класове и всеки от тези класове имат равно разпределение от мъже и жени, или доста близо до равно разпределение. Взимаме извадка от целия клас, затова се нарича техника на групиране, или групирана случайна извадка, понеже правим случайна извадка на класовете, при всеки от които сме близо или може би с точен баланс от мъже и жени, така че знаем, че ще имаме добра репрезентация, но все пак взимаме извадки от групите, но после ще проучим всеки един човек във всяка от тези групи, всеки един човек в един от тези класове. Отново, всички тези са форми на случайни проучвания, или случайни извадки, имаш простата случайна извадка, можеш да стратифицираш или можеш да групираш и после случайно да избереш групите и после да проучиш всеки в тази група. Ако всички тези са случайни извадки, какви са неслучайните неща? Един случай на неслучайна извадка е, че може да имаш проучване с доброволно участие или извадка с доброволно участие и това може да е като, примерно, да кажеш на всеки ученик в училището: "Ето ти един уеб адрес. Ако се заинтересуваш, ела и попълни това проучване." Това вероятно ще доведе до пристрастност, понеже някои от учениците, които наистина харесват обучението по математика в училището си, е по-вероятно да го попълнят, а, може би, учениците, които не я харесват, е по-вероятно да не го попълнят, може би това ще направят децата, които просто имат повече време – може би те е по-вероятно да я попълнят. Има голям шанс това да доведе до пристрастност. Учениците, които попълнят проучването, може да бъдат по-изкривени в една или в друга посока, понеже са участвали доброволно. Друга неслучайна извадка би било, ако води до пристрастност поради удобство, като това термин, който често е използван, и може да каже: "Нека направим извадка от 100-те първи ученици, които се появят в училище. Това просто е удобно за мен, понеже няма да трябва да използвам случайни числа или да правя стратификация, или групиране." Но можеш да разбереш как всичко това може да доведе до пристрастност, понеже първите 100 ученици, които се появят в училище, може да са най-прилежните ученици, може би всички те участват в ранен клас по математика, който има много добър преподавател, и те много го харесват. Или може да е по обратния начин, учителят там не е най-добрият и затова това може да доведе до пристрастност в другата посока. Ако дадеш възможност на хората доброволно да участват или кажеш: "Нека взема първите N-брой ученици." Или кажеш: "Нека просто говоря с всички ученици, които в момента са пред мен." Те може да са пред теб за твое удобство, но може да не са истински случайна извадка. Има и други причини, които може да доведат до пристрастност, и може да не е поради правенето на извадката. Може да има пристрастност, поради формулировката на проучването ти. Можеш да си представиш, че проучване, което казва: "Смяташ ли, че имаш късмет да получиш образование по математика, до което много малко други хора в света имат достъп?" Това може да доведе до пристрастност, понеже може да кажеш: "Да, предполагам, че чувствам, че имам късмет." Ако формулировката беше: "Харесва ли ти фактът, че много повече ученици в училището ти се провалят по алгебра в сравнение с близките училища?" Това също може да доведе до отрицателна пристрастност. Формулировката наистина, наистина, наистина има значение при проучванията и има много, което включва това. Другото е просто това, което е наречено пристрастност на отговора. Отново, това не е... Пристрастност на отговора. Това е, понеже хората може да не искат да кажат истината или може дори да не искат да отговорят. Може би те се страхуват, че по някакъв начин отговорите им ще бъдат разкрити пред учителя им по математика или администраторите, или ако те са твърде отрицателни, могат да бъдат разкрити по някакъв начин. Поради това може да не са искрени, така че може да са прекалено положителни или да не го попълнят изобщо. Това е доста високо ниво на преглед за нещата, които се отнасят до извадките. Искаш да е случайно, понеже това намалява вероятността да са пристрастни. А това са някои техники. Също, помисли си дали попадаш в някои от тези капани, при които има голям шанс да се стигне до пристрастност.