If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Курс: 12. клас (България) Профилирана подготовка Модул 3 Практическа математика > Раздел 2

Урок 5: Анализ на диаграми – зависимост на две категорни променливи

Анализиране на тенденции при качествени (категорийни) данни

Сал решава пример, където от него искат да изчисли сравнителните честоти и анализира тенденциите в категорийните (качествените) данни.  Създадено от Сал Кан.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Таблицата с относителните честоти по-долу показва данни от проучване за връзката между количеството време, което човек прекарва на компютъра преди лягане, и времето, през което човек спи всяка нощ. Що се отнася до използване на компютър, времето на всеки участник е класифицирано като минимално, умерено или твърде много. Да погледнем таблицата с честотите по-долу. Да видим. Това е таблицата с честотите и можем да видим, че има 3 категории за време на компютъра, точно както ни казаха – минимално, умерено и твърде много. Това е преди човек да си легне или през нощта. После са трите категории за количеството сън – 5 или по-малко часа на нощ; от 5 до 7 часа на нощ; 7 или повече часа. Дотук добре. Да видим какво искат да направим. "Да приемем, че в проучването има 17 души, които едновременно умерено използват компютър и спят от 5 до 7 часа." Умерено, от 5 до 7. В тази група, ето тук, има 17 души. За да отбележа това, копирах и поставих тази графика в бележника си, за да мога да пиша на нея. Казват ни, че тази група... и химикалът ми не работи. Не знам какво точно става. В тази група тук има 17 души. Какво искат от нас да направим? Питат ни: "Колко хора в проучването използват компютър твърде много и едновременно с това спят от 5 до 7 часа? Закръгли до най-близкото цяло число." Твърде много и от 5 до 7. Ще извадя бележника си. Питат ни колко хора са в тази група, ето тук. Мисля, че трябва да сменя химикала на таблета си. Не знам защо става така на петна. Как можем да разсъждаваме за това? В групата, заградена с червено, участват 17 души. Колко хора са в тази група, заградена в синьо? Казват ни, че 17 е 34% от общия брой хора в реда, така че може да се каже, че 17 е 34,3% от хората, които умерено използват компютър, или може да се каже, че 17 е 30% от хората, които спят от 5 до 7 часа всяка нощ, или че 17 е 10% от общия брой хора. Нека почнем оттам. Можем да открием общия брой хора. Нека го запиша по този начин. 10% от общия брой, 10% от общия брой ще е равно на 17, или общият брой – просто раздеям двете страни на 10%, е равен на 17, делено на 10%, което е същото нещо като 17 върху 0,1. Което, разбира се, е равно на 170. Общият брой хора е 170, като ни казват, че хората, които използват компютър твърде много, и спят от 5 до 7 часа на нощ, представляват 11,7% от общия брой. Отговорът на въпроса им: "Колко хора използват компютър твърде много и спят от 5 до 7 часа на нощ" е 11,7% от 170. Нека се върнем ето тук. Тук имаме приложение за калкулатор. Това е 11,7%, което е 0,117, умножено по 170... Нека се уверя, че виждаш какво правя, като дойда малко насам. По 170 е равно на 19,89. Ако закръгляме да най-близкото цяло число, това ще са 20 души. 20 души. После ни задават няколко въпроса. Питат ни: "Таблицата дава ли доказателство за връзка между това да използваш компютър минимално и да спиш по 7 или повече часа на нощ?" Нека погледнем таблицата. Връзка между това да използваш компютър минимално и да спиш по 7 часа или повече. Изглежда, че това са тези, които използват компютър минимално и спят по 7 или повече часа. Има два начина да разчетем това. Можеш да кажеш, че 51% от тези, които ползват компютър минимално, спят по 7 или повече часа. Можеш да кажеш, че от хората, които спят по 7 часа или повече, 55% използват компютър минимално. Разбира се, това ни казва само, че хората, които използват компютър минимално и спят по 7 или повече часа, представляват 18,3% от всички участници в проучването. Нека погледнем вариантите. Всъщност, преди дори да погледна вариантите, нека видим дали има връзка. Изглежда сякаш ако погледнеш хората, които използват компютър минимално, само 16% спят по 5 или по-малко часа. По-голям процент спят от 5 до 7 часа, а 51% – най-високият процент, спят по 7 или повече часа. При хората, които използват компютър минимално, изглежда сякаш разпределението определено натежава към повечето часове сън. Например ако погледнем хората, които много използват компютър, там моделът е обратен. Там 47% спят по 5 или по-малко часа на нощ, 33% спят от 5 до 7 часа, а само 19% спят по 7 или повече. Изглежда, че умерената графа е някъде между тях. Като гледаме всеки един от тези редове, изглежда, че има модел, при който, ако използваш компютър по-малко време, е по-вероятно да спиш повече, и, по същия начин, ако използваш компютър повече, е по-вероятно да спиш по-малко. Друг начин да мислим за това е като погледнем хората, които спят по 7 или повече часа, основната част от тях използват минимално компютър. И има три групи. Изглежда тези 55%, които използват компютър минимално, са определено по-непропорционално представени в групата със 7 или повече часа сън. Виждаш, че в тази група хората, които използват компютър твърде много, представляват само 20% от хората в нея. Изглежда, че има връзка между минималната употреба на компютър и спането по 7 или повече часа. Но нека видим какви отговори ни дават. "Показва ли таблицата връзка между минималната употреба на компютър и спането по 7 или повече часа?" "Да, понеже 35.1% са тези, които много използват компютър, а 29.1% от хората го използват умерено." Отговарям с да, но това не изглежда да подкрепя твърдението. Това просто ни дава някаква произволна информация за процента хора, които използват компютър твърде много или за тези, които използват компютър умерено. "Не"... Добре... Обясних защо ще отговорим да, понеже изглежда има някакъв модел. И дори не съм съгласен с това твърдение, според което "общите проценти на колоната по-същество са еднакви." Виждаме, че процентите в колоната не са еднакви за различните... за хората, които спят по 7 или повече часа. Виждаме това тук – 55, 25, 20, така че няма да отговоря така. "Да, понеже 51% от тези, които използват компютър минимално, спят по 7 или повече часа, а само 33% от всички, които използват компютър, спят по 7 или повече часа." Да. Това изглежда доста добре. "51% от тези, които използват компютър минимално, спят по 7 или повече часа, а само 33% от всички, които използват компютър, спят по 7 или повече часа." Това изглежда като доста добро обяснение, така че ще избера това, но нека прегледаме всички. "Не." Е, вече казах, че мисля, че е да. "Не, понеже общият процент на хората, които използват компютър твърде много и спят от 5 до 7 часа, е същият като общия процент на хората, които използват компютър умерено и спят от 5 до 7 часа." Това няма връзка с зависимостта, която търсим. "Да, понеже 55% от хората, които спят по 7 или повече часа, използват компютър минимално, а само 35% от всички използват компютър минимално." Всъщност, ще избера и това. Да, това е въпрос с множество отговори, така че мога да избера и това. Това, гледаме го от... Тук гледахме процента хора, които използват компютър минимално и спят по 7 часа, и видяхме, че този процент е по-висок, отколкото при общия брой хора. Тук гледаме хората, които спят 7 или повече часа, и казваме, че 55% от тях използват компютър минимално, въпреки че само 35% от всички хора използват компютър минимално. Ще избера и двете. Нека проверим отговора си. И сме отговорили вярно.