Текущ час:0:00Обща продължителност:8:54

Видео транскрипция

Сега ще започнем пътешествие в света на статистиката, което е наистина начин да разберем или да се запознаем с данните. И така, статистиката е всичко, свързано с данни. И тъй като започваме пътешествие в света на статистиката, ние ще правим много от това, което можем да наричаме дескриптивна статистика. И така, ако имаме един куп данни и искаме да кажем нещо за всички тези данни, без да даваме всичките данни, можем ли по някакъв начин да ги изобразим с по-малък набор от числа? Сега ще се съсредоточим върху това. И след като веднъж намерим нашия инструментариум за дескриптивната статистика, след това можем да започнем да правим изводи за тези данни – ще започнем да правим заключения, ще започнем да правим преценки. И ще започнем да работим много с инференциалната статистика – да правим заключения. И така, имайки предвид това, нека помислим как можем да опишем данните. Нека кажем, че имаме множество от числа. Можем да приемем, че това ще бъдат данните. Може би измерваме височината на растенията в нашата градина. И нека кажем, че имаме 6 растения. И височините им са 4 инча, 3 инча, 1 инч, 6 инча и имаме още едно от 1 инч, и друго от 7 инча. И нека кажем, че някой просто казва – в другата стая, без да гледа твоите растения, просто казва: "А знаеш ли колко са високи твоите растения?" И този някой иска да чуе едно число. Иска някак си да получи едно число, което представя всички тези различни височини на растенията. Как ще направиш това? Може би ще си помислиш: "Добре, как мога да намеря нещо, което – може би искам символично число – някакво число, което някак си изобразява средата. Може би искам най-често срещаното число. Може би искам числото, което по някакъв начин изобразява центъра на всичките тези числа." И ако си помислиш някое от тези неща, ти всъщност ще правиш същите неща като хората, измислили дескриптивната статистика. Те са си казали: "Добре, как можем да направим това?" И ще започнем, мислейки за идеята за средно аритметично. И в ежедневната терминология, средно аритметично има много специфично значение, както ще видим. Много хора когато говорят за средно аритметично, имат предвид просто в аритметиката, и ние ще разгледаме това след малко. Но в статистиката средно аритметично означава нещо много по-всеобщо. То наистина означава: "Дай ми типично, или дай ми средно число, или – и това са "или". И наистина това са опити да се намери дадена мярка на централната тенденция. Централна тенденция. Още веднъж – имаме множество числа. Опитваме се по някакъв начин да ги изобразим с едно число, което ще наречем средно аритметично, което е по някакъв начин типично или средно, или по някакъв начин централно на тези числа. И както ще видим, има много видове средни величини. Първата е една, която вероятно познаваш. Тя е това, за което хората казват - Хей средно за този изпит или средната височина. И това е аритметичната среда. Нека го напиша с... Ще го напиша с жълто, аритметична среда. Когато аритметика е съществително, го казваме аритметика. Когато е прилагателно като това, го казваме аритметично, Аритметична среда. И това е наистина просто сумата от всичките числа, разделена на - това е дефиниция, направена от хората, която намираме за полезна - сумата от всички тези числа, делена на броя на числата, които имаме. Знаейки това, каква е аритметичната среда на този набор от данни? Добре, нека просто да го изчислим. Това ще бъде 4 плюс 3, плюс 1, плюс 6, плюс 1, плюс 7, върху броя на точките с данни, които имаме. И така, ние имаме шест точки с данни. Така че, ще разделим на 6. И получаваме, 4 плюс 3 е 7, плюс 1 е 8, плюс 6 е 14, плюс 1 е 15, плюс 7. 15 плюс 7 е 22. Нека го направя още веднъж. Имате 7, 8, 14, 15, 22, всичкото това върху 6. И бихме написали това като смесено число. 6 се съдържа в 22 три пъти с остатък от 4. Така че, това е 3 и 4/6, което е същото нещо като 3 и 2/3. Бихме могли да напишем това като десетично число с 3.6 в период. Така че, това е също 3.6 в период. Бихме могли да го напишем по всеки един от тези начини. Но това е един вид представително число. То се опитва да ни покаже основната тенденция. Още веднъж, тези са измислени от хората. Никой никога - това не е като някой просто да е намерил някакви религиозни документи, които казват, това е начинът, по който аритметичната среда трябва да бъде определена. Това не е чисто пресмятане, като, да кажем, намирането на обиколката на окръжност, където наистина е така - това беше един вид - ние изучавахме вселената. И това просто ни попадна при изучаването на вселената. Това е дефиниция, измислена от хората, която сме намерили за полезна. Сега, има други начини да измерим средното или да намерим типична или средна стойност. Другият много типичен начин е медианата. И аз ще напиша медиана. Свършват ми цветовете. Ще напиша медиана в розово. И така, ето я медианата. И медианата е буквално търсенето на средното число. Така че, ако трябваше да подредите всичките тези числа във вашия набор и да намерите средното, тогава това ще бъде вашата медиана. Имайки това, каква ще бъде медианата на този набор от числа? Нека се опитаме да я намерим. Нека се опитаме да ги подредим. И така, имаме 1. След това имаме друго 1. След това имаме 3. След това имаме 4, 6 и 7. Всичко, което направих е да пренаредя това. И така, кое е средното число? Ами вижте тук, тъй като имаме четен брой числа, имаме 6 числа, няма едно средно число. В действителност има две средни числа тук. Имате две средни числа тук. Имате 3 и 4. И в този случай, когато имате две средни числа, вие всъщност отивате по средата между тези две числа. Вие по същество вземате аритметичната среда на тези две числа, за да намерите медианата. Така че, медианата ще бъде по средата между 3 и 4, което ще бъде 3.5. Така че, медианата в този случай е 3.5. И така, ако имате четен брой числа, медианата или средните две - по същество аритметичната среда на средните две или половината между средните две. Ако имате нечетен брой числа, е малко по-лесно да се изчисли. И ето така виждаме, че...нека ви дам друг набор от данни. Нека кажем, че наборън от данни - и аз ще го подредя за вас - нека кажем, че наборът от данни беше 0, 7, 50, не знам, 10,000 и 1 милион. Нека кажем, че това е наборът от данни. Малко странен набор от данни. Но в тази ситуация, каква е медианата? Ами, тук имаме пет числа. Имаме нечетен брой числа. Така че е по-лесно да изберем средата. Средата е числото, което е по-голямо от две от числата и е по-малко от две от числата. То е точно в средата. Така че, в този случай, медианата е 50. Сега, третата мярка на основната тенденция и това е тази, която вероятно се използва най-рядко в живота, е модата. И хората често забравят за нея. Звучи като нещо много сложно. Но това, което ще видим е всъщност много просто понятие. И в известен смисъл, то е най-простото понятие. И така, модата е всъщност най- повтарящото се число в набора от данни, ако има най-повтарящо се число. Ако всички числа са представени по равно, и няма нито едно най-повтарящо се число, тогава нямате мода. Но имайки тази дефиниция за модата, какво е единственото най-повтарящо се число в нашия първоначален набор от данни, в този набор от данни ето тук? Ами, имаме само едно 4. Имаме само едно 3. Но имаме две единици. Имаме едно 6 и едно 7. Така че, числото което се явява най-повтарящо се тук, е 1. Така че, модата, най-типичното число, най-повтарящото се число тук е 1. И така, виждате, че тези са всички различни начини при опитите ни да получим типична или средна, или основна тенденция. Но те го правят по много, много различни начини. И когато учим повече и повече статистика, ще видим, че те са добри за различни неща. Това се използва много често. Медианата е наистина добра, ако имате някакъв вид странно число тук, което би имало в известна степен несиметрична аритметична среда. Модата може също да бъде полезна в ситуации като тази, особено, ако имате едно число, което се показва по-често. Както и да е, ще ви оставя тук. И в следващите няколко клипа, ще изучаваме статистиката дори по-подробно.