У дома - подове
Как да намерите средната стойност на няколко числа. Как да намерите средното аритметично и геометрично на числата

В повечето случаи данните са концентрирани около определена централна точка. По този начин, за да се опише всеки набор от данни, е достатъчно да се посочи средната стойност. Разгледайте последователно три числени характеристики, които се използват за оценка на средната стойност на разпределението: средно аритметично, медиана и мода.

Средно аритметично

Средната аритметична стойност (често наричана просто средна) е най-често срещаната оценка на средната стойност на разпределение. Това е резултат от разделянето на сумата от всички наблюдавани числови стойности на техния брой. За проба на числата X 1, X 2, ..., Xн, средната стойност на извадката (обозначена със символа ) се равнява \u003d (X 1 + X 2 + ... + Xн) / н, или

къде е средната стойност на извадката, н- размер на извадката, хазi-ти елементпроби.

Изтеглете бележка в или формат, примери във формат

Помислете за изчисляване на средната аритметична стойност на петгодишната средна годишна възвръщаемост на 15 взаимни фонда с много високо нивориск (фиг. 1).

Ориз. 1. Средна годишна доходност на 15 взаимни фонда с много висок риск

Средната стойност на извадката се изчислява, както следва:

то добри доходи, особено в сравнение с възвръщаемостта от 3-4%, която вложителите в банки или кредитни съюзи са получили за същия период от време. Ако сортирате стойностите на възвращаемостта, лесно можете да видите, че осем фонда имат доходност над, а седем - под средната. Средната аритметична стойност действа като точка на баланс, така че фондовете с ниски доходи балансират фондовете с високи доходи. Всички елементи на извадката участват в изчисляването на средната стойност. Нито един от другите оценители на средната стойност на разпределението няма това свойство.

Кога да се изчисли средноаритметичната стойност.Тъй като средноаритметичната стойност зависи от всички елементи на извадката, наличието на екстремни стойности значително влияе върху резултата. В такива ситуации средноаритметичната стойност може да изкриви значението на числовите данни. Следователно, когато се описва набор от данни, съдържащ екстремни стойности, е необходимо да се посочи медианата или средноаритметичното и медианата. Например, ако възвръщаемостта на фонда RS Emerging Growth бъде премахната от извадката, средната извадкова възвръщаемост на 14-те фонда намалява с почти 1% до 5,19%.

Медиана

Медианата е средната стойност на подреден масив от числа. Ако масивът не съдържа повтарящи се числа, тогава половината от неговите елементи ще бъдат по-малки от и половината повече от медианата. Ако извадката съдържа екстремни стойности, по-добре е да се използва медианата, а не средното аритметично, за да се оцени средната стойност. За да се изчисли медианата на извадка, тя първо трябва да бъде сортирана.

Тази формула е двусмислена. Резултатът му зависи от това дали числото е четно или нечетно. н:

  • Ако извадката съдържа нечетен брой елементи, медианата е (n+1)/2-ти елемент.
  • Ако извадката съдържа четен брой елементи, медианата се намира между двата средни елемента на извадката и е равна на средноаритметичната стойност, изчислена върху тези два елемента.

За да изчислим медианата за извадка от 15 взаимни фонда с много висок риск, първо трябва да сортираме необработените данни (Фигура 2). Тогава медианата ще бъде срещу номера на средния елемент на извадката; в нашия пример номер 8. Excel има специална функция=MEDIAN(), който работи и с неподредени масиви.

Ориз. 2. Медиана 15 средства

Така медианата е 6,5. Това означава, че половината от фондовете с много висок риск не надвишават 6,5, докато другата половина го правят. Имайте предвид, че медианата от 6,5 е малко по-голяма от медианата от 6,08.

Ако премахнем доходността на фонда RS Emerging Growth от извадката, тогава медианата на останалите 14 фонда ще намалее до 6,2%, тоест не толкова значително, колкото средноаритметичната (фиг. 3).

Ориз. 3. Медиана 14 средства

Мода

Терминът е въведен за първи път от Pearson през 1894 г. Fashion е числото, което се среща най-често в извадката (най-модерното). Модата описва добре например типичната реакция на шофьорите при светофар за спиране на движението. Класически примеризползване на модата - изборът на размера на произведената партида обувки или цвета на тапета. Ако едно разпределение има множество режими, тогава се казва, че е мултимодално или мултимодално (има два или повече „пика“). Мултимодалността на разпространение дава важна информацияза естеството на изследваната променлива. Например, в социологически проучвания, ако една променлива представлява предпочитание или отношение към нещо, тогава мултимодалността може да означава, че има няколко ясно различни мнения. Мултимодалността също е индикатор, че извадката не е хомогенна и че наблюденията могат да бъдат генерирани от две или повече „припокриващи се“ разпределения. За разлика от средноаритметичната стойност, отклоненията не влияят на режима. За непрекъснато разпределени случайни променливи, като средната годишна възвръщаемост на взаимните фондове, режимът понякога изобщо не съществува (или няма смисъл). Тъй като тези индикатори могат да приемат различни стойности, повтарящите се стойности са изключително редки.

Квартили

Квартилите са мерки, които най-често се използват за оценка на разпределението на данни, когато се описват свойствата на големи числени извадки. Докато медианата разделя подредения масив наполовина (50% от елементите на масива са по-малки от медианата и 50% са по-големи), квартилите разделят подредения набор от данни на четири части. Стойностите на Q 1, медианата и Q 3 са съответно 25-ти, 50-ти и 75-ти персентил. Първият квартил Q 1 е число, което разделя извадката на две части: 25% от елементите са по-малко от и 75% са повече от първия квартил.

Третият квартил Q 3 е число, което също разделя извадката на две части: 75% от елементите са по-малко от и 25% са повече от третия квартил.

За изчисляване на квартили във версии на Excel преди 2007 г. се използва функцията =QUARTILE(масив, част). Започвайки с Excel 2010, се прилагат две функции:

  • =QUARTILE.ON(масив, част)
  • =QUARTILE.EXC(масив, част)

Тези две функции дават малко различни значения(фиг. 4). Например, когато се изчисляват квартилите на извадка, съдържаща данни за средната годишна доходност на 15 взаимни фонда с много висок риск, Q 1 = 1,8 или -0,7 съответно за QUARTILE.INC и QUARTILE.EXC. Между другото, функцията QUARTILE, използвана по-рано, съответства на модерна функцияКВАРТИЛ НА За да изчислите квартили в Excel с помощта на горните формули, масивът от данни може да бъде оставен неподреден.

Ориз. 4. Изчислете квартили в Excel

Нека отново подчертаем. Excel може да изчислява квартили за едномерни дискретна серия, съдържащ стойностите случайна величина. Изчисляването на квартилите за базирано на честота разпределение е дадено в раздела по-долу.

средно геометрично

За разлика от средното аритметично, средното геометрично измерва колко се е променила дадена променлива във времето. Средната геометрична е коренът нстепен от продукта нстойности (в Excel се използва функцията = CUGEOM):

Ж= (X 1 * X 2 * ... * X n) 1/n

Подобен параметър - средното геометрично на нормата на възвръщаемост - се определя по формулата:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

където R i- норма на възвръщаемост аз-ти период от време.

Да предположим например, че първоначалната инвестиция е $100 000. До края на първата година тя спада до $50 000, а до края на втората година се възстановява до първоначалните $100 000. Процентът на възвръщаемост на тази инвестиция за два годишен период е равен на 0, тъй като първоначалната и крайната сума на средствата са равни една на друга. Въпреки това средноаритметичната стойност на годишните норми на възвръщаемост е = (-0,5 + 1) / 2 = 0,25 или 25%, тъй като нормата на възвръщаемост през първата година R 1 = (50 000 - 100 000) / 100 000 = -0,5, и във втория R 2 = (100 000 - 50 000) / 50 000 = 1. В същото време средната геометрична стойност на нормата на възвръщаемост за две години е: G = [(1–0,5) * (1 + 1 )] 1 /2 – 1 = ½ – 1 = 1 – 1 = 0. По този начин средногеометричната стойност отразява по-точно промяната (по-точно липсата на промяна) в обема на инвестициите през двугодишния период, отколкото средноаритметичната.

Интересни факти.Първо, средното геометрично винаги ще бъде по-малко от средното аритметично на същите числа. С изключение на случая, когато всички взети числа са равни едно на друго. Второ, като се имат предвид свойствата правоъгълен триъгълник, можете да разберете защо средната се нарича геометрична. Височината на правоъгълен триъгълник, спусната до хипотенузата, е средната пропорционална стойност между проекциите на катетите върху хипотенузата, а всеки катет е средната пропорционална стойност между хипотенузата и неговата проекция върху хипотенузата (фиг. 5). Това дава геометричен начин за конструиране на средното геометрично на два (дължини) сегмента: трябва да изградите окръжност върху сумата от тези два сегмента като диаметър, след това височината, възстановена от точката на тяхната връзка до пресечната точка с кръг, ще даде необходимата стойност:

Ориз. 5. Геометричният характер на средното геометрично (фигура от Wikipedia)

Второто важно свойство на числовите данни е тяхното вариацияхарактеризиращ степента на дисперсия на данните. Две различни проби могат да се различават както по средни стойности, така и по вариации. Въпреки това, както е показано на фиг. 6 и 7, две проби могат да имат една и съща вариация, но различни средни стойности, или една и съща средна и напълно различна вариация. Данните, съответстващи на многоъгълник B на фиг. 7 се променят много по-малко от данните, от които е построен полигон А.

Ориз. 6. Две симетрични камбановидни разпределения с еднакво разпространение и различни средни стойности

Ориз. 7. Две симетрични камбановидни разпределения с еднакви средни стойности и различно разсейване

Има пет оценки за вариация на данните:

  • педя,
  • интерквартилен диапазон,
  • дисперсия,
  • стандартно отклонение,
  • коефициентът на вариация.

обхват

Диапазонът е разликата между най-големия и най-малкия елемент на извадката:

Плъзнете = XМакс-XМин

Диапазонът на извадка, съдържаща средната годишна доходност на 15 взаимни фонда с много висок риск, може да бъде изчислен с помощта на подреден масив (вижте Фигура 4): диапазон = 18,5 - (-6,1) = 24,6. Това означава, че разликата между най-високата и най-ниската средна годишна доходност за фондовете с много висок риск е 24,6%.

Диапазонът измерва общото разпространение на данните. Въпреки че обхватът на извадката е много проста оценка на общото разпространение на данните, неговата слабост е, че не взема предвид точно как данните са разпределени между минималния и максималния елемент. Този ефект се вижда добре на фиг. 8, която илюстрира проби със същия диапазон. Скалата B показва, че ако извадката съдържа поне една екстремна стойност, диапазонът на извадката е много неточна оценка на разсейването на данните.

Ориз. 8. Сравнение на три проби с еднакъв диапазон; триъгълникът символизира опората на баланса, а местоположението му съответства на средната стойност на пробата

Интерквартилен диапазон

Интерквартилът или средният диапазон е разликата между третия и първия квартил на извадката:

Интерквартилен диапазон \u003d Q 3 - Q 1

Тази стойност позволява да се оцени разпространението на 50% от елементите и да не се отчита влиянието на екстремни елементи. Интерквартилният диапазон за извадка, съдържаща данни за средната годишна възвръщаемост на 15 много високорискови взаимни фонда, може да бъде изчислен с помощта на данните на фиг. 4 (например за функцията QUARTILE.EXC): Интерквартилен диапазон = 9,8 - (-0,7) = 10,5. Интервалът между 9,8 и -0,7 често се нарича средна половина.

Трябва да се отбележи, че стойностите на Q 1 и Q 3, а оттам и междуквартилният обхват, не зависят от наличието на извънредни стойности, тъй като тяхното изчисление не взема предвид стойност, която би била по-малка от Q 1 или по-голяма от Q 3 . Обща сума количествени характеристики, като медианата, първия и третия квартил и интерквартилния диапазон, които не се влияят от извънредни стойности, се наричат ​​стабилни мерки.

Докато обхватът и интерквартилният обхват предоставят съответно оценка на общото и средното разсейване на извадката, нито една от тези оценки не отчита точно как са разпределени данните. Дисперсия и стандартно отклонениесвободен от този недостатък. Тези индикатори ви позволяват да оцените степента на колебание на данните около средната стойност. Дисперсия на извадкатае приближение на средната аритметична стойност, изчислена от квадратните разлики между всеки елемент на извадката и средната извадка. За извадка от X 1 , X 2 , ... X n дисперсията на извадката (означена със символа S 2 се дава със следната формула:

AT общ случайДисперсията на извадката е сумата от квадратните разлики между елементите на извадката и средната извадка, разделена на стойност, равна на размера на извадката минус едно:

където - средноаритметично, н- размер на извадката, X i - аз-ти примерен елемент х. В Excel преди версия 2007 за изчисление дисперсия на извадкатабеше използвана функцията =VAR(), от версия 2010 се използва функцията =VAR.B().

Най-практичната и широко приета оценка на разсейването на данните е стандартно отклонение. Този показател се обозначава със символа S и е равен на корен квадратенот дисперсията на извадката:

В Excel преди версия 2007 функцията =STDEV() се използва за изчисляване на стандартното отклонение, от версия 2010 се използва функцията =STDEV.V(). За да се изчислят тези функции, масивът от данни може да бъде неподреден.

Нито дисперсията на извадката, нито стандартното отклонение на извадката могат да бъдат отрицателни. Единствената ситуация, при която показателите S 2 и S могат да бъдат нула, е ако всички елементи на извадката са равни. В това напълно невероятен случайдиапазонът и интерквартилният диапазон също са нула.

Числовите данни по своята същност са непостоянни. Всяка променлива може да приеме набор различни стойности. Например различните взаимни фондове имат различни нива на възвръщаемост и загуба. Поради променливостта на числените данни е много важно да се изследват не само оценките на средната стойност, които са обобщаващи по природа, но и оценките на дисперсията, които характеризират разсейването на данните.

Дисперсията и стандартното отклонение ни позволяват да оценим разпространението на данните около средната стойност, с други думи, да определим колко елемента от извадката са по-малки от средната и колко са по-големи. Дисперсията има някои ценни математически свойства. Стойността му обаче е квадрат на единица мярка - квадратен процент, квадратен долар, квадратен инч и т.н. Следователно естествена оценка на дисперсията е стандартното отклонение, което се изразява в обичайните мерни единици - процент от дохода, долари или инчове.

Стандартното отклонение ви позволява да оцените степента на колебание на елементите на извадката около средната стойност. В почти всички ситуации по-голямата част от наблюдаваните стойности са в рамките на плюс или минус едно стандартно отклонение от средната стойност. Следователно, знаейки средното аритметично на елементите на извадката и стандартното отклонение на извадката, е възможно да се определи интервалът, към който принадлежи по-голямата част от данните.

Стандартното отклонение на възвръщаемостта на 15 взаимни фонда с много висок риск е 6,6 (Фигура 9). Това означава, че доходността на по-голямата част от фондовете се различава от средната стойност с не повече от 6,6% (т.е. тя варира в диапазона от - С= 6,2 – 6,6 = –0,4 до +S= 12,8). Всъщност този интервал съдържа петгодишна средна годишна възвръщаемост от 53,3% (8 от 15) средства.

Ориз. 9. Стандартно отклонение

Обърнете внимание, че в процеса на сумиране на квадратните разлики елементите, които са по-далеч от средната стойност, получават по-голяма тежест от елементите, които са по-близо. Това свойство е основната причина, поради която средната стойност най-често се използва за оценка на средната стойност на разпределение. аритметична стойност.

Коефициентът на вариация

За разлика от предишните оценки на разсейването, коефициентът на вариация е относителна оценка. Винаги се измерва като процент, а не в оригиналните единици данни. Коефициентът на вариация, означен със символите CV, измерва разсейването на данните около средната стойност. Коефициентът на вариация е равен на стандартното отклонение, разделено на средната аритметична стойност и умножено по 100%:

където С- стандартно отклонение на извадката, - извадкова средна стойност.

Коефициентът на вариация ви позволява да сравните две проби, чиито елементи са изразени в различни мерни единици. Например, мениджърът на услуга за доставка на поща възнамерява да обнови автопарка от камиони. Когато зареждате пакети, има два вида ограничения, които трябва да имате предвид: теглото (в паундове) и обемът (в кубични футове) на всеки пакет. Да приемем, че в проба от 200 торби средното тегло е 26,0 паунда, стандартното отклонение на теглото е 3,9 паунда, средният обем на опаковката е 8,8 кубически фута, а стандартното отклонение на обема е 2,2 кубични фута. Как да сравним разпределението на теглото и обема на пакетите?

Тъй като мерните единици за тегло и обем се различават една от друга, мениджърът трябва да сравни относителното разпространение на тези стойности. Коефициентът на вариация на теглото е CV W = 3,9 / 26,0 * 100% = 15%, а коефициентът на вариация на обема CV V = 2,2 / 8,8 * 100% = 25%. По този начин относителното разсейване на обемите на пакетите е много по-голямо от относителното разсейване на техните тегла.

Форма за разпространение

Третото важно свойство на извадката е формата на нейното разпределение. Това разпределение може да бъде симетрично или асиметрично. За да се опише формата на разпределение, е необходимо да се изчисли неговата средна стойност и медиана. Ако тези две мерки са еднакви, се казва, че променливата е симетрично разпределена. Ако средната стойност на дадена променлива е по-голяма от медианата, нейното разпределение има положителна асиметрия (фиг. 10). Ако медианата е по-голяма от средната, разпределението на променливата е отрицателно изкривено. Положителна асиметрия възниква, когато средната стойност се увеличи до необичайно високи стойности. Отрицателна асиметрия възниква, когато средната стойност намалее до необичайно малки стойности. Една променлива е симетрично разпределена, ако не приема никакви екстремни стойности в нито една посока, така че големи и малки стойности на променливата взаимно се компенсират.

Ориз. 10. Три вида разпределения

Данните, изобразени по скала А, имат отрицателна асиметрия. Тази фигура показва дълга опашка и ляво изкривяване, причинено от необичайно малки стойности. Тези изключително малки стойности изместват средната стойност наляво и тя става по-малка от медианата. Данните, показани в скала B, са разпределени симетрично. Лявата и дясната половина на разпределението са техните огледални изображения. Големите и малките стойности се балансират взаимно, а средната и медианата са равни. Данните, показани на скала B, имат положителна асиметрия. Тази фигура показва дълга опашка и изкривяване надясно, причинено от наличието на необичайно високи стойности. Тези твърде големи стойности изместват средната стойност надясно и тя става по-голяма от медианата.

В Excel може да се получи описателна статистика с помощта на добавката Пакет за анализ. Преминете през менюто ДанниАнализ на данни, в прозореца, който се отваря, изберете реда Описателна статистикаи щракнете Добре. В прозореца Описателна статистикане забравяйте да посочите интервал на въвеждане(фиг. 11). Ако искате да видите описателна статистика на същия лист като оригиналните данни, изберете бутона за избор изходен интервали посочете клетката, където искате да поставите горния ляв ъгъл на показаната статистика (в нашия пример $C$1). Ако искате да изпратите данни до нов листили в нова книгапросто изберете съответния бутон за избор. Поставете отметка в квадратчето до Крайна статистика. По желание можете също да изберете Ниво на трудност,k-тото най-малко иk-то по големина.

Ако е на депозит Даннив района на Анализне виждате иконата Анализ на данни, първо трябва да инсталирате добавката Пакет за анализ(виж, например,).

Ориз. 11. Описателна статистика на петгодишната средна годишна доходност на фондове с много високи нива на риск, изчислена с помощта на добавката Анализ на данни Excel програми

Excel изчислява редица статистически данни, обсъдени по-горе: средна стойност, медиана, режим, стандартно отклонение, дисперсия, диапазон ( интервал), минимум, максимум и размер на извадката ( проверка). Освен това Excel изчислява някои нови статистики за нас: стандартна грешка, ексцес и изкривяване. стандартна грешкае равно на стандартното отклонение, разделено на корен квадратен от размера на извадката. асиметрияхарактеризира отклонението от симетрията на разпределението и е функция, която зависи от куба на разликите между елементите на извадката и средната стойност. Ексцесът е мярка за относителната концентрация на данни около средната стойност спрямо опашките на разпределението и зависи от разликите между извадката и средната стойност, повишена на четвърта степен.

Изчисляване на описателна статистика за генералната съвкупност

Средната стойност, разсейването и формата на разпределението, обсъдени по-горе, са характеристики, базирани на извадка. Въпреки това, ако наборът от данни съдържа числени измервания на цялата популация, тогава неговите параметри могат да бъдат изчислени. Тези параметри включват средна стойност, дисперсия и стандартно отклонение на популацията.

Очаквана стойносте равна на сумата от всички стойности на генералната съвкупност, разделена на обема на генералната съвкупност:

където µ - очаквана стойност, хаз- аз-та променлива наблюдение х, н- обемът на генералната съвкупност. В Excel за изчисляване на математическото очакване се използва същата функция като за средното аритметично: =AVERAGE().

Дисперсия на населениеторавна на сумата от квадратите на разликите между елементите на генералната съвкупност и мат. очакване, разделено на размера на населението:

където σ2е дисперсията на генералната съвкупност. Excel преди версия 2007 използва функцията =VAR() за изчисляване на дисперсията на популацията, започвайки с версия 2010 =VAR.G().

стандартно отклонение на населениетое равно на корен квадратен от дисперсията на популацията:

Excel преди версия 2007 използва =STDEV() за изчисляване на стандартното отклонение на популацията, като се започне от версия 2010 =STDEV.Y(). Обърнете внимание, че формулите за вариация на популацията и стандартно отклонение са различни от формулите за вариация на извадката и стандартно отклонение. При изчисляване на извадкова статистика S2и Сзнаменателят на дробта е n - 1, и при изчисляване на параметрите σ2и σ - обемът на генералната съвкупност н.

основно правило

В повечето ситуации голяма част от наблюденията са концентрирани около медианата, образувайки клъстер. В набори от данни с положителна асиметрия, този клъстер е разположен вляво (т.е. под) от математическото очакване, а в набори с отрицателна асиметрия този клъстер е разположен вдясно (т.е. отгоре) на математическото очакване. Симетричните данни имат една и съща средна стойност и медиана, а наблюденията се групират около средната стойност, образувайки разпределение във формата на камбана. Ако разпределението няма ясно изразено изкривяване и данните са концентрирани около определен център на тежестта, може да се използва правило за оценка на променливостта, което гласи: ако данните имат камбанообразно разпределение, тогава приблизително 68% от наблюденията са по-малко от едно стандартно отклонение от математическото очакване, Приблизително 95% от наблюденията са в рамките на две стандартни отклонения от очакваната стойност, а 99,7% от наблюденията са в рамките на три стандартни отклонения от очакваната стойност.

По този начин стандартното отклонение, което е оценка на средната флуктуация около математическото очакване, помага да се разбере как са разпределени наблюденията и да се идентифицират отклоненията. От основното правило следва, че за камбанообразните разпределения само една от двадесет стойности се различава от математическото очакване с повече от две стандартни отклонения. Следователно стойности извън интервала µ ± 2σ, могат да се считат за извънредни стойности. Освен това само три от 1000 наблюдения се различават от математическото очакване с повече от три стандартни отклонения. По този начин стойностите са извън интервала µ ± 3σпочти винаги са отклонения. За разпределения, които са силно изкривени или не са с форма на камбана, може да се приложи основното правило на Biename-Chebyshev.

Преди повече от сто години математиците Биенамай и Чебишев откриха независимо един от друг полезно свойствостандартно отклонение. Те откриха, че за всеки набор от данни, независимо от формата на разпределението, процентът наблюдения, които се намират на разстояние, което не надвишава кстандартни отклонения от математическото очакване, не по-малко (1 – 1/ 2)*100%.

Например ако к= 2, правилото на Biename-Chebyshev гласи, че най-малко (1 - (1/2) 2) x 100% = 75% от наблюденията трябва да се намират в интервала µ ± 2σ. Това правило е вярно за всеки кнадвишава едно. Правилото на Biename-Chebyshev е от много общ характер и е валидно за разпределения от всякакъв вид. Показва минималния брой наблюдения, разстоянието от които до математическото очакване не надвишава дадена стойност. Въпреки това, ако разпределението е с форма на камбана, основното правило оценява по-точно концентрацията на данни около средната стойност.

Изчисляване на описателна статистика за честотно базирано разпределение

Ако оригиналните данни не са налични, разпределението на честотата става единственият източник на информация. В такива ситуации можете да изчислите приблизителните стойности на количествените показатели на разпределението, като средно аритметично, стандартно отклонение, квартили.

Ако примерните данни са представени като честотно разпределение, може да се изчисли приблизителна стойност на средната аритметична стойност, като се приеме, че всички стойности във всеки клас са концентрирани в средната точка на класа:

където - извадкова средна стойност, н- брой наблюдения или размер на извадката, с- броя на класовете в честотното разпределение, mj- средна точка й-ти клас, fй- честота, съответстваща на й-ти клас.

За да се изчисли стандартното отклонение от честотното разпределение, също се приема, че всички стойности във всеки клас са концентрирани в средната точка на класа.

За да разберем как се определят квартилите на реда въз основа на честотите, нека разгледаме изчисляването на долния квартил въз основа на данните за 2013 г. за разпределението на руското население по среден паричен доход на глава от населението (фиг. 12).

Ориз. 12. Делът на населението на Русия със средно на глава от населението парични приходисредно на месец, рубли

За да изчислите първия квартил от серията интервални вариации, можете да използвате формулата:

където Q1 е стойността на първия квартил, xQ1 е долната граница на интервала, съдържащ първия квартил (интервалът се определя от натрупаната честота, като първата надвишава 25%); i е стойността на интервала; Σf е сумата от честотите на цялата извадка; вероятно винаги е равно на 100%; SQ1–1 е кумулативната честота на интервала, предхождащ интервала, съдържащ долния квартил; fQ1 е честотата на интервала, съдържащ долния квартил. Формулата за третия квартил се различава по това, че на всички места, вместо Q1, трябва да използвате Q3 и да замените ¾ вместо ¼.

В нашия пример (фиг. 12) долният квартил е в диапазона 7000,1 - 10 000, чиято кумулативна честота е 26,4%. Долната граница на този интервал е 7000 рубли, стойността на интервала е 3000 рубли, натрупаната честота на интервала, предхождащ интервала, съдържащ долния квартил, е 13,4%, честотата на интервала, съдържащ долния квартил, е 13,0%. Така: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \u003d 9677 рубли.

Клопки, свързани с описателната статистика

В тази бележка разгледахме как да опишем набор от данни, използвайки различни статистики, които оценяват неговата средна стойност, разсейване и разпределение. Следващата стъпка е да анализирате и интерпретирате данните. Досега изучавахме обективните свойства на данните, а сега се обръщаме към тяхната субективна интерпретация. Две грешки чакат изследователя: неправилно избран предмет на анализ и неправилно тълкуване на резултатите.

Анализът на представянето на 15 взаимни фонда с много висок риск е доста безпристрастен. Той доведе до напълно обективни заключения: всички взаимни фондове имат различна доходност, спредът на доходността на фондовете варира от -6,1 до 18,5, а средната доходност е 6,08. Осигурена е обективност на анализа на данните правилният изборобщи количествени показатели на разпространение. Бяха разгледани няколко метода за оценка на средната стойност и разсейването на данните и бяха посочени техните предимства и недостатъци. Как да изберем правилната статистика, която предоставя обективен и безпристрастен анализ? Ако разпределението на данните е леко изкривено, трябва ли медианата да бъде избрана пред средната аритметична? Кой индикатор характеризира по-точно разпространението на данните: стандартно отклонение или диапазон? Трябва ли да се посочи положителната асиметрия на разпределението?

От друга страна, интерпретацията на данни е субективен процес. Различни хорастигат до различни заключения, тълкувайки едни и същи резултати. Всеки си има своя гледна точка. Някой смята общата средна годишна доходност на 15 фонда с много високо ниво на риск за добра и е доста доволен от получения доход. Други може да си помислят, че тези фондове имат твърде ниска възвръщаемост. Така субективизмът трябва да се компенсира от честност, неутралност и яснота на заключенията.

Етични въпроси

Анализът на данни е неразривно свързан с етичните въпроси. Човек трябва да бъде критичен към информацията, разпространявана от вестници, радио, телевизия и интернет. С времето ще се научите да бъдете скептични не само към резултатите, но и към целите, предмета и обективността на изследването. Известният британски политик Бенджамин Дизраели го каза най-добре: „Има три вида лъжи: лъжи, проклети лъжи и статистика.

Както е отбелязано в бележката, етични проблеми възникват при избора на резултатите, които трябва да бъдат представени в доклада. Трябва да се публикуват както положителните, така и отрицателните резултати. Освен това, когато се прави доклад или писмен доклад, резултатите трябва да бъдат представени честно, неутрално и обективно. Правете разлика между лоши и нечестни презентации. За целта е необходимо да се определи какви са били намеренията на говорещия. Понякога говорещият пропуска важна информация поради незнание, а понякога и умишлено (например, ако използва средната аритметична стойност, за да оцени средната стойност на ясно изкривени данни, за да получи желания резултат). Също така е нечестно да се премълчават резултати, които не отговарят на гледната точка на изследователя.

Използвани са материали от книгата Левин и др.Статистика за мениджъри. - М.: Уилямс, 2004. - стр. 178–209

Функцията QUARTILE е запазена за привеждане в съответствие с по-ранните версии на Excel

Най-вече в ек. На практика трябва да се използва средноаритметичната стойност, която може да се изчисли като проста и среднопретеглена аритметична стойност.

Средно аритметично (CA)най-често срещаният тип среда. Използва се в случаите, когато обемът на променлив атрибут за цялата популация е сумата от стойностите на атрибутите на отделните му единици. Социалните явления се характеризират с адитивност (сумиране) на обемите на вариращия признак, което определя обхвата на SA и обяснява неговото разпространение като обобщаващ показател, например: общият фонд работна заплата е сумата от работната заплата на всички служители.

За да изчислите SA, трябва да разделите сумата от всички стойности на характеристиките на техния брой. SA се използва в 2 форми.

Помислете първо за простата средна аритметична стойност.

1-CA проста (първоначална, дефинираща форма) е равна на простата сума на отделните стойности на осреднената характеристика, разделена на общия брой на тези стойности (използва се, когато има негрупирани индексни стойности на характеристиката):

Направените изчисления могат да бъдат обобщени в следната формула:

(1)

където - средната стойност на променливия атрибут, т.е. средно аритметично;

означава сумиране, т.е. добавяне на отделни характеристики;

х- индивидуални стойности на променлив атрибут, които се наричат ​​варианти;

н - брой единици съвкупност

Пример1,изисква се да се намери средната производителност на един работник (шлосер), ако се знае колко части е произвел всеки от 15-те работници, т.е. предвид редица инд. стойности на признаци, бр.: 21; двадесет; двадесет; 19; 21; 19; осемнадесет; 22; 19; двадесет; 21; двадесет; осемнадесет; 19; двадесет.

SA проста се изчислява по формулата (1), бр.:

Пример2. Нека изчислим SA въз основа на условни данни за 20 магазина, които са част от търговска компания (Таблица 1). маса 1

Разпределение на магазините на търговска фирма "Весна" по търговска площ, кв. М

номер на магазина

номер на магазина

За да изчислите средната площ на магазина ( ) е необходимо да се сумират площите на всички магазини и да се раздели резултатът на броя на магазините:

Така средната магазинна площ за тази група търговски предприятия е 71 кв.м.

Следователно, за да се определи просто SA, е необходимо да се раздели сумата от всички стойности на даден атрибут на броя единици, които имат този атрибут.

2

където f 1 , f 2 , … ,f н тегло (честота на повторение на едни и същи характеристики);

е сумата от произведенията на големината на характеристиките и техните честоти;

е общият брой единици на съвкупността.

- SA претеглено - Ссредата на опциите, които се повтарят различен брой пъти или се казва, че имат различна тежест. Теглата са броят на единиците в различни групи от населението (групата комбинира едни и същи опции). SA претеглено средно от групираните стойности х 1 , х 2 , .., хн изчислено: (2)

Където х- настроики;

f- честота (тегло).

SA претеглено е частното от разделянето на сумата от произведенията на вариантите и съответните им честоти на сумата от всички честоти. Честоти ( f), които се появяват във формулата на SA, обикновено се извикват везни, в резултат на което SA, изчислена с отчитане на теглата, се нарича претеглена SA.

Ще илюстрираме техниката за изчисляване на претеглена SA, като използваме разгледания по-горе пример 1. За да направим това, групираме първоначалните данни и ги поставяме в таблица.

Средната стойност на групираните данни се определя по следния начин: първо вариантите се умножават по честотите, след това продуктите се добавят и получената сума се разделя на сумата от честотите.

Съгласно формула (2), претеглената SA е, бр.:

Разпределението на работниците за разработване на части

П

данните, дадени в предходния пример 2, могат да бъдат комбинирани в хомогенни групи, които са представени в табл. Таблица

Разпределение на магазини Весна по търговска площ, кв. м

Така резултатът е същият. Това обаче вече ще е средноаритметично претеглената стойност.

В предишния пример изчислихме средната аритметична стойност, при условие че са известни абсолютните честоти (брой магазини). В някои случаи обаче няма абсолютни честоти, но са известни относителни честоти или, както обикновено се наричат, честоти, които показват пропорцията илисъотношението на честотите в цялата популация.

При изчисляване на SA претеглена употреба честотиви позволява да опростите изчисленията, когато честотата е изразена в големи, многоцифрени числа. Изчислението се извършва по същия начин, но тъй като средната стойност се увеличава 100 пъти, резултатът трябва да се раздели на 100.

Тогава формулата за среднопретеглената аритметична стойност ще изглежда така:

където д- честота, т.е. делът на всяка честота в общата сума на всички честоти.

(3)

В нашия пример първо се дефинира 2 специфично тегломагазини по групи в общия брой магазини на фирма "Весна". Така че за първата група специфичното тегло съответства на 10%
. Получаваме следните данни Таблица3

При работа с числови изразипонякога има нужда да се изчисли средната им стойност. наречено средно аритметично. В Excel, редактор на електронни таблици от Microsoft, е възможно да не се изчислява ръчно, а да се използват специални инструменти. В тази статия ще бъдат представени методи, които ви позволяват да намерите и покажете средното аритметично.

Метод 1: стандартен

Първо, нека анализираме метода за изчисляване на средната аритметична стойност в Excel, което включва използването на стандартен инструмент за това. Методът е най-простият и удобен за използване, но има и някои недостатъци. Но за тях по-късно, но сега нека да преминем към задачата.

  1. Изберете клетките в колоната или реда, които съдържат числовите стойности, които трябва да бъдат изчислени.
  2. Отидете в раздела "Начало".
  3. В лентата с инструменти в категорията "Редактиране" щракнете върху бутона "Автосумиране", но трябва да кликнете върху стрелката до него, така че да се появи падащ списък.
  4. В него трябва да кликнете върху елемента "Средно".

Веднага след като направите това, резултатът от изчисляването на средноаритметичната стойност на избраните стойности ще се появи в клетката до него. Местоположението му ще зависи от блока с данни, ако сте избрали ред, тогава резултатът ще бъде вдясно от селекцията, ако колоната е отдолу.

Но както споменахме по-рано, този метод има своите недостатъци. Така че няма да можете да изчислите стойността от диапазон от клетки или клетки, намиращи се в тях различни места. Например, ако вашата таблица има две колони с числови стойности до тях, тогава като ги изберете и изпълните горните стъпки, ще получите резултата за всяка колона поотделно.

Метод 2: Използване на съветника за функции

Има много начини за намиране на средната аритметична стойност в Excel и естествено е, че с тяхна помощ е възможно да се заобиколят ограниченията, които предполага предишният метод. Сега ще говорим за извършване на изчисления с помощта на съветника за функции. И така, ето какво трябва да направите.

  1. С левия бутон на мишката изберете клетката, в която искате да видите резултата от изчислението.
  2. Отворете прозореца на съветника за функции, като щракнете върху бутона "Вмъкване на функция", разположен вляво от лентата с формули, или като използвате клавишните комбинации Shift+F3.
  3. В прозореца, който се показва, намерете реда „СРЕДНО“ в списъка, изберете го и щракнете върху бутона „OK“.
  4. Ще се появи нов прозорец за въвеждане на аргументи на функцията. В него ще видите две полета: "Число1" и "Число2".
  5. В първото поле въведете адресите на клетките, в които се намират числените стойности за изчислението. Това може да стане както ръчно, така и с специален инструмент. Във втория случай щракнете върху бутона, който се намира от дясната страна на полето за въвеждане. Прозорецът на съветника ще се свие и ще трябва да изберете клетките за изчисление с мишката.
  6. Ако друг диапазон от клетки с данни се намира на друго място в листа, тогава го посочете в полето „Номер2“.
  7. Въвеждайте данните, докато не въведете всички необходими.
  8. Щракнете върху бутона OK.

След приключване на въвеждането прозорецът на съветника ще се затвори и резултатът от изчислението ще се появи в клетката, която сте избрали в самото начало. Сега знаете втория начин как да изчислите средната аритметична стойност в Excel. Но не и последното, така че продължаваме напред.

Метод 3: Чрез лентата с формули

Този метод, как да се изчисли средната аритметична стойност в Excel, не се различава много от предишния, но в някои случаи може да изглежда по-удобен, така че си струва да го сортирате. предимно, този методоферти само Алтернативен вариантизвикване на съветника за функции.


Веднага след като всички действия от списъка бъдат завършени, пред вас ще се появи прозорецът на съветника за функции, където трябва да въведете аргументите. Вече знаете как да направите това от предишния метод, всички следващи действия не се различават.

Метод 4: ръчно въвеждане на функция

Ако желаете, можете да избегнете взаимодействието със съветника за функции, ако знаете формулата за средно аритметично в Excel. В някои ситуации ръчното въвеждане ще ускори процеса на изчисление многократно.

За да разберете всички нюанси, трябва да разгледате синтаксиса на формулата, изглежда така:

AVERAGE(адрес_на_клетка(номер), адрес_на_клетка(номер))

От синтаксиса следва, че в аргументите на функцията е необходимо да се предпише или адресът на диапазона от клетки, в който се намират числата, които трябва да се преброят, или самите числа, които да се изчислят директно. На практика използването на този метод е както следва:

AVERAGE(C4:D6;C8:D9)

Метод 5: изчисляване по условие

  • изберете клетката, в която ще се извърши изчислението;
  • щракнете върху бутона "вмъкване на функция";
  • в прозореца на съветника, който се показва, в списъка изберете реда "когато";
  • щракнете върху OK.

След това ще се появи прозорец за въвеждане на аргументи на функцията. Много е подобно на това, което беше демонстрирано по-рано, но сега се появи допълнително поле- "Състояние". Именно в него трябва да се впише условието. Така че, като въведете "> 1500", само тези стойности, които са по-големи от посочените, ще бъдат взети под внимание.

Под понятието средно аритметични числаима се предвид резултатът от проста последователност от изчисления на средната стойност за поредица от числа, определени предварително. Трябва да се отбележи, че тази стойност в момента се използва широко от специалисти в редица индустрии. Например, формули са известни при извършване на изчисления от икономисти или служители на статистическата индустрия, където се изисква да има стойност от този тип. В допълнение, този показател се използва активно в редица други индустрии, които са свързани с горното.

Една от характеристиките на изчисляването на тази стойност е простотата на процедурата. Извършете изчислениявсеки може. За това не е нужно специално образование. Често не е необходимо да се използват компютърни технологии.

Като отговор на въпроса как да намерите средната аритметична стойност, помислете за редица ситуации.

от най-много прост вариантизчисляването на дадено количество е неговото изчисляване за две числа. Процедурата за изчисление в този случай е много проста:

  1. Първоначално е необходимо да се извърши операцията по добавяне на избраните числа. Това често може да се направи, както се казва, ръчно, без да се използва електронно оборудване.
  2. След като се направи добавянето и се получи неговият резултат, е необходимо да се раздели. Тази операция включва разделяне на сумата от две добавени числа на две - броя на добавените числа. Именно това действие ще ви позволи да получите необходимата стойност.

Формула

Така формулата за изчисляване на необходимата стойност в случай на две ще изглежда така:

(A+B)/2

Тази формула използва следната нотация:

A и B са предварително избрани числа, за които трябва да намерите стойност.

Намиране на стойност за три

Изчисляването на тази стойност в ситуация, в която са избрани три числа, няма да се различава много от предишната опция:

  1. За да направите това, изберете числата, необходими за изчислението, и ги добавете, за да получите обща сума.
  2. След намирането на този сбор от три е необходимо отново да се извърши процедурата за деление. В този случай получената сума трябва да бъде разделена на три, което съответства на броя на избраните числа.

Формула

По този начин формулата, необходима при изчисляване на аритметичното три, ще изглежда така:

(A+B+C)/3

В тази формулае приета следната нотация:

A, B и C са числата, на които ще е необходимо да се намери средното аритметично.

Изчисляване на средно аритметично от четири

Както вече се видя по аналогия с предишните опции, изчисляването на тази стойност за количество, равно на четири, ще бъде в следния ред:

  1. Избират се четири цифри, за които да се изчисли средноаритметичната стойност. След това се извършва сумирането и намирането на крайния резултат от тази процедура.
  2. Сега, за да получите крайния резултат, трябва да вземете получения сбор от четири и да го разделите на четири. Получените данни ще бъдат необходимата стойност.

Формула

От описаната по-горе последователност от действия за намиране на средната аритметична стойност за четири можете да получите следната формула:

(A+B+C+E)/4

В тази формулапроменливите имат следваща стойност:

A, B, C и E са тези, за които трябва да намерите средната аритметична стойност.

Използвайки тази формула, винаги ще бъде възможно да се изчисли необходимата стойност за даден брой числа.

Изчисляване на средно аритметично от пет

Извършването на тази операция ще изисква определен алгоритъм от действия.

  1. На първо място, трябва да изберете пет числа, за които ще се изчисли средноаритметичната стойност. След този избор, тези числа, както и в предишните опции, просто трябва да добавите и да получите крайната сума.
  2. Получената сума ще трябва да бъде разделена на техния брой на пет, което ще ви позволи да получите необходимата стойност.

Формула

По този начин, подобно на разгледаните по-рано опции, получаваме следната формула за изчисляване на средната аритметична стойност:

(A+B+C+E+P)/5

В тази формула променливите имат следната нотация:

A, B, C, E и P са числата, за които искате да получите средната аритметична стойност.

Универсална формула за изчисление

Провеждане на преглед различни опцииформули за изчисляване на средната аритметична стойност, можете да обърнете внимание на факта, че те имат общ модел.

Следователно ще бъде по-практично да се приложи общата формула за намиране на средната аритметична стойност. В крайна сметка има ситуации, когато броят и размерът на изчисленията могат да бъдат много големи. Следователно би било по-разумно да се използва универсална формула и да не се показва всеки път индивидуална технологияза да изчислите тази стойност.

Основното при определянето на формулата е принципът на изчисляване на средната аритметична стойностотносно.

Този принцип, както се вижда от горните примери, изглежда така:

  1. Броят на числата, които са зададени за получаване на необходимата стойност, се преброява. Тази операция може да се извърши както ръчно с малък брой числа, така и с помощта на компютърна технология.
  2. Избраните числа се сумират. Тази операция в повечето ситуации се извършва с помощта на компютърна технология, тъй като числата могат да се състоят от две, три или повече цифри.
  3. Сумата, получена чрез събиране на избраните числа, трябва да бъде разделена на техния брой. Тази стойност се определя в началния етап на изчисляване на средното аритметично.

Така общата формула за изчисляване на средната аритметична стойност на поредица от избрани числа ще изглежда така:

(А+В+…+N)/N

Тази формула съдържаследните променливи:

A и B са числа, които са избрани предварително, за да се изчисли тяхната средна аритметична стойност.

N е броят на числата, взети за изчисляване на необходимата стойност.

Заменяйки всеки път избраните числа в тази формула, винаги можем да получим необходимата стойност на средната аритметична стойност.

Както се вижда, намиране на средното аритметичное лесна процедура. Въпреки това, трябва да сте внимателни към изчисленията и да проверите получения резултат. Този подход се обяснява с факта, че дори в най-простите ситуации съществува възможност за получаване на грешка, която след това може да повлияе на по-нататъшни изчисления. В тази връзка се препоръчва използването на компютърна технология, която е в състояние да прави изчисления с всякаква сложност.

Средно аритметично в ексел. Електронните таблици на Excel са най-подходящи за всички видове изчисления. След като сте изучавали Excel, ще можете да решавате задачи по химия, физика, математика, геометрия, биология, статистика, икономика и много други. Ние дори не се замисляме какъв мощен инструмент е на нашите компютри, което означава, че не го използваме в пълния му потенциал. Много родители смятат, че компютърът е просто скъпа играчка. Но напразно! Разбира се, за да може детето наистина да учи върху него, вие сами трябва да се научите как да работите върху него и след това да научите детето. Е, това е друга тема, но днес искам да говоря с вас за това как да намерите средното аритметично в Excel.

Как да намерите средното аритметично в Excel

Вече говорихме за бързо в Excel, а днес ще говорим за средно аритметично.

Изберете клетка C12и с помощта Помощници за функции запишете в него формулата за изчисляване на средноаритметичното. За да направите това, в лентата с инструменти Standard кликнете върху бутона - Вмъкване на функция −fx (на снимката по-горе червената стрелка е отгоре). Ще се отвори диалогов прозорец Функция Master .

  • Изберете в полето КатегорииСтатистически ;
  • В полето Изберете функция: СРЕДНО АРИТМЕТИЧНО ;
  • Щракнете върху бутона Добре .

Ще отвори следващия прозорец Аргументи и функции .

В полето Номер 1ще видите записа S2: S11- самата програма определи диапазона от клетки, за които е необходимо намерете средното аритметично.

Щракнете върху бутона Добреи в клетката C12ще се появи средната аритметична стойност на резултатите.

Оказва се, че изчисляването на средно аритметично в ексел не е никак трудно. И винаги се страхувах от всякакви формули. Ех, не по това време учехме.



 


Прочети:



Ползите и значението на хидроаминокиселината треонин за човешкото тяло Инструкции за употреба на треонин

Ползите и значението на хидроаминокиселината треонин за човешкото тяло Инструкции за употреба на треонин

Той диктува собствените си правила. Хората все повече прибягват до корекция на диетата и, разбира се, спорт, което е разбираемо. В края на краищата, в условията на големи ...

Плодове от копър: полезни свойства, противопоказания, особености на приложение Резене обикновен химически състав

Плодове от копър: полезни свойства, противопоказания, особености на приложение Резене обикновен химически състав

Семейство Сенникоцветни - Apiaceae. Народно наименование: аптечен копър. Използвани части: зрял плод, много рядко корен. Име на аптеката:...

Генерализирана атеросклероза: причини, симптоми и лечение

Генерализирана атеросклероза: причини, симптоми и лечение

Клас 9 Болести на кръвоносната система I70-I79 Болести на артериите, артериолите и капилярите I70 Атеросклероза I70.0 Атеросклероза на аортата I70.1...

Контрактури на различни групи стави, причини, симптоми и методи на лечение

Контрактури на различни групи стави, причини, симптоми и методи на лечение

Травматолозите и ортопедите се занимават с лечение на контрактура на Дюпюитрен. Лечението може да бъде както консервативно, така и хирургично. Избор на методи...

изображение на емисия RSS