реклама

У дома - Подове
Как да разберете средната стойност на няколко числа. Как да намерим средното аритметично и средното геометрично на числата

В повечето случаи данните са концентрирани около определена Централна точка. По този начин, за да се опише всеки набор от данни, е достатъчно да се посочи средната стойност. Нека разгледаме последователно три числови характеристики, които се използват за оценка на средната стойност на разпределението: средно аритметично, медиана и мода.

Средно аритметично

Средната аритметична стойност (често наричана просто средна) е най-често срещаната оценка на средната стойност на разпределение. Това е резултат от разделянето на сумата от всички наблюдавани числени стойности на техния брой. За проба, състояща се от числа X 1, X 2, …, Xн, извадкова средна (означена с ) равно на = (X 1 + X 2 + … + Xн) / н, или

къде е средната стойност на извадката, н- размер на извадката, хазi-ти елементпроби.

Изтеглете бележката в или формат, примери във формат

Помислете за изчисляване на средната аритметична стойност на петгодишната средна годишна възвръщаемост на 15 взаимни фонда с много високо нивориск (фиг. 1).

Ориз. 1. Средна годишна доходност на 15 взаимни фонда с много висок риск

Средната стойност на извадката се изчислява, както следва:

Това добър доход, особено в сравнение с 3-4% възвръщаемост, която вложителите в банки или кредитни съюзи са получили за същия период от време. Ако сортираме доходността, лесно се вижда, че осем фонда имат доходност над средната, а седем - под средната. Средната аритметична стойност действа като точка на равновесие, така че фондове с ниска възвръщаемост балансират средства с висока възвръщаемост. Всички елементи на извадката участват в изчисляването на средната стойност. Нито една от другите оценки на средната стойност на разпределението няма това свойство.

Кога трябва да изчислите средноаритметичното?Тъй като средноаритметичната стойност зависи от всички елементи в извадката, наличието на екстремни стойности значително влияе върху резултата. В такива ситуации средноаритметичната стойност може да изкриви значението на числените данни. Следователно, когато се описва набор от данни, съдържащ екстремни стойности, е необходимо да се посочи медианата или средноаритметичното и медианата. Например, ако премахнем възвръщаемостта на фонда RS Emerging Growth от извадката, средната извадкова възвръщаемост на 14-те фонда намалява с почти 1% до 5,19%.

Медиана

Медианата представлява средната стойност на подреден масив от числа. Ако масивът не съдържа повтарящи се числа, тогава половината от неговите елементи ще бъдат по-малки от и половината ще бъдат по-големи от медианата. Ако извадката съдържа екстремни стойности, по-добре е да се използва медианата, а не средноаритметичното, за да се оцени средната стойност. За да се изчисли медианата на извадка, тя първо трябва да бъде подредена.

Тази формула е двусмислена. Резултатът му зависи от това дали числото е четно или нечетно н:

  • Ако извадката съдържа нечетен брой елементи, медианата е (n+1)/2-ти елемент.
  • Ако извадката съдържа четен брой елементи, медианата се намира между двата средни елемента на извадката и е равна на средноаритметичната стойност, изчислена върху тези два елемента.

За да изчислите медианата на извадка, съдържаща възвръщаемостта на 15 взаимни фонда с много висок риск, първо трябва да сортирате необработените данни (Фигура 2). Тогава медианата ще бъде срещу номера на средния елемент на извадката; в нашия пример № 8. Excel има специална функция=MEDIAN(), който работи и с неподредени масиви.

Ориз. 2. Медиана 15 средства

Така медианата е 6,5. Това означава, че доходността на половината от фондовете с много висок риск не надвишава 6,5, а доходността на другата половина го надвишава. Имайте предвид, че медианата от 6,5 не е много по-голяма от средната стойност от 6,08.

Ако премахнем възвръщаемостта на фонда RS Emerging Growth от извадката, тогава медианата на останалите 14 фонда намалява до 6,2%, тоест не толкова значително, колкото средноаритметичната стойност (Фигура 3).

Ориз. 3. Медиана 14 средства

Мода

Терминът е въведен за първи път от Pearson през 1894 г. Fashion е числото, което се среща най-често в извадка (най-модерното). Модата описва добре например типичната реакция на шофьорите на сигнал на светофара да спрат да се движат. Класически примеризползване на модата - избор на размера на партидата обувки или цвета на тапета. Ако едно разпределение има няколко режима, тогава се казва, че е мултимодално или мултимодално (има два или повече „пика“). Мултимодална дистрибуция дава важна информацияза естеството на изследваната променлива. Например, в социологически проучвания, ако една променлива представлява предпочитание или отношение към нещо, тогава мултимодалността може да означава, че има няколко ясно различни мнения. Мултимодалността също така служи като индикатор, че извадката не е хомогенна и наблюденията могат да бъдат генерирани от две или повече „припокриващи се“ разпределения. За разлика от средноаритметичната стойност, отклоненията не влияят на режима. За непрекъснато разпределени случайни променливи, като средната годишна възвръщаемост на взаимните фондове, режимът понякога изобщо не съществува (или няма смисъл). Тъй като тези индикатори могат да приемат много различни стойности, повтарящите се стойности са изключително редки.

Квартили

Квартилите са показателите, които най-често се използват за оценка на разпределението на данни, когато се описват свойствата на големи числени извадки. Докато медианата разделя подредения масив наполовина (50% от елементите на масива са по-малки от медианата и 50% са по-големи), квартилите разделят подредения набор от данни на четири части. Стойностите на Q 1, медианата и Q 3 са съответно 25-ти, 50-ти и 75-ти персентил. Първият квартил Q 1 е число, което разделя извадката на две части: 25% от елементите са по-малки от и 75% са по-големи от първия квартил.

Третият квартил Q 3 е число, което също разделя извадката на две части: 75% от елементите са по-малки от и 25% са по-големи от третия квартил.

За да изчислите квартили във версии на Excel преди 2007 г., използвайте функцията =QUARTILE(array,part). Започвайки от Excel 2010, се използват две функции:

  • =QUARTILE.ON(масив,част)
  • =QUARTILE.EXC(масив,част)

Тези две функции дават малко различни значения(фиг. 4). Например, когато се изчисляват квартилите на извадка, съдържаща средната годишна доходност на 15 взаимни фонда с много висок риск, Q 1 = 1,8 или –0,7 съответно за QUARTILE.IN и QUARTILE.EX. Между другото, функцията QUARTILE, използвана по-рано, съответства на модерна функцияКВАРТИЛ.ВКЛ. За да изчислите квартили в Excel с помощта на горните формули, не е необходимо масивът от данни да бъде подреден.

Ориз. 4. Изчисляване на квартили в Excel

Нека подчертаем отново. Excel може да изчислява квартили за едномерен дискретна серия, съдържащ стойностите случайна величина. Изчисляването на квартилите за базирано на честота разпределение е дадено по-долу в раздела.

Средна геометрична

За разлика от средното аритметично, средното геометрично ви позволява да оцените степента на промяна в дадена променлива във времето. Средната геометрична е коренът нстепен от работата нколичества (в Excel се използва функцията =SRGEOM):

Ж= (X 1 * X 2 * … * X n) 1/n

Подобен параметър - средногеометричната стойност на нормата на печалба - се определя по формулата:

G = [(1 + R 1) * (1 + R 2) * … * (1 + R n)] 1/n – 1,

Където R i– норма на печалба за азти период от време.

Например, да предположим, че първоначалната инвестиция е 100 000 долара. До края на първата година тя спада до 50 000 долара, а до края на втората година се възстановява до първоначалното ниво от 100 000 долара -годишен период е равен на 0, тъй като първоначалната и крайната сума на средствата са равни една на друга. Въпреки това средноаритметичната стойност на годишните норми на печалба е = (–0,5 + 1) / 2 = 0,25 или 25%, тъй като нормата на печалба през първата година R 1 = (50 000 – 100 000) / 100 000 = –0,5, а през второто R 2 = (100 000 – 50 000) / 50 000 = 1. В същото време средната геометрична стойност на нормата на печалба за две години е равна на: G = [(1–0,5) * (1+1 ) ] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. По този начин средната геометрична отразява по-точно промяната (по-точно липсата на промени) в обема на инвестициите за период от две години, отколкото аритметичната означава.

Интересни факти.Първо, средното геометрично винаги ще бъде по-малко от средното аритметично на същите числа. С изключение на случая, когато всички взети числа са равни едно на друго. Второ, като разгледахме свойствата правоъгълен триъгълник, може да се разбере защо средната се нарича геометрична. Височината на правоъгълен триъгълник, спусната до хипотенузата, е средната пропорционална стойност между проекциите на катетите върху хипотенузата, а всеки катет е средната пропорционална стойност между хипотенузата и нейната проекция върху хипотенузата (фиг. 5). Това дава геометричен начин за конструиране на средното геометрично на два сегмента (дължини): трябва да конструирате окръжност върху сумата от тези два сегмента като диаметър, след това височината, възстановена от точката на тяхната връзка до пресечната точка с кръга ще даде желаната стойност:

Ориз. 5. Геометричен характер на средното геометрично (фигура от Wikipedia)

Второто важно свойство на числовите данни е тяхното вариация, характеризираща степента на дисперсия на данните. Две различни проби може да се различават както по средни стойности, така и по дисперсии. Въпреки това, както е показано на фиг. 6 и 7, две проби могат да имат еднакви вариации, но различни средни стойности, или еднакви средни стойности и напълно различни вариации. Данните, които съответстват на многоъгълник B на фиг. 7, се променят много по-малко от данните, върху които е конструиран полигон А.

Ориз. 6. Две симетрични камбановидни разпределения с еднакво разпространение и различни средни стойности

Ориз. 7. Две симетрични камбанообразни разпределения с еднакви средни стойности и различни спредове

Има пет оценки за вариация на данните:

  • обхват,
  • интерквартилен диапазон,
  • дисперсия,
  • стандартно отклонение,
  • коефициентът на вариация.

Обхват

Диапазонът е разликата между най-големия и най-малкия елемент на извадката:

Диапазон = XМакс – XМин

Диапазонът на извадка, съдържаща средната годишна доходност на 15 взаимни фонда с много висок риск, може да бъде изчислен с помощта на подредения масив (вижте Фигура 4): Диапазон = 18,5 – (–6,1) = 24,6. Това означава, че разликата между най-високата и най-ниската средна годишна доходност на много високорисковите фондове е 24,6%.

Обхватът измерва общото разпространение на данните. Въпреки че обхватът на извадката е много проста оценка на общото разпространение на данните, нейната слабост е, че не взема предвид точно как данните са разпределени между минималните и максималните елементи. Този ефект е ясно видим на фиг. 8, която илюстрира проби със същия диапазон. Скала Б показва, че ако извадката съдържа поне една екстремна стойност, диапазонът на извадката е много неточна оценка на разпространението на данните.

Ориз. 8. Сравнение на три проби с еднакъв диапазон; триъгълникът символизира опората на скалата, а местоположението му съответства на средната стойност на извадката

Интерквартилен диапазон

Интерквартилът или средният обхват е разликата между третия и първия квартил на извадката:

Интерквартилен диапазон = Q 3 – Q 1

Тази стойност ни позволява да оценим разсейването на 50% от елементите и да не отчитаме влиянието на екстремни елементи. Интерквартилният обхват на извадка, съдържаща средната годишна възвръщаемост на 15 взаимни фонда с много висок риск, може да бъде изчислен с помощта на данните на фиг. 4 (например за функцията QUARTILE.EXC): Интерквартилен диапазон = 9,8 – (–0,7) = 10,5. Интервалът, ограничен от числата 9,8 и -0,7, често се нарича средна половина.

Трябва да се отбележи, че стойностите на Q 1 и Q 3 и следователно интерквартилният диапазон не зависят от наличието на извънредни стойности, тъй като тяхното изчисление не взема предвид стойност, която би била по-малка от Q 1 или по-голяма отколкото Q 3 . Обща сума количествени характеристикистойности като медианата, първи и трети квартил и интерквартилен диапазон, които не се влияят от извънредни стойности, се наричат ​​стабилни мерки.

Въпреки че обхватът и интерквартилният обхват предоставят съответно оценки на общото и средното разпространение на дадена извадка, нито една от тези оценки не отчита точно как са разпределени данните. Дисперсия и стандартно отклонениеса лишени от този недостатък. Тези индикатори ви позволяват да оцените степента, в която данните се колебаят около средната стойност. Дисперсия на извадкатае приближение на средната аритметична стойност, изчислена от квадратите на разликите между всеки елемент на извадката и средната извадка. За извадка X 1, X 2, ... X n дисперсията на извадката (означена със символа S 2 се дава по следната формула:

IN общ случайдисперсията на извадката е сумата от квадратите на разликите между елементите на извадката и средната извадка, разделена на стойност, равна на размера на извадката минус едно:

Където - средноаритметично, н- размер на извадката, X i - азти елемент за избор х. В Excel до версия 2007 за изчисления дисперсия на извадкатаизползвана е функцията =DISP(); от версия 2010 се използва функцията =DISP.V().

Най-практичната и широко приета оценка за разпространението на данни е извадково стандартно отклонение. Този показател се обозначава със символа S и е равен на корен квадратенот вариация на извадката:

В Excel преди версия 2007 функцията =STDEV.() се използва за изчисляване на стандартното отклонение на извадката; от версия 2010 се използва функцията =STDEV.V(). За да се изчислят тези функции, масивът от данни може да не е подреден.

Нито дисперсията на извадката, нито стандартното отклонение на извадката могат да бъдат отрицателни. Единствената ситуация, при която показателите S 2 и S могат да бъдат нула, е ако всички елементи на извадката са равни помежду си. Това е абсолютно невероятен случайдиапазонът и интерквартилният диапазон също са нула.

Числените данни по своята същност са непостоянни. Всяка променлива може да приеме много различни значения. Например различните взаимни фондове имат различни нива на възвръщаемост и загуба. Поради променливостта на числовите данни е много важно да се изследват не само оценките на средната стойност, които са обобщени по природа, но и оценките на дисперсията, които характеризират разпространението на данните.

Дисперсията и стандартното отклонение ви позволяват да оцените разпространението на данните около средната стойност, с други думи, да определите колко елемента на извадката са по-малки от средната и колко са по-големи. Дисперсията има някои ценни математически свойства. Стойността му обаче е квадратът на мерната единица - квадратен процент, квадратен долар, квадратен инч и т.н. Следователно естествена мярка за дисперсия е стандартното отклонение, което се изразява в общи единици процент на дохода, долари или инчове.

Стандартното отклонение ви позволява да оцените степента на вариация на елементите на извадката около средната стойност. В почти всички ситуации по-голямата част от наблюдаваните стойности са в рамките на плюс или минус едно стандартно отклонение от средната стойност. Следователно, знаейки средното аритметично на елементите на извадката и стандартното отклонение на извадката, е възможно да се определи интервалът, към който принадлежи по-голямата част от данните.

Стандартното отклонение на възвръщаемостта за 15-те взаимни фонда с много висок риск е 6,6 (Фигура 9). Това означава, че доходността на по-голямата част от фондовете се различава от средната стойност с не повече от 6,6% (т.е. тя варира в диапазона от - С= 6,2 – 6,6 = –0,4 до +S= 12,8). Всъщност петгодишната средна годишна доходност от 53,3% (8 от 15) на фондовете е в този диапазон.

Ориз. 9. Примерно стандартно отклонение

Обърнете внимание, че при сумиране на разликите на квадрат, примерните елементи, които са по-далеч от средната стойност, получават по-голяма тежест от елементите, които са по-близо до средната стойност. Това свойство е основната причина, поради която средната стойност най-често се използва за оценка на средната стойност на разпределение. аритметична стойност.

Коефициентът на вариация

За разлика от предишните оценки на разсейването, коефициентът на вариация е относителна оценка. Винаги се измерва като процент, а не в единици от оригиналните данни. Коефициентът на вариация, означен със символите CV, измерва дисперсията на данните около средната стойност. Коефициентът на вариация е равен на стандартното отклонение, разделено на средната аритметична стойност и умножено по 100%:

Където С- стандартно отклонение на извадката, - извадково средно.

Коефициентът на вариация ви позволява да сравните две проби, чиито елементи са изразени в различни мерни единици. Например управител на служба за доставка на поща възнамерява да обнови автопарка си от камиони. Когато зареждате пакети, има два вида ограничения, които трябва да имате предвид: теглото (в паундове) и обемът (в кубични футове) на всеки пакет. Да предположим, че в проба, съдържаща 200 торби, средното тегло е 26,0 паунда, стандартното отклонение на теглото е 3,9 паунда, средният обем на торбата е 8,8 кубически фута, а стандартното отклонение на обема е 2,2 кубични фута. Как да сравним разликата в теглото и обема на пакетите?

Тъй като мерните единици за тегло и обем се различават една от друга, мениджърът трябва да сравни относителното разпространение на тези количества. Коефициентът на вариация на теглото е CV W = 3,9 / 26,0 * 100% = 15%, а коефициентът на вариация на обема е CV V = 2,2 / 8,8 * 100% = 25%. По този начин относителната промяна в обема на пакетите е много по-голяма от относителната промяна в теглото им.

Форма за разпространение

Третото важно свойство на извадката е формата на нейното разпределение. Това разпределение може да бъде симетрично или асиметрично. За да се опише формата на разпределение, е необходимо да се изчисли неговата средна стойност и медиана. Ако двете са еднакви, променливата се счита за симетрично разпределена. Ако средната стойност на дадена променлива е по-голяма от медианата, нейното разпределение има положителна асиметрия (фиг. 10). Ако медианата е по-голяма от средната, разпределението на променливата е отрицателно изкривено. Положителна асиметрия възниква, когато средната стойност се увеличи до необичайно високи стойности. Отрицателна асиметрия възниква, когато средната стойност намалее до необичайно малки стойности. Една променлива е симетрично разпределена, ако не приема екстремни стойности в нито една посока, така че големите и малките стойности на променливата взаимно се компенсират.

Ориз. 10. Три вида разпределения

Данните, показани на скала А, са отрицателно изкривени. Тази фигура показва дълга опашка и изкривяване наляво, причинено от наличието на необичайно малки стойности. Тези изключително малки стойности изместват средната стойност наляво, правейки я по-малка от медианата. Данните, показани в скала B, са разпределени симетрично. Лявата и дясната половина на разпределението са огледални изображения на себе си. Големите и малките стойности се балансират взаимно, а средната и медианата са равни. Данните, показани на скала B, са положително изкривени. Тази фигура показва дълга опашка и изкривяване надясно, причинено от наличието на необичайно високи стойности. Тези твърде големи стойности изместват средната стойност надясно, правейки я по-голяма от медианата.

В Excel описателната статистика може да бъде получена с помощта на добавка Пакет за анализ. Преминете през менюто ДанниАнализ на данни, в прозореца, който се отваря, изберете реда Описателна статистикаи щракнете Добре. В прозореца Описателна статистикане забравяйте да посочите Интервал на въвеждане(фиг. 11). Ако искате да видите описателна статистика на същия лист като оригиналните данни, изберете бутона за избор Изходен интервали посочете клетката, където трябва да бъде поставен горният ляв ъгъл на показаната статистика (в нашия пример $C$1). Ако искате да изведете данни към нов листили в нова книга, просто изберете подходящия ключ. Поставете отметка в квадратчето до Обобщена статистика. При желание може и да изберете Ниво на трудност,k-то най-малко иk-то по големина.

Ако е на депозит Даннив района Анализне виждате иконата Анализ на данни, първо трябва да инсталирате добавката Пакет за анализ(виж, например,).

Ориз. 11. Описателна статистика на петгодишна средна годишна възвръщаемост на фондове с много високи нива на риск, изчислена с помощта на добавката Анализ на данни Excel програми

Excel изчислява редица статистически данни, обсъдени по-горе: средна стойност, медиана, режим, стандартно отклонение, дисперсия, диапазон ( интервал), минимум, максимум и размер на извадката ( проверка). Excel също изчислява някои статистики, които са нови за нас: стандартна грешка, ексцес и изкривяване. Стандартна грешкаравно на стандартното отклонение, разделено на корен квадратен от размера на извадката. Асиметрияхарактеризира отклонението от симетрията на разпределението и е функция, която зависи от куба на разликите между елементите на извадката и средната стойност. Ексцесът е мярка за относителната концентрация на данни около средната стойност в сравнение с опашките на разпределението и зависи от разликите между елементите на извадката и средната стойност, повишена на четвърта степен.

Изчисляване на описателна статистика за популация

Средната стойност, разпространението и формата на разпределението, обсъдено по-горе, са характеристики, определени от извадката. Въпреки това, ако наборът от данни съдържа числени измервания на цялата съвкупност, неговите параметри могат да бъдат изчислени. Такива параметри включват очакваната стойност, дисперсия и стандартно отклонение на съвкупността.

Очаквана стойностравна на сумата от всички стойности в популацията, разделена на размера на популацията:

Където µ - очаквана стойност, хаз- азнаблюдение на променлива х, н- обем на генералната съвкупност. В Excel за изчисляване на математическото очакване се използва същата функция като за средното аритметично: =AVERAGE().

Дисперсия на населениеторавна на сумата от квадратите на разликите между елементите на генералната съвкупност и мат. очакване, разделено на размера на населението:

Където σ 2– дисперсия на генералната популация. В Excel преди версия 2007 функцията =VARP() се използва за изчисляване на дисперсията на популацията, като се започне от версия 2010 =VARP().

Стандартно отклонение на населениеторавен на корен квадратен от дисперсията на популацията:

В Excel преди версия 2007 функцията =STDEV() се използва за изчисляване на стандартното отклонение на популация, като се започне с версия 2010 =STDEV.Y(). Обърнете внимание, че формулите за дисперсията на съвкупността и стандартното отклонение са различни от формулите за изчисляване на дисперсията на извадката и стандартното отклонение. При изчисляване на извадкова статистика S 2И Сзнаменателят на дробта е n – 1, и при изчисляване на параметрите σ 2И σ - обем на генералната съвкупност н.

Основно правило

В повечето ситуации голяма част от наблюденията са концентрирани около медианата, образувайки клъстер. В набори от данни с положителна асиметрия този клъстер е разположен отляво (т.е. под) математическото очакване, а в набори с отрицателна асиметрия този клъстер е разположен отдясно (т.е. над) от математическото очакване. За симетрични данни средната стойност и медианата са еднакви и наблюденията се групират около средната стойност, образувайки камбанообразно разпределение. Ако разпределението не е ясно изкривено и данните са концентрирани около център на тежестта, правило, което може да се използва за оценка на променливостта е, че ако данните имат камбанообразно разпределение, тогава приблизително 68% от наблюденията са в рамките на едно стандартно отклонение от очакваната стойност, приблизително 95% от наблюденията са на не повече от две стандартни отклонения от математическото очакване и 99,7% от наблюденията са на не повече от три стандартни отклонения от математическото очакване.

По този начин стандартното отклонение, което е оценка на средната вариация около очакваната стойност, помага да се разбере как са разпределени наблюденията и да се идентифицират отклоненията. Основното правило е, че за камбанообразните разпределения само една от двадесет стойности се различава от математическото очакване с повече от две стандартни отклонения. Следователно стойности извън интервала µ ± 2σ, могат да се считат за извънредни стойности. Освен това само три от 1000 наблюдения се различават от математическото очакване с повече от три стандартни отклонения. По този начин стойностите са извън интервала µ ± 3σпочти винаги са отклонения. За разпределения, които са силно изкривени или не са с форма на камбана, може да се приложи основното правило на Биенамай-Чебишев.

Преди повече от сто години математиците Биенамай и Чебишев откриха независимо един от друг полезно свойствостандартно отклонение. Те откриха, че за всеки набор от данни, независимо от формата на разпределението, процентът на наблюденията, разположени на разстояние от кстандартни отклонения от математическото очакване, не по-малко (1 – 1/ k 2)*100%.

Например ако к= 2, правилото на Bienname-Chebyshev гласи, че най-малко (1 – (1/2) 2) x 100% = 75% от наблюденията трябва да се намират в интервала µ ± 2σ. Това правило е вярно за всеки к, надхвърлящ едно. Правилото на Bienamay-Chebyshev е много общо и валидно за разпределения от всякакъв тип. Той определя минималния брой наблюдения, разстоянието от които до математическото очакване не надвишава определена стойност. Въпреки това, ако разпределението е с форма на камбана, основното правило оценява по-точно концентрацията на данни около очакваната стойност.

Изчисляване на описателна статистика за разпределение, базирано на честота

Ако оригиналните данни не са налични, разпределението на честотата става единственият източник на информация. В такива ситуации е възможно да се изчислят приблизителните стойности на количествените показатели на разпределението, като средно аритметично, стандартно отклонение и квартили.

Ако примерните данни са представени като честотно разпределение, може да се изчисли приближение на средната аритметична стойност, като се приеме, че всички стойности във всеки клас са концентрирани в средната точка на класа:

Където - средна проба, н- брой наблюдения или размер на извадката, с- брой класове в честотното разпределение, m j- средна точка йти клас, fй- съответна честота й-ти клас.

За да се изчисли стандартното отклонение от честотно разпределение, също се приема, че всички стойности във всеки клас са концентрирани в средната точка на класа.

За да разберете как се определят квартилите на серия въз основа на честотите, помислете за изчисляването на долния квартил въз основа на данни за 2013 г. за разпределението на руското население по среден паричен доход на глава от населението (фиг. 12).

Ориз. 12. Дял на руското население със среден доход на глава от населението парични приходисредно на месец, рубли

За да изчислите първия квартил на серия от интервални вариации, можете да използвате формулата:

където Q1 е стойността на първия квартил, xQ1 е долната граница на интервала, съдържащ първия квартил (интервалът се определя от натрупаната честота, която първо надвишава 25%); i – интервална стойност; Σf – сума от честотите на цялата извадка; вероятно винаги е равно на 100%; SQ1–1 – акумулирана честота на интервала, предхождащ интервала, съдържащ долния квартил; fQ1 – честота на интервала, съдържащ долния квартил. Формулата за третия квартил се различава по това, че на всички места трябва да използвате Q3 вместо Q1 и да замените ¾ вместо ¼.

В нашия пример (фиг. 12) долният квартил е в диапазона 7000,1 – 10 000, чиято акумулирана честота е 26,4%. Долната граница на този интервал е 7000 рубли, стойността на интервала е 3000 рубли, натрупаната честота на интервала, предхождащ интервала, съдържащ долния квартил, е 13,4%, честотата на интервала, съдържащ долния квартил, е 13,0%. Така: Q1 = 7000 + 3000 * (¼ * 100 – 13,4) / 13 = 9677 rub.

Клопки, свързани с описателната статистика

В тази публикация разгледахме как да опишем набор от данни, използвайки различни статистики, които оценяват неговата средна стойност, разпространение и разпределение. Следващата стъпка е анализ и интерпретация на данни. Досега изучавахме обективните свойства на данните, а сега преминаваме към тяхната субективна интерпретация. Изследователят се сблъсква с две грешки: неправилно избран предмет на анализ и неправилна интерпретация на резултатите.

Анализът на възвръщаемостта на 15 много високорискови взаимни фонда е доста безпристрастен. Той доведе до напълно обективни заключения: всички взаимни фондове имат различна доходност, спредът на доходността на фондовете варира от -6,1 до 18,5, а средната доходност е 6,08. Осигурена е обективност на анализа на данните правилният изборобщи количествени показатели на разпространение. Бяха разгледани няколко метода за оценка на средната стойност и разсейването на данните и бяха посочени техните предимства и недостатъци. Как избирате правилната статистика, за да осигурите обективен и безпристрастен анализ? Ако разпределението на данните е леко изкривено, трябва ли да изберете медианата, а не средната стойност? Кой индикатор характеризира по-точно разпространението на данните: стандартно отклонение или диапазон? Трябва ли да се посочи положителната асиметрия на разпределението?

От друга страна, интерпретацията на данните е субективен процес. Различни хорастигат до различни заключения, когато интерпретират едни и същи резултати. Всеки си има своя гледна точка. Някой смята общата средна годишна доходност на 15 фонда с много високо ниво на риск за добра и е доста доволен от получения доход. Други може да смятат, че тези фондове имат твърде ниска възвръщаемост. Така субективизмът трябва да се компенсира от честност, неутралност и яснота на заключенията.

Етични въпроси

Анализът на данни е неразривно свързан с етичните въпроси. Трябва да бъдете критични към информацията, разпространявана от вестници, радио, телевизия и интернет. С времето ще се научите да бъдете скептични не само към резултатите, но и към целите, предмета и обективността на изследването. Известният британски политик Бенджамин Дизраели го каза най-добре: „Има три вида лъжи: лъжи, проклети лъжи и статистика.

Както е отбелязано в бележката, етични проблеми възникват при избора на резултатите, които трябва да бъдат представени в доклада. Трябва да се публикуват както положителните, така и отрицателните резултати. Освен това, когато се прави доклад или писмен доклад, резултатите трябва да бъдат представени честно, неутрално и обективно. Трябва да се прави разлика между неуспешни и нечестни презентации. За целта е необходимо да се определи какви са били намеренията на говорещия. Понякога говорещият пропуска важна информация поради незнание, а понякога е умишлено (например, ако използва средноаритметичното, за да оцени средната стойност на ясно изкривени данни, за да получи желания резултат). Също така е нечестно да се премълчават резултати, които не отговарят на гледната точка на изследователя.

Използвани са материали от книгата Levin et al. – М.: Уилямс, 2004. – стр. 178–209

Функцията QUARTILE е запазена за съвместимост с по-стари версии на Excel.

Най-вече в ек. На практика трябва да използваме средноаритметичната стойност, която може да се изчисли като проста и среднопретеглена аритметична стойност.

Средно аритметично (SA)Най-често срещаният тип средно. Използва се в случаите, когато обемът на различна характеристика за цялата популация е сумата от стойностите на характеристиките на нейните отделни единици. Социалните явления се характеризират с адитивност (тоталност) на обемите на различна характеристика; това определя обхвата на приложение на SA и обяснява разпространението му като общ показател, например: общият фонд работна заплата е сумата от заплатите на всички служители.

За да изчислите SA, трябва да разделите сумата от всички стойности на характеристиките на техния брой. SA се използва в 2 форми.

Нека първо разгледаме просто средно аритметично.

1-CA проста (оригинална, дефинираща форма) е равна на простата сума на отделните стойности на осреднената характеристика, разделена на общия брой на тези стойности (използва се, когато има негрупирани стойности на индекса на характеристиката):

Направените изчисления могат да се обобщят в следната формула:

(1)

Където - средната стойност на вариращата характеристика, т.е. простото средно аритметично;

означава сумиране, т.е. добавяне на индивидуални характеристики;

х- индивидуални стойности на различна характеристика, които се наричат ​​варианти;

н - брой единици от съвкупността

Пример 1,изисква се да се намери средната производителност на един работник (механик), ако се знае колко части е произвел всеки от 15 работници, т.е. дадена поредица от инд. стойности на атрибути, бр.: 21; 20; 20; 19; 21; 19; 18; 22; 19; 20; 21; 20; 18; 19; 20.

Обикновено SA се изчислява по формула (1), бр.:

Пример2. Нека изчислим SA въз основа на условни данни за 20 магазина, включени в търговската компания (Таблица 1). маса 1

Разпределение на магазините на търговска фирма "Весна" по търговска площ, кв. М

Магазин №

Магазин №

За да изчислите средната площ на магазина ( ) е необходимо да се сумират площите на всички магазини и да се раздели полученият резултат на броя на магазините:

Така средната площ на магазина за тази група предприятия за търговия на дребно е 71 кв.м.

Следователно, за да определите прост SA, трябва да разделите сумата от всички стойности на даден атрибут на броя единици, притежаващи този атрибут.

2

Където f 1 , f 2 , … ,f н тегло (честота на повторение на еднакви знаци);

– сумата от произведенията на големината на признаците и техните честоти;

– общият брой единици от съвкупността.

- SA претеглено - ССредата на опциите, които се повтарят различен брой пъти или, както се казва, имат различна тежест. Теглата са броят на единиците в различни групи от съвкупността (еднакви опции се комбинират в група). SA претеглено средно от групираните стойности х 1 , х 2 , .., хн, изчислено: (2)

Където х- настроики;

f- честота (тегло).

Претеглената SA е частното от разделянето на сумата от продуктите на опциите и съответните им честоти на сумата от всички честоти. Честоти ( f), които се появяват във формулата на SA, обикновено се извикват везни, в резултат на което SA, изчислена с отчитане на теглата, се нарича претеглена.

Ще илюстрираме техниката за изчисляване на претеглена SA, като използваме пример 1, обсъден по-горе, за да направим това, ще групираме първоначалните данни и ще ги поставим в таблицата.

Средната стойност на групираните данни се определя по следния начин: първо опциите се умножават по честотите, след това продуктите се добавят и получената сума се разделя на сумата от честотите.

Съгласно формула (2), претеглената SA е равна, бр.:

Разпределение на работници за производство на детайли

П

Представените в предходния пример 2 данни могат да се комбинират в хомогенни групи, които са представени в табл. Таблица

Разпределение на магазини Весна по търговска площ, кв. м

Така резултатът беше същият. Това обаче вече ще бъде средноаритметична претеглена стойност.

В предишния пример изчислихме средната аритметична стойност, при условие че са известни абсолютните честоти (брой магазини). Въпреки това, в редица случаи липсват абсолютни честоти, но са известни относителни честоти или, както обикновено се наричат, честоти, които показват пропорцията илипропорцията на честотите в целия набор.

При изчисляване на SA претеглена употреба честотиви позволява да опростите изчисленията, когато честотата е изразена в големи, многоцифрени числа. Изчислението се извършва по същия начин, но тъй като средната стойност се оказва увеличена 100 пъти, резултатът трябва да се раздели на 100.

Тогава формулата за среднопретеглената аритметична стойност ще изглежда така:

Където д- честота, т.е. делът на всяка честота в общата сума на всички честоти.

(3)

В нашия пример 2 първо дефинираме специфично тегломагазини по групи в общия брой магазини Весна. И така, за първата група специфичното тегло съответства на 10%
. Получаваме следните данни Таблица3

При работа с числови изразипонякога има нужда да се изчисли средната им стойност. наречено средно аритметично. В Excel, редактор на електронни таблици от Microsoft, е възможно да не се изчислява ръчно, а да се използват специални инструменти. Тази статия ще представи методи, които ви позволяват да намерите и извлечете числото на средното аритметично.

Метод 1: стандартен

Първо, нека да разгледаме начина за изчисляване на средната аритметична стойност в Excel, което включва използването на стандартен инструмент за това. Методът е най-простият и удобен за използване, но има и някои недостатъци. Но повече за тях по-късно, а сега нека да преминем към изпълнението на поставената задача.

  1. Изберете клетките в колоната или реда, които съдържат числовите стойности, които трябва да бъдат изчислени.
  2. Отидете в раздела "Начало".
  3. В лентата с инструменти в категорията „Редактиране“ щракнете върху бутона „Автосумиране“, но трябва да кликнете върху стрелката до него, така че да се появи падащ списък.
  4. В него трябва да кликнете върху елемента „Средно“.

Веднага след като направите това, резултатът от изчисляването на средната аритметична стойност на избраните стойности ще се появи в клетката до него. Местоположението му ще зависи от блока с данни; ако сте избрали ред, резултатът ще бъде разположен вдясно от селекцията, ако е колона, ще бъде отдолу.

Но както споменахме по-рано, този метод има и недостатъци. Така че няма да можете да изчислите стойност от диапазон от клетки или клетки, намиращи се в тях различни места. Например, ако вашата таблица съдържа две съседни колони с числови стойности, тогава като ги изберете и изпълните описаните по-горе стъпки, ще получите резултата за всяка колона поотделно.

Метод 2: Използване на съветника за функции

Има много начини за намиране на средната аритметична стойност в Excel и естествено с тяхна помощ е възможно да се заобиколят ограниченията на предишния метод. Сега ще говорим за извършване на изчисления с помощта на съветника за функции. И така, ето какво трябва да направите.

  1. С левия бутон на мишката изберете клетката, в която искате да видите резултата от изчислението.
  2. Отворете прозореца на съветника за функции, като щракнете върху бутона „Вмъкване на функция“, разположен отляво на лентата с формули, или като използвате клавишните комбинации Shift+F3.
  3. В прозореца, който се показва, намерете реда „СРЕДНО“ в списъка, маркирайте го и щракнете върху бутона „OK“.
  4. Ще се появи нов прозорец за въвеждане на аргументи на функцията. В него ще видите две полета: “Number1” и “Number2”.
  5. В първото поле въведете адресите на клетките, в които се намират числените стойности за изчислението. Това може да стане както ръчно, така и с помощта на специален инструмент. Във втория случай щракнете върху бутона, който се намира от дясната страна на полето за въвеждане. Прозорецът на съветника ще се свие и ще трябва да изберете клетките за изчисление с мишката.
  6. Ако друг диапазон от клетки с данни се намира на друго място в листа, тогава го посочете в полето „Номер2“.
  7. Продължете да въвеждате данните, докато предоставите цялата необходима информация.
  8. Натиснете OK.

Когато завършите въвеждането, прозорецът на съветника ще се затвори и резултатът от изчислението ще се появи в клетката, която сте избрали в самото начало. Сега знаете втория начин за изчисляване на средната аритметична стойност в Excel. Но далеч не е последното, така че нека продължим.

Метод 3: Чрез лентата с формули

Този метод за изчисляване на средната аритметична стойност в Excel не се различава много от предишния, но в някои случаи може да изглежда по-удобен, така че си струва да се разгледа. предимно, този методоферти само Алтернативен вариантизвикване на съветника за функции.


Веднага след като всички действия в списъка бъдат завършени, пред вас ще се появи прозорецът на съветника за функции, където трябва да въведете аргументи. Вече знаете как да направите това от предишния метод; всички следващи действия не се различават.

Метод 4: Ръчно въвеждане на функция

Ако желаете, можете да избегнете взаимодействието със съветника за функции, ако знаете формулата за средна аритметична стойност в Excel. В някои ситуации ръчното му въвеждане ще ускори процеса на изчисление многократно.

За да разберете всички нюанси, трябва да разгледате синтаксиса на формулата, изглежда така:

AVERAGE(адрес_на_клетка(номер); адрес_на_клетка(номер))

От синтаксиса следва, че в аргументите на функцията е необходимо да посочите или адреса на диапазона от клетки, в който се намират числата, които трябва да се изчислят, или самите числа, които трябва да бъдат изчислени. На практика използването на този метод изглежда така:

СРЕДНО(C4:D6,C8:D9)

Метод 5: изчисляване по условие

  • изберете клетката, в която ще се извърши изчислението;
  • щракнете върху бутона „вмъкване на функция“;
  • в прозореца на съветника, който се показва, изберете реда „averageif“ в списъка;
  • Натиснете OK.

След това ще се появи прозорец за въвеждане на аргументи на функцията. Много е подобно на това, което беше демонстрирано по-рано, но сега се появи допълнително поле- "Състояние". Тук трябва да се въведе условието. По този начин, като въведете „>1500“, ще бъдат взети предвид само онези стойности, които са по-големи от определената стойност.

Под понятието средно аритметични числаозначава резултат от проста последователност от изчисления на средната стойност за серия от числа, определени предварително. Трябва да се отбележи, че тази стойност в момента се използва широко от специалисти в редица индустрии. Например, известни са формули за изчисления на икономисти или работници в статистическата индустрия, където се изисква стойност от този тип. В допълнение, този показател се използва активно в редица други индустрии, които са свързани с горното.

Една от характеристиките на изчисляването на тази стойност е простотата на процедурата. Извършете изчисленияВсеки може да го направи. Не се нуждаете от специално образование, за да направите това. Често не е необходимо да се използват компютърни технологии.

За да отговорите на въпроса как да намерите средната аритметична стойност, помислете за редица ситуации.

Повечето прост вариантизчисляването на дадена стойност е изчисляването й за две числа. Процедурата за изчисление в този случай е много проста:

  1. Първоначално трябва да извършите операцията по добавяне на избраните числа. Това често може да се направи, както се казва, ръчно, без да се използва електронно оборудване.
  2. След като се извърши събирането и се получи неговият резултат, трябва да се извърши разделяне. Тази операция включва разделяне на сумата от две добавени числа на две - броя на добавените числа. Именно това действие ще ви позволи да получите необходимата стойност.

Формула

Така формулата за изчисляване на необходимата стойност в случай на две ще изглежда така:

(A+B)/2

Тази формула използва следната нотация:

A и B са предварително избрани числа, за които трябва да намерите стойност.

Намиране на стойността за три

Изчисляването на тази стойност в ситуация, в която са избрани три числа, няма да се различава много от предишната опция:

  1. За да направите това, изберете числата, необходими за изчислението, и ги добавете, за да получите обща сума.
  2. След като този сбор от три бъде намерен, процедурата за деление трябва да се извърши отново. В този случай получената сума трябва да бъде разделена на три, което съответства на броя на избраните числа.

Формула

По този начин формулата, необходима за изчисляване на аритметичното три, ще изглежда така:

(A+B+C)/3

В тази формулаПриема се следната нотация:

A, B и C са числата, за които ще трябва да намерите средното аритметично.

Изчисляване на средно аритметично от четири

Както вече може да се види по аналогия с предишните опции, изчисляването на тази стойност за количество, равно на четири, ще бъде в следния ред:

  1. Избират се четири цифри, за които трябва да се изчисли средноаритметичната стойност. След това се извършва сумиране и се намира крайният резултат от тази процедура.
  2. Сега, за да получите крайния резултат, трябва да вземете получения сбор от четири и да го разделите на четири. Получените данни ще бъдат необходимата стойност.

Формула

От описаната по-горе последователност от действия за намиране на средната аритметична стойност за четири можете да получите следната формула:

(A+B+C+E)/4

В тази формулапроменливите имат следваща стойност:

A, B, C и E са тези, за които е необходимо да се намери средната аритметична стойност.

Използвайки тази формула, винаги ще бъде възможно да се изчисли необходимата стойност за даден брой числа.

Изчисляване на средно аритметично от пет

Извършването на тази операция ще изисква определен алгоритъм от действия.

  1. На първо място, трябва да изберете пет числа, за които ще се изчисли средноаритметичната стойност. След този избор, тези числа, както и в предишните опции, просто трябва да се добавят и да получите крайната сума.
  2. Получената сума ще трябва да бъде разделена на техния брой на пет, което ще ви позволи да получите необходимата стойност.

Формула

По този начин, подобно на разгледаните по-рано опции, получаваме следната формула за изчисляване на средната аритметична стойност:

(A+B+C+E+P)/5

В тази формула променливите са обозначени, както следва:

A, B, C, E и P са числа, за които е необходимо да се получи средно аритметично.

Универсална формула за изчисление

Провеждане на преглед различни опцииформули за изчисляване на средната аритметична стойност, можете да обърнете внимание на факта, че те имат общ модел.

Следователно ще бъде по-практично да се използва обща формула за намиране на средното аритметично. В крайна сметка има ситуации, когато броят и мащабът на изчисленията може да бъде много голям. Следователно би било по-разумно да използвате универсална формула и да не я извеждате всеки път индивидуална технологияза да изчислите тази стойност.

Основното при определяне на формулата е принцип на изчисляване на средното аритметичноО.

Този принцип, както се вижда от дадените примери, изглежда така:

  1. Броят на числата, които са зададени за получаване на необходимата стойност, се преброява. Тази операция може да се извърши ръчно с малък брой числа или с помощта на компютърна технология.
  2. Избраните числа се сумират. Тази операция в повечето ситуации се извършва с помощта на компютърна технология, тъй като числата могат да се състоят от две, три или повече цифри.
  3. Сумата, получена чрез събиране на избраните числа, трябва да бъде разделена на техния брой. Тази стойност се определя в началния етап на изчисляване на средното аритметично.

Така общата формула за изчисляване на средната аритметична стойност на поредица от избрани числа ще изглежда така:

(A+B+...+N)/N

Тази формула съдържаследните променливи:

A и B са числа, които са избрани предварително, за да се изчисли тяхната средна аритметична стойност.

N е броят на числата, взети за изчисляване на изискваната стойност.

Като заместваме избраните числа в тази формула всеки път, винаги можем да получим необходимата стойност на средното аритметично.

Както се вижда, намиране на средното аритметичное проста процедура. Трябва обаче да внимавате за извършените изчисления и да проверявате получените резултати. Този подход се обяснява с факта, че дори в най-простите ситуации съществува възможност за получаване на грешка, която след това може да повлияе на по-нататъшни изчисления. В тази връзка се препоръчва използването на компютърна технология, която е в състояние да извършва изчисления с всякаква сложност.

Средно аритметично в ексел. Таблиците на Excel са идеални за всякакви изчисления. След като сте изучавали Excel, ще можете да решавате задачи по химия, физика, математика, геометрия, биология, статистика, икономика и много други. Ние дори не се замисляме какъв мощен инструмент е на нашите компютри, което означава, че не го използваме в пълния му потенциал. Много родители смятат, че компютърът е просто скъпа играчка. Но напразно! Разбира се, за да може детето наистина да се упражнява върху него, вие сами трябва да се научите как да работите върху него и след това да научите детето. Е, това е друга тема, но днес искам да говоря с вас за това как да намерите средното аритметично в Excel.

Как да намерите средното аритметично в Excel

Вече говорихме за бързо в Excel, а днес ще говорим за средно аритметично.

Изберете клетка C12и с помощта Помощници за функции Нека напишем в него формулата за изчисляване на средното аритметично. За да направите това, в лентата с инструменти Standard щракнете върху бутона - Вмъкване на функция –fx (на горната снимка има червена стрелка в горната част). Ще се отвори диалогов прозорец Функция Master .

  • Изберете в полето КатегорииСтатистически ;
  • В полето Изберете функция: СРЕДНО АРИТМЕТИЧНО ;
  • Щракнете върху бутона Добре .

Ще отвори следващия прозорец Аргументи и функции .

В полето Номер 1ще видите запис C2:C11– самата програма е определила диапазона от клетки, за които е необходимо намерете средното аритметично.

Щракнете върху бутона Добреи в клетката C12Ще се появи средноаритметичната стойност на резултатите.

Оказва се, че изчисляването на средно аритметично в Excel не е никак трудно. И винаги съм се страхувала от всякакви формули. Ех, учехме в неподходящо време.



 


Прочети:



Отчитане на разчети с бюджета

Отчитане на разчети с бюджета

Сметка 68 в счетоводството служи за събиране на информация за задължителни плащания към бюджета, удържани както за сметка на предприятието, така и...

Чийзкейкове от извара на тиган - класически рецепти за пухкави чийзкейкове Чийзкейкове от 500 г извара

Чийзкейкове от извара на тиган - класически рецепти за пухкави чийзкейкове Чийзкейкове от 500 г извара

Продукти: (4 порции) 500 гр. извара 1/2 чаша брашно 1 яйце 3 с.л. л. захар 50 гр. стафиди (по желание) щипка сол сода бикарбонат...

Салата Черна перла със сини сливи Салата Черна перла със сини сливи

Салата

Добър ден на всички, които се стремят към разнообразие в ежедневната си диета. Ако сте уморени от еднообразни ястия и искате да зарадвате...

Рецепти за лечо с доматено пюре

Рецепти за лечо с доматено пюре

Много вкусно лечо с доматено пюре, като българско лечо, приготвено за зимата. Така обработваме (и изяждаме!) 1 торба чушки в нашето семейство. И кой бих...

feed-image RSS