Монография на методите за вземане на статистически решения. Вероятностни и статистически модели за вземане на решения. Обем на дисциплината и видове учебна работа

И следва след „просто лъжи“ и „откровени лъжи“, приписвани на Бенджамин Дизраели, който е четиридесетият и четиридесет и вторият (периодите попадат във втората половина на 19 век) министър-председател на Великобритания. В наше време обаче авторството на Дизраели, рекламирано от Марк Твен, се отрича. Но както и да е, много експерти продължават да повтарят тази фраза в своите трудове или основното съдържание на това са методите за статистически анализ. По правило звучи като виц, в който има само частица от шегата ...

Статистиката е клон от определени знания, който описва процедурата за събиране, анализиране и интерпретиране на големи количества данни, както качествени, така и количествени. Засяга различни научни или практически области на живота. Например, приложната статистика помага да се избере правилният статистически метод за обработка на всички видове данни за анализ. Правни работи в областта на правонарушенията и контрола върху тях. Mathematical разработва математически методи, които ви позволяват да систематизирате и използвате получената информация за практически или научни цели. Демографията описва модели Статистиката на заявките е повече за лингвистите и Интернет.

Използването на статистически методи датира поне от 5 век пр. н. е. Едно от най-ранните записи съдържа книга, написана през 9 век сл. н. е. д. Арабски философ, лекар, математик и музикант Ал-Кинди. Той даде Подробно описаниекак да използвате честотен анализ (хистограма). Новите хроники, датиращи от 14 век и описващи историята на Флоренция, се считат за едно от първите положителни произведения на статистиката в историята. Те са съставени от флорентинския банкер Джовани Вилани и включват много информация за населението, правителството, търговията, образованието и религиозните обекти.

Ранното използване на статистиката се обуславя от желанието на държавата да изгради демографски и икономически стабилна политика. Обхватът му е разширен в началото на 19 век, за да включва събирането и анализа на данни като цяло. Днес тази област на знанието се използва широко от държавни агенции, бизнес, природни и социални науки. Неговите математически основи, необходимостта от които възниква от изучаването на хазарта, са положени през 17 век с развитието на теорията на вероятностите от френските математици и Пиер дьо Ферма. Статистиката е описана за първи път от Карл Фридрих Гаус около 1794 г.

Бързият и постоянен растеж на изчислителната мощ от втората половина на 20-ти век оказва значително влияние върху развитието на приложната статистика. Компютърната революция постави нов акцент върху своите експериментални и емпирични компоненти. Вече са налични голям брой както общи, така и специални програми, с които можете лесно да приложите на практика всеки статистически метод, независимо дали става въпрос за контролни диаграми, хистограми, контролен списък, метод на стратификация, диаграма на Ишикава или анализ на Парето.

Днес статистиката е един от основните инструменти за провеждане ефективен бизнеси организация на производството. Тя ви позволява да разбирате и измервате тенденциите в променливостта, което води до подобрен контрол на процеса, както и до подобрено качество на продуктите и услугите. Така например мениджърите, които използват статистически качества, като правило вземат информирани решения, като по този начин управлението работи ефективно и носи очакваните резултати. Следователно статистиката в този случай е ключовият и може би единственият надежден инструмент.

Способността да изберете и правилно да приложите статистически метод ви позволява да получите надеждни заключения и да не заблуждавате тези, на които са предоставени данните от анализа. Ето защо честото споменаване от специалистите на старото твърдение за 3-те степени на лъжата трябва да се разглежда като предупреждение срещу грешки, които могат да подведат и формират основата на решения с пагубни последици.

Страница 1
Статистически методи за вземане на решения при риск.

При анализа на икономическия риск се разглеждат неговите качествени, количествени и правни аспекти. За численото изразяване на риска се използва определен математически апарат.

Случайна променлива наричаме променлива, която под въздействието на случайни фактори може с определени вероятности да приема определени стойности от определен набор от числа.

Под вероятностнякакво събитие (например събитие, състоящо се във факта, че случайна променлива е приела определена стойност) обикновено се разбира като част от броя на резултатите, които благоприятстват това събитие в общ бройвъзможни еднакво вероятни резултати. Случайните променливи се означават с букви: X, Y, ξ, R, Ri, x ~ и др.

За да оценим големината на риска (степента на риска), нека се съсредоточим върху следните критерии.

1. Математическо очакване (средна стойност) на случайна величина.

Математическото очакване на дискретна случайна променлива X се намира по формулата

където xi са стойностите на случайната променлива; pi са вероятностите, с които се приемат тези стойности.

Математическото очакване на непрекъсната случайна променлива X се намира по формулата

Където f(x) е плътността на разпределението на стойностите на случайната променлива.

2. Дисперсия (вариация) и стандартно отклонение на случайна променлива.

Дисперсията е степента на дисперсия (разсейване) на стойностите на случайна променлива около нейната средна стойност. Дисперсията и стандартното отклонение на случайна променлива се намират съответно по формулите:

Стандартното отклонение е равно на корена от дисперсията на случайната променлива


3. Коефициент на вариация.

Коефициент на вариация на случайна променлива- мярка за относителното разпространение на случайна променлива; показва каква част от средната стойност на това количество е неговият среден спред.

Равно на отношение стандартно отклонениеда се математическо очакване.

Коефициентът на вариация V е безразмерна величина. С негова помощ можете дори да сравните колебанията на знаците, изразени в различни мерни единици. Коефициентът на вариация варира от 0 до 100%. Колкото по-голям е коефициентът, толкова по-силна е волатилността. Инсталира следното качествена оценкаразлични стойности на коефициента на вариация: до 10% - слаба флуктуация, 10-25% - умерена флуктуация, над 25% - висока флуктуация.

С този метод за оценка на риска, т.е. въз основа на изчисляването на дисперсията, стандартното отклонение и коефициента на вариация е възможно да се оцени рискът не само на конкретна сделка, но и на предприемаческата фирма като цяло (чрез анализиране на динамиката на нейния доход) за определен период от време. период от време.

Пример 1В хода на конверсията предприятието създава производство на нови марки перални машинималък обем. В същото време възможни затруднения поради недостатъчно проучен пазар на продажби през маркетингово проучване. Възможни три варианта на действие (стратегия) по отношение на търсенето на продукти. В този случай бийтовете ще бъдат съответно 700, 500 и -300 милиона krb. (допълнителна печалба). Вероятностите на тези стратегии са:

П 1 =0.4; Р 2 =0,5; Р3 =0.1.

Определете очаквания размер на риска, т.е. загуби.

Решение.Изчисляваме стойността на риска по формула (1.2). Обозначете

х 1 = 700; х Ж = 500; х Ж = -300. Тогава

Да се\u003d M (X) \u003d 700 * 0,4 + 500 * 0,5 + (-300) * 0,1 \u003d 280 + 250-30 \u003d 500

Пример2. Има възможност за избор на производство и продажба на два комплекта потребителски стоки с еднакъв очакван доход (150 милиона крони). Според маркетинговия отдел, който проведе проучване на пазарната ниша, доходът от производството и продажбата на първия набор от стоки зависи от конкретна вероятностна икономическа ситуация. Възможни две еднакво вероятни връщания:

200 милиона UAH При успешна реализация на първия комплект стоки

100 милиона гривна, когато резултатите са по-малко успешни.

Приходът от продажбата на втория комплект стоки може да бъде 151 милиона гривни, но има вероятност за ниско търсене на тези продукти, когато приходите ще бъдат само 51 милиона крони.

Резултатите от разглеждания избор и техните вероятности, получени от маркетинговия отдел, са обобщени в табл.

Сравнение на опциите за производство и продажба на стоки


Възможност за производство и продажба на стоки

Резултат 1

Резултат 2

Вероятност

Доход 2 милиона UAH

Вероятности Ри

Доход 2 милиона UAH

Първият

0,5

200

0,5

100

Второ

0,99

151

0,01

51

Необходимо е да се измери размера на риска и да се вземе решение за освобождаването на един от двата комплекта стоки.

Решение.Означаваме с хдоход от производството и продажбата на първия набор от стоки, а чрез Y - доход от производството и продажбата на втория набор от стоки.

Нека изчислим математическото очакване за всяка от опциите:

M(X) =х 1 p,+х 2 Р 2 = 200*0.5 + 100*0.5 = 150 (милиона гривна)

М(Y) 1Р1 + г 2 Р 2 =151*0,99 + 51*0,01 = 150(милиона UAH..)

Обърнете внимание, че и двете опции имат еднаква очаквана възвръщаемост, тъй като.

M(X) = M(Y) = 150 (милиона UAH)Дисперсията на резултатите обаче не е еднаква. Ние използваме дисперсията на резултатите като мярка за риска.

За първия комплект стоки рисковата стойност D х = (200-150) 2 *0,5(100-150) 2 *0,5= 2500, за втория набор

д при = (151 -150) 2 *0.99+ (51 -150) 2 *0.01= 99.

Тъй като размерът на риска, свързан с производството и продажбата на потребителски стоки, е по-голям в първия вариант, отколкото във втория Да се х При , вторият вариант е по-малко рисков от първия. Ще получим същия резултат, като вземем средноквадратичното отклонение като мярка за риск.

Пример3 . Нека променим някои условия от предишния пример. Да предположим, че в първия вариант доходът се е увеличил с 10 милиона гривни. за всеки от разглежданите резултати, т.е. х 1 = 210, х 2 =110. Останалите данни останаха непроменени.

Необходимо е да се измери големината на риска и да се вземе решение за освобождаването на един от двата комплекта потребителски стоки.

Решение.За първия вариант за производство и продажба на потребителски стоки очакваната стойност на дохода е M(X) = 160, дисперсията е D(X) = 2500. За втория вариант получаваме M(Y) = 150, съответно и д(Y) = 99.

Тук е трудно да се сравнява. абсолютни показателидисперсия. Поради това е препоръчително да се премине към относителни стойности, като се вземе коефициентът на вариация като мярка за риск K

В нашия случайние имаме:

R Y =CV(X)=
=50/160=0.31

RX=CV(Y)=9,9/150=0,07

Защото Р х > Р Y, тогава вторият вариант е по-малко рисков от първия.

Имайте предвид, че в общия случай, в подобни ситуации (когато М(Y) (X), D(Y) > д(х)) трябва да се вземе предвид и склонността (нежеланието) на лицето (субект на управление) към риск. Това изисква познания от теорията на полезността.

Задачи.

Задача 1.Имаме два проекта А и Б по отношение на инвестициите. Известни оценки на прогнозираните стойности на приходите от всеки от тези проекти и съответните вероятности.

Проект А.

Проект Б.

Необходимо е да се оцени степента на риск на всеки от тези проекти, като се избере един от тях (този, който осигурява по-малък риск) за инвестиция.

Задача2 . Приходът (в милиони рубли) от износа, получен от кооперацията от производството и износа на бродирани кърпи и ризи, е случайна величина X. Законът за разпределение на тази дискретна стойност е даден в таблицата.


X=xi

100+20*i

400+30*i

600+20*i

900+10*i

P(X=xi)=pi

0.5

0.1

0.1

0.3

Определете мярката на риска като стандартното отклонение на дохода.

Задача 3.

Таблицата показва възможните нетни приходи и техните вероятности за две инвестиционни опции. Определете коя инвестиция си струва да направите въз основа на очакваната възвръщаемост и стандартното отклонение, коефициентът на вариация.



Нетна печалба, хиляди UAH.

Вероятности:

-3-и-й

-2-и-й

-1-и-й

0+i+j

1+i+j

2+i+j

3+i+j

4+i+j

Инвестиция 1

0

0

0.1

0.2

0.3

0.2

0.2

0

Инвестиция 2

0.1

0.1

0.1

0.1

0.1

0.1

0.2

0.2

Задача 2.Търговската фирма произвежда на дребнозапалки, които получава от четири доставчика, а именно:

от първи -40% от стоките, от втори 25%, от трети 15%, от четвърти 20%.трети (7+i)%, от четвърти (3+i)% . Определете размера на риска, свързан с намирането на дефектни продукти.

Страница 1

Изпратете добрата си работа в базата знания е лесно. Използвайте формата по-долу

Студенти, докторанти, млади учени, които използват базата от знания в обучението и работата си, ще ви бъдат много благодарни.

публикувано на http://www.allbest.ru/

[Въведете текст]

Въведение

1. Теория на вероятностите и математическа статистика при вземане на решения

1.1 Как се използват вероятността и статистиката

1.2 Примери за приложение на теория на вероятностите и математическа статистика

1.3 Цели на оценката

1.4 Какво е "математическа статистика"

1.5 Накратко за историята на математическата статистика

1.6 Вероятностно-статистически методи и оптимизация

2. Типични практически задачи за вземане на вероятностно-статистически решения и методи за тяхното решаване

2.1 Статистика и приложна статистика

2.2 Задачи на статистическия анализ на точността и стабилността на технологичните процеси и качеството на продукта

2.3 Проблеми на едномерната статистика (статистика на случайни променливи)

2.4 Многовариантен статистически анализ

2.5 Статистика на случайни процеси и времеви редове

2.6 Статистика на нечислови обекти

3. Приложение на вероятностно-статистически методи за вземане на решения при решаване на икономически проблеми

Заключение

Препратки

Въведение

Вероятностно-статистическите методи за вземане на решения се използват, когато ефективността на взетите решения зависи от фактори, които са случайни променливи, за които са известни законите на разпределението на вероятностите и други статистически характеристики. Освен това всяко решение може да доведе до един от многото възможни резултати и всеки резултат има определена вероятност за възникване, която може да бъде изчислена. Индикаторите, които характеризират проблемната ситуация, също се описват с помощта на вероятностни характеристики. При такива проблеми с вземането на решения вземащият решение винаги рискува да получи грешен резултат, от който се ръководи, избирайки оптималното решение въз основа на осреднените статистически характеристики на случайни фактори, тоест решението се взема при рискови условия .

На практика често се използват вероятностни и статистически методи, когато заключенията, направени от извадкови данни, се прехвърлят към цялата популация (например от извадка към цяла партида продукти). В този случай обаче във всяка конкретна ситуация трябва първо да се оцени фундаменталната възможност за получаване на достатъчно надеждни вероятностни и статистически данни.

Когато се използват идеите и резултатите от теорията на вероятностите и математическата статистика при вземане на решения, основата е математически модел, в който обективните връзки са изразени от гледна точка на теорията на вероятностите. Вероятностите се използват предимно за описание на случайността, която трябва да се вземе предвид при вземането на решения. Това се отнася както за нежелани възможности (рискове), така и за привлекателни („щастлив шанс”).

Същността на вероятностно-статистическите методи за вземане на решения е използването на вероятностни модели, базирани на оценка и тестване на хипотези, като се използват характеристики на извадката.

Логиката на използване на извадкови характеристики за вземане на решения въз основа на теоретични модели включва едновременното използване на две паралелни серии от понятия - тези, свързани с теорията (вероятностен модел) и тези, свързани с практиката (извадка от резултати от наблюдения). Например, теоретичната вероятност съответства на честотата, намерена от извадката. Математическото очакване (теоретична серия) съответства на средноаритметичното извадково (практическа серия). По правило характеристиките на извадката са оценки на теоретичните характеристики.

Предимствата на използването на тези методи включват възможността да се вземат предвид различни сценарии за развитие на събитията и техните вероятности. Недостатъкът на тези методи е, че сценарийните вероятности, използвани в изчисленията, обикновено са много трудни за получаване на практика.

Прилагането на конкретен вероятностно-статистически метод за вземане на решение се състои от три етапа:

Преходът от икономическа, управленска, технологична реалност към абстрактна математико-статистическа схема, т.е. изграждане на вероятностен модел на система за управление, технологичен процес, процедура за вземане на решения, по-специално въз основа на резултатите от статистическия контрол и др.;

Вероятностният модел на реално явление трябва да се счита за изграден, ако разглежданите величини и връзките между тях са изразени от гледна точка на теорията на вероятностите. Адекватността на вероятностния модел е обоснована, по-специално, с помощта на статистически методи за проверка на хипотези.

Математическата статистика обикновено се разделя на три раздела според вида на проблемите, които трябва да бъдат решени: описание на данните, оценка и тестване на хипотези. Според вида на статистическите данни, които се обработват, математическата статистика се разделя на четири области:

Пример за това кога е препоръчително да се използват вероятностно-статистически модели.

При контрол на качеството на всеки продукт се взема проба от него, за да се прецени дали произведената партида продукти отговаря на установените изисквания. Въз основа на резултатите от пробния контрол се прави заключение за цялата партида. В този случай е много важно да се избегне субективизъм при формирането на извадката, т.е. необходимо е всяка единица продукт в контролираната партида да има еднаква вероятност да бъде избрана в извадката. Изборът по партидата в такава ситуация не е достатъчно обективен. Следователно, в условията на трудизборът на продуктови единици в извадката обикновено се извършва не чрез партида, а чрез специални таблици на произволни числа или с помощта на компютърни генератори на произволни числа.

При статистическото регулиране на технологичните процеси, базирано на методите на математическата статистика, се разработват правила и планове за статистически контрол на процесите, насочени към своевременно откриване на нарушенията на технологичните процеси и предприемане на мерки за тяхното коригиране и предотвратяване на освобождаването на продукти, които правят не отговаря на установените изисквания. Тези мерки са насочени към намаляване на производствените разходи и загубите от доставката на нискокачествени продукти. Със статистическия приемен контрол, базиран на методите на математическата статистика, се разработват планове за контрол на качеството чрез анализиране на проби от продуктови партиди. Трудността се състои в възможността за правилно изграждане на вероятностно-статистически модели за вземане на решения, въз основа на които е възможно да се отговори на поставените по-горе въпроси. В математическата статистика за това са разработени вероятностни модели и методи за проверка на хипотези.

В допълнение, в редица управленски, индустриални, икономически, национални икономически ситуации възникват проблеми от различен тип - проблеми за оценка на характеристиките и параметрите на вероятностните разпределения.

Или при статистически анализ на точността и стабилността на технологичните процеси е необходимо да се оценят такива показатели за качество като средната стойност на контролирания параметър и степента на неговото разпространение в разглеждания процес. Според теорията на вероятността е препоръчително да се използва нейното математическо очакване като средна стойност на случайна променлива, а дисперсията, стандартното отклонение или коефициентът на вариация като статистическа характеристика на спреда. Това повдига въпроса: как да се оценят тези статистически характеристики от извадкови данни и с каква точност може да се направи това? В литературата има много подобни примери. Всички те показват как могат да се използват теорията на вероятностите и математическата статистика управление на производствотопри вземане на решения в областта на управлението на качеството на статистическите продукти.

В конкретни области на приложение се използват както вероятностно-статистически методи с широко приложение, така и специфични. Например, в раздела за управление на производството, посветен на статистическите методи за управление на качеството на продуктите, се използва приложна математическа статистика (включително проектирането на експерименти). С помощта на неговите методи се извършва статистически анализ на точността и стабилността на технологичните процеси и статистическа оценка на качеството. Специфичните методи включват методи за статистическо приемане на качеството на продукта, статистическо регулиране на технологичните процеси, оценка и контрол на надеждността
и т.н.

В управлението на производството, по-специално, когато се оптимизира качеството на продукта и се гарантира съответствие със стандартните изисквания, е особено важно да се прилагат статистически методи за начална фаза кръговат на животапродукти, т.е. на етапа на изследователска подготовка на експериментални дизайнерски разработки (разработване на обещаващи изисквания за продукти, предварителен дизайн, техническо заданиеза развойна работа). Това се дължи на ограничената налична информация в началния етап от жизнения цикъл на продукта и необходимостта от прогнозиране технически възможностии икономическата ситуация за в бъдеще.

Най-разпространените вероятностно-статистически методи са регресионният анализ, факторен анализ, дисперсионен анализ, статистически методи за оценка на риска, сценариен метод и др. Областта на статистическите методи, посветена на анализа на статистически данни от нечислов характер, придобива все по-голямо значение. резултати от измерване на качествени и разнородни характеристики. Едно от основните приложения на статистиката на обекти с нечислов характер е теорията и практиката експертни оценкисвързани с теорията статистически решенияи проблеми с гласуването.

Ролята на човек при решаването на проблеми с помощта на методите на теорията на статистическите решения е да формулира проблема, т.е. истинска задачакъм съответния стандартен, при определяне на вероятностите за събития въз основа на статистически данни, както и при утвърждаване на полученото оптимално решение.

1. Теория на вероятностите и математическа статистика при вземане на решения

1.1 Как се използва вероятносттаи математическа статистика

Тези дисциплини са в основата на вероятностно-статистическите методи за вземане на решения. За да се използва техният математически апарат, е необходимо да се изразят проблемите за вземане на решения по отношение на вероятностно-статистически модели. Прилагането на конкретен вероятностно-статистически метод за вземане на решение се състои от три етапа:

Преходът от икономическа, управленска, технологична реалност към абстрактна математико-статистическа схема, т.е. изграждане на вероятностен модел на система за управление, технологичен процес, процедура за вземане на решения, по-специално въз основа на резултатите от статистически контрол и др.

Извършване на изчисления и получаване на заключения с чисто математически средства в рамките на вероятностен модел;

Тълкуване на математически и статистически заключения във връзка с реална ситуация и вземане на подходящо решение (например относно съответствието или несъответствието на качеството на продукта с установените изисквания, необходимостта от коригиране на технологичния процес и т.н.), по-специално, заключения (за съотношението на дефектните единици продукти в партида, за конкретна форма на закони за разпределение на контролираните параметри на технологичния процес и др.).

Математическата статистика използва концепциите, методите и резултатите от теорията на вероятностите. Нека разгледаме основните въпроси на изграждането на вероятностни модели за вземане на решения в икономически, управленски, технологични и други ситуации. За активното и правилно използване на нормативно-технически и инструктивно-методически документи за вероятностно-статистически методи за вземане на решения са необходими предварителни познания. Така че е необходимо да се знае при какви условия трябва да се прилага един или друг документ, каква първоначална информация е необходима за неговия избор и прилагане, какви решения трябва да се вземат въз основа на резултатите от обработката на данни и др.

1.2 Примери за приложение на теорията на вероятноститеи математическа статистика

Нека разгледаме няколко примера, когато вероятностно-статистическите модели са добър инструмент за решаване на управленски, индустриални, икономически и национални икономически проблеми. Така например в романа на А. Н. Толстой „Вървейки по мъките“ (том 1) се казва: „цехът дава двадесет и три процента от брака, вие държите на тази цифра“, каза Струков на Иван Илич.

Възниква въпросът как да разбираме тези думи в разговора на ръководителите на фабрики, тъй като една единица продукция не може да бъде дефектна с 23%. Тя може да бъде както добра, така и дефектна. Може би Струков е имал предвид, че голяма партида съдържа приблизително 23% дефектни единици. Тогава възниква въпросът какво означава „около“? Да предположим, че от 100 проверени бройки продукция се окажат дефектни, или от 1000 - 300, или от 100 000 - 30 000 и т.н., трябва ли Струков да бъде обвинен в лъжа?

Или друг пример. Монетата, която се използва като лот, трябва да бъде "симетрична", т.е. когато се хвърля, средно в половината от случаите трябва да изпадне гербът, а в половината от случаите - решетката (опашки, номер). Но какво означава „средно“? Ако прекарате много серии от 10 хвърляния във всяка серия, тогава често ще има серии, в които монета изпада 4 пъти с герб. За симетрична монета това ще се случи в 20,5% от сериите. И ако има 40 000 герба за 100 000 хвърляния, може ли монетата да се счита за симетрична? Процедурата за вземане на решение се основава на теорията на вероятностите и математическата статистика.

Разглежданият пример може да не изглежда достатъчно сериозен. Обаче не е така. Тегленето се използва широко при организиране на експерименти за индустриална осъществимост, например при обработка на резултатите от измерването на индекса на качеството (момент на триене) на лагерите в зависимост от различни технологични фактори (влиянието на консервационната среда, методите за подготовка на лагерите преди измерване, влияние на натоварването на лагера в процеса на измерване и др.). Да предположим, че е необходимо да се сравни качеството на лагерите в зависимост от резултатите от тяхното съхранение в различни консервационни масла, т.е. в масла от състав А и Б. При планирането на такъв експеримент възниква въпросът кои лагери трябва да се поставят в масло от състав А и кои - в масло от състав В, но така, че да се избегне субективизма и да се гарантира обективността на решение.

Отговорът на този въпрос може да бъде получен чрез теглене на жребий. Подобен пример може да се даде с контрола на качеството на всеки продукт. За да се реши дали дадена проверена партида продукти отговаря или не на установените изисквания, от нея се взема проба. Въз основа на резултатите от пробния контрол се прави заключение за цялата партида. В този случай е много важно да се избегне субективизъм при формирането на извадката, т.е. необходимо е всяка единица продукт в контролираната партида да има еднаква вероятност да бъде избрана в извадката. При производствени условия изборът на производствени единици в извадката обикновено се извършва не чрез партида, а чрез специални таблици със случайни числа или с помощта на компютърни генератори на случайни числа.

Подобни проблеми за осигуряване на обективност на сравнението възникват при сравняване различни схемиорганизация на производството, възнаграждения, по време на търгове и конкурси, подбор на кандидати за свободни позициии т.н. Навсякъде имате нужда от лотария или подобни процедури. Нека обясним с помощта на примера за определяне на най-силния и втория най-силен отбор при организирането на турнир според олимпийската система (губещият се елиминира). Нека по-силният отбор винаги побеждава по-слабия. Ясно е, че най-силният отбор със сигурност ще стане шампион. Вторият по сила отбор ще стигне до финала само ако няма мачове с бъдещия шампион преди финала. Ако се планира такава игра, тогава вторият по сила отбор няма да стигне до финала. Този, който планира турнира, може или да „нокаутира“ втория най-силен отбор от турнира предсрочно, като го свали в първата среща с лидера, или да му осигури второ място, като осигури срещи с по-слаби отбори до финала. За да избегнете субективизъм, изтеглете жребий. За турнир с 8 отбора вероятността двата най-силни отбора да се срещнат на финала е 4/7. Съответно, с вероятност от 3/7, вторият най-силен отбор ще напусне турнира предсрочно.

При всяко измерване на продуктови единици (като се използва дебеломер, микрометър, амперметър и т.н.) има грешки. За да се установи дали има систематични грешки, е необходимо да се направят многократни измервания на единица продукция, чиито характеристики са известни (например стандартна проба). Трябва да се помни, че в допълнение към системната грешка има и случайна грешка.

Ето защо възниква въпросът как да разберем от резултатите от измерването дали има системна грешка. Ако отбележим само дали грешката, получена при следващото измерване, е положителна или отрицателна, тогава този проблем може да бъде сведен до предишния. Наистина, нека сравним измерването с хвърлянето на монета, положителната грешка - със загубата на герба, отрицателната - с решетката (нулева грешка с достатъчен брой деления на скалата почти никога не възниква). Тогава проверката за липса на систематична грешка е еквивалентна на проверка на симетрията на монетата.

Целта на тези разсъждения е да се намали проблемът за проверка на липсата на систематична грешка до проблема за проверка на симетрията на монета. Горните разсъждения водят до така наречения "критерий на знаците" в математическата статистика.

При статистическото регулиране на технологичните процеси, базирано на методите на математическата статистика, се разработват правила и планове за статистически контрол на процесите, насочени към своевременно откриване на нарушенията на технологичните процеси и предприемане на мерки за тяхното коригиране и предотвратяване на освобождаването на продукти, които правят не отговаря на установените изисквания. Тези мерки са насочени към намаляване на производствените разходи и загубите от доставката на нискокачествени продукти. Със статистическия приемен контрол, базиран на методите на математическата статистика, се разработват планове за контрол на качеството чрез анализиране на проби от продуктови партиди. Трудността се състои в възможността за правилно изграждане на вероятностно-статистически модели за вземане на решения, въз основа на които е възможно да се отговори на поставените по-горе въпроси. В математическата статистика за това са разработени вероятностни модели и методи за проверка на хипотези, по-специално хипотези, че делът на дефектните единици продукция е равен на определено число p0, например p0 = 0,23 (помнете думите на Струков от романът на А. Н. Толстой).

1.3 Цели на оценката

В редица управленски, индустриални, икономически, национални икономически ситуации възникват проблеми от различен тип - проблеми за оценка на характеристиките и параметрите на вероятностните разпределения.

Помислете за пример. Нека партида от N електрически лампи дойде към управлението. Проба от n електрически лампи е избрана на случаен принцип от тази партида. Възникват редица естествени въпроси. Как може да се определи средният експлоатационен живот на електрическите лампи от резултатите от изпитването на пробните елементи и с каква точност може да се оцени тази характеристика? Как се променя точността, ако се вземе по-голяма проба? При какъв брой часове T може да се гарантира, че поне 90% от електрическите лампи ще издържат T или повече часа?

Да предположим, че при тестване на образец от n електрически лампи, X електрически лампи се оказаха дефектни. Тогава възникват следните въпроси. Какви ограничения могат да бъдат определени за броя D на дефектните електрически лампи в партида, за нивото на дефектност D/N и т.н.?

Или при статистически анализ на точността и стабилността на технологичните процеси е необходимо да се оценят такива показатели за качество като средната стойност на контролирания параметър и степента на неговото разпространение в разглеждания процес. Според теорията на вероятността е препоръчително да се използва нейното математическо очакване като средна стойност на случайна променлива, а дисперсията, стандартното отклонение или коефициентът на вариация като статистическа характеристика на спреда. Това повдига въпроса: как да се оценят тези статистически характеристики от извадкови данни и с каква точност може да се направи това? Има много подобни примери. Тук беше важно да се покаже как теорията на вероятностите и математическата статистика могат да се използват в управлението на производството при вземане на решения в областта на управлението на качеството на статистическите продукти.

1.4 Какво е "математическа статистика"

Математическата статистика се разбира като „раздел от математиката, посветен на математическите методи за събиране, систематизиране, обработка и тълкуване на статистически данни, както и използването им за научни или практически заключения. Правилата и процедурите на математическата статистика се основават на теорията на вероятностите, което позволява да се оцени точността и надеждността на заключенията, получени във всяка задача въз основа на наличния статистически материал. В същото време статистическите данни се отнасят до информация за броя на обектите във всяка повече или по-малко обширна колекция, която има определени характеристики.

Според вида на проблемите, които се решават, математическата статистика обикновено се разделя на три раздела: описание на данните, оценка и тестване на хипотези.

Според вида на статистическите данни, които се обработват, математическата статистика се разделя на четири области:

Едномерна статистика (статистика на случайни променливи), при която резултатът от наблюдение се описва с реално число;

Многовариантен статистически анализ, при който резултатът от наблюдението на даден обект се описва с няколко числа (вектор);

Статистика на случайни процеси и времеви редове, където резултатът от наблюдението е функция;

Статистика на обекти от нечислово естество, при което резултатът от наблюдение е от нечислово естество, например, това е набор (геометрична фигура), подреждане или получен в резултат на измерване от качествен атрибут.

Исторически, някои области на статистиката на обекти с нечислов характер (по-специално, проблеми с оценката на процента на дефектни продукти и тестване на хипотези за това) и едномерната статистика бяха първите, които се появиха. Математическият апарат е по-прост за тях, поради което чрез своя пример те обикновено демонстрират основните идеи на математическата статистика.

Само онези методи за обработка на данни, т.е. математическата статистика е базирана на доказателства, които се основават на вероятностни модели на съответни реални явления и процеси. Говорим за модели на потребителско поведение, възникване на рискове, функциониране технологично оборудване, получаване на резултатите от експеримента, хода на заболяването и др. Вероятностният модел на реално явление трябва да се счита за изграден, ако разглежданите величини и връзките между тях са изразени от гледна точка на теорията на вероятностите. Съответствие с вероятностния модел на реалността, т.е. неговата адекватност се обосновава, по-специално, с помощта на статистически методи за проверка на хипотези.

Невероятните методи за обработка на данни са проучвателни, те могат да се използват само когато предварителен анализданни, тъй като те не позволяват да се оцени точността и достоверността на изводите, получени въз основа на ограничен статистически материал.

Вероятностните и статистическите методи са приложими навсякъде, където е възможно да се изгради и обоснове вероятностен модел на явление или процес. Използването им е задължително, когато изводите, направени от данните за извадката, се прехвърлят към цялата популация (например от извадка към цяла партида продукти).

В конкретни области на приложение се използват както вероятностно-статистически методи с широко приложение, така и специфични. Например, в раздела за управление на производството, посветен на статистическите методи за управление на качеството на продуктите, се използва приложна математическа статистика (включително проектирането на експерименти). С помощта на неговите методи се извършва статистически анализ на точността и стабилността на технологичните процеси и статистическа оценка на качеството. Специфичните методи включват методи за статистическо приемане на качеството на продукта, статистическо регулиране на технологичните процеси, оценка и контрол на надеждността и др.

Широко използвани са такива приложни вероятностно-статистически дисциплини като теория на надеждността и теория на масовото обслужване. Съдържанието на първия от тях става ясно от заглавието, вторият се занимава с изследване на системи като телефонна централа, която приема обаждания в произволни моменти - изискванията на абонатите, набиращи номера на своите телефони. Продължителността на услугата на тези изисквания, т.е. продължителността на разговорите също се моделира чрез случайни променливи. Голям принос за развитието на тези дисциплини направи член-кореспондентът на Академията на науките на СССР А.Я. Хинчин (1894-1959), академик на Академията на науките на Украинската ССР Б. В. Гнеденко (1912-1995) и други местни учени.

1.5 Накратко за историята на математическата статистика

Математическата статистика като наука започва с трудовете на известния немски математик Карл Фридрих Гаус (1777-1855), който, базирайки се на теорията на вероятностите, изследва и обосновава метода на най-малките квадрати, който създава през 1795 г. и прилага при обработката астрономически данни (за да се изясни орбитата на малка планета Церера). Едно от най-популярните вероятностни разпределения, нормалното, често е кръстено на него, а в теорията на случайните процеси основният обект на изследване са процесите на Гаус.

В края на XIXв. - началото на ХХ век. голям принос в математическата статистика е направен от английски изследователи, предимно К. Пиърсън (1857-1936) и Р. А. Фишър (1890-1962). По-специално, Пиърсън разработи теста хи-квадрат за тестване на статистически хипотези, а Фишър разработи анализ на дисперсията, теорията за планиране на експеримента и метода на максималната вероятност за оценка на параметрите.

През 30-те години на ХХ век. Полякът Йежи Нойман (1894-1977) и англичанинът Е. Пиърсън разработиха обща теория за проверка на статистически хипотези, а съветските математици академик А.Н. Колмогоров (1903-1987) и член-кореспондент на Академията на науките на СССР Н. В. Смирнов (1900-1966) полагат основите на непараметричната статистика. През четиридесетте години на ХХ век. Румънецът А. Валд (1902-1950) изгражда теорията на последователния статистически анализ.

В днешно време математическата статистика се развива бързо. И така, през последните 40 години могат да се разграничат четири фундаментално нови области на изследване:

Разработване и внедряване на математически методи за планиране на експерименти;

Развитие на статистиката на обекти с нечислов характер като самостоятелно направление в приложната математическа статистика;

Разработване на статистически методи, устойчиви на малки отклонения от използвания вероятностен модел;

Широко разпространено развитие на работата по създаването на компютърни софтуерни пакети, предназначени за статистически анализ на данни.

1.6 Вероятностно-статистически методи и оптимизация

Идеята за оптимизация прониква в съвременната приложна математическа статистика и други статистически методи. А именно, методи за планиране на експерименти, статистически приемлив контрол, статистически контрол на технологичните процеси и др. От друга страна, оптимизационните формулировки в теорията на решенията, например приложната теория за оптимизиране на качеството на продукта и стандартните изисквания, осигуряват широко използване на вероятностно-статистически методи, предимно приложна математическа статистика.

В управлението на производството, по-специално, когато се оптимизира качеството на продукта и стандартните изисквания, е особено важно да се прилагат статистически методи в началния етап от жизнения цикъл на продукта, т.е. на етапа на изследователска подготовка на експериментални дизайнерски разработки (разработване на обещаващи изисквания за продукти, предварителен дизайн, задание за разработване на експериментален дизайн). Това се дължи на ограничената налична информация в началния етап от жизнения цикъл на продукта и необходимостта от прогнозиране на техническите възможности и икономическата ситуация за в бъдеще. Статистическите методи трябва да се прилагат на всички етапи от решаването на задача за оптимизация - при мащабиране на променливи, разработване на математически модели за функциониране на продукти и системи, провеждане на технически и икономически експерименти и др.

При оптимизационни проблеми, включително оптимизиране на качеството на продукта и стандартните изисквания, се използват всички области на статистиката. А именно статистика на случайни променливи, многомерен статистически анализ, статистика на случайни процеси и времеви редове, статистика на обекти с нечислов характер. Изборът на статистически метод за анализ на конкретни данни трябва да се извършва съгласно препоръките.

2. Типични практически проблеми на вероятностно-статистично вземане на решенияи методи за тяхното решаване

2.1 Статистика и приложна статистика

Приложната статистика се разбира като част от математическата статистика, посветена на методите за обработка на реални статистически данни, както и съответните математически и софтуер. По този начин чисто математическите проблеми не се включват в приложната статистика.

Под статистически данни се разбират числени или нечислови стойности на контролирани параметри (характеристики) на изследваните обекти, които са получени в резултат на наблюдения (измервания, анализи, тестове, експерименти и др.) на определен брой характеристики за всяка единица, включена в изследването. Методите за получаване на статистически данни и размерите на извадките се установяват въз основа на формулирането на конкретен приложен проблем, базиран на методите на математическата теория на планирането на експеримента.

Резултатът от наблюдението xi на изследвания признак X (или съвкупността от изследвани признаци X) на i-тата извадкова единица отразява количествените и/или качествените свойства на изследваната единица с номер i (тук i = 1, 2, . .., n, където n е размерът на извадката).

Резултатите от наблюденията x1, x2,…, xn, където xi е резултатът от наблюдението на i -та единица извадка, или резултатите от наблюденията за няколко извадки, се обработват с помощта на приложени статистически методи, подходящи за задачата. По правило се използват аналитични методи, т.е. методи, базирани на числени изчисления (обекти с нечислов характер се описват с помощта на числа). В някои случаи е допустимо използването на графични методи (визуален анализ).

2.2 Задачи на статистическия анализ на точността и стабилността на технологичните процеси и качеството на продуктите

Статистическите методи се използват по-специално за анализиране на точността и стабилността на технологичните процеси и качеството на продуктите. Целта е да се изготвят решения, които осигуряват ефективното функциониране на технологичните звена и подобряват качеството и конкурентоспособността на продуктите. Статистическите методи трябва да се използват във всички случаи, когато въз основа на резултатите от ограничен брой наблюдения е необходимо да се установят причините за подобряването или влошаването на точността и стабилността на технологичното оборудване. Под точността на технологичния процес се разбира свойството на технологичния процес, което определя близостта на действителните и номиналните стойности на параметрите на произвежданите продукти. Под стабилност на технологичния процес се разбира свойството на технологичния процес, което определя постоянството на вероятностните разпределения за неговите параметри за определен период от време без външна намеса.

Целите на прилагането на статистически методи за анализиране на точността и стабилността на технологичните процеси и качеството на продуктите на етапите на разработване, производство и експлоатация (потребление) на продуктите са по-специално:

* определяне на действителни показатели за точност и стабилност на технологичния процес, оборудването или качеството на продукта;

* установяване на съответствието на качеството на продукта с изискванията на нормативната и техническата документация;

* проверка на спазването на технологичната дисциплина;

* изследване на случайни и систематични фактори, които могат да доведат до появата на дефекти;

* идентифициране на производствени и технологични резерви;

* обосновка технически стандартии продуктови одобрения

* Оценка на резултатите от изпитването на прототипи при обосноваване на изискванията към продуктите и стандартите за тях;

* обосновка на избора на технологично оборудване и средства за измерване и изпитване;

* сравнение на различни мостри на продукти;

* обосновка за замяна пълен контролстатистически;

* идентифициране на възможността за въвеждане на статистически методи за управление на качеството на продуктите и др.

За постигане на горните цели се използват различни методи за описание на данни, оценка и тестване на хипотези. Нека дадем примери за формулировки на проблеми.

2.3 Проблеми на едномерната статистика (статистика на случайни променливи)

Сравнението на математическите очаквания се извършва в случаите, когато е необходимо да се установи съответствието между показателите за качество на произведените продукти и референтната проба. Това е задачата за тестване на хипотезата:

H0: M(X) = m0,

където m0 е стойността, съответстваща на референтната проба; X е случайна променлива, симулираща резултатите от наблюденията. В зависимост от формулирането на вероятностния модел на ситуацията и алтернативната хипотеза, сравнението на математическите очаквания се извършва чрез параметрични или непараметрични методи.

Сравнението на отклоненията се извършва, когато е необходимо да се установи разликата между дисперсията на показателя за качество и номиналния. За целта се тества хипотезата:

Не по-малко важни от проблемите на проверката на хипотези са проблемите на оценката на параметрите. Те, както и задачите за проверка на хипотези, в зависимост от използвания вероятностен модел на ситуацията, се разделят на параметрични и непараметрични.

В задачите за параметрично оценяване се приема вероятностен модел, според който резултатите от наблюденията x1, x2, ..., xn се разглеждат като реализации на n независими случайни променливи с функция на разпределение F(x;u). Тук и е неизвестен параметър, лежащ в пространството на параметрите и даден от използвания вероятностен модел. Задачата на оценката е да се определят точкови оценки и граници на достоверност (или област на достоверност) за параметъра и.

Параметърът и е или число, или вектор с фиксирана крайна размерност. И така, за нормално разпределение u = (m, y2) е двумерен вектор, за биномно разпределение u = p е число, за гама разпределение
и = (a, b, c) е 3D вектор и т.н.

В съвременната математическа статистика са разработени редица общи методи за определяне на оценки и доверителни граници - методът на моментите, методът на максималното правдоподобие, методът на едностъпковите оценки, методът на стабилните (робастни) оценки, методът на безпристрастни оценки и др.

Нека да разгледаме набързо първите три от тях.

Методът на моментите се основава на използването на изрази за моментите на разглежданите случайни величини по отношение на параметрите на техните функции на разпределение. Оценките на метода на моментите се получават чрез заместване на примерни моменти вместо теоретични във функции, изразяващи параметри чрез моменти.

В метода на максималната правдоподобност, разработен главно от R.A. Fisher, като оценка на параметъра и се взема стойността на u*, за която така наречената функция на вероятността е максимална

f(x1, u) f(x2, u) … f(xn, u),

където x1, x2,…, xn са резултатите от наблюденията; f(x, u) е тяхната плътност на разпределение в зависимост от параметъра u, който трябва да се оцени.

Оценителите на максималната вероятност обикновено са ефективни (или асимптотично ефективни) и имат по-малка дисперсия от метода на моментните оценители. В някои случаи формулите за тях се изписват изрично (нормално разпределение, експоненциално разпределение без отместване). Въпреки това, по-често, за да ги намерите, е необходимо да се реши числено система от трансцендентални уравнения (разпределения на Weibull-Gnedenko, гама). В такива случаи е препоръчително да се използват не оценки на максималната вероятност, а други видове оценки, предимно оценки в една стъпка.

При проблеми с непараметрична оценка се приема вероятностен модел, в който резултатите от наблюденията x1, x2,…, xn се разглеждат като реализации на n независими случайни променливи с функцията на разпределение F(x) общ изглед. От F(x) се изисква само да изпълнява определени условия като непрекъснатост, наличие на математическо очакване и дисперсия и т.н. Такива условия не са толкова строги, колкото условието за принадлежност към определено параметрично семейство.

При непараметрична формулировка се оценяват или характеристиките на случайна променлива (математическо очакване, дисперсия, коефициент на вариация), или нейната функция на разпределение, плътност и др. По този начин, по силата на закона за големите числа, средната аритметична извадка е последователна оценка на математическото очакване M(X) (за всяка функция на разпределение F(x) на резултатите от наблюденията, за които съществува математическото очакване). С помощта на централната гранична теорема се определят асимптотични доверителни граници

(M(X))H = , (M(X))B = .

където r е доверителната вероятност, е квантилът от порядъка на стандартното нормално разпределение N(0;1) с нулево математическо очакване и единична дисперсия, е средната аритметична извадка, s е извадковото стандартно отклонение. Терминът "асимптотични доверителни граници" означава, че вероятностите

P((M(X))H< M(X)}, P{(M(X))B >M(X)),

P((M(X))H< M(X) < (M(X))B}

са склонни към и r, съответно, за n > ?, но, най-общо казано, не са равни на тези стойности за крайни n. На практика асимптотичните граници на достоверност дават достатъчна точност за n от порядъка на 10.

Вторият пример за непараметрична оценка е оценката на функцията на разпределение. Според теоремата на Гливенко емпиричната функция на разпределение Fn(x) е последователна оценка на функцията на разпределение F(x). Ако F(x) е непрекъсната функция, тогава въз основа на теоремата на Колмогоров доверителните граници за функцията на разпределение F(x) са дадени като

(F(x))Н = max , (F(x))B = min ,

където k(r,n) е порядъкът на квантила на разпределението на статистиката на Колмогоров за размера на извадката n (припомнете си, че разпределението на тази статистика не зависи от F(x)).

Правилата за определяне на оценките и доверителните граници в параметричния случай се основават на параметричното семейство от разпределения F(x;u). При обработката на реални данни възниква въпросът - отговарят ли тези данни на приетия вероятностен модел? Тези. статистическа хипотеза, че резултатите от наблюденията имат функция на разпределение от семейството (F(x; u), u) за някои u = u0? Такива хипотези се наричат ​​хипотези за добро съответствие, а критериите за тяхната проверка се наричат ​​добро съответствие.

Ако истинската стойност на параметъра u = u0 е известна, функцията на разпределение F(x; u0) е непрекъсната, тогава тестът на Колмогоров, базиран на статистика, често се използва за проверка на хипотезата за добро съответствие.

където Fn(x) е емпиричната функция на разпределение.

Ако истинската стойност на параметъра u0 е неизвестна, например, когато се тества хипотезата за нормалността на разпределението на резултатите от наблюдението (т.е. когато се проверява дали това разпределение принадлежи към семейството на нормалните разпределения), тогава понякога се използва статистика

Тя се различава от статистиката на Колмогоров Dn по това, че вместо истинската стойност на параметъра u0 се замества неговата оценка u*.

Разпределението на статистиката Dn(u*) е много различно от разпределението на статистиката Dn. Като пример, разгледайте проверка за нормалност, когато u = (m, y2) и u* = (, s2). За този случай квантилите на разпределенията на статистиките Dn и Dn(u*) са дадени в таблица 1. Така квантилите се различават около 1,5 пъти.

Таблица 1 - Квантили на статистиките Dn и Dn(u*) при тестване на нормалността

При първичната обработка на статистическите данни важна задача е премахването на резултатите от наблюденията, получени в резултат на груби грешки и грешки. Например, когато преглеждате данни за теглото (в килограми) на новородени, заедно с числата 3500, 2750, 4200 може да се появи числото 35,00. Ясно е, че това е пропуск и се е получило грешно число с грешен запис - запетаята е изместена с един знак, в резултат на наблюдението, резултатът от наблюдението е погрешно увеличен с 10 пъти.

Статистическите методи за изключване на извънредни стойности се основават на предположението, че такива наблюдения имат разпределения, които се различават рязко от изследваните, и следователно те трябва да бъдат изключени от извадката.

Най-простият вероятностен модел е следният. При нулевата хипотеза резултатите от наблюденията се разглеждат като реализации на независими еднакво разпределени случайни променливи X1,X2 , Xn с функцията на разпределение F(x). При алтернативната хипотеза X1, X2, Xn-1 са същите като при нулевата хипотеза, а Xn съответства на груба грешка и има функция на разпределение G(x) = F(x - c), където c е голямо. Тогава, с вероятност, близка до 1 (по-точно, клоняща към 1 с нарастване на размера на извадката),

Xn = max (X1, X2, Xn) = Xmax,

тези. когато се описват данните, Xmax трябва да се разглежда като възможна груба грешка. Критичният регион има формата

W \u003d (x: x\u003e d).

Критичната стойност d = d(b, n) се избира в зависимост от нивото на значимост b и размера на извадката n от условието

P(Xmax > d | H0) = b (1)

Условие (1) е еквивалентно за голямо n и малко b на следното:

Ако функцията на разпределение на резултатите от наблюденията F(x) е известна, тогава критичната стойност d се намира от съотношението (2). Ако F(x) е известно до параметри, например е известно, че F(x) е нормална функция на разпределение, тогава се разработват и правилата за проверка на разглежданата хипотеза.

Често обаче формата на функцията на разпределение на резултатите от наблюденията е известна не съвсем точно и не до параметри, а само с известна грешка. Тогава връзката (2) става практически безполезна, тъй като малка грешка в дефиницията на F(x), както може да се покаже, води до голяма грешкапри определяне на критичната стойност d от условие (2) и при фиксиран d нивото на значимост на критерия може да се различава значително от номиналното.

Следователно, в ситуация, в която няма пълна информация за F(x), но са известни математическото очакване M(X) и дисперсията y2 = D(X) на резултатите от наблюденията X1, X2, Xn, непараметричните правила за отхвърляне въз основа на неравенството на Чебишев може да се използва. Използвайки това неравенство, намираме критичната стойност d = d(b, n), така че

тогава съотношението (3) ще бъде изпълнено, ако

Чрез неравенството на Чебишев

следователно, за да бъде изпълнено (4), е достатъчно да се приравнят десните части на формули (4) и (5), т.е. определете d от условието

Правилото за отхвърляне, базирано на критичната стойност на d, изчислена по формула (6), използва минималната информация за функцията на разпределение F(x) и следователно изключва само наблюдения, които са много далеч от основната маса. С други думи, стойността на d1, дадена от връзка (1), обикновено е много по-малка от стойността на d2, дадена от връзка (6).

2.4 Многовариантен статистически анализ

Многовариантният статистически анализ се използва за решаване на следните проблеми:

* изследване на връзката между признаците;

* класификация на обекти или характеристики, дадени от вектори;

* намаляване на размера на пространството на характеристиките.

В този случай резултатът от наблюденията е вектор от стойности на фиксиран брой количествени, а понякога и качествени характеристики, измерени в даден обект. Количественият признак е признак на наблюдавана единица, който може да се изрази директно с число и мерна единица. Количественият признак се противопоставя на качествения - атрибут на наблюдавана единица, определен чрез приписване на една от две или повече условни категории (ако има точно две категории, тогава атрибутът се нарича алтернативен). Статистическият анализ на качествените характеристики е част от статистиката на нечисловите обекти. Количествените признаци се разделят на признаци, измерени в скалите на интервали, съотношения, разлики, абсолютни.

И качествени - по признаците, измерени в скалата на имената и порядъчната скала. Методите за обработка на данните трябва да са в съответствие със скалите, в които се измерват разглежданите характеристики.

Целите на изучаването на връзката между характеристиките са да се докаже съществуването на връзка между характеристиките и да се изследва тази връзка. Корелационният анализ се използва за доказване на съществуването на връзка между две случайни променливи X и Y. Ако съвместното разпределение на X и Y е нормално, тогава статистическите заключения се основават на коефициента на линейна корелация на извадката, в други случаи се използват коефициентите на рангова корелация на Kendall и Spearman, а за качествени характеристики се използва тестът хи-квадрат .

Регресионният анализ се използва за изследване на функционалната зависимост на количествения признак Y от количествените признаци x(1), x(2), ..., x(k). Тази зависимост се нарича регресия или накратко регресия. Най-простият вероятностен модел на регресионен анализ (в случай на k = 1) използва като първоначална информация набор от двойки резултати от наблюдение (xi, yi), i = 1, 2, …, n, и има формата

yi = axi + b + ei, i = 1, 2, …, n,

където ei са грешки при наблюдение. Понякога се приема, че ei са независими случайни променливи с едно и също нормално разпределение N(0, y2). Тъй като разпределението на грешките при наблюдение обикновено е различно от нормалното, препоръчително е регресионният модел да се разглежда в непараметрична формулировка, т.е. за произволно разпределение на ei.

Основната задача на регресионния анализ е да се оценят неизвестните параметри a и b, които определят линейната зависимост на y от x. За решаването на този проблем се използва методът на най-малките квадрати, разработен от К. Гаус през 1794 г., т.е. намерете оценки на неизвестни параметри на модела a и b от условието за минимизиране на сумата от квадрати

за променливи a и b.

Дисперсионният анализ се използва за изследване на влиянието на качествените характеристики върху количествената променлива. Например, нека има k проби от резултатите от измерванията на количествения показател за качеството на единици продукция, произведени на k машини, т.е. набор от числа (x1(j), x2(j), …, xn(j)), където j е номерът на машината, j = 1, 2, …, k и n е размерът на извадката. В общата формулировка на дисперсионния анализ се приема, че резултатите от измерването са независими и във всяка проба имат нормално разпределение N(m(j), y2) със същата дисперсия.

Проверка на еднаквостта на качеството на продукта, т.е. липса на влияние на номера на машината върху качеството на продукта, се свежда до проверка на хипотезата

H0: m(1) = m(2) = … = m(k).

В дисперсионния анализ са разработени методи за тестване на такива хипотези.

Хипотезата H0 се тества спрямо алтернативната хипотеза H1, според която поне едно от посочените равенства не е изпълнено. Проверката на тази хипотеза се основава на следното "разлагане на дисперсии", посочено от R.A. Fisher:

където s2 е дисперсията на извадката в сборната извадка, т.е.

Така първият член от дясната страна на формула (7) отразява вътрешногруповата дисперсия. И накрая, междугруповата дисперсия,

Областта на приложната статистика, свързана с разширенията на дисперсията от типа на формулата (7), се нарича анализ на дисперсията. Като пример за проблем с дисперсията, помислете за тестване на горната хипотеза H0 при предположението, че резултатите от измерването са независими и във всяка проба имат нормално разпределение N(m(j), y2) със същата дисперсия. Ако H0 е вярно, първият член от дясната страна на формула (7), разделен на y2, има разпределение хи-квадрат с k(n-1) степени на свобода, а вторият член, разделен на y2, също има разпределение хи-квадрат, но с (k-1) степени на свобода, а първият и вторият член са независими като случайни променливи. Така че случайната променлива

има разпределение на Фишер с (k-1) степени на свобода числител и k(n-1) степени на свобода знаменател. Хипотезата H0 се приема, ако F< F1-б, и отвергается в противном случае, где F1-б - квантиль порядка 1-б распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н1 величина F безгранично увеличивается при росте объема выборок n. Значения F1-б берут из соответствующих таблиц.

Разработени са непараметрични методи за решаване на класически проблеми на дисперсионния анализ, по-специално тестване на хипотезата H0.

Следващият тип задачи за многомерен статистически анализ са проблемите с класификацията. Те се разделят основно на три различен вид- дискриминантен анализ, клъстерен анализ, проблеми с групирането.

Задачата на дискриминантния анализ е да намери правило за приписване на наблюдаван обект към един от описаните по-горе класове. В този случай обектите се описват в математически модел с помощта на вектори, чиито координати са резултат от наблюдение на редица характеристики за всеки обект. Класовете се описват или директно в математически термини, или с помощта на обучителни проби. Учебен образец е образец, за всеки елемент от който е посочено към кой клас принадлежи.

...

Подобни документи

    История на иконометрията и приложната статистика. Приложна статистика в народното стопанство. точки на растеж. Непараметрична статистика. Статистиката на обекти с нечислов характер е част от приложната статистика.

    резюме, добавено на 01/08/2009

    Структурни компоненти на детерминирания компонент. Основната цел на статистическия анализ на динамичните редове. Екстраполативно прогнозиране икономически процеси. Идентифициране на аномални наблюдения, както и изграждане на модели на времеви редове.

    курсова работа, добавена на 03/11/2014

    Статистически модели за вземане на решения. Описание на модели с известно вероятностно разпределение на състоянието на околната среда. Разглеждане най-простата схемадинамичен процес на вземане на решения. Извършване на изчисляване на вероятността от промяна на предприятието.

    контролна работа, добавена на 07.11.2011 г

    Статистически методи за анализ на едномерни времеви редове, решаване на задачи за анализ и прогнозиране, построяване на графиката на изследвания показател. Критерии за идентифициране на компонентите на серията, тестване на хипотезата за случайността на серията и стойностите на стандартните грешки.

    контролна работа, добавена на 13.08.2010 г

    Ролята на статистическите методи за обективна оценка на количествените и качествени характеристики на управленския процес. Използване на инструменти за качество при анализа на процесите и параметрите на продукта. Дискретни случайни променливи. Теория на вероятностите.

    курсова работа, добавена на 11.01.2015 г

    Математическа теория за вземане на оптимални решения. Табличен симплекс метод. Постановка и решение на двойствения проблем линейно програмиране. Математически модел на транспортната задача. Анализ на осъществимостта на производството на продукти в предприятието.

    контролна работа, добавена на 13.06.2012 г

    Обща, селективна популация. Методологични основи на вероятностно-статистическия анализ. Функции на MathCad, предназначени да решават проблеми на математическата статистика. Решаване на задачи в MS Excel с помощта на формули и използване на менюто "Анализ на данни".

    курсова работа, добавена на 20.01.2014 г

    Изчисляване на размера на разходите за производствения план. Коефициенти на линейното уравнение на двойната регресия. Характеристики на графичната интерпретация на резултатите. Развитие на икономическите процеси. Характеристики на иконометричното моделиране на времеви редове.

    тест, добавен на 22.02.2011 г

    Основни елементи на иконометричния анализ на динамичните редове. Задачи за анализ и първоначалната им обработка. Решаване на задачи за краткосрочно и средносрочно прогнозиране на стойностите на динамичните редове. Методи за намиране на параметрите на уравнението на тренда. Метод на най-малките квадрати.

    контролна работа, добавена на 03.06.2009 г

    Елементарни понятия за случайни събития, величини и функции. Числени характеристики на случайни величини. Видове асиметрия на разпределенията. Статистическа оценка на разпределението на случайни величини. Решаване на задачи за структурно-параметрична идентификация.

Аналитичните методи се основават на работата на мениджъра с редица аналитични зависимости. Които определят връзката между условията на изпълняваната задача и нейния резултат под формата на формули, графики и др.

Статистически методи, базирани на използването на информация за миналото добър опитпри проектирането на приемането на SD. Тези методи се прилагат чрез събиране, обработка, анализ на статистически данни с помощта на статично моделиране. Такива методи могат да се използват както на етапа на разработка, така и на етапа на избор на решение.

Математически методи, те ви позволяват да изчислите най-доброто решение според оптималните критерии. За целта в компютъра се въвежда необходимата ситуация, въвеждат се целта и критериите. Компютър, базиран на математическа връзка, или разработва нова, или избира подходяща.

18 Активиращи методи за вземане на управленски решения

Мозъчната атака е метод за групово обсъждане на проблем, основан на неаналитично мислене.

1) Етапът на генериране на идеи е отделен от етапа на критика;

2) На етапа на генериране на идеи всякаква критика е забранена; приемат се абсурдни идеи.

3) Всички идеи се записват в писмен вид;

4) На този етап критиците избират 3-4 идеи, които могат да се считат за алтернативни.

Методът "Въпроси и отговори" се основава на предварителното съставяне на набор от въпроси, чиито отговори могат да формират нов подходза решаване на проблема.

Метод "5 защо"

Пет "защо?" е ефективен инструмент, който използва въпроси, за да изследва причинно-следствените връзки, лежащи в основата на определен проблем, да идентифицира причинно-следствените фактори и да идентифицира първопричината. Разглеждайки логиката в посока „Защо?“, ние постепенно разкриваме цялата верига от последователно взаимосвързани причинно-следствени фактори, които влияят на проблема.

План за действие

Определете конкретния проблем, който трябва да бъде разрешен.

Постигнете съгласие относно формулировката на разглеждания проблем.

Когато търсите решение на проблем, трябва да започнете от крайния резултат (проблем) и да работите назад (към първопричината), като питате защо възниква проблемът.

Напишете отговора под задачата.

Ако отговорът не разкрива основната причина за проблема, задайте отново въпроса „Защо?“ и напишете нов отговор по-долу.

Въпросът "Защо?" трябва да се повтаря, докато не стане ясна основната причина за проблема.

Ако отговорът решава проблема и групата е съгласна с него, се взема решение, като се използва отговорът.

„Методът на теорията на игрите“ се основава на създаването на система човек-машина за разработване на решения. Традиционните срещи бяха предшественик. Обикновено на такива срещи, икономически, социални. И специализирани решения. Интересите на участниците често са различни, а кръгът от въпроси – широк. Качествено развитие на методологията на срещите беше въвеждането на процеса на разработка на SD, изкуствен интелект под формата на компютърен модел.

Компютърният модел на организацията включва:

1) Справочни данни (за доставчици, потребители);

2) Симулационни модели на фирмата

3) Методи за икономическо изчисляване и прогнозиране

4) Информация за решения в подобни ситуации.

В резултат на това срещите са по-продуктивни. Такава среща може да бъде в няколко сесии на играта: където в 1 сесия всички участници въвеждат своите изисквания, след обработка на компютъра. Издава определено решение, което може да бъде обсъдено и коригирано отново. Това може да продължи до вземане на общо решение или до отказ на решение.

според какъв вид данни са "на входа":

2.1. Числа.

2.2. Крайномерни вектори.

2.3. Функции (времеви редове).

2.4. Обекти с нечислова природа.

Най-интересна е класификацията според онези задачи на контролинга, за чието решаване се използват иконометрични методи. С този подход могат да се разпределят блокове:

3.1. Поддръжка за прогнозиране и планиране.

3.2. Проследяване контролирани параметрии откриване на отклонения.

3.3. поддържа вземане на решение, и т.н.

Какви фактори определят честотата на използване на определени инструменти за иконометричен контрол? Както при другите приложения на иконометрията, има две основни групи фактори – това са задачите, които трябва да се решат и квалификацията на специалистите.

При практическото приложение на иконометричните методи в работата на контролера е необходимо използването на подходящи софтуерни системи. Общи статистически системи като SPSS, Statgraphics, Statistica, ADDA, и по-специализирани Statcon, SPC, NADIS, REST(според статистиката на интервалните данни), Matrixerи много други. Масово приемане на лесен за използване софтуерни продукти, които включват съвременни иконометрични инструменти за анализ на конкретни икономически данни, могат да се разглеждат като един от ефективни начиниускоряване на научно-техническия прогрес, разпространение на съвременни иконометрични знания.

Иконометрията непрекъснато се развива. Приложните изследвания водят до необходимостта от по-задълбочен анализ на класическите методи.

Добър пример за обсъждане са методите за тестване на хомогенността на две проби. Има два агрегата и е необходимо да се реши дали са различни или еднакви. За целта от всеки от тях се взема проба и се използва един или друг статистически метод за проверка на хомогенността. Преди около 100 години е предложен методът на Стюдънт, който се използва широко днес. Той обаче има цял куп недостатъци. Първо, според Студент, извадковите разпределения трябва да са нормални (по Гаус). По правило това не е така. Второ, той е насочен към проверка не на хомогенността като цяло (така наречената абсолютна хомогенност, т.е. съвпадението на функциите на разпределение, съответстващи на две популации), а само на проверка на равенството на математическите очаквания. Но, трето, по необходимост се приема, че дисперсиите за елементите на двете проби са еднакви. Въпреки това проверката на равенството на дисперсиите и още повече на нормалността е много по-трудна от равенството на математическите очаквания. Следователно t-тестът на Стюдънт обикновено се прилага без извършване на такива проверки. И тогава изводите по критерия на Студента увисват във въздуха.

По-напреднали в теорията, експертите се обръщат към други критерии, например към критерия на Уилкоксън. Той е непараметричен, т.е. не разчита на предположението за нормалност. Но той не е без недостатъци. Не може да се използва за проверка на абсолютна хомогенност (съвпадение на функции на разпределение, съответстващи на две популации). Това може да стане само с помощта на т.нар. последователни критерии, по-специално критериите на Смирнов и типа омега-квадрат.

От практическа гледна точка критерият на Смирнов има недостатък - статистиката му приема само малък брой стойности, разпределението му е концентрирано в малък брой точки и не е възможно да се използват традиционните нива на значимост от 0,05 и 0,01 .

Терминът "високи статистически технологии". В термина "високи статистически технологии" всяка от трите думи носи собствено значение.

„Високо“, както и в други области, означава, че технологията се основава на съвременните постижения в теорията и практиката, по-специално на теорията на вероятностите и приложната математическа статистика. В същото време „въз основа на съвременни научни постижения“ означава, първо, че математическата основа на технологията в рамките на съответната научна дисциплина е получена сравнително наскоро, и второ, че алгоритмите за изчисление са разработени и обосновани в съответствие с него (и не са т.нар. „евристични“). С течение на времето, ако новите подходи и резултати не ни принудят да преразгледаме оценката за приложимостта и възможностите на технологията, да я заменим с по-модерна, "високата иконометрична технология" се превръща в "класическа статистическа технология". Като метод на най-малките квадрати. И така, високите статистически технологии са плод на последните сериозни научно изследване. Ето две ключови понятия- "младостта" на технологиите (във всеки случай не по-стари от 50 години, или по-добре - не по-стари от 10 или 30 години) и разчитане на "висока наука".

Терминът "статистически" е познат, но има много конотации. Известни са повече от 200 дефиниции на термина "статистика".

И накрая, терминът "технология" се използва относително рядко по отношение на статистиката. Анализът на данните, като правило, включва редица процедури и алгоритми, изпълнявани последователно, паралелно или в по-сложна схема. По-специално могат да се разграничат следните типични етапи:

  • планиране на статистическо изследване;
  • организиране на събирането на данни според оптимална или поне рационална програма (планиране на проби, създаване организационна структураи подбор на екип от специалисти, обучение на персонал, който ще се занимава със събиране на данни, както и администратори на данни и др.);
  • директно събиране на данни и тяхното фиксиране на различни носители (с контрол на качеството на събирането и отхвърляне на грешни данни по причини на предметната област);
  • първично описание на данните (изчисляване на различни характеристики на извадката, функции на разпределение, непараметрични оценки на плътността, изграждане на хистограми, корелационни полета, различни таблици и диаграми и др.),
  • оценка на определени числени или нечислови характеристики и параметри на разпределенията (например непараметрична интервална оценка на коефициента на вариация или възстановяване на връзката между отговора и факторите, т.е. оценка на функцията),
  • тестване на статистически хипотези (понякога техните вериги - след тестване на предишната хипотеза се взема решение за проверка на една или друга последваща хипотеза),
  • по-задълбочено проучване, т.е. използването на различни алгоритми за многомерен статистически анализ, диагностични и класификационни алгоритми, статистика на нечислови и интервални данни, анализ на времеви редове и др.;
  • проверка на стабилността на получените оценки и заключения по отношение на допустимите отклонения на първоначалните данни и предположенията на използваните вероятностно-статистически модели, допустимите трансформации на измервателните скали, по-специално изследването на свойствата на оценките по метода на извадково умножение;
  • прилагане на получените статистически резултати за приложни цели (например за диагностициране на конкретни материали, правене на прогнози, избор на инвестиционен проектот предложените варианти, намиране на оптималния режим за изпълнение на технологичния процес, обобщаване на резултатите от изпитване на образци на технически устройства и др.),
  • изготвяне на финални доклади, по-специално предназначени за тези, които не са специалисти по иконометрични и статистически методи за анализ на данни, включително за мениджмънт - "вземащи решения".

Възможно е и друго структуриране на статистическите технологии. Важно е да се подчертае, че квалифицираното и ефикасно прилагане на статистически методи в никакъв случай не е тестване на една единствена статистическа хипотеза или оценка на параметрите на едно дадено разпределение от фиксирано семейство. Операции от този вид са само тухлите, които изграждат сградата на статистическата технология. В същото време учебниците и монографиите по статистика и иконометрия обикновено говорят за отделни градивни елементи, но не обсъждат проблемите на тяхната организация в технология, предназначена за приложна употреба. Преходът от една статистическа процедура към друга остава в сянка.

Проблемът с "съвпадението" на статистическите алгоритми изисква специално внимание, тъй като използването на предишния алгоритъм често нарушава условията за приложимост на следващия. По-специално, резултатите от наблюденията могат да престанат да бъдат независими, тяхното разпределение може да се промени и т.н.

Например, когато се тестват статистически хипотези, нивото на значимост и мощност са от голямо значение. Методите за тяхното изчисляване и използването им за проверка на една хипотеза обикновено са добре известни. Ако първо се тества една хипотеза и след това, като се вземат предвид резултатите от нейната проверка, втората, тогава крайната процедура, която може да се разглежда и като тестване на някои (по-сложни) статистически хипотези, има характеристики (ниво на значимост и мощност ), които по правило не могат лесно да се изразят по отношение на характеристиките на двете компонентни хипотези и следователно те обикновено са неизвестни. В резултат на това крайната процедура не може да се счита за научно обоснована, тя принадлежи към евристични алгоритми. Разбира се, след подходящо изследване, например по метода Монте Карло, това може да се превърне в една от научно обоснованите процедури на приложната статистика.

И така, процедурата за анализ на иконометрични или статистически данни е информационна технологичен процес с други думи, тази или онази информационна технология. В момента не би било сериозно да се говори за автоматизиране на целия процес на анализ на иконометрични (статистически) данни, тъй като има твърде много нерешени проблеми, които предизвикват дискусии сред специалистите.

Целият арсенал от използвани в момента статистически методи може да бъде разделен на три потока:

  • високи статистически технологии;
  • класически статистически технологии,
  • ниски статистически технологии.

Необходимо е да се гарантира, че само първите два вида технологии се използват в конкретни изследвания.. В същото време под класически статистически технологии разбираме технологии на вековна възраст, запазили своята научна стойност и значение за съвременната статистическа практика. Това са метод на най-малките квадрати, статистика на Колмогоров, Смирнов, омега-квадрат, непараметрични коефициенти на корелация на Спирман и Кендъл и много други.

Имаме порядък по-малко иконометристи, отколкото в Съединените щати и Великобритания (Американската статистическа асоциация включва повече от 20 000 членове). Русия се нуждае от обучение на нови специалисти - иконометристи.

Каквито и нови научни резултати да се получат, ако те останат непознати за студентите, тогава ново поколение изследователи и инженери са принудени да ги овладеят, действайки самостоятелно, или дори да ги преоткрият. Донякъде грубо можем да кажем това: онези подходи, идеи, резултати, факти, алгоритми, които попаднаха в курсове за обучениеи свързани учебни ръководства- се запазват и използват от потомци, тези, които не са получили - изчезват в праха на библиотеките.

Точки на растеж. Разпределете пет сегашните тенденции, в който се развива съвременна приложна статистика, т.е. пет "точки на растеж": непараметричност, устойчивост, първоначално зареждане, интервална статистика, статистика на обекти с нечислов характер. Нека обсъдим накратко тези текущи тенденции.

Непараметричните или непараметричните статистики ви позволяват да правите статистически заключения, да оценявате характеристиките на разпределението, да тествате статистически хипотези без слабо обосновани предположения, че функцията на разпределение на елементите на извадката е включена в едно или друго параметрично семейство. Например, има широко разпространено убеждение, че статистиката често следва нормално разпределение. Въпреки това, анализът на конкретните резултати от наблюденията, по-специално на грешките при измерване, показва, че в преобладаващата част от случаите реалните разпределения се различават значително от нормалните. Безкритичното използване на хипотезата за нормалност често води до значителни грешки, например при отхвърляне на отклонения от наблюденията (извънредности), при статистически контрол на качеството и в други случаи. Поради това е целесъобразно да се използват непараметрични методи, при които се налагат само много слаби изисквания към функциите на разпределение на резултатите от наблюденията. Обикновено се предполага само тяхната непрекъснатост. Към днешна дата с помощта на непараметрични методи е възможно да се реши почти същата гама от проблеми, които преди това бяха решени с параметрични методи.

Основната идея на работите върху устойчивостта (стабилността): заключенията трябва да се променят малко с малки промени в първоначалните данни и отклонения от предположенията на модела. Тук има две области на безпокойство. Едната е да се проучи устойчивостта на общите алгоритми за анализ на данни. Второто е търсенето на стабилни алгоритми за решаване на определени проблеми.

Сам по себе си терминът "устойчивост" няма еднозначно значение. Винаги е необходимо да се посочи конкретен вероятностно-статистически модел. В същото време моделът на "запушване" на Tukey-Huber-Hampel обикновено не е практически полезен. Тя е ориентирана към „претегляне на опашките“, а в реални ситуации „опашките се отрязват“ чрез априорни ограничения върху резултатите от наблюденията, свързани например с използваните измервателни уреди.

Bootstrap е клон на непараметрична статистика, базиран на интензивното използване на информационни технологии. Основната идея е "умножаване на пробите", т.е. в получаването на набор от много проби, наподобяващи този, получен в експеримента. Този набор може да се използва за оценка на свойствата на различни статистически процедури. Най-простият начин"възпроизвеждане на извадката" се състои в изключването от нея на един резултат от наблюдението. Изключваме първото наблюдение, получаваме извадка, подобна на оригиналната, но с обем, намален с 1. След това връщаме изключения резултат от първото наблюдение, но изключваме второто наблюдение. Получаваме втора проба, подобна на оригиналната. След това връщаме резултата от второто наблюдение и т.н. Има и други начини за "умножаване на проби". Например, възможно е да се изгради една или друга оценка на функцията на разпределение от първоначалната извадка и след това, използвайки метода на статистическите тестове, да се моделира серия от извадки от елементи, в приложната статистика е извадка, т.е. набор от независими еднакво разпределени произволни елементи. Каква е природата на тези елементи? В класическата математическа статистика елементите на извадката са числа или вектори. А в нечисловата статистика елементите на извадката са обекти с нечислова природа, които не могат да се събират и умножават с числа. С други думи, обекти с нечислова природа лежат в пространства, които нямат векторна структура.