आणि "फक्त खोटे" आणि "निरपेक्ष खोटे" नंतर, बेंजामिन डिझरायली, जे ग्रेट ब्रिटनचे चाळीसावे आणि चाळीसावे (कालावधी 19व्या शतकाच्या उत्तरार्धात येतात) पंतप्रधान होते. तथापि, आमच्या काळात, मार्क ट्वेनने जाहिरात केलेल्या डिझरायलीचे लेखकत्व नाकारले जाते. परंतु, असे होऊ शकते की, बरेच तज्ञ त्यांच्या कामात या वाक्यांशाची पुनरावृत्ती करत आहेत किंवा त्यातील मुख्य सामग्री सांख्यिकीय विश्लेषणाच्या पद्धती आहे. नियमानुसार, हे विनोदासारखे वाटते, ज्यामध्ये विनोदाचा फक्त एक अंश आहे ...
सांख्यिकी ही विशिष्ट ज्ञानाची एक शाखा आहे जी गुणात्मक आणि परिमाणवाचक अशा दोन्ही प्रकारच्या डेटाचे संकलन, विश्लेषण आणि व्याख्या करण्याच्या प्रक्रियेचे वर्णन करते. हे जीवनाच्या विविध वैज्ञानिक किंवा व्यावहारिक क्षेत्रांशी संबंधित आहे. उदाहरणार्थ, उपयोजित आकडेवारी विश्लेषणासाठी सर्व प्रकारच्या डेटावर प्रक्रिया करण्यासाठी योग्य सांख्यिकीय पद्धत निवडण्यास मदत करते. गुन्ह्यांच्या क्षेत्रात कायदेशीर कार्य आणि त्यांच्यावर नियंत्रण. मॅथेमॅटिकल अशा गणितीय पद्धती विकसित करते ज्या तुम्हाला व्यावहारिक किंवा वैज्ञानिक हेतूंसाठी प्राप्त माहिती पद्धतशीर आणि वापरण्याची परवानगी देतात. लोकसंख्याशास्त्र नमुन्यांची वर्णने क्वेरी आकडेवारी भाषाशास्त्रज्ञ आणि इंटरनेट बद्दल अधिक आहेत.
सांख्यिकीय पद्धतींचा वापर इ.स.पूर्व 5 व्या शतकापर्यंतचा आहे. सुरुवातीच्या नोंदींपैकी एकामध्ये इसवी सन 9व्या शतकात लिहिलेले पुस्तक आहे. e अरब तत्वज्ञानी, चिकित्सक, गणितज्ञ आणि संगीतकार अल-किंडी. त्याने दिले तपशीलवार वर्णनवारंवारता विश्लेषण (हिस्टोग्राम) कसे वापरावे. नवीन इतिहास, 14 व्या शतकातील आणि फ्लॉरेन्सच्या इतिहासाचे वर्णन करणारे, इतिहासातील आकडेवारीच्या पहिल्या सकारात्मक कामांपैकी एक मानले जाते. ते फ्लोरेंटाईन बँकर जिओव्हानी विलानी यांनी संकलित केले होते आणि लोकसंख्या, सरकार, वाणिज्य आणि व्यापार, शिक्षण आणि धार्मिक स्थळांबद्दल बरीच माहिती समाविष्ट करते.
लोकसंख्याशास्त्रीय आणि आर्थिकदृष्ट्या सुदृढ धोरण तयार करण्याच्या राज्याच्या इच्छेनुसार आकडेवारीचा लवकर वापर निश्चित केला जातो. सर्वसाधारणपणे डेटाचे संकलन आणि विश्लेषण समाविष्ट करण्यासाठी 19व्या शतकाच्या सुरुवातीला त्याची व्याप्ती वाढवण्यात आली. आज, ज्ञानाचे हे क्षेत्र सरकारी संस्था, व्यवसाय, नैसर्गिक आणि सामाजिक विज्ञानांद्वारे मोठ्या प्रमाणावर वापरले जाते. त्याचा गणितीय पाया, ज्याची गरज जुगाराच्या अभ्यासातून निर्माण झाली होती, 17 व्या शतकात फ्रेंच गणितज्ञ आणि पियरे डी फर्मॅट यांनी संभाव्यता सिद्धांताच्या विकासासह घातली. 1794 च्या सुमारास कार्ल फ्रेडरिक गॉस यांनी प्रथम सांख्यिकीचे वर्णन केले.
20 व्या शतकाच्या उत्तरार्धापासून संगणकीय शक्तीच्या वेगवान आणि स्थिर वाढीचा लागू आकडेवारीच्या विकासावर महत्त्वपूर्ण परिणाम झाला आहे. संगणक क्रांतीने त्याच्या प्रायोगिक आणि अनुभवजन्य घटकांवर नवीन भर दिला आहे. आता मोठ्या संख्येने सामान्य आणि विशेष कार्यक्रम उपलब्ध आहेत ज्याद्वारे तुम्ही कोणत्याही सांख्यिकीय पद्धतीचा वापर सहजपणे करू शकता, मग ते नियंत्रण तक्ते, हिस्टोग्राम, चेकलिस्ट, स्तरीकरण पद्धत, इशिकावा चार्ट किंवा पॅरेटो विश्लेषण असो.
आज सांख्यिकी हे आचारसंहितेचे प्रमुख साधन आहे कार्यक्षम व्यवसायआणि उत्पादन संस्था. हे तुम्हाला परिवर्तनशीलतेतील ट्रेंड समजून घेण्यास आणि मापन करण्यास अनुमती देते, परिणामी प्रक्रिया नियंत्रण सुधारते, तसेच उत्पादन आणि सेवा गुणवत्ता सुधारते. म्हणून, उदाहरणार्थ, सांख्यिकीय गुण वापरणारे व्यवस्थापक, नियमानुसार, माहितीपूर्ण निर्णय घेतात, ज्यामुळे व्यवस्थापन कार्यक्षमतेने कार्य करते आणि अपेक्षित परिणाम आणते. म्हणूनच, या प्रकरणातील आकडेवारी हे मुख्य आणि कदाचित एकमेव विश्वसनीय साधन आहे.
सांख्यिकीय पद्धत निवडण्याची आणि योग्यरित्या लागू करण्याची क्षमता आपल्याला विश्वासार्ह निष्कर्ष प्राप्त करण्यास आणि विश्लेषण डेटा प्रदान केलेल्या लोकांची दिशाभूल करू शकत नाही. म्हणून, खोटेपणाच्या 3 अंशांबद्दल जुन्या विधानाच्या तज्ञांनी वारंवार केलेला उल्लेख चुकीच्या विरूद्ध चेतावणी मानला पाहिजे ज्यामुळे दिशाभूल होऊ शकते आणि विनाशकारी परिणामांसह निर्णयांचा आधार बनू शकतो.
पान 1
जोखीम अंतर्गत निर्णय घेण्याच्या सांख्यिकीय पद्धती.
आर्थिक जोखमीचे विश्लेषण करताना, त्याचे गुणात्मक, परिमाणवाचक आणि कायदेशीर पैलू विचारात घेतले जातात. जोखमीच्या संख्यात्मक अभिव्यक्तीसाठी, एक विशिष्ट गणितीय उपकरण वापरले जाते.
यादृच्छिक व्हेरिएबलला आपण व्हेरिएबल म्हणतो, जे यादृच्छिक घटकांच्या प्रभावाखाली, विशिष्ट संभाव्यतेसह, संख्यांच्या विशिष्ट संचामधून विशिष्ट मूल्ये घेऊ शकतात.
अंतर्गत संभाव्यताकाही घटना (उदाहरणार्थ, यादृच्छिक व्हेरिएबलने एक विशिष्ट मूल्य घेतले आहे या वस्तुस्थितीचा समावेश असलेली घटना) सहसा या घटनेला अनुकूल असलेल्या परिणामांच्या संख्येचे प्रमाण समजले जाते. एकूण संख्याशक्य तितकेच संभाव्य परिणाम. रँडम व्हेरिएबल्स अक्षरांद्वारे दर्शविले जातात: X, Y, ξ, R, Ri, x ~, इ.
जोखीम (जोखमीची डिग्री) च्या परिमाणाचे मूल्यांकन करण्यासाठी, खालील निकषांवर लक्ष केंद्रित करूया.
1. रँडम व्हेरिएबलची गणितीय अपेक्षा (सरासरी मूल्य).
एका वेगळ्या यादृच्छिक चल X ची गणितीय अपेक्षा सूत्राद्वारे आढळते
जेथे xi ही यादृच्छिक व्हेरिएबलची मूल्ये आहेत; pi या संभाव्यता आहेत ज्यासह ही मूल्ये स्वीकारली जातात.
सतत यादृच्छिक चल X ची गणितीय अपेक्षा सूत्राद्वारे आढळते
जेथे f(x) ही यादृच्छिक व्हेरिएबलच्या मूल्यांची वितरण घनता आहे.
2. यादृच्छिक व्हेरिएबलचे फैलाव (भिन्नता) आणि मानक विचलन.
फैलाव म्हणजे त्याच्या सरासरी मूल्याभोवती यादृच्छिक व्हेरिएबलच्या मूल्यांचे फैलाव (स्कॅटर) प्रमाण. यादृच्छिक व्हेरिएबलचे भिन्नता आणि मानक विचलन अनुक्रमे सूत्रांद्वारे आढळतात:
मानक विचलन यादृच्छिक व्हेरिएबलच्या भिन्नतेच्या मुळाशी समान आहे
3. भिन्नतेचे गुणांक.
यादृच्छिक व्हेरिएबलच्या भिन्नतेचे गुणांक- यादृच्छिक व्हेरिएबलच्या सापेक्ष प्रसाराचे मोजमाप; या प्रमाणाच्या सरासरी मूल्याचे किती प्रमाण हे त्याचा सरासरी प्रसार दर्शविते.
गुणोत्तर समान प्रमाणित विचलनकरण्यासाठी गणितीय अपेक्षा.
भिन्नतेचे गुणांक व्ही एक आकारहीन प्रमाण आहे. त्याच्या मदतीने, आपण मोजमापाच्या वेगवेगळ्या युनिट्समध्ये व्यक्त केलेल्या चिन्हांच्या चढउतारांची तुलना देखील करू शकता. भिन्नतेचे गुणांक 0 ते 100% पर्यंत बदलते. गुणांक जितका मोठा, तितकी अस्थिरता मजबूत. खालील स्थापित केले गुणात्मक मूल्यांकनभिन्नतेच्या गुणांकाची भिन्न मूल्ये: 10% पर्यंत - कमकुवत चढ-उतार, 10-25% - मध्यम चढ-उतार, 25% पेक्षा जास्त - उच्च चढ-उतार.
जोखीम मूल्यांकनाच्या या पद्धतीसह, i.e. फैलाव, मानक विचलन आणि भिन्नतेच्या गुणांकाच्या गणनेवर आधारित, केवळ विशिष्ट व्यवहाराच्या जोखमीचेच नव्हे तर संपूर्णपणे (त्याच्या उत्पन्नाच्या गतिशीलतेचे विश्लेषण करून) एका विशिष्ट व्यवहाराच्या जोखमीचे मूल्यांकन करणे शक्य आहे. कालावधी.
उदाहरण १रूपांतरणाच्या दरम्यान, एंटरप्राइझ नवीन ब्रँडचे उत्पादन स्थापित करते वाशिंग मशिन्सलहान खंड. त्याच वेळी, दरम्यान एक अपुरा अभ्यास विक्री बाजार माध्यमातून संभाव्य अडथळे विपणन संशोधन. उत्पादनांच्या मागणीबाबत कृतीसाठी संभाव्य तीन पर्याय (रणनीती). या प्रकरणात, बीट्स अनुक्रमे 700, 500 आणि -300 दशलक्ष krb असतील. (अतिरिक्त नफा). या धोरणांच्या संभाव्यता आहेत:
पी 1 =0.4; आर 2 =0.5; पी ३ = ०.१.
जोखमीची अपेक्षित रक्कम निश्चित करा, उदा. नुकसान
उपाय.आम्ही सूत्र (1.2) वापरून जोखीम मूल्याची गणना करतो. सूचित करा
एक्स 1 = 700; एक्स जी = 500; एक्स जी = -300. मग
ला\u003d M (X) \u003d 700 * 0.4 + 500 * 0.5 + (-300) * 0.1 \u003d 280 + 250-30 \u003d 500
उदाहरण2. समान अपेक्षित उत्पन्न (150 दशलक्ष krb.) सह दोन ग्राहक वस्तूंचे उत्पादन आणि विक्री निवडण्याची संधी आहे. मार्केटिंग विभागाच्या मते, ज्याने कोनाडा बाजार सर्वेक्षण केले, पहिल्या संचाच्या मालाचे उत्पादन आणि विक्रीतून मिळणारे उत्पन्न विशिष्ट संभाव्यतेवर अवलंबून असते. आर्थिक परिस्थिती. संभाव्य दोन समान संभाव्य परतावा:
200 दशलक्ष UAH वस्तूंच्या पहिल्या संचाच्या यशस्वी अंमलबजावणीच्या अधीन
100 दशलक्ष रिव्निया, जेव्हा परिणाम कमी यशस्वी होतात.
मालाच्या दुसऱ्या संचाच्या विक्रीतून मिळणारे उत्पन्न 151 दशलक्ष रिव्निया असू शकते, परंतु या उत्पादनांची मागणी कमी असण्याची शक्यता आहे, जेव्हा उत्पन्न फक्त 51 दशलक्ष krb असेल.
विचारात घेतलेल्या निवडीचे परिणाम आणि विपणन विभागाकडून मिळालेल्या त्यांच्या संभाव्यता सारणीमध्ये सारांशित केल्या आहेत.
वस्तूंच्या उत्पादन आणि विक्रीच्या पर्यायांची तुलना
वस्तूंचे उत्पादन आणि विक्रीसाठी पर्याय |
निकाल १ |
निकाल २ |
||
संभाव्यता |
उत्पन्न 2 दशलक्ष UAH |
संभाव्यता Rі |
उत्पन्न 2 दशलक्ष UAH |
|
पहिला |
0,5 |
200 |
0,5 |
100 |
दुसरा |
0,99 |
151 |
0,01 |
51 |
जोखमीचे प्रमाण मोजणे आणि मालाच्या दोन संचांपैकी एक सोडण्याचा निर्णय घेणे आवश्यक आहे.
उपाय.द्वारे सूचित करा एक्समालाच्या पहिल्या संचाच्या उत्पादन आणि विक्रीतून मिळणारे उत्पन्न आणि Y द्वारे - दुसऱ्या वस्तूंच्या उत्पादन आणि विक्रीतून मिळणारे उत्पन्न.
चला प्रत्येक पर्यायासाठी गणितीय अपेक्षांची गणना करूया:
M(X) =एक्स 1 p,+एक्स 2 आर 2 = 200*0.5 + 100*0.5 = 150 (दशलक्ष रिव्निया)
मी(वाय) =y 1R1 + y 2 आर 2 =१५१*०.९९ + ५१*०.०१ = १५०(दशलक्ष UAH..)
लक्षात घ्या की दोन्ही पर्यायांमध्ये समान अपेक्षित परतावा आहे.
M(X) = M(वाय) = 150 (दशलक्ष UAH)तथापि, परिणामांची भिन्नता समान नाही. जोखीम मोजण्यासाठी आम्ही परिणामांचे फैलाव वापरतो.
मालाच्या पहिल्या संचासाठी, जोखीम मूल्य D x = (200-150) 2 *0.5(100-150) 2 *0.5= 2500, दुसऱ्या सेटसाठी
डी येथे = (151 -150) 2 *0.99+ (51 -150) 2 *0.01= 99.
ग्राहकोपयोगी वस्तूंच्या उत्पादन आणि विक्रीशी संबंधित जोखमीचे प्रमाण दुसऱ्या पर्यायापेक्षा पहिल्या पर्यायामध्ये जास्त असल्याने ला एक्स > के येथे , दुसरा पर्याय पहिल्यापेक्षा कमी धोकादायक आहे. जोखमीचे माप म्हणून रूट-मीन-स्क्वेअर विचलन घेतल्यास आपल्याला समान परिणाम मिळेल.
उदाहरण3 . मागील उदाहरणातील काही अटी बदलू. समजा पहिल्या प्रकारात उत्पन्न 10 दशलक्ष रिव्नियाने वाढले. प्रत्येक विचारात घेतलेल्या परिणामांसाठी, म्हणजे एक्स 1 = 210, एक्स 2 =110. उर्वरित डेटा अपरिवर्तित राहिला.
जोखमीचे परिमाण मोजणे आणि ग्राहकोपयोगी वस्तूंच्या दोन संचांपैकी एक सोडण्याचा निर्णय घेणे आवश्यक आहे.
उपाय.ग्राहकोपयोगी वस्तूंच्या उत्पादन आणि विक्रीसाठी पहिल्या पर्यायासाठी, उत्पन्नाचे अपेक्षित मूल्य M(X) = 160 आहे, भिन्नता D(X) = 2500 आहे. दुसऱ्या पर्यायासाठी, आम्हाला M(Y) = 150 मिळेल, अनुक्रमे, आणि डी(वाय) = 99.
येथे तुलना करणे कठीण आहे. परिपूर्ण निर्देशकफैलाव म्हणून, जोखीम K चे मोजमाप म्हणून भिन्नतेचे गुणांक घेऊन, सापेक्ष मूल्यांवर स्विच करणे उचित आहे
आमच्या बाबतीतआमच्याकडे आहे:
R Y =CV(X)= =50/160=0.31
RX=CV(Y)=9.9/150=0.07
कारण आर एक्स > आर वाय, तर दुसरा पर्याय पहिल्यापेक्षा कमी धोकादायक आहे.
लक्षात घ्या की सामान्य बाबतीत, समान परिस्थितींमध्ये (जेव्हा मी(वाय) (X), D(Y) > डी(एक्स)) एखाद्या व्यक्तीची (व्यवस्थापनाचा विषय) जोखीम पत्करण्याची प्रवृत्ती (अस्वस्थता) देखील विचारात घेतली पाहिजे. यासाठी उपयुक्तता सिद्धांताचे ज्ञान आवश्यक आहे.
कार्ये.
कार्य १.आमच्याकडे गुंतवणुकीसंदर्भात अ आणि ब असे दोन प्रकल्प आहेत. या प्रत्येक प्रकल्पातील उत्पन्नाच्या अंदाजित मूल्यांचे ज्ञात अंदाज आणि संबंधित संभाव्यता.
प्रकल्प ए.
प्रकल्प बी.
यापैकी प्रत्येक प्रकल्पाच्या जोखमीच्या प्रमाणात मूल्यांकन करणे आवश्यक आहे, त्यापैकी एक (जो कमी प्रमाणात जोखीम प्रदान करतो) गुंतवणूकीसाठी निवडणे आवश्यक आहे.
एक कार्य2
.
एम्ब्रॉयडरी टॉवेल्स आणि शर्ट्सच्या उत्पादनातून आणि निर्यातीतून सहकारी संस्थेला मिळालेल्या निर्यातीतून मिळणारे उत्पन्न (लाखो रूबलमध्ये) हे यादृच्छिक परिवर्तनशील X आहे. या स्वतंत्र मूल्याच्या वितरणाचा नियम तक्त्यामध्ये दिलेला आहे.
X=xi |
100+20*i |
400+30*i |
600+20*i |
900+10*i |
P(X=xi)=pi |
0.5 |
0.1 |
0.1 |
0.3 |
उत्पन्नाचे मानक विचलन म्हणून जोखमीचे माप निश्चित करा.
कार्य 3.
टेबल संभाव्य निव्वळ उत्पन्न आणि दोन गुंतवणूक पर्यायांसाठी त्यांची संभाव्यता दर्शवते. अपेक्षित परतावा आणि मानक विचलन, भिन्नता गुणांक यांच्या आधारावर कोणती गुंतवणूक करणे योग्य आहे ते ठरवा.
निव्वळ नफा, हजार UAH. |
||||||||
संभाव्यता: |
-3-i-j |
-2-i-j |
-1-i-j |
0+i+j |
1+i+j |
2+i+j |
3+i+j |
4+i+j |
गुंतवणूक १ |
0 |
0 |
0.1 |
0.2 |
0.3 |
0.2 |
0.2 |
0 |
गुंतवणूक 2 |
0.1 |
0.1 |
0.1 |
0.1 |
0.1 |
0.1 |
0.2 |
0.2 |
कार्य २.व्यावसायिक फर्म उत्पादन करते किरकोळलाइटर, जे ते चार पुरवठादारांकडून प्राप्त करतात, म्हणजे:
पहिल्यापासून -40% वस्तू, दुसऱ्या 25%, तिसऱ्या 15%, चौथ्या 20%, तिसऱ्या (7+i)%, चौथ्या (3+i)% मधून. सदोष उत्पादने शोधण्याशी संबंधित जोखमीचे प्रमाण निश्चित करा.
पान 1
ज्ञान बेस मध्ये आपले चांगले काम पाठवा सोपे आहे. खालील फॉर्म वापरा
विद्यार्थी, पदवीधर विद्यार्थी, तरुण शास्त्रज्ञ जे ज्ञानाचा आधार त्यांच्या अभ्यासात आणि कार्यात वापरतात ते तुमचे खूप आभारी असतील.
वर पोस्ट केले http://www.allbest.ru/
[मजकूर प्रविष्ट करा]
परिचय
1. निर्णय घेताना संभाव्यता सिद्धांत आणि गणितीय आकडेवारी
1.1 संभाव्यता आणि आकडेवारी कशी वापरली जाते
1.2 संभाव्यता सिद्धांत आणि गणितीय आकडेवारीची अनुप्रयोग उदाहरणे
1.3 मूल्यांकन उद्दिष्टे
1.4 "गणितीय आकडेवारी" म्हणजे काय
1.5 गणितीय आकडेवारीच्या इतिहासाबद्दल थोडक्यात
1.6 संभाव्य-सांख्यिकीय पद्धती आणि ऑप्टिमायझेशन
2. संभाव्य-सांख्यिकीय निर्णय घेण्याच्या विशिष्ट व्यावहारिक समस्या आणि त्यांचे निराकरण करण्याच्या पद्धती
2.1 आकडेवारी आणि लागू आकडेवारी
2.2 तांत्रिक प्रक्रिया आणि उत्पादनाच्या गुणवत्तेची अचूकता आणि स्थिरता यांच्या सांख्यिकीय विश्लेषणाची कार्ये
2.3 एक-आयामी आकडेवारीच्या समस्या (यादृच्छिक चलांची आकडेवारी)
2.4 बहुविविध सांख्यिकीय विश्लेषण
2.5 यादृच्छिक प्रक्रिया आणि वेळ मालिकेची आकडेवारी
2.6 संख्यात्मक नसलेल्या वस्तूंची आकडेवारी
3. आर्थिक समस्यांचे निराकरण करण्यासाठी संभाव्य-सांख्यिकीय निर्णय घेण्याच्या पद्धतींचा वापर
निष्कर्ष
संदर्भ
परिचय
संभाव्यता-सांख्यिकीय निर्णय घेण्याच्या पद्धती वापरल्या जातात जेव्हा घेतलेल्या निर्णयांची परिणामकारकता यादृच्छिक चल असलेल्या घटकांवर अवलंबून असते ज्यासाठी संभाव्यता वितरणाचे नियम आणि इतर सांख्यिकीय वैशिष्ट्ये ज्ञात असतात. शिवाय, प्रत्येक निर्णयामुळे अनेक संभाव्य परिणामांपैकी एक होऊ शकतो आणि प्रत्येक परिणामाची विशिष्ट संभाव्यता असते, ज्याची गणना केली जाऊ शकते. समस्या परिस्थितीचे वैशिष्ट्य दर्शविणारे संकेतक देखील संभाव्य वैशिष्ट्ये वापरून वर्णन केले आहेत. यादृच्छिक घटकांच्या सरासरी सांख्यिकीय वैशिष्ट्यांवर आधारित इष्टतम निर्णय निवडून, निर्णय घेणारा निर्णय घेणारा नेहमीच चुकीचा निकाल मिळण्याचा धोका असतो, ज्याचे त्याला मार्गदर्शन केले जाते, म्हणजेच जोखीम परिस्थितीत निर्णय घेतला जातो. .
व्यवहारात, संभाव्य आणि सांख्यिकीय पद्धती वापरल्या जातात जेव्हा नमुना डेटामधून काढलेले निष्कर्ष संपूर्ण लोकसंख्येमध्ये हस्तांतरित केले जातात (उदाहरणार्थ, नमुन्यापासून उत्पादनांच्या संपूर्ण बॅचमध्ये). तथापि, या प्रकरणात, प्रत्येक विशिष्ट परिस्थितीत, एखाद्याने प्रथम पुरेसा विश्वासार्ह संभाव्यता आणि सांख्यिकीय डेटा मिळविण्याच्या मूलभूत संभाव्यतेचे मूल्यांकन केले पाहिजे.
निर्णय घेताना संभाव्यता सिद्धांत आणि गणितीय आकडेवारीच्या कल्पना आणि परिणाम वापरताना, आधार हे एक गणितीय मॉडेल आहे ज्यामध्ये संभाव्यता सिद्धांताच्या संदर्भात वस्तुनिष्ठ संबंध व्यक्त केले जातात. संभाव्यता प्रामुख्याने यादृच्छिकतेचे वर्णन करण्यासाठी वापरली जाते जी निर्णय घेताना लक्षात घेतली पाहिजे. हे अवांछित संधी (जोखीम) आणि आकर्षक ("भाग्यवान संधी") या दोन्हींचा संदर्भ देते.
संभाव्य-सांख्यिकीय निर्णय घेण्याच्या पद्धतींचे सार म्हणजे नमुना वैशिष्ट्यांचा वापर करून अनुमान आणि परिकल्पना चाचणीवर आधारित संभाव्य मॉडेल्सचा वापर.
सैद्धांतिक मॉडेल्सवर आधारित निर्णय घेण्यासाठी नमुना वैशिष्ट्ये वापरण्याच्या तर्कामध्ये संकल्पनांच्या दोन समांतर मालिका - सिद्धांताशी संबंधित (संभाव्यतावादी मॉडेल) आणि सराव (निरीक्षण परिणामांचा नमुना) यांच्याशी संबंधित असलेल्या संकल्पनांचा एकाचवेळी वापर समाविष्ट आहे. उदाहरणार्थ, सैद्धांतिक संभाव्यता नमुन्यातून आढळलेल्या वारंवारतेशी संबंधित आहे. गणितीय अपेक्षा (सैद्धांतिक मालिका) नमुना अंकगणितीय सरासरी (व्यावहारिक मालिका) शी संबंधित आहे. नियमानुसार, नमुना वैशिष्ट्ये सैद्धांतिक वैशिष्ट्यांचे अंदाज आहेत.
या पद्धती वापरण्याच्या फायद्यांमध्ये घटनांच्या विकासासाठी आणि त्यांच्या संभाव्यतेसाठी विविध परिस्थिती विचारात घेण्याची क्षमता समाविष्ट आहे. या पद्धतींचा तोटा असा आहे की गणनेमध्ये वापरल्या जाणार्या परिस्थिती संभाव्यता सहसा सराव मध्ये प्राप्त करणे खूप कठीण असते.
विशिष्ट संभाव्य-सांख्यिकीय निर्णय घेण्याच्या पद्धतीच्या वापरामध्ये तीन टप्पे असतात:
आर्थिक, व्यवस्थापकीय, तांत्रिक वास्तवापासून अमूर्त गणितीय आणि सांख्यिकीय योजनेकडे संक्रमण, म्हणजे. नियंत्रण प्रणालीचे संभाव्य मॉडेल तयार करणे, तांत्रिक प्रक्रिया, निर्णय घेण्याची प्रक्रिया, विशेषतः सांख्यिकीय नियंत्रणाच्या परिणामांवर आधारित;
विचाराधीन परिमाण आणि त्यांच्यातील संबंध संभाव्यता सिद्धांताच्या संदर्भात व्यक्त केल्यास वास्तविक घटनेचे संभाव्य मॉडेल तयार मानले जावे. संभाव्य मॉडेलची पर्याप्तता सिद्ध केली जाते, विशेषतः, परिकल्पना तपासण्यासाठी सांख्यिकीय पद्धती वापरून.
गणितीय सांख्यिकी सामान्यत: सोडवल्या जाणार्या समस्यांच्या प्रकारानुसार तीन विभागांमध्ये विभागल्या जातात: डेटा वर्णन, अंदाज आणि गृहीतक चाचणी. सांख्यिकीय डेटाच्या प्रकारानुसार, गणितीय आकडेवारी चार भागात विभागली गेली आहे:
संभाव्य-सांख्यिकीय मॉडेल्स कधी वापरणे उचित आहे याचे उदाहरण.
कोणत्याही उत्पादनाची गुणवत्ता नियंत्रित करताना, उत्पादित उत्पादनांची बॅच स्थापित आवश्यकता पूर्ण करते की नाही हे ठरवण्यासाठी त्यातून एक नमुना घेतला जातो. नमुना नियंत्रणाच्या परिणामांवर आधारित, संपूर्ण बॅचबद्दल एक निष्कर्ष काढला जातो. या प्रकरणात, नमुन्याच्या निर्मितीमध्ये सब्जेक्टिव्हिटी टाळणे फार महत्वाचे आहे, म्हणजे नियंत्रित लॉटमधील उत्पादनाच्या प्रत्येक युनिटची नमुना निवडण्याची समान संभाव्यता असणे आवश्यक आहे. अशा परिस्थितीत लॉटवर आधारित निवड पुरेशी वस्तुनिष्ठ नाही. म्हणून, मध्ये काम परिस्थितीनमुन्यातील उत्पादन युनिट्सची निवड सहसा लॉटद्वारे केली जात नाही, परंतु यादृच्छिक संख्यांच्या विशेष सारण्यांद्वारे किंवा संगणक यादृच्छिक संख्या जनरेटरच्या मदतीने केली जाते.
गणितीय आकडेवारीच्या पद्धतींवर आधारित तांत्रिक प्रक्रियेच्या सांख्यिकीय नियमनात, प्रक्रियांच्या सांख्यिकीय नियंत्रणासाठी नियम आणि योजना विकसित केल्या जातात, ज्याचा उद्देश तांत्रिक प्रक्रियेच्या विकृतीचा वेळेवर शोध घेणे आणि त्यांना समायोजित करण्यासाठी उपाययोजना करणे आणि उत्पादनांचे प्रकाशन रोखणे हे आहे. स्थापित आवश्यकता पूर्ण करत नाहीत. या उपाययोजनांचे उद्दिष्ट उत्पादन खर्च आणि कमी दर्जाच्या उत्पादनांच्या पुरवठ्यातून होणारे नुकसान कमी करणे आहे. सांख्यिकीय स्वीकृती नियंत्रणासह, गणितीय आकडेवारीच्या पद्धतींवर आधारित, उत्पादन बॅचेसमधील नमुन्यांचे विश्लेषण करून गुणवत्ता नियंत्रण योजना विकसित केल्या जातात. संभाव्य-सांख्यिकीय निर्णय घेण्याचे मॉडेल योग्यरित्या तयार करण्यात सक्षम होण्यात अडचण आहे, ज्याच्या आधारे वर विचारलेल्या प्रश्नांची उत्तरे देणे शक्य आहे. गणितीय सांख्यिकीमध्ये, संभाव्य मॉडेल आणि परिकल्पना तपासण्याच्या पद्धती यासाठी विकसित केल्या गेल्या आहेत.
याव्यतिरिक्त, अनेक व्यवस्थापकीय, औद्योगिक, आर्थिक, राष्ट्रीय आर्थिक परिस्थितींमध्ये, भिन्न प्रकारच्या समस्या उद्भवतात - संभाव्यता वितरणाची वैशिष्ट्ये आणि पॅरामीटर्सचा अंदाज लावण्याच्या समस्या.
किंवा, तांत्रिक प्रक्रियेच्या अचूकता आणि स्थिरतेच्या सांख्यिकीय विश्लेषणामध्ये, नियंत्रित पॅरामीटरचे सरासरी मूल्य आणि विचाराधीन प्रक्रियेमध्ये त्याच्या प्रसाराची डिग्री यासारख्या गुणवत्ता निर्देशकांचे मूल्यांकन करणे आवश्यक आहे. संभाव्यतेच्या सिद्धांतानुसार, यादृच्छिक चलचे सरासरी मूल्य आणि प्रसाराचे सांख्यिकीय वैशिष्ट्य म्हणून भिन्नता, मानक विचलन किंवा भिन्नतेचे गुणांक म्हणून त्याची गणितीय अपेक्षा वापरणे उचित आहे. हे प्रश्न उपस्थित करते: नमुना डेटावरून या सांख्यिकीय वैशिष्ट्यांचा अंदाज कसा लावायचा आणि हे कोणत्या अचूकतेने केले जाऊ शकते? साहित्यात अशी अनेक उदाहरणे आहेत. हे सर्व दाखवतात की संभाव्यता सिद्धांत आणि गणितीय सांख्यिकी कशा प्रकारे वापरल्या जाऊ शकतात उत्पादन व्यवस्थापनसांख्यिकीय उत्पादन गुणवत्ता व्यवस्थापन क्षेत्रात निर्णय घेताना.
अनुप्रयोगाच्या विशिष्ट क्षेत्रांमध्ये, विस्तृत अनुप्रयोगाच्या संभाव्य-सांख्यिकीय पद्धती आणि विशिष्ट पद्धती वापरल्या जातात. उदाहरणार्थ, उत्पादन गुणवत्ता व्यवस्थापनाच्या सांख्यिकीय पद्धतींना समर्पित उत्पादन व्यवस्थापनाच्या विभागात, लागू गणितीय आकडेवारी (प्रयोगांच्या डिझाइनसह) वापरली जातात. त्याच्या पद्धतींच्या मदतीने, तांत्रिक प्रक्रियेच्या अचूकतेचे आणि स्थिरतेचे सांख्यिकीय विश्लेषण आणि गुणवत्तेचे सांख्यिकीय मूल्यांकन केले जाते. विशिष्ट पद्धतींमध्ये उत्पादनाच्या गुणवत्तेच्या सांख्यिकीय स्वीकृती नियंत्रणाच्या पद्धती, तांत्रिक प्रक्रियेचे सांख्यिकीय नियमन, मूल्यांकन आणि विश्वासार्हतेचे नियंत्रण यांचा समावेश होतो.
आणि इ.
उत्पादन व्यवस्थापनामध्ये, विशेषतः, उत्पादनाची गुणवत्ता ऑप्टिमाइझ करताना आणि मानक आवश्यकतांचे पालन सुनिश्चित करताना, सांख्यिकीय पद्धती लागू करणे विशेषतः महत्वाचे आहे प्रारंभिक टप्पा जीवन चक्रउत्पादने, म्हणजे प्रायोगिक डिझाइन विकासाच्या संशोधन तयारीच्या टप्प्यावर (उत्पादनांसाठी आशादायक आवश्यकतांचा विकास, प्राथमिक डिझाइन, संदर्भ अटीविकास कामासाठी). हे उत्पादनाच्या जीवनचक्राच्या सुरुवातीच्या टप्प्यावर उपलब्ध मर्यादित माहिती आणि अंदाज लावण्याची गरज यामुळे आहे तांत्रिक क्षमताआणि भविष्यासाठी आर्थिक परिस्थिती.
सर्वात सामान्य संभाव्य-सांख्यिकीय पद्धती म्हणजे प्रतिगमन विश्लेषण, घटक विश्लेषण, भिन्नतेचे विश्लेषण, जोखीम मूल्यांकनासाठी सांख्यिकीय पद्धती, परिस्थिती पद्धत इ. संख्यात्मक नसलेल्या स्वरूपाच्या सांख्यिकीय डेटाच्या विश्लेषणासाठी समर्पित सांख्यिकीय पद्धतींचे क्षेत्र अधिकाधिक महत्त्व प्राप्त करत आहे. गुणात्मक आणि विषम वैशिष्ट्यांवर मापन परिणाम. संख्यात्मक नसलेल्या वस्तूंच्या आकडेवारीच्या मुख्य अनुप्रयोगांपैकी एक म्हणजे सिद्धांत आणि सराव तज्ञ मूल्यांकनसिद्धांत संबंधित सांख्यिकीय निर्णयआणि मतदान समस्या.
सांख्यिकीय निर्णयांच्या सिद्धांताच्या पद्धतींचा वापर करून समस्या सोडवण्यामध्ये व्यक्तीची भूमिका म्हणजे समस्या तयार करणे, म्हणजे, आणणे. वास्तविक कार्यसांख्यिकीय डेटावर आधारित इव्हेंटच्या संभाव्यता निर्धारित करण्यासाठी, तसेच परिणामी इष्टतम समाधान मंजूर करण्यासाठी संबंधित मानकानुसार.
1. निर्णय घेताना संभाव्यता सिद्धांत आणि गणितीय आकडेवारी
1.1 संभाव्यता कशी वापरली जातेआणि गणितीय आकडेवारी
या शाखा संभाव्य-सांख्यिकीय निर्णय घेण्याच्या पद्धतींचा आधार आहेत. त्यांचे गणितीय उपकरण वापरण्यासाठी, संभाव्य-सांख्यिकीय मॉडेल्सच्या संदर्भात निर्णय घेण्याच्या समस्या व्यक्त करणे आवश्यक आहे. विशिष्ट संभाव्य-सांख्यिकीय निर्णय घेण्याच्या पद्धतीच्या वापरामध्ये तीन टप्पे असतात:
आर्थिक, व्यवस्थापकीय, तांत्रिक वास्तवापासून अमूर्त गणितीय आणि सांख्यिकीय योजनेकडे संक्रमण, म्हणजे. नियंत्रण प्रणालीचे संभाव्य मॉडेल तयार करणे, तांत्रिक प्रक्रिया, निर्णय घेण्याची प्रक्रिया, विशेषतः सांख्यिकीय नियंत्रणाच्या परिणामांवर आधारित इ.
संभाव्य मॉडेलच्या चौकटीत पूर्णपणे गणिती माध्यमांद्वारे गणना करणे आणि निष्कर्ष प्राप्त करणे;
वास्तविक परिस्थितीच्या संदर्भात गणितीय आणि सांख्यिकीय निष्कर्षांचे स्पष्टीकरण आणि योग्य निर्णय घेणे (उदाहरणार्थ, स्थापित आवश्यकतांसह उत्पादनाच्या गुणवत्तेचे अनुरूपता किंवा गैर-अनुपालन, तांत्रिक प्रक्रिया समायोजित करण्याची आवश्यकता इ.), विशेषतः, निष्कर्ष (बॅचमधील उत्पादनांच्या सदोष युनिट्सच्या प्रमाणात, तांत्रिक प्रक्रियेच्या नियंत्रित पॅरामीटर्सच्या वितरणाच्या कायद्याच्या विशिष्ट स्वरूपावर इ.).
गणितीय आकडेवारी संभाव्यता सिद्धांताच्या संकल्पना, पद्धती आणि परिणाम वापरते. आर्थिक, व्यवस्थापकीय, तांत्रिक आणि इतर परिस्थितींमध्ये संभाव्य निर्णयक्षमतेचे मॉडेल तयार करण्याच्या मुख्य मुद्द्यांचा विचार करूया. निर्णय घेण्याच्या संभाव्य-सांख्यिकीय पद्धतींवरील मानक-तांत्रिक आणि उपदेशात्मक-पद्धतीविषयक दस्तऐवजांच्या सक्रिय आणि योग्य वापरासाठी, प्राथमिक ज्ञान आवश्यक आहे. म्हणून, हे जाणून घेणे आवश्यक आहे की कोणत्या परिस्थितीत एक किंवा दुसरा दस्तऐवज लागू केला जावा, त्याची निवड आणि अर्ज करण्यासाठी कोणती प्रारंभिक माहिती असणे आवश्यक आहे, डेटा प्रक्रियेच्या परिणामांवर आधारित कोणते निर्णय घेतले जावेत इ.
1.2 संभाव्यता सिद्धांताची अनुप्रयोग उदाहरणेआणि गणितीय आकडेवारी
व्यवस्थापकीय, औद्योगिक, आर्थिक आणि राष्ट्रीय आर्थिक समस्यांचे निराकरण करण्यासाठी संभाव्य-सांख्यिकीय मॉडेल एक चांगले साधन आहेत तेव्हा आपण अनेक उदाहरणे विचारात घेऊ या. म्हणून, उदाहरणार्थ, ए.एन. टॉल्स्टॉयच्या कादंबरीत "वॉकिंग थ्रू द टॉर्मेंट्स" (खंड 1) असे म्हटले आहे: "कार्यशाळा लग्नाच्या तेवीस टक्के देते, तुम्ही या आकृतीवर ठाम आहात," स्ट्रुकोव्हने इव्हान इलिचला सांगितले.
फॅक्टरी व्यवस्थापकांच्या संभाषणात हे शब्द कसे समजून घ्यावेत हा प्रश्न उद्भवतो, कारण उत्पादनाचे एक युनिट 23% ने दोषपूर्ण असू शकत नाही. हे एकतर चांगले किंवा दोषपूर्ण असू शकते. कदाचित स्ट्रुकोव्हचा अर्थ असा आहे की मोठ्या बॅचमध्ये सुमारे 23% दोषपूर्ण युनिट्स असतात. मग प्रश्न पडतो, “बद्दल” म्हणजे काय? समजा उत्पादनाच्या 100 पैकी 30 चाचणी केलेल्या युनिट्स सदोष निघाल्या, किंवा 1000 - 300 पैकी, किंवा 100,000 - 30,000 पैकी, इत्यादी, स्ट्रुकोव्हवर खोटे बोलल्याचा आरोप केला पाहिजे का?
किंवा दुसरे उदाहरण. भरपूर म्हणून वापरलेले नाणे "सममित" असले पाहिजे, म्हणजे. जेव्हा ते फेकले जाते, तेव्हा सरासरी, अर्ध्या प्रकरणांमध्ये, शस्त्राचा कोट बाहेर पडला पाहिजे आणि अर्ध्या प्रकरणांमध्ये - जाळी (शेपटी, संख्या). पण "सरासरी" म्हणजे काय? तुम्ही प्रत्येक मालिकेत 10 थ्रोच्या अनेक मालिका खर्च केल्यास, अनेकदा अशी मालिका असेल ज्यामध्ये एक नाणे 4 वेळा शस्त्राच्या आवरणासह बाहेर पडेल. सममितीय नाण्यासाठी, हे मालिकेच्या 20.5% मध्ये होईल. आणि जर 100,000 टॉससाठी 40,000 कोट शस्त्रे असतील तर नाणे सममितीय मानले जाऊ शकते का? निर्णय घेण्याची प्रक्रिया संभाव्यता सिद्धांत आणि गणितीय आकडेवारीवर आधारित आहे.
विचाराधीन उदाहरण पुरेसे गंभीर वाटत नाही. मात्र, तसे नाही. औद्योगिक व्यवहार्यता प्रयोग आयोजित करण्यासाठी ड्रॉचा मोठ्या प्रमाणावर वापर केला जातो, उदाहरणार्थ, विविध तांत्रिक घटकांवर (संवर्धन वातावरणाचा प्रभाव, मोजमाप करण्यापूर्वी बेअरिंग्स तयार करण्याच्या पद्धती, मोजमाप प्रक्रियेत भार सहन करण्याचा परिणाम इ.) p.). समजा विविध संवर्धन तेलांमध्ये त्यांच्या स्टोरेजच्या परिणामांवर अवलंबून बीयरिंगच्या गुणवत्तेची तुलना करणे आवश्यक आहे, म्हणजे. A आणि B च्या तेलांमध्ये. अशा प्रयोगाची योजना आखत असताना, तेल रचना A मध्ये कोणते बेअरिंग ठेवले पाहिजे आणि कोणते - तेल रचना B मध्ये, परंतु व्यक्तिनिष्ठता टाळण्यासाठी आणि वस्तुनिष्ठता सुनिश्चित करण्यासाठी अशा प्रकारे प्रश्न उद्भवतो. निर्णय.
या प्रश्नाचे उत्तर चिठ्ठ्या काढून मिळू शकते. कोणत्याही उत्पादनाच्या गुणवत्ता नियंत्रणाचे असेच उदाहरण देता येईल. उत्पादनांची तपासणी केलेली बॅच स्थापित आवश्यकता पूर्ण करते की नाही हे ठरवण्यासाठी, त्यातून एक नमुना घेतला जातो. नमुना नियंत्रणाच्या परिणामांवर आधारित, संपूर्ण बॅचबद्दल एक निष्कर्ष काढला जातो. या प्रकरणात, नमुन्याच्या निर्मितीमध्ये सब्जेक्टिव्हिटी टाळणे फार महत्वाचे आहे, म्हणजे नियंत्रित लॉटमधील उत्पादनाच्या प्रत्येक युनिटची नमुना निवडण्याची समान संभाव्यता असणे आवश्यक आहे. उत्पादनाच्या परिस्थितीत, नमुन्यातील उत्पादनाच्या युनिट्सची निवड सहसा लॉटद्वारे केली जात नाही, परंतु यादृच्छिक संख्यांच्या विशेष सारण्यांद्वारे किंवा संगणक यादृच्छिक संख्या जनरेटरच्या मदतीने केली जाते.
तुलना करताना वस्तुनिष्ठता सुनिश्चित करण्याच्या समान समस्या उद्भवतात विविध योजनाउत्पादनाची संघटना, मोबदला, निविदा आणि स्पर्धा दरम्यान, उमेदवारांची निवड रिक्त पदेइ. प्रत्येक ठिकाणी तुम्हाला लॉटरी किंवा तत्सम प्रक्रियांची आवश्यकता आहे. ऑलिम्पिक पद्धतीनुसार स्पर्धा आयोजित करताना सर्वात बलवान आणि दुसऱ्या क्रमांकाचा बलवान संघ ओळखण्याचे उदाहरण वापरून समजावून सांगूया (पराभवणाऱ्याला बाहेर काढले जाते). बलवान संघ नेहमी कमकुवत संघावर विजय मिळवू दे. बलाढ्य संघ नक्कीच चॅम्पियन होणार हे स्पष्ट आहे. दुसरा सर्वात बलाढ्य संघ अंतिम फेरीत पोहोचेल जर आणि फक्त जर त्याचे भविष्यातील चॅम्पियनशी फायनलपूर्वी कोणतेही गेम नसेल. अशा खेळाचे नियोजन केले, तर दुसरा बलाढ्य संघ अंतिम फेरीत पोहोचू शकणार नाही. जो स्पर्धेची योजना आखतो तो एकतर स्पर्धेतील दुसऱ्या सर्वात मजबूत संघाला वेळापत्रकाच्या आधी “नॉक आउट” करू शकतो, त्याला नेत्याबरोबरच्या पहिल्या बैठकीत खाली आणू शकतो किंवा अंतिम फेरीपर्यंत कमकुवत संघांसोबत बैठकीची खात्री करून दुसरे स्थान सुनिश्चित करू शकतो. व्यक्तिनिष्ठता टाळण्यासाठी, चिठ्ठ्या काढा. 8 संघांच्या स्पर्धेसाठी, दोन सर्वात बलाढ्य संघ अंतिम फेरीत भेटतील याची संभाव्यता 4/7 आहे. त्यानुसार, 3/7 च्या संभाव्यतेसह, दुसरा सर्वात मजबूत संघ नियोजित वेळेपूर्वी स्पर्धा सोडेल.
उत्पादन युनिट्सच्या कोणत्याही मापनामध्ये (कॅलिपर, मायक्रोमीटर, अॅमीटर इ. वापरून), त्रुटी आहेत. पद्धतशीर त्रुटी आहेत की नाही हे शोधण्यासाठी, उत्पादनाच्या युनिटची वारंवार मोजमाप करणे आवश्यक आहे, ज्याची वैशिष्ट्ये ज्ञात आहेत (उदाहरणार्थ, मानक नमुना). हे लक्षात ठेवले पाहिजे की पद्धतशीर त्रुटी व्यतिरिक्त, एक यादृच्छिक त्रुटी देखील आहे.
त्यामुळे पद्धतशीर त्रुटी आहे की नाही हे मोजमापाच्या निकालांवरून कसे शोधायचे असा प्रश्न निर्माण होतो. पुढील मोजमाप करताना मिळालेली त्रुटी सकारात्मक किंवा नकारात्मक आहे की नाही हे फक्त लक्षात घेतल्यास, ही समस्या मागील एकापर्यंत कमी केली जाऊ शकते. खरंच, मोजमापाची तुलना नाणे फेकण्याशी करूया, धनात्मक त्रुटी - कोट ऑफ आर्म्सच्या नुकसानीसह, नकारात्मक - जालीसह (शून्य त्रुटी पुरेशा प्रमाणात विभागणीसह जवळजवळ कधीच उद्भवत नाही). मग पद्धतशीर त्रुटीची अनुपस्थिती तपासणे हे नाण्याची सममिती तपासण्यासारखे आहे.
या विचारांचा उद्देश नाण्याची सममिती तपासण्याच्या समस्येकडे पद्धतशीर त्रुटीची अनुपस्थिती तपासण्याची समस्या कमी करणे हा आहे. वरील तर्क गणितीय आकडेवारीत तथाकथित "चिन्हांचा निकष" ठरतो.
गणितीय आकडेवारीच्या पद्धतींवर आधारित तांत्रिक प्रक्रियेच्या सांख्यिकीय नियमनात, प्रक्रियांच्या सांख्यिकीय नियंत्रणासाठी नियम आणि योजना विकसित केल्या जातात, ज्याचा उद्देश तांत्रिक प्रक्रियेच्या विकृतीचा वेळेवर शोध घेणे आणि त्यांना समायोजित करण्यासाठी उपाययोजना करणे आणि उत्पादनांचे प्रकाशन रोखणे हे आहे. स्थापित आवश्यकता पूर्ण करत नाहीत. या उपाययोजनांचे उद्दिष्ट उत्पादन खर्च आणि कमी दर्जाच्या उत्पादनांच्या पुरवठ्यातून होणारे नुकसान कमी करणे आहे. सांख्यिकीय स्वीकृती नियंत्रणासह, गणितीय आकडेवारीच्या पद्धतींवर आधारित, उत्पादन बॅचेसमधील नमुन्यांचे विश्लेषण करून गुणवत्ता नियंत्रण योजना विकसित केल्या जातात. संभाव्य-सांख्यिकीय निर्णय घेण्याचे मॉडेल योग्यरित्या तयार करण्यात सक्षम होण्यात अडचण आहे, ज्याच्या आधारे वर विचारलेल्या प्रश्नांची उत्तरे देणे शक्य आहे. गणितीय सांख्यिकीमध्ये, संभाव्य मॉडेल्स आणि गृहितकांच्या चाचणीसाठी पद्धती विकसित केल्या गेल्या आहेत, विशेषतः, गृहितके की उत्पादनाच्या सदोष युनिट्सचे प्रमाण विशिष्ट संख्येच्या p0 च्या समान आहे, उदाहरणार्थ, p0 = 0.23 (पासून स्ट्रुकोव्हचे शब्द लक्षात ठेवा. ए.एन. टॉल्स्टॉय यांची कादंबरी).
1.3 मूल्यांकन उद्दिष्टे
अनेक व्यवस्थापकीय, औद्योगिक, आर्थिक, राष्ट्रीय आर्थिक परिस्थितींमध्ये, वेगळ्या प्रकारच्या समस्या उद्भवतात - संभाव्यता वितरणाची वैशिष्ट्ये आणि पॅरामीटर्सचा अंदाज लावण्याच्या समस्या.
एक उदाहरण विचारात घ्या. एन इलेक्ट्रिक दिव्यांची बॅच नियंत्रणात येऊ द्या. या बॅचमधून n विद्युत दिव्यांच्या नमुना यादृच्छिकपणे निवडण्यात आला. अनेक नैसर्गिक प्रश्न निर्माण होतात. नमुना घटकांच्या चाचणीच्या परिणामांवरून विद्युत दिव्यांचे सरासरी सेवा आयुष्य कसे ठरवता येईल आणि या वैशिष्ट्याचा अंदाज कोणत्या अचूकतेने लावता येईल? मोठा नमुना घेतल्यास अचूकता कशी बदलते? किमान 90% विद्युत दिवे किती तास T किंवा त्याहून अधिक तास टिकतील याची खात्री देता येईल?
समजा n इलेक्ट्रिक दिव्यांच्या नमुन्याची चाचणी करताना, X विद्युत दिवे दोषपूर्ण असल्याचे दिसून आले. मग पुढील प्रश्न उद्भवतात. बॅचमधील सदोष विद्युत दिव्यांची संख्या D, दोषपूर्णता D/N इ.च्या पातळीसाठी कोणत्या मर्यादा निर्दिष्ट केल्या जाऊ शकतात?
किंवा, तांत्रिक प्रक्रियेच्या अचूकता आणि स्थिरतेच्या सांख्यिकीय विश्लेषणामध्ये, नियंत्रित पॅरामीटरचे सरासरी मूल्य आणि विचाराधीन प्रक्रियेमध्ये त्याच्या प्रसाराची डिग्री यासारख्या गुणवत्ता निर्देशकांचे मूल्यांकन करणे आवश्यक आहे. संभाव्यतेच्या सिद्धांतानुसार, यादृच्छिक चलचे सरासरी मूल्य आणि प्रसाराचे सांख्यिकीय वैशिष्ट्य म्हणून भिन्नता, मानक विचलन किंवा भिन्नतेचे गुणांक म्हणून त्याची गणितीय अपेक्षा वापरणे उचित आहे. हे प्रश्न उपस्थित करते: नमुना डेटावरून या सांख्यिकीय वैशिष्ट्यांचा अंदाज कसा लावायचा आणि हे कोणत्या अचूकतेने केले जाऊ शकते? अशी अनेक उदाहरणे आहेत. सांख्यिकीय उत्पादन गुणवत्ता व्यवस्थापन क्षेत्रात निर्णय घेताना उत्पादन व्यवस्थापनामध्ये संभाव्यता सिद्धांत आणि गणितीय आकडेवारीचा वापर कसा करता येईल हे दाखवणे येथे महत्त्वाचे होते.
1.4 "गणितीय आकडेवारी" म्हणजे काय
गणितीय सांख्यिकी म्हणजे "गणिताचा एक विभाग जो सांख्यिकीय डेटा गोळा करणे, पद्धतशीर करणे, प्रक्रिया करणे आणि त्याचा अर्थ लावणे, तसेच त्यांचा वैज्ञानिक किंवा व्यावहारिक निष्कर्षांसाठी वापर करणे यासाठी गणितीय पद्धतींना समर्पित आहे. गणितीय आकडेवारीचे नियम आणि कार्यपद्धती संभाव्यतेच्या सिद्धांतावर आधारित आहेत, ज्यामुळे उपलब्ध सांख्यिकीय सामग्रीच्या आधारे प्रत्येक समस्येमध्ये प्राप्त झालेल्या निष्कर्षांची अचूकता आणि विश्वासार्हतेचे मूल्यांकन करणे शक्य होते. त्याच वेळी, सांख्यिकीय डेटा विशिष्ट वैशिष्ट्ये असलेल्या कोणत्याही अधिक किंवा कमी विस्तृत संग्रहातील वस्तूंच्या संख्येबद्दल माहितीचा संदर्भ देते.
सोडवल्या जाणाऱ्या समस्यांच्या प्रकारानुसार, गणितीय आकडेवारी सहसा तीन विभागांमध्ये विभागली जाते: डेटा वर्णन, अंदाज आणि गृहीतक चाचणी.
सांख्यिकीय डेटाच्या प्रकारानुसार, गणितीय आकडेवारी चार भागात विभागली गेली आहे:
एक-आयामी आकडेवारी (यादृच्छिक चलांची आकडेवारी), ज्यामध्ये निरीक्षणाचा परिणाम वास्तविक संख्येद्वारे वर्णन केला जातो;
बहुविविध सांख्यिकीय विश्लेषण, जेथे ऑब्जेक्टच्या निरीक्षणाचा परिणाम अनेक संख्या (वेक्टर) द्वारे वर्णन केला जातो;
यादृच्छिक प्रक्रिया आणि वेळ मालिकेची आकडेवारी, जेथे निरीक्षणाचा परिणाम एक कार्य आहे;
संख्यात्मक नसलेल्या स्वरूपाच्या वस्तूंची आकडेवारी, ज्यामध्ये निरीक्षणाचा परिणाम हा संख्यात्मक नसलेला असतो, उदाहरणार्थ, तो एक संच (भौमितिक आकृती), क्रमवार किंवा मोजमापाच्या परिणामी प्राप्त केलेला असतो. एक गुणात्मक गुणधर्म.
ऐतिहासिकदृष्ट्या, संख्यात्मक नसलेल्या वस्तूंच्या आकडेवारीचे काही क्षेत्र (विशेषतः, दोषपूर्ण उत्पादनांच्या टक्केवारीचा अंदाज लावण्याच्या समस्या आणि त्याबद्दल परिकल्पना चाचणी) आणि एक-आयामी आकडेवारी प्रथम दिसून आली. त्यांच्यासाठी गणितीय उपकरणे सोपे आहेत, म्हणून, त्यांच्या उदाहरणाद्वारे, ते सहसा गणितीय आकडेवारीच्या मुख्य कल्पना प्रदर्शित करतात.
डेटा प्रोसेसिंगच्या फक्त त्या पद्धती, म्हणजे. गणितीय आकडेवारी पुराव्यावर आधारित असतात, जी संबंधित वास्तविक घटना आणि प्रक्रियांच्या संभाव्य मॉडेलवर आधारित असतात. आम्ही ग्राहकांच्या वर्तनाचे मॉडेल, जोखमीचा उदय, कार्यप्रणाली याबद्दल बोलत आहोत तांत्रिक उपकरणे, प्रयोगाचे परिणाम प्राप्त करणे, रोगाचा कोर्स इ. विचाराधीन परिमाण आणि त्यांच्यातील संबंध संभाव्यता सिद्धांताच्या संदर्भात व्यक्त केल्यास वास्तविक घटनेचे संभाव्य मॉडेल तयार मानले जावे. वास्तविकतेच्या संभाव्य मॉडेलशी पत्रव्यवहार, म्हणजे. त्याची पर्याप्तता, विशेषतः, परिकल्पना तपासण्यासाठी सांख्यिकीय पद्धतींच्या मदतीने सिद्ध केली जाते.
डेटा प्रोसेसिंगच्या अविश्वसनीय पद्धती अन्वेषणात्मक आहेत, त्या तेव्हाच वापरल्या जाऊ शकतात प्राथमिक विश्लेषणडेटा, कारण ते मर्यादित सांख्यिकीय सामग्रीच्या आधारे प्राप्त केलेल्या निष्कर्षांच्या अचूकतेचे आणि विश्वासार्हतेचे मूल्यांकन करणे शक्य करत नाहीत.
संभाव्य आणि सांख्यिकीय पद्धती लागू आहेत जेथे घटना किंवा प्रक्रियेचे संभाव्य मॉडेल तयार करणे आणि सिद्ध करणे शक्य आहे. जेव्हा नमुना डेटावरून काढलेले निष्कर्ष संपूर्ण लोकसंख्येला हस्तांतरित केले जातात तेव्हा त्यांचा वापर अनिवार्य असतो (उदाहरणार्थ, नमुन्यापासून उत्पादनांच्या संपूर्ण बॅचमध्ये).
अनुप्रयोगाच्या विशिष्ट क्षेत्रांमध्ये, विस्तृत अनुप्रयोगाच्या संभाव्य-सांख्यिकीय पद्धती आणि विशिष्ट पद्धती वापरल्या जातात. उदाहरणार्थ, उत्पादन गुणवत्ता व्यवस्थापनाच्या सांख्यिकीय पद्धतींना समर्पित उत्पादन व्यवस्थापनाच्या विभागात, लागू गणितीय आकडेवारी (प्रयोगांच्या डिझाइनसह) वापरली जातात. त्याच्या पद्धतींच्या मदतीने, तांत्रिक प्रक्रियेच्या अचूकतेचे आणि स्थिरतेचे सांख्यिकीय विश्लेषण आणि गुणवत्तेचे सांख्यिकीय मूल्यांकन केले जाते. विशिष्ट पद्धतींमध्ये उत्पादनाच्या गुणवत्तेच्या सांख्यिकीय स्वीकृती नियंत्रणाच्या पद्धती, तांत्रिक प्रक्रियेचे सांख्यिकीय नियमन, मूल्यांकन आणि विश्वासार्हतेचे नियंत्रण इत्यादींचा समावेश होतो.
विश्वासार्हता सिद्धांत आणि रांगेत सिद्धांत यासारख्या लागू संभाव्य-सांख्यिकीय विषयांचा मोठ्या प्रमाणावर वापर केला जातो. त्यातील पहिल्यामधील मजकूर शीर्षकावरून स्पष्ट आहे, दुसरा टेलिफोन एक्सचेंज सारख्या सिस्टमच्या अभ्यासाशी संबंधित आहे, ज्याला यादृच्छिक वेळी कॉल येतात - त्यांच्या टेलिफोनवर नंबर डायल करणार्या ग्राहकांच्या आवश्यकता. या आवश्यकतांच्या सेवेचा कालावधी, म्हणजे. संभाषणाचा कालावधी देखील यादृच्छिक व्हेरिएबल्सद्वारे तयार केला जातो. या विषयांच्या विकासासाठी एक मोठे योगदान यूएसएसआर अकादमी ऑफ सायन्सेसचे संबंधित सदस्य ए.या यांनी केले. खिंचिन (1894-1959), युक्रेनियन एसएसआर बी.व्ही. ग्नेडेन्को (1912-1995) आणि इतर देशांतर्गत शास्त्रज्ञांच्या विज्ञान अकादमीचे शिक्षणतज्ज्ञ.
1.5 गणितीय आकडेवारीच्या इतिहासाबद्दल थोडक्यात
विज्ञान म्हणून गणितीय आकडेवारीची सुरुवात प्रसिद्ध जर्मन गणितज्ञ कार्ल फ्रेडरिक गॉस (१७७७-१८५५) यांच्या कार्यापासून होते, ज्यांनी संभाव्यतेच्या सिद्धांतावर आधारित, त्यांनी १७९५ मध्ये तयार केलेली किमान चौरस पद्धत तपासली आणि सिद्ध केली. खगोलशास्त्रीय डेटा (सेरेस ग्रहाची कक्षा स्पष्ट करण्यासाठी). सर्वात लोकप्रिय संभाव्यता वितरणांपैकी एक, सामान्य, बहुतेकदा त्याच्या नावावर ठेवले जाते आणि यादृच्छिक प्रक्रियेच्या सिद्धांतामध्ये, अभ्यासाचा मुख्य उद्देश गॉसियन प्रक्रिया आहे.
XIX शतकाच्या शेवटी. - विसाव्या शतकाच्या सुरूवातीस. गणितीय आकडेवारीत मोठे योगदान इंग्रजी संशोधकांनी केले, प्रामुख्याने के. पीअरसन (1857-1936) आणि आर.ए. फिशर (1890-1962). विशेषतः, पीअरसनने सांख्यिकीय गृहीतके तपासण्यासाठी ची-स्क्वेअर चाचणी विकसित केली आणि फिशरने भिन्नतेचे विश्लेषण, प्रयोग नियोजनाचा सिद्धांत आणि पॅरामीटर्सचा अंदाज लावण्यासाठी जास्तीत जास्त संभाव्यता पद्धत विकसित केली.
विसाव्या शतकाच्या 30 च्या दशकात. पोल जेर्झी न्यूमन (1894-1977) आणि इंग्लिशमन ई. पीअरसन यांनी सांख्यिकीय गृहितकांच्या चाचणीचा एक सामान्य सिद्धांत विकसित केला आणि सोव्हिएत गणितज्ञ अकादमीशियन ए.एन. कोल्मोगोरोव (1903-1987) आणि यूएसएसआर अकादमी ऑफ सायन्सेसचे संबंधित सदस्य एनव्ही स्मरनोव्ह (1900-1966) यांनी नॉनपॅरामेट्रिक आकडेवारीचा पाया घातला. विसाव्या शतकाच्या चाळीसच्या दशकात. रोमानियन ए. वाल्ड (1902-1950) यांनी सातत्यपूर्ण सांख्यिकीय विश्लेषणाचा सिद्धांत तयार केला.
सध्याच्या घडीला गणितीय आकडेवारी झपाट्याने विकसित होत आहे. तर, गेल्या 40 वर्षांत, संशोधनाची चार मूलभूतपणे नवीन क्षेत्रे ओळखली जाऊ शकतात:
नियोजन प्रयोगांसाठी गणितीय पद्धतींचा विकास आणि अंमलबजावणी;
लागू गणितीय आकडेवारीमध्ये स्वतंत्र दिशा म्हणून संख्यात्मक नसलेल्या वस्तूंच्या आकडेवारीचा विकास;
वापरलेल्या संभाव्य मॉडेलमधून लहान विचलनांना प्रतिरोधक सांख्यिकीय पद्धतींचा विकास;
डेटाच्या सांख्यिकीय विश्लेषणासाठी डिझाइन केलेले संगणक सॉफ्टवेअर पॅकेज तयार करण्याच्या कामाचा व्यापक विकास.
1.6 संभाव्य-सांख्यिकीय पद्धती आणि ऑप्टिमायझेशन
ऑप्टिमायझेशनची कल्पना आधुनिक लागू गणितीय सांख्यिकी आणि इतर सांख्यिकीय पद्धतींमध्ये पसरते. उदाहरणार्थ, प्रयोगांच्या नियोजनाच्या पद्धती, सांख्यिकीय स्वीकृती नियंत्रण, तांत्रिक प्रक्रियांचे सांख्यिकीय नियंत्रण, इ. दुसरीकडे, निर्णय सिद्धांतातील ऑप्टिमायझेशन फॉर्म्युलेशन, उदाहरणार्थ, उत्पादनाची गुणवत्ता आणि मानक आवश्यकता ऑप्टिमाइझ करण्याचा लागू केलेला सिद्धांत, याचा व्यापक वापर प्रदान करतो. संभाव्य-सांख्यिकीय पद्धती, प्रामुख्याने गणितीय आकडेवारी लागू केली जाते.
उत्पादन व्यवस्थापनामध्ये, विशेषतः, उत्पादनाची गुणवत्ता आणि मानक आवश्यकता अनुकूल करताना, उत्पादनाच्या जीवन चक्राच्या सुरुवातीच्या टप्प्यावर सांख्यिकीय पद्धती लागू करणे विशेषतः महत्वाचे आहे, म्हणजे. प्रायोगिक डिझाइन विकासाच्या संशोधन तयारीच्या टप्प्यावर (उत्पादनांसाठी आशादायक आवश्यकतांचा विकास, प्राथमिक डिझाइन, प्रायोगिक डिझाइन विकासासाठी संदर्भ अटी). हे उत्पादनाच्या जीवनचक्राच्या सुरुवातीच्या टप्प्यावर उपलब्ध असलेल्या मर्यादित माहितीमुळे आणि भविष्यासाठी तांत्रिक शक्यता आणि आर्थिक परिस्थितीचा अंदाज लावण्याची गरज यामुळे आहे. ऑप्टिमायझेशन समस्येचे निराकरण करण्याच्या सर्व टप्प्यांवर सांख्यिकीय पद्धती लागू केल्या पाहिजेत - व्हेरिएबल्स स्केलिंग करताना, उत्पादने आणि सिस्टमच्या कार्यासाठी गणितीय मॉडेल विकसित करताना, तांत्रिक आणि आर्थिक प्रयोग आयोजित करणे इ.
ऑप्टिमायझेशन समस्यांमध्ये, उत्पादनाची गुणवत्ता आणि मानक आवश्यकतांच्या ऑप्टिमायझेशनसह, आकडेवारीची सर्व क्षेत्रे वापरली जातात. म्हणजे, यादृच्छिक चलांची आकडेवारी, बहुविध सांख्यिकीय विश्लेषण, यादृच्छिक प्रक्रियांची आकडेवारी आणि वेळ मालिका, संख्यात्मक नसलेल्या वस्तूंची आकडेवारी. विशिष्ट डेटाच्या विश्लेषणासाठी सांख्यिकीय पद्धतीची निवड शिफारसींनुसार केली पाहिजे.
2. संभाव्य-स्ट च्या ठराविक व्यावहारिक समस्याatistic निर्णय घेणेआणि त्यांच्या निराकरणाच्या पद्धती
2.1 आकडेवारी आणि लागू आकडेवारी
उपयोजित सांख्यिकी हे वास्तविक सांख्यिकीय डेटावर प्रक्रिया करण्याच्या पद्धतींना समर्पित गणितीय आकडेवारीचा एक भाग म्हणून समजले जाते, तसेच संबंधित गणिती आणि सॉफ्टवेअर. अशा प्रकारे, पूर्णपणे गणितीय समस्या लागू केलेल्या आकडेवारीमध्ये समाविष्ट केल्या जात नाहीत.
सांख्यिकीय डेटा हा अभ्यासाधीन ऑब्जेक्ट्सच्या नियंत्रित पॅरामीटर्स (वैशिष्ट्ये) ची संख्यात्मक किंवा गैर-संख्यात्मक मूल्ये म्हणून समजला जातो, जे विशिष्ट संख्येच्या निरीक्षणे (मापने, विश्लेषणे, चाचण्या, प्रयोग इ.) परिणाम म्हणून प्राप्त होतात. अभ्यासात समाविष्ट असलेल्या प्रत्येक युनिटसाठी वैशिष्ट्ये. सांख्यिकीय डेटा आणि नमुना आकार मिळविण्याच्या पद्धती प्रयोग नियोजनाच्या गणितीय सिद्धांताच्या पद्धतींवर आधारित विशिष्ट लागू केलेल्या समस्येच्या निर्मितीवर आधारित आहेत.
i-th सॅम्पलिंग युनिटच्या अभ्यास केलेल्या गुण X (किंवा अभ्यास केलेल्या गुण X चा संच) च्या निरीक्षणाचा परिणाम i (येथे i = 1, 2, . .., n, जेथे n नमुना आकार आहे).
निरीक्षणांचे परिणाम x1, x2,…, xn, जेथे xi हा i-th नमुना युनिटच्या निरीक्षणाचा परिणाम आहे, किंवा अनेक नमुन्यांच्या निरीक्षणांचे परिणाम, कार्यासाठी योग्य असलेल्या लागू सांख्यिकी पद्धती वापरून प्रक्रिया केली जाते. नियमानुसार, विश्लेषणात्मक पद्धती वापरल्या जातात, म्हणजे. संख्यात्मक गणनेवर आधारित पद्धती (संख्या नसलेल्या स्वरूपाच्या वस्तूंचे वर्णन संख्या वापरून केले जाते). काही प्रकरणांमध्ये, ग्राफिकल पद्धती (दृश्य विश्लेषण) वापरण्याची परवानगी आहे.
2.2 तांत्रिक प्रक्रिया आणि उत्पादनाच्या गुणवत्तेची अचूकता आणि स्थिरता यांच्या सांख्यिकीय विश्लेषणाची कार्ये
सांख्यिकीय पद्धती वापरल्या जातात, विशेषतः, तांत्रिक प्रक्रिया आणि उत्पादनाच्या गुणवत्तेची अचूकता आणि स्थिरता यांचे विश्लेषण करण्यासाठी. तांत्रिक युनिट्सचे कार्यक्षम कार्य सुनिश्चित करणारे उपाय तयार करणे आणि उत्पादनांची गुणवत्ता आणि स्पर्धात्मकता सुधारणे हे उद्दिष्ट आहे. सांख्यिकीय पद्धती सर्व प्रकरणांमध्ये वापरल्या पाहिजेत जेथे, मर्यादित संख्येच्या निरीक्षणांच्या परिणामांवर आधारित, तांत्रिक उपकरणांची अचूकता आणि स्थिरता सुधारण्याची किंवा बिघडण्याची कारणे स्थापित करणे आवश्यक आहे. तांत्रिक प्रक्रियेच्या अचूकतेनुसार, तांत्रिक प्रक्रियेची मालमत्ता समजली जाते, जी उत्पादित उत्पादनांच्या पॅरामीटर्सच्या वास्तविक आणि नाममात्र मूल्यांची समीपता निर्धारित करते. तांत्रिक प्रक्रियेच्या स्थिरतेच्या अंतर्गत, तांत्रिक प्रक्रियेची मालमत्ता समजली जाते, जी बाहेरील हस्तक्षेपाशिवाय विशिष्ट कालावधीत त्याच्या पॅरामीटर्ससाठी संभाव्यता वितरणाची स्थिरता निर्धारित करते.
उत्पादनांच्या विकास, उत्पादन आणि ऑपरेशन (उपभोग) च्या टप्प्यावर तांत्रिक प्रक्रियेची अचूकता आणि स्थिरता आणि उत्पादनाच्या गुणवत्तेचे विश्लेषण करण्यासाठी सांख्यिकीय पद्धती लागू करण्याचे उद्दीष्टे आहेत:
* तांत्रिक प्रक्रिया, उपकरणे किंवा उत्पादनाच्या गुणवत्तेची अचूकता आणि स्थिरतेच्या वास्तविक निर्देशकांचे निर्धारण;
* नियामक आणि तांत्रिक कागदपत्रांच्या आवश्यकतांसह उत्पादनाच्या गुणवत्तेची अनुरूपता स्थापित करणे;
* तांत्रिक शिस्तीच्या अनुपालनाची पडताळणी;
* यादृच्छिक आणि पद्धतशीर घटकांचा अभ्यास ज्यामुळे दोष दिसू शकतात;
* उत्पादन आणि तंत्रज्ञानाच्या साठ्याची ओळख;
* औचित्य तांत्रिक मानकेआणि उत्पादन मंजूरी
* उत्पादनांच्या आवश्यकता आणि त्यासाठी मानके सिद्ध करण्यासाठी नमुना चाचणीच्या परिणामांचे मूल्यांकन;
* तांत्रिक उपकरणे आणि मोजमाप आणि चाचणी साधनांच्या निवडीचे प्रमाणीकरण;
* विविध उत्पादनांच्या नमुन्यांची तुलना;
* बदलण्याचे तर्क एकूण नियंत्रणसांख्यिकीय
* उत्पादन गुणवत्ता व्यवस्थापनाच्या सांख्यिकीय पद्धती सादर करण्याची शक्यता ओळखणे इ.
वरील उद्दिष्टे साध्य करण्यासाठी, डेटाचे वर्णन, अंदाज आणि गृहीतके चाचणी करण्याच्या विविध पद्धती वापरल्या जातात. समस्या विधानांची उदाहरणे देऊ.
2.3 एक-आयामी आकडेवारीच्या समस्या (यादृच्छिक चलांची आकडेवारी)
उत्पादित उत्पादनांचे गुणवत्ता निर्देशक आणि संदर्भ नमुना यांच्यातील पत्रव्यवहार स्थापित करणे आवश्यक असलेल्या प्रकरणांमध्ये गणितीय अपेक्षांची तुलना केली जाते. हे गृहितक तपासण्याचे कार्य आहे:
H0: M(X) = m0,
जेथे m0 हे संदर्भ नमुन्याशी संबंधित मूल्य आहे; X हे निरीक्षणांच्या परिणामांचे अनुकरण करणारे यादृच्छिक चल आहे. परिस्थितीचे संभाव्य मॉडेल तयार करणे आणि पर्यायी गृहीतके यावर अवलंबून, गणितीय अपेक्षांची तुलना पॅरामेट्रिक किंवा नॉन-पॅरामेट्रिक पद्धतींद्वारे केली जाते.
गुणवत्तेचे सूचक आणि नाममात्र यांच्यातील फरक स्थापित करणे आवश्यक असताना भिन्नतेची तुलना केली जाते. हे करण्यासाठी, गृहीतकांची चाचणी केली जाते:
परिकल्पना चाचणीच्या समस्यांपेक्षा कमी महत्त्वाच्या नाहीत पॅरामीटर अंदाजाच्या समस्या. ते, परिकल्पना तपासण्याच्या कार्यांप्रमाणे, परिस्थितीच्या वापरलेल्या संभाव्य मॉडेलवर अवलंबून, पॅरामेट्रिक आणि नॉनपॅरामेट्रिकमध्ये विभागले गेले आहेत.
पॅरामेट्रिक अंदाज समस्यांमध्ये, संभाव्य मॉडेलचा अवलंब केला जातो, त्यानुसार x1, x2, ..., xn निरीक्षणांचे परिणाम F(x;u) वितरण कार्यासह n स्वतंत्र यादृच्छिक चलांचे प्राप्ती मानले जातात. येथे, आणि एक अज्ञात पॅरामीटर आहे जो पॅरामीटर स्पेसमध्ये आहे आणि वापरलेल्या संभाव्य मॉडेलद्वारे दिलेला आहे. पॅरामीटरसाठी बिंदू अंदाज आणि आत्मविश्वास मर्यादा (किंवा आत्मविश्वास क्षेत्र) निर्धारित करणे हे अंदाजाचे कार्य आहे.
पॅरामीटर आणि एकतर संख्या किंवा निश्चित मर्यादित परिमाणाचा सदिश आहे. तर, सामान्य वितरणासाठी, u = (m, y2) एक द्विमितीय वेक्टर आहे, द्विपदीय वितरणासाठी, u = p ही संख्या आहे, गॅमा वितरणासाठी
आणि = (a, b, c) हा 3D वेक्टर आहे, आणि असेच.
आधुनिक गणितीय आकडेवारीमध्ये, अंदाज आणि आत्मविश्वास मर्यादा निश्चित करण्यासाठी अनेक सामान्य पद्धती विकसित केल्या गेल्या आहेत - क्षणांची पद्धत, जास्तीत जास्त संभाव्यता पद्धत, एक-चरण अंदाजांची पद्धत, स्थिर (मजबूत) अंदाजांची पद्धत, निष्पक्ष अंदाज इ.
त्यातील पहिल्या तीन गोष्टींवर एक झटकन नजर टाकूया.
क्षणांची पद्धत त्यांच्या वितरण कार्यांच्या पॅरामीटर्सच्या दृष्टीने विचारात घेतलेल्या यादृच्छिक चलांच्या क्षणांसाठी अभिव्यक्तीच्या वापरावर आधारित आहे. क्षणांच्या पद्धतीचे अंदाज क्षणांच्या संदर्भात पॅरामीटर्स व्यक्त करणाऱ्या फंक्शन्समध्ये सैद्धांतिक क्षणांऐवजी नमुना क्षण बदलून प्राप्त केले जातात.
जास्तीत जास्त शक्यता पद्धतीत, प्रामुख्याने आर.ए. फिशरने विकसित केलेल्या, पॅरामीटरचा अंदाज म्हणून आणि u* चे मूल्य घेतले जाते, ज्यासाठी तथाकथित संभाव्यता कार्य कमाल आहे
f(x1, u) f(x2, u) … f(xn, u),
जेथे x1, x2,…, xn हे निरीक्षणाचे परिणाम आहेत; f(x, u) ही त्यांची वितरण घनता आहे, u या पॅरामीटरवर अवलंबून आहे.
जास्तीत जास्त संभाव्यता अंदाजक सामान्यत: कार्यक्षम (किंवा असिम्प्टोटिकली कार्यक्षम) असतात आणि क्षण अंदाजकर्त्यांच्या पद्धतीपेक्षा लहान फरक असतात. काही प्रकरणांमध्ये, त्यांच्यासाठी सूत्रे स्पष्टपणे लिहिली जातात (सामान्य वितरण, शिफ्टशिवाय घातांकीय वितरण). तथापि, अधिक वेळा त्यांना शोधण्यासाठी, अंकीयदृष्ट्या ट्रान्सेंडेंटल समीकरणे (वेइबुल-ग्नेडेन्को वितरण, गामा) ची प्रणाली सोडवणे आवश्यक आहे. अशा प्रकरणांमध्ये, जास्तीत जास्त संभाव्यतेचा अंदाज न वापरण्याचा सल्ला दिला जातो, परंतु इतर प्रकारचे अंदाज, प्रामुख्याने एक-चरण अंदाज.
नॉनपॅरामेट्रिक अंदाज समस्यांमध्ये, एक संभाव्य मॉडेल स्वीकारले जाते ज्यामध्ये x1, x2,…, xn निरीक्षणांचे परिणाम F(x) वितरण कार्यासह n स्वतंत्र यादृच्छिक चलांचे प्राप्ती मानले जातात. सामान्य दृश्य. F(x) फक्त काही अटी पूर्ण करण्यासाठी आवश्यक आहे जसे की सातत्य, गणितीय अपेक्षांचे अस्तित्व आणि फैलाव इ. अशा अटी विशिष्ट पॅरामेट्रिक कुटुंबाशी संबंधित असलेल्या अटीइतक्या कठोर नाहीत.
नॉन-पॅरामेट्रिक फॉर्म्युलेशनमध्ये, एकतर यादृच्छिक व्हेरिएबलची वैशिष्ट्ये (गणितीय अपेक्षा, भिन्नता, भिन्नतेचे गुणांक) किंवा त्याचे वितरण कार्य, घनता इत्यादींचा अंदाज लावला जातो. अशाप्रकारे, मोठ्या संख्येच्या नियमानुसार, अंकगणित नमुना सरासरी हा गणितीय अपेक्षेचा M(X) (निरीक्षणांच्या परिणामांच्या F(x) कोणत्याही वितरण कार्यासाठी ज्यासाठी गणितीय अपेक्षा अस्तित्वात आहे) एक सुसंगत अंदाज आहे. मध्यवर्ती मर्यादा प्रमेयाच्या मदतीने, असिम्प्टोटिक आत्मविश्वास सीमा निर्धारित केल्या जातात
(M(X))H = , (M(X))B = .
जेथे r ही आत्मविश्वास संभाव्यता आहे, शून्य गणितीय अपेक्षा आणि एकक भिन्नतेसह मानक सामान्य वितरण N(0;1) च्या क्रमाचे परिमाण आहे, नमुना अंकगणितीय सरासरी आहे, s हा नमुना मानक विचलन आहे. "असिम्प्टोटिक कॉन्फिडन्स बाउंड्स" या शब्दाचा अर्थ असा होतो की संभाव्यता
P((M(X))H< M(X)}, P{(M(X))B >M(X)),
P((M(X))H< M(X) < (M(X))B}
n > ? साठी अनुक्रमे, आणि r कडे कल, परंतु, सर्वसाधारणपणे, मर्यादित n साठी या मूल्यांच्या समान नाहीत. सराव मध्ये, असिम्प्टोटिक कॉन्फिडन्स बाउंड्स 10 च्या ऑर्डरच्या n साठी पुरेशी अचूकता देतात.
नॉनपॅरामेट्रिक अंदाजाचे दुसरे उदाहरण वितरण कार्य अंदाज आहे. ग्लिव्हेंकोच्या प्रमेयानुसार, अनुभवजन्य वितरण कार्य Fn(x) हे वितरण कार्य F(x) चे सातत्यपूर्ण अंदाज आहे. जर F(x) एक सतत फंक्शन असेल, तर कोल्मोगोरोव्ह प्रमेयाच्या आधारावर, वितरण कार्य F(x) साठी आत्मविश्वास मर्यादा खालीलप्रमाणे दिली जाते.
(F(x))Н = कमाल , (F(x))B = मिनिट ,
जेथे k(r,n) हा नमुना आकार n साठी कोल्मोगोरोव्ह आकडेवारीच्या वितरणाचा क्रम परिमाण आहे (या आकडेवारीचे वितरण F(x) वर अवलंबून नाही हे लक्षात ठेवा).
पॅरामेट्रिक केसमध्ये अंदाज आणि आत्मविश्वास मर्यादा निर्धारित करण्याचे नियम F(x;u) वितरणाच्या पॅरामेट्रिक कुटुंबावर आधारित आहेत. वास्तविक डेटावर प्रक्रिया करताना, प्रश्न उद्भवतो - हे डेटा स्वीकारलेल्या संभाव्य मॉडेलशी संबंधित आहेत का? त्या. सांख्यिकीय गृहीतक असे की निरीक्षणांच्या परिणामांमध्ये काही u = u0 साठी कुटुंबातील (F(x; u), u) वितरण कार्य असते? अशा गृहितकांना चाडनेस-ऑफ-फिट गृहीतक म्हणतात, आणि त्यांच्या पडताळणीच्या निकषांना तंदुरुस्तपणा म्हणतात.
u = u0 या पॅरामीटरचे खरे मूल्य ज्ञात असल्यास, वितरण कार्य F(x; u0) सतत असेल, तर आकडेवारीवर आधारित कोल्मोगोरोव्ह चाचणी बहुतेक वेळा योग्य गृहीतकाच्या चांगुलपणाची चाचणी घेण्यासाठी वापरली जाते.
जेथे Fn(x) हे अनुभवजन्य वितरण कार्य आहे.
जर u0 पॅरामीटरचे खरे मूल्य अज्ञात असेल, उदाहरणार्थ, निरीक्षण परिणामांच्या वितरणाच्या सामान्यतेबद्दलच्या गृहीतकाची चाचणी करताना (म्हणजे, हे वितरण सामान्य वितरणाच्या कुटुंबाशी संबंधित आहे की नाही हे तपासताना), तर काही वेळा आकडेवारी वापरली जाते.
हे कोल्मोगोरोव्ह आकडेवारी Dn पेक्षा वेगळे आहे कारण u0 पॅरामीटरच्या खरे मूल्याऐवजी, त्याचा अंदाज u* बदलला आहे.
आकडेवारीचे वितरण Dn(u*) आकडेवारी Dn च्या वितरणापेक्षा खूप वेगळे आहे. उदाहरण म्हणून, u = (m, y2) आणि u* = (, s2) तेव्हा सामान्यता तपासणीचा विचार करा. या प्रकरणात, Dn आणि Dn(u*) आकडेवारीच्या वितरणाचे परिमाण तक्ता 1 मध्ये दिले आहेत. अशा प्रकारे, परिमाणांमध्ये सुमारे 1.5 पट फरक आहे.
सारणी 1 - सामान्यतेची चाचणी करताना Dn आणि Dn(u*) आकडेवारीचे परिमाण
सांख्यिकीय डेटाच्या प्राथमिक प्रक्रियेत, एक महत्त्वपूर्ण कार्य म्हणजे स्थूल चुका आणि त्रुटींमुळे प्राप्त झालेल्या निरीक्षणांचे परिणाम काढून टाकणे. उदाहरणार्थ, 3,500, 2,750, 4,200 या संख्येसह नवजात मुलांचे वजन डेटा (किलोग्राममध्ये) पाहताना, 35.00 संख्या दिसू शकते. हे स्पष्ट आहे की ही एक चुक आहे, आणि चुकीच्या नोंदीसह एक चुकीची संख्या प्राप्त झाली होती - स्वल्पविराम एका चिन्हाद्वारे हलविला गेला होता, निरीक्षणाच्या परिणामी, निरीक्षणाचा परिणाम चुकून 10 पट वाढला होता.
आऊटलायर्स वगळण्याच्या सांख्यिकीय पद्धती या गृहितकावर आधारित आहेत की अशा निरीक्षणांमध्ये असे वितरण आहे जे अभ्यासाधीन असलेल्यांपेक्षा तीव्रपणे भिन्न आहेत आणि म्हणून त्यांना नमुन्यातून वगळले पाहिजे.
सर्वात सोपा संभाव्य मॉडेल खालीलप्रमाणे आहे. शून्य गृहीतके अंतर्गत, निरीक्षणांचे परिणाम F(x) वितरण कार्यासह स्वतंत्र एकसमान वितरित यादृच्छिक चल X1,X2, Xn ची प्राप्ती म्हणून मानले जातात. पर्यायी गृहीतके अंतर्गत, X1, X2, Xn-1 हे शून्य गृहीतकाप्रमाणेच आहेत आणि Xn हे एकूण त्रुटीशी संबंधित आहे आणि त्याचे वितरण कार्य G(x) = F(x - c) आहे, जेथे c मोठे आहे. नंतर, 1 च्या जवळ संभाव्यतेसह (अधिक तंतोतंत, नमुना आकार वाढत असताना 1 कडे झुकत आहे),
Xn = कमाल ( X1, X2 , Xn) = Xmax ,
त्या डेटाचे वर्णन करताना, Xmax ला संभाव्य एकूण त्रुटी म्हणून विचारात घेतले पाहिजे. गंभीर प्रदेशाला फॉर्म असतो
W \u003d (x: x\u003e d).
गंभीर मूल्य d = d(b, n) हे स्थितीतील महत्त्व पातळी b आणि नमुना आकार n यावर अवलंबून निवडले जाते.
P(Xmax > d | H0) = b (1)
अट (1) खालीलपैकी मोठ्या n आणि लहान b साठी समतुल्य आहे:
F(x) निरीक्षणांच्या परिणामांचे वितरण कार्य ज्ञात असल्यास, संबंध (2) वरून d हे गंभीर मूल्य आढळते. जर F(x) हे पॅरामीटर्सपर्यंत ज्ञात असेल, उदाहरणार्थ, F(x) हे एक सामान्य वितरण कार्य आहे हे ज्ञात असेल, तर विचाराधीन गृहितके तपासण्याचे नियम देखील विकसित केले जातात.
तथापि, बहुतेक वेळा निरीक्षणांच्या परिणामांच्या वितरण कार्याचे स्वरूप पूर्णपणे अचूक नसते आणि पॅरामीटर्सपर्यंत नसते, परंतु केवळ काही त्रुटींसह ओळखले जाते. मग संबंध (2) व्यावहारिकदृष्ट्या निरुपयोगी बनतात, कारण F(x) च्या व्याख्येतील एक लहान त्रुटी, जसे दर्शविल्या जाऊ शकते, मोठी त्रुटीस्थिती (2) वरून गंभीर मूल्य d निर्धारित करताना आणि निश्चित d वर, निकषाची महत्त्व पातळी नाममात्रापेक्षा लक्षणीय भिन्न असू शकते.
म्हणून, अशा परिस्थितीत जेथे F(x) बद्दल कोणतीही संपूर्ण माहिती नाही, परंतु गणितीय अपेक्षा M(X) आणि X1, X2, Xn या निरीक्षणांच्या निकालांचे भिन्नता y2 = D(X) ज्ञात आहेत, नॉनपॅरामेट्रिक नकार नियम Chebyshev असमानता आधारित वापरले जाऊ शकते. या असमानतेचा वापर करून, आम्हाला d = d(b, n) असे गंभीर मूल्य आढळते.
नंतर संबंध (3) समाधानी असेल जर
चेबीशेव्हच्या असमानतेद्वारे
म्हणून, (4) समाधानी होण्यासाठी, हे सूत्र (4) आणि (5) च्या उजव्या बाजूचे समीकरण करणे पुरेसे आहे, उदा. स्थितीवरून डी निश्चित करा
सूत्र (6) द्वारे गणना केलेल्या d च्या गंभीर मूल्यावर आधारित नकार नियम वितरण कार्य F(x) बद्दल किमान माहिती वापरतो आणि म्हणून केवळ मुख्य वस्तुमानापासून खूप दूर असलेली निरीक्षणे वगळतो. दुस-या शब्दात, संबंध (1) द्वारे दिलेले d1 चे मूल्य सामान्यतः संबंधाने (6) दिलेल्या d2 च्या मूल्यापेक्षा खूपच लहान असते.
2.4 बहुविविध सांख्यिकीय विश्लेषण
खालील समस्यांचे निराकरण करण्यासाठी बहुविध सांख्यिकीय विश्लेषण वापरले जाते:
* वैशिष्ट्यांमधील संबंधांचा अभ्यास;
* वेक्टरद्वारे दिलेल्या वस्तू किंवा वैशिष्ट्यांचे वर्गीकरण;
* वैशिष्ट्य स्पेसच्या परिमाणात घट.
या प्रकरणात, निरीक्षणाचा परिणाम म्हणजे ऑब्जेक्टमध्ये मोजल्या गेलेल्या परिमाणवाचक आणि कधीकधी गुणात्मक वैशिष्ट्यांच्या निश्चित संख्येच्या मूल्यांचे वेक्टर. परिमाणवाचक चिन्ह हे निरीक्षण केलेल्या युनिटचे चिन्ह आहे, जे थेट संख्या आणि मोजमापाच्या एककाद्वारे व्यक्त केले जाऊ शकते. एक परिमाणवाचक गुणधर्म गुणात्मक एकाच्या विरूद्ध आहे - निरीक्षण केलेल्या युनिटचे गुणधर्म, दोन किंवा अधिक सशर्त श्रेणींपैकी एकास असाइनमेंटद्वारे निर्धारित केले जाते (जर नक्की दोन श्रेणी असतील तर गुणधर्माला पर्यायी म्हणतात). गुणात्मक वैशिष्ट्यांचे सांख्यिकीय विश्लेषण हा संख्यात्मक नसलेल्या वस्तूंच्या आकडेवारीचा भाग आहे. परिमाणवाचक चिन्हे मध्यांतर, गुणोत्तर, फरक, निरपेक्ष या मोजमापांमध्ये मोजलेल्या चिन्हांमध्ये विभागली जातात.
आणि गुणात्मक - नावांच्या स्केल आणि ऑर्डिनल स्केलमध्ये मोजलेल्या चिन्हांवर. डेटा प्रोसेसिंग पद्धती त्या स्केलशी सुसंगत असाव्यात ज्यामध्ये मानलेली वैशिष्ट्ये मोजली जातात.
वैशिष्ट्यांमधील संबंधांचा अभ्यास करण्याचे उद्दिष्ट वैशिष्ट्यांमधील नातेसंबंधाचे अस्तित्व सिद्ध करणे आणि या संबंधाचा अभ्यास करणे आहे. सहसंबंध विश्लेषणाचा उपयोग X आणि Y या दोन यादृच्छिक चलांमधील कनेक्शनचे अस्तित्व सिद्ध करण्यासाठी केला जातो. जर X आणि Y चे संयुक्त वितरण सामान्य असेल, तर सांख्यिकीय निष्कर्ष नमुना रेखीय सहसंबंध गुणांकावर आधारित असतात, इतर बाबतीत, केंडल आणि स्पिअरमॅन रँक सहसंबंध गुणांक वापरले जातात आणि गुणात्मक वैशिष्ट्यांसाठी, ची-स्क्वेअर चाचणी वापरली जाते. .
रीग्रेशन विश्लेषणाचा उपयोग परिमाणवाचक गुण Y च्या परिमाणवाचक वैशिष्ट्यांवर x(1), x(2), ..., x(k) च्या कार्यात्मक अवलंबनाचा अभ्यास करण्यासाठी केला जातो. या अवलंबनाला प्रतिगमन किंवा थोडक्यात, प्रतिगमन म्हणतात. प्रतिगमन विश्लेषणाचे सर्वात सोपे संभाव्य मॉडेल (k = 1 च्या बाबतीत) प्रारंभिक माहिती म्हणून निरीक्षण परिणामांच्या जोड्यांचा संच वापरते (xi, yi), i = 1, 2, … , n, आणि त्याचे स्वरूप आहे
yi = axi + b + ei, i = 1, 2, … , n,
जेथे ei निरीक्षण त्रुटी आहेत. कधीकधी असे गृहीत धरले जाते की ei समान सामान्य वितरण N(0, y2) सह स्वतंत्र यादृच्छिक चल आहेत. निरीक्षण त्रुटींचे वितरण सामान्यतः सामान्यपेक्षा वेगळे असल्याने, नॉनपॅरामेट्रिक फॉर्म्युलेशनमध्ये रीग्रेशन मॉडेलचा विचार करणे उचित आहे, म्हणजे. ei च्या अनियंत्रित वितरणासाठी.
प्रतिगमन विश्लेषणाचे मुख्य कार्य म्हणजे अज्ञात पॅरामीटर्स a आणि b चा अंदाज लावणे, जे x वर y चे रेखीय अवलंबन निर्धारित करतात. या समस्येचे निराकरण करण्यासाठी, के. गॉस यांनी 1794 मध्ये विकसित केलेली किमान वर्गांची पद्धत वापरली जाते, म्हणजे. वर्गांची बेरीज कमी करण्याच्या स्थितीवरून अज्ञात मॉडेल पॅरामीटर्स a आणि b चे अंदाज शोधा
व्हेरिएबल्स a आणि b साठी.
परिमाणवाचक व्हेरिएबलवरील गुणात्मक वैशिष्ट्यांच्या प्रभावाचा अभ्यास करण्यासाठी भिन्नतेचे विश्लेषण वापरले जाते. उदाहरणार्थ, k मशीनवर उत्पादित केलेल्या उत्पादनाच्या युनिट्सच्या गुणवत्तेच्या परिमाणवाचक निर्देशकाच्या मोजमापांच्या परिणामांचे k नमुने असू द्या, उदा. संख्यांचा संच (x1(j), x2(j), … , xn(j)), जिथे j हा मशीन क्रमांक आहे, j = 1, 2, …, k, आणि n हा नमुना आकार आहे. भिन्नतेच्या विश्लेषणाच्या सामान्य सूत्रामध्ये, असे गृहीत धरले जाते की मापन परिणाम स्वतंत्र आहेत आणि प्रत्येक नमुन्यामध्ये समान भिन्नता असलेले सामान्य वितरण N(m(j), y2) आहे.
उत्पादनाच्या गुणवत्तेची एकसमानता तपासत आहे, म्हणजे. उत्पादनाच्या गुणवत्तेवर मशीन क्रमांकाचा प्रभाव नसणे, गृहीतके तपासण्यासाठी खाली येते
H0: m(1) = m(2) = … = m(k).
फैलाव विश्लेषणामध्ये, अशा गृहितकांची चाचणी घेण्यासाठी पद्धती विकसित केल्या गेल्या आहेत.
गृहीतक H0 ची वैकल्पिक गृहीतक H1 विरुद्ध चाचणी केली जाते, त्यानुसार सूचित केलेल्या समानतेपैकी किमान एक समाधानी नाही. या गृहितकाची पडताळणी आर.ए. फिशरने सूचित केलेल्या खालील "विघटनांचे विघटन" वर आधारित आहे:
जेथे s2 हा संचित नमुन्यातील नमुना भिन्नता आहे, उदा.
अशा प्रकारे, सूत्र (7) च्या उजव्या बाजूला असलेली पहिली संज्ञा इंट्राग्रुप डिस्पर्शन दर्शवते. शेवटी, आंतरसमूह भिन्नता,
फॉर्म्युलाच्या प्रकार (7) च्या भिन्नतेच्या विस्ताराशी संबंधित लागू केलेल्या आकडेवारीच्या क्षेत्रास भिन्नतेचे विश्लेषण म्हणतात. भिन्नता समस्येच्या विश्लेषणाचे उदाहरण म्हणून, मापन परिणाम स्वतंत्र आहेत आणि प्रत्येक नमुन्यात समान भिन्नता असलेले सामान्य वितरण N(m(j), y2) आहे असे गृहीत धरून वरील गृहीतक H0 ची चाचणी करण्याचा विचार करा. जर H0 सत्य असेल तर, सूत्राच्या उजव्या बाजूला असलेल्या पहिल्या पदाला (7), y2 ने भागल्यास, स्वातंत्र्याच्या k(n-1) अंशांसह ची-चौरस वितरण आहे, आणि दुसऱ्या पदाला, y2 ने भागल्यास, देखील आहे एक ची-स्क्वेअर वितरण, परंतु ( k-1) अंशांच्या स्वातंत्र्यासह, आणि प्रथम आणि द्वितीय संज्ञा यादृच्छिक चल म्हणून स्वतंत्र आहेत. तर रँडम व्हेरिएबल
स्वातंत्र्याच्या (k-1) अंश अंशांसह फिशर वितरण आहे आणि स्वातंत्र्याच्या k(n-1) भाजक अंश आहेत. गृहीतक H0 स्वीकारले जाते जर F< F1-б, и отвергается в противном случае, где F1-б - квантиль порядка 1-б распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н1 величина F безгранично увеличивается при росте объема выборок n. Значения F1-б берут из соответствующих таблиц.
पांगापांग विश्लेषणाच्या शास्त्रीय समस्यांचे निराकरण करण्यासाठी नॉनपॅरामेट्रिक पद्धती, विशेषतः, गृहीतक H0 ची चाचणी, विकसित केली गेली आहे.
पुढील प्रकारच्या बहुविविध सांख्यिकीय विश्लेषण समस्या म्हणजे वर्गीकरण समस्या. ते मुळात तीन भागात विभागलेले आहेत भिन्न प्रकार- भेदभावपूर्ण विश्लेषण, क्लस्टर विश्लेषण, गटबद्ध समस्या.
भेदभावपूर्ण विश्लेषणाचे कार्य म्हणजे पूर्वी वर्णन केलेल्या वर्गांपैकी एकास निरीक्षण केलेले ऑब्जेक्ट नियुक्त करण्यासाठी नियम शोधणे. या प्रकरणात, वस्तूंचे वर्णन गणितीय मॉडेलमध्ये वेक्टर वापरून केले जाते, ज्याचे निर्देशांक प्रत्येक ऑब्जेक्टसाठी अनेक वैशिष्ट्यांचे निरीक्षण करण्याचे परिणाम आहेत. वर्गांचे वर्णन थेट गणिताच्या अटींमध्ये किंवा प्रशिक्षण नमुने वापरून केले जाते. प्रशिक्षण नमुना एक नमुना असतो, ज्याच्या प्रत्येक घटकासाठी तो कोणत्या वर्गाशी संबंधित आहे हे सूचित केले जाते.
...तत्सम दस्तऐवज
अर्थमिति आणि लागू आकडेवारीचा इतिहास. राष्ट्रीय अर्थव्यवस्थेत लागू आकडेवारी. वाढीचे बिंदू. नॉनपॅरामेट्रिक आकडेवारी. संख्यात्मक नसलेल्या वस्तूंची आकडेवारी लागू आकडेवारीचा एक भाग आहे.
अमूर्त, 01/08/2009 जोडले
निर्धारक घटकाचे स्ट्रक्चरल घटक. वेळ मालिकेचे सांख्यिकीय विश्लेषणाचे मुख्य लक्ष्य. Extrapolative अंदाज आर्थिक प्रक्रिया. विसंगत निरीक्षणांची ओळख, तसेच वेळ मालिका मॉडेलचे बांधकाम.
टर्म पेपर, 03/11/2014 जोडले
निर्णय घेण्याचे सांख्यिकीय मॉडेल. पर्यावरणाच्या स्थितीच्या ज्ञात संभाव्यता वितरणासह मॉडेलचे वर्णन. विचार करणे सर्वात सोपा सर्किटडायनॅमिक निर्णय घेण्याची प्रक्रिया. एंटरप्राइझच्या बदलाच्या संभाव्यतेची गणना करणे.
नियंत्रण कार्य, 11/07/2011 जोडले
एक-आयामी वेळ मालिकेच्या विश्लेषणासाठी सांख्यिकीय पद्धती, विश्लेषण आणि अंदाजाच्या समस्या सोडवणे, अभ्यासाधीन निर्देशकाचा आलेख तयार करणे. मालिकेतील घटक ओळखण्यासाठी निकष, मालिकेच्या यादृच्छिकतेबद्दलच्या गृहीतकाची चाचणी आणि मानक त्रुटींची मूल्ये.
नियंत्रण कार्य, 08/13/2010 जोडले
व्यवस्थापन प्रक्रियेच्या परिमाणवाचक आणि गुणात्मक वैशिष्ट्यांच्या वस्तुनिष्ठ मूल्यांकनामध्ये सांख्यिकीय पद्धतींची भूमिका. प्रक्रिया आणि उत्पादन पॅरामीटर्सच्या विश्लेषणामध्ये दर्जेदार साधनांचा वापर. स्वतंत्र यादृच्छिक चल. संभाव्यता सिद्धांत.
टर्म पेपर, 01/11/2015 जोडले
इष्टतम निर्णय घेण्याचा गणिती सिद्धांत. टॅब्युलर सिम्प्लेक्स पद्धत. दुहेरी समस्येचे सूत्रीकरण आणि निराकरण रेखीय प्रोग्रामिंग. वाहतूक समस्येचे गणितीय मॉडेल. एंटरप्राइझमध्ये उत्पादनांच्या व्यवहार्यतेचे विश्लेषण.
नियंत्रण कार्य, 06/13/2012 जोडले
सामान्य, निवडक लोकसंख्या. संभाव्य-सांख्यिकीय विश्लेषणाचे पद्धतशीर पाया. गणितीय आकडेवारीच्या समस्यांचे निराकरण करण्यासाठी डिझाइन केलेली MathCad कार्ये. सूत्रे वापरून आणि "डेटा विश्लेषण" मेनू वापरून एमएस एक्सेलमधील समस्या सोडवणे.
टर्म पेपर, 01/20/2014 जोडले
उत्पादन योजनेसाठी खर्चाच्या रकमेची गणना. जोडी प्रतिगमनाच्या रेखीय समीकरणाचे गुणांक. परिणामांच्या ग्राफिकल व्याख्याची वैशिष्ट्ये. आर्थिक प्रक्रियांचा विकास. वेळ मालिकेच्या इकोनोमेट्रिक मॉडेलिंगची वैशिष्ट्ये.
चाचणी, 02/22/2011 जोडले
वेळ मालिकेच्या अर्थमितीय विश्लेषणाचे मूलभूत घटक. विश्लेषण कार्ये आणि त्यांची प्रारंभिक प्रक्रिया. वेळ मालिका मूल्यांच्या अल्प आणि मध्यम-मुदतीच्या अंदाजाच्या समस्या सोडवणे. ट्रेंड समीकरणाचे पॅरामीटर्स शोधण्याच्या पद्धती. किमान चौरस पद्धत.
नियंत्रण कार्य, 06/03/2009 जोडले
यादृच्छिक घटना, प्रमाण आणि कार्यांबद्दल प्राथमिक संकल्पना. यादृच्छिक चलांची संख्यात्मक वैशिष्ट्ये. वितरणाच्या असममितीचे प्रकार. यादृच्छिक चलांच्या वितरणाचे सांख्यिकीय मूल्यांकन. स्ट्रक्चरल-पॅरामीट्रिक ओळख समस्या सोडवणे.
विश्लेषणात्मक पद्धती अनेक विश्लेषणात्मक अवलंबनांसह व्यवस्थापकाच्या कार्यावर आधारित आहेत. जे केले जात असलेल्या कार्याची परिस्थिती आणि सूत्रे, आलेख इत्यादींच्या रूपात त्याचे परिणाम यांच्यातील संबंध निर्धारित करतात.
भूतकाळातील माहितीच्या वापरावर आधारित सांख्यिकीय पद्धती चांगला अनुभवएसडीचा अवलंब डिझाइन करताना. स्टॅटिक मॉडेलिंगचा वापर करून सांख्यिकीय डेटाचे संकलन, प्रक्रिया, विश्लेषण करून या पद्धती लागू केल्या जातात. अशा पद्धती विकासाच्या टप्प्यावर आणि उपाय निवडण्याच्या टप्प्यावर दोन्ही वापरल्या जाऊ शकतात.
गणितीय पद्धती, ते आपल्याला इष्टतम निकषांनुसार सर्वोत्तम समाधानाची गणना करण्यास अनुमती देतात. हे करण्यासाठी, आवश्यक परिस्थिती संगणकात प्रविष्ट केली जाते, ध्येय आणि निकष प्रविष्ट केले जातात. गणितीय संबंधावर आधारित संगणक एकतर नवीन विकसित करतो किंवा योग्य निवडतो.
18 व्यवस्थापकीय निर्णय घेण्याच्या पद्धती सक्रिय करणे
विचारमंथन ही विश्लेषणात्मक नसलेल्या विचारांवर आधारित समस्येच्या गट चर्चेची पद्धत आहे.
1) कल्पना निर्माण करण्याचा टप्पा टीकेच्या टप्प्यापासून वेगळा केला जातो;
2) कल्पना निर्माण करण्याच्या टप्प्यावर, कोणतीही टीका निषिद्ध आहे; मूर्ख कल्पना स्वीकारल्या जातात.
3) सर्व कल्पना लिखित स्वरूपात रेकॉर्ड केल्या जातात;
4) या टप्प्यावर, समीक्षक 3-4 कल्पना निवडतात ज्यांचा पर्याय म्हणून विचार केला जाऊ शकतो.
"प्रश्न आणि उत्तरे" ची पद्धत प्रश्नांच्या संचाच्या प्राथमिक संकलनावर आधारित आहे, ज्याची उत्तरे तयार होऊ शकतात नवीन दृष्टीकोनसमस्या सोडवण्यासाठी.
पद्धत "5 का"
पाच "का?" हे एक प्रभावी साधन आहे जे विशिष्ट समस्येचे कारण-आणि-परिणाम संबंध शोधण्यासाठी, कारक घटक ओळखण्यासाठी आणि मूळ कारण ओळखण्यासाठी प्रश्नांचा वापर करते. "का?" च्या दिशेने तर्काकडे पाहिल्यास, आम्ही हळूहळू या समस्येवर प्रभाव टाकणार्या एकमेकांशी जोडलेल्या कारक घटकांची संपूर्ण साखळी प्रकट करतो.
कृती योजना
निराकरण करण्यासाठी विशिष्ट समस्या निश्चित करा.
विचाराधीन समस्येच्या शब्दांवर सहमती मिळवा.
एखाद्या समस्येवर उपाय शोधताना, एखाद्याने अंतिम परिणाम (समस्या) पासून सुरुवात केली पाहिजे आणि समस्या का उद्भवते हे विचारून मागे (मूळ कारणाकडे) कार्य केले पाहिजे.
समस्येखाली उत्तर लिहा.
जर उत्तराने समस्येचे मूळ कारण प्रकट केले नाही तर, "का?" प्रश्न पुन्हा विचारा. आणि खाली एक नवीन उत्तर लिहा.
प्रश्न "का?" समस्येचे मूळ कारण स्पष्ट होईपर्यंत पुनरावृत्ती करणे आवश्यक आहे.
जर उत्तराने समस्या सोडवली आणि गट त्याच्याशी सहमत असेल तर, उत्तर वापरून निर्णय घेतला जातो.
"गेम-सैद्धांतिक पद्धत" समाधान विकसित करण्यासाठी मानवी-मशीन प्रणालीच्या निर्मितीवर आधारित आहे. पारंपारिक बैठका अग्रदूत होत्या. सहसा अशा बैठकांमध्ये आर्थिक, सामाजिक. आणि विशेष उपाय. सहभागींच्या आवडी अनेकदा भिन्न असतात आणि समस्यांची श्रेणी विस्तृत असते. मीटिंगच्या पद्धतीचा गुणात्मक विकास म्हणजे संगणक मॉडेलच्या स्वरूपात एसडी, कृत्रिम बुद्धिमत्तेच्या विकास प्रक्रियेचा परिचय.
संस्थेच्या संगणक मॉडेलमध्ये हे समाविष्ट आहे:
1) संदर्भ डेटा (पुरवठादार, ग्राहकांवर);
2) कंपनीचे सिम्युलेशन मॉडेल
3) आर्थिक गणना आणि अंदाज पद्धती
4) समान परिस्थितीत उपायांबद्दल माहिती.
परिणामी, सभा अधिक फलदायी ठरतात. अशी बैठक खेळाच्या अनेक सत्रांमध्ये असू शकते: जिथे 1 सत्रात सर्व सहभागी संगणकावर प्रक्रिया केल्यानंतर त्यांच्या आवश्यकता प्रविष्ट करतात. एक विशिष्ट निर्णय जारी करते ज्यावर चर्चा केली जाऊ शकते आणि पुन्हा समायोजित केली जाऊ शकते. हे एक सामान्य निर्णय होईपर्यंत किंवा निर्णय नाकारले जाईपर्यंत टिकू शकते.
"इनपुटवर" कोणत्या प्रकारचा डेटा आहे त्यानुसार:२.१. संख्या.
२.२. मर्यादित-आयामी वेक्टर.
२.३. कार्ये (वेळ मालिका).
२.४. संख्यात्मक नसलेल्या वस्तू.
सर्वात मनोरंजक वर्गीकरण नियंत्रणाच्या त्या कार्यांनुसार आहे, ज्याच्या निराकरणासाठी अर्थमितीय पद्धती वापरल्या जातात. या दृष्टिकोनासह, ब्लॉक्सचे वाटप केले जाऊ शकते:
३.१. अंदाज आणि नियोजनासाठी समर्थन.
३.२. ट्रॅकिंग नियंत्रित पॅरामीटर्सआणि विचलन शोधणे.
३.३. सपोर्ट निर्णय घेणे, आणि इ.
विशिष्ट इकोनोमेट्रिक कंट्रोलिंग टूल्स वापरण्याची वारंवारता कोणते घटक ठरवतात? इकोनोमेट्रिक्सच्या इतर अनुप्रयोगांप्रमाणे, घटकांचे दोन मुख्य गट आहेत - ही सोडवायची कार्ये आणि तज्ञांची पात्रता आहेत.
कंट्रोलरच्या ऑपरेशनमध्ये इकोनोमेट्रिक पद्धतींचा व्यावहारिक वापर करताना, योग्य सॉफ्टवेअर सिस्टम वापरणे आवश्यक आहे. सामान्य सांख्यिकी प्रणाली जसे SPSS, Statgraphics, Statistica, ADDA, आणि अधिक विशेष Statcon, SPC, NADIS, REST(मध्यांतर डेटाच्या आकडेवारीनुसार), मॅट्रिक्सरआणि इतर अनेक. वापरण्यास सुलभतेचा मोठ्या प्रमाणावर अवलंब सॉफ्टवेअर उत्पादने, ज्यामध्ये विशिष्ट आर्थिक डेटाचे विश्लेषण करण्यासाठी आधुनिक अर्थमितीय साधने समाविष्ट आहेत, त्यापैकी एक मानले जाऊ शकते प्रभावी मार्गवैज्ञानिक आणि तांत्रिक प्रगतीचा वेग, आधुनिक अर्थमितीय ज्ञानाचा प्रसार.
अर्थमिती सतत विकसित होत आहे. उपयोजित संशोधनामुळे शास्त्रीय पद्धतींच्या सखोल विश्लेषणाची गरज भासते.
चर्चा करण्यासाठी एक चांगले उदाहरण म्हणजे दोन नमुन्यांची एकसमानता तपासण्याच्या पद्धती. दोन समुच्चय आहेत, आणि ते वेगळे किंवा समान आहेत हे ठरवणे आवश्यक आहे. हे करण्यासाठी, त्या प्रत्येकाकडून एक नमुना घेतला जातो आणि एकसंधता तपासण्यासाठी एक किंवा दुसरी सांख्यिकीय पद्धत वापरली जाते. सुमारे 100 वर्षांपूर्वी, विद्यार्थी पद्धत प्रस्तावित करण्यात आली होती, जी आज मोठ्या प्रमाणावर वापरली जाते. तथापि, त्यात कमतरतांचा संपूर्ण समूह आहे. प्रथम, विद्यार्थ्यानुसार, नमुना वितरण सामान्य (गॉसियन) असणे आवश्यक आहे. एक नियम म्हणून, हे प्रकरण नाही. दुसरे म्हणजे, सर्वसाधारणपणे एकजिनसीपणा तपासणे (तथाकथित परिपूर्ण एकजिनसीपणा, म्हणजे, दोन लोकसंख्येशी संबंधित वितरण कार्यांचा योगायोग), परंतु केवळ गणितीय अपेक्षांची समानता तपासणे हे त्याचे उद्दीष्ट आहे. परंतु, तिसरे म्हणजे, दोन नमुन्यांमधील घटकांचे फरक समान आहेत असे गृहीत धरले पाहिजे. तथापि, भिन्नतेची समानता तपासणे, आणि त्याहूनही अधिक सामान्यता, गणितीय अपेक्षांच्या समानतेपेक्षा खूप कठीण आहे. त्यामुळे, विद्यार्थ्यांची टी-टेस्ट सहसा अशी तपासणी न करता लागू केली जाते. आणि मग विद्यार्थ्यांच्या निकषानुसार निष्कर्ष हवेतच लटकतात.
सिद्धांतामध्ये अधिक प्रगत, तज्ञ इतर निकषांकडे वळतात, उदाहरणार्थ, विल्कोक्सन निकषाकडे. हे नॉनपॅरामेट्रिक आहे, म्हणजे. सामान्यतेच्या गृहीतकावर अवलंबून नाही. पण तो दोषांशिवाय नाही. पूर्ण एकजिनसीपणा (दोन लोकसंख्येशी संबंधित वितरण कार्यांचा योगायोग) तपासण्यासाठी याचा वापर केला जाऊ शकत नाही. हे केवळ तथाकथितांच्या मदतीने केले जाऊ शकते. सुसंगत निकष, विशेषतः, स्मरनोव्ह निकष आणि ओमेगा-स्क्वेअर प्रकार.
व्यावहारिक दृष्टिकोनातून, स्मिर्नोव्ह निकषात एक कमतरता आहे - त्याची आकडेवारी केवळ थोड्या संख्येने मूल्ये घेते, त्याचे वितरण थोड्या संख्येत केंद्रित आहे आणि 0.05 आणि 0.01 च्या पारंपारिक महत्त्व पातळी वापरणे शक्य नाही. .
"उच्च सांख्यिकीय तंत्रज्ञान" हा शब्द. "उच्च सांख्यिकीय तंत्रज्ञान" या शब्दामध्ये तीनपैकी प्रत्येक शब्दाचा स्वतःचा अर्थ आहे.
"उच्च", इतर क्षेत्रांप्रमाणे, याचा अर्थ असा आहे की तंत्रज्ञान सिद्धांत आणि सराव, विशेषत: संभाव्यतेचा सिद्धांत आणि लागू गणितीय आकडेवारीच्या आधुनिक उपलब्धींवर आधारित आहे. त्याच वेळी, "आधुनिक वैज्ञानिक यशांवर आधारित" म्हणजे, प्रथम, संबंधित वैज्ञानिक शिस्तीच्या चौकटीत तंत्रज्ञानाचा गणितीय आधार तुलनेने अलीकडेच प्राप्त झाला आहे आणि दुसरे म्हणजे, गणना अल्गोरिदम विकसित केले गेले आहेत आणि त्यात न्याय्य आहेत. त्यानुसार (आणि तथाकथित नाहीत. "ह्युरिस्टिक"). कालांतराने, जर नवीन दृष्टीकोन आणि परिणाम आम्हाला तंत्रज्ञानाच्या उपयुक्तता आणि क्षमतांच्या मूल्यांकनावर पुनर्विचार करण्यास भाग पाडत नाहीत, तर ते अधिक आधुनिक तंत्रज्ञानाने बदला, "उच्च अर्थमितीय तंत्रज्ञान" "शास्त्रीय सांख्यिकीय तंत्रज्ञान" मध्ये बदलते. जसे किमान चौरस पद्धत. तर, उच्च सांख्यिकीय तंत्रज्ञान अलीकडील गंभीर फळे आहेत वैज्ञानिक संशोधन. येथे दोन आहेत मुख्य संकल्पना- तंत्रज्ञानाचे "युवा" (कोणत्याही परिस्थितीत, 50 वर्षांपेक्षा जुने नाही, किंवा चांगले - 10 किंवा 30 वर्षांपेक्षा जुने नाही) आणि "उच्च विज्ञान" वर अवलंबून असणे.
"सांख्यिकीय" हा शब्द परिचित आहे, परंतु त्याचे अनेक अर्थ आहेत. "सांख्यिकी" या शब्दाच्या 200 हून अधिक व्याख्या ज्ञात आहेत.
शेवटी, "तंत्रज्ञान" हा शब्द आकडेवारीच्या संदर्भात तुलनेने क्वचितच वापरला जातो. डेटा विश्लेषणामध्ये, एक नियम म्हणून, अनेक प्रक्रिया आणि अल्गोरिदम समाविष्ट असतात ज्या क्रमाने, समांतर किंवा अधिक जटिल योजनेमध्ये केल्या जातात. विशेषतः, खालील वैशिष्ट्यपूर्ण टप्पे ओळखले जाऊ शकतात:
- सांख्यिकीय अभ्यासाचे नियोजन;
- इष्टतम किंवा कमीतकमी तर्कसंगत कार्यक्रमानुसार डेटा संकलन आयोजित करणे (नमुने नियोजन, तयार करणे संघटनात्मक रचनाआणि तज्ञांच्या टीमची निवड, डेटा संकलनात गुंतलेल्या कर्मचार्यांचे प्रशिक्षण, तसेच डेटा नियंत्रक इ.);
- डेटाचे थेट संकलन आणि विविध माध्यमांवर त्यांचे निर्धारण (विषय क्षेत्राच्या कारणास्तव चुकीचा डेटा संकलन आणि नाकारण्याच्या गुणवत्ता नियंत्रणासह);
- डेटाचे प्राथमिक वर्णन (विविध नमुना वैशिष्ट्यांची गणना, वितरण कार्ये, नॉनपॅरामेट्रिक घनता अंदाज, हिस्टोग्रामचे बांधकाम, सहसंबंध फील्ड, विविध तक्ते आणि तक्ते इ.),
- विशिष्ट संख्यात्मक किंवा गैर-संख्यात्मक वैशिष्ट्ये आणि वितरणाच्या पॅरामीटर्सचा अंदाज (उदाहरणार्थ, भिन्नतेच्या गुणांकाचा नॉन-पॅरामेट्रिक मध्यांतर अंदाज किंवा प्रतिसाद आणि घटकांमधील संबंध पुनर्संचयित करणे, म्हणजे कार्य अंदाज),
- सांख्यिकीय गृहीतकांची चाचणी (कधीकधी त्यांची साखळी - मागील गृहीतकांची चाचणी घेतल्यानंतर, एक किंवा दुसर्या नंतरच्या गृहीतकाची चाचणी करण्याचा निर्णय घेतला जातो),
- अधिक सखोल अभ्यास, म्हणजे बहुविविध सांख्यिकीय विश्लेषणासाठी विविध अल्गोरिदमचा वापर, निदान आणि वर्गीकरण अल्गोरिदम, संख्यात्मक नसलेल्या आणि मध्यांतर डेटाची आकडेवारी, वेळ मालिका विश्लेषण इ.;
- प्राप्त अंदाजांच्या स्थिरतेची पडताळणी आणि प्रारंभिक डेटाच्या अनुज्ञेय विचलन आणि संभाव्य-सांख्यिकीय मॉडेल्सच्या गृहीतकांबद्दलचे निष्कर्ष, मोजमाप स्केलचे अनुज्ञेय परिवर्तन, विशेषतः, अंदाजांच्या गुणधर्मांचा अभ्यास नमुना गुणाकार;
- लागू केलेल्या उद्देशांसाठी प्राप्त सांख्यिकीय परिणामांचा वापर (उदाहरणार्थ, विशिष्ट सामग्रीचे निदान करणे, अंदाज बांधणे, निवड करणे गुंतवणूक प्रकल्पप्रस्तावित पर्यायांमधून, तांत्रिक प्रक्रियेच्या अंमलबजावणीसाठी इष्टतम मोड शोधणे, तांत्रिक उपकरणांच्या चाचणी नमुन्यांच्या निकालांचा सारांश इ.),
- अंतिम अहवाल तयार करणे, विशेषतः, जे डेटा विश्लेषणाच्या अर्थमितीय आणि सांख्यिकीय पद्धतींमध्ये तज्ञ नाहीत त्यांच्यासाठी, व्यवस्थापनासह - "निर्णयकर्ते".
सांख्यिकीय तंत्रज्ञानाची इतर रचना शक्य आहे. सांख्यिकीय पद्धतींचा योग्य आणि कार्यक्षम वापर हा कोणत्याही प्रकारे एकाच सांख्यिकीय गृहीतकाची चाचणी किंवा एका निश्चित कुटुंबाकडून दिलेल्या वितरणाच्या पॅरामीटर्सचा अंदाज नसतो यावर जोर देणे महत्त्वाचे आहे. या प्रकारच्या ऑपरेशन्स केवळ विटा आहेत जे सांख्यिकीय तंत्रज्ञानाची इमारत बनवतात. दरम्यान, सांख्यिकी आणि अर्थमितीवरील पाठ्यपुस्तके आणि मोनोग्राफ सामान्यत: वैयक्तिक बिल्डिंग ब्लॉक्सबद्दल बोलतात, परंतु त्यांच्या संस्थेच्या समस्यांबद्दल वापरल्या जाणार्या तंत्रज्ञानावर चर्चा करत नाहीत. एका सांख्यिकीय प्रक्रियेतून दुसर्याकडे होणारे संक्रमण सावलीत राहते.
"जुळणाऱ्या" सांख्यिकीय अल्गोरिदमच्या समस्येवर विशेष विचार करणे आवश्यक आहे, कारण मागील अल्गोरिदमचा वापर अनेकदा पुढील अल्गोरिदमसाठी लागू होण्याच्या अटींचे उल्लंघन करतो. विशेषतः, निरिक्षणांचे परिणाम स्वतंत्र राहणे बंद होऊ शकतात, त्यांचे वितरण बदलू शकते, इत्यादी.
उदाहरणार्थ, सांख्यिकीय गृहीतकांची चाचणी करताना, महत्त्वाची पातळी आणि शक्ती खूप महत्त्वाची असते. त्यांची गणना करण्याच्या आणि एका गृहीतकाची चाचणी घेण्यासाठी त्यांचा वापर करण्याच्या पद्धती सामान्यतः ज्ञात आहेत. जर एका गृहीतकाची प्रथम चाचणी केली गेली, आणि नंतर, त्याच्या पडताळणीचे परिणाम लक्षात घेऊन, दुसरी, तर अंतिम प्रक्रिया, जी काही (अधिक जटिल) सांख्यिकीय गृहीतकांची चाचणी म्हणून देखील मानली जाऊ शकते, त्यात वैशिष्ट्ये आहेत (महत्त्वाची पातळी आणि शक्ती. ) जे, एक नियम म्हणून, दोन घटक गृहितकांच्या वैशिष्ट्यांनुसार व्यक्त करणे सोपे असू शकत नाही आणि म्हणून ते सहसा अज्ञात असतात. परिणामी, अंतिम प्रक्रिया वैज्ञानिकदृष्ट्या आधारित मानली जाऊ शकत नाही; ती ह्युरिस्टिक अल्गोरिदमशी संबंधित आहे. अर्थात, योग्य अभ्यासानंतर, उदाहरणार्थ, मॉन्टे कार्लो पद्धतीद्वारे, ती लागू आकडेवारीच्या वैज्ञानिकदृष्ट्या आधारित प्रक्रियांपैकी एक होऊ शकते.
तर, अर्थमितीय किंवा सांख्यिकीय डेटा विश्लेषणाची प्रक्रिया माहितीपूर्ण आहे तांत्रिक प्रक्रिया दुसऱ्या शब्दांत, हे किंवा ते माहिती तंत्रज्ञान. सध्या, इकॉनॉमेट्रिक (सांख्यिकीय) डेटा विश्लेषणाची संपूर्ण प्रक्रिया स्वयंचलित करण्याबद्दल बोलणे गंभीर होणार नाही, कारण तज्ञांमध्ये चर्चा करण्यासाठी अनेक निराकरण न झालेल्या समस्या आहेत.
सध्या वापरलेल्या सांख्यिकीय पद्धतींचे संपूर्ण शस्त्रागार तीन प्रवाहांमध्ये विभागले जाऊ शकते:
- उच्च सांख्यिकीय तंत्रज्ञान;
- शास्त्रीय सांख्यिकी तंत्रज्ञान,
- कमी सांख्यिकीय तंत्रज्ञान.
हे सुनिश्चित करणे आवश्यक आहे की केवळ पहिल्या दोन प्रकारच्या तंत्रज्ञानाचा वापर विशिष्ट अभ्यासांमध्ये केला जातो.. त्याच वेळी, शास्त्रीय सांख्यिकीय तंत्रज्ञानाद्वारे आमचा अर्थ आदरणीय युगातील तंत्रज्ञान आहे ज्यांनी त्यांचे वैज्ञानिक मूल्य आणि आधुनिक सांख्यिकीय अभ्यासासाठी महत्त्व टिकवून ठेवले आहे. हे आहेत किमान चौरस पद्धत, Kolmogorov, Smirnov, omega-square, Spearman आणि Kendall चे नॉन-पॅरामेट्रिक सहसंबंध गुणांक आणि इतर अनेकांची आकडेवारी.
आमच्याकडे युनायटेड स्टेट्स आणि ग्रेट ब्रिटन (अमेरिकन स्टॅटिस्टिकल असोसिएशनमध्ये 20,000 पेक्षा जास्त सदस्यांचा समावेश आहे) पेक्षा कमी अर्थमितीय तज्ञांचा क्रम आहे. रशियाला नवीन तज्ञांच्या प्रशिक्षणाची आवश्यकता आहे - अर्थमितितज्ञ.
जे काही नवीन वैज्ञानिक परिणाम मिळतात, ते विद्यार्थ्यांसाठी अज्ञात राहिल्यास, संशोधक आणि अभियंते यांच्या नवीन पिढीला त्यांच्यावर प्रभुत्व मिळविण्यास भाग पाडले जाते, एकट्याने काम केले जाते किंवा त्यांना पुन्हा शोधून काढले जाते. काहीसे खडबडीत, आम्ही असे म्हणू शकतो: ते दृष्टिकोन, कल्पना, परिणाम, तथ्ये, अल्गोरिदम प्रशिक्षण अभ्यासक्रमआणि संबंधित अभ्यास मार्गदर्शक- वंशजांनी जतन केले आणि वापरलेले आहेत, जे मिळाले नाहीत - लायब्ररीच्या धुळीत गायब होतात.
वाढीचे गुण. पाच वाटप करा वर्तमान ट्रेंड, ज्यामध्ये आधुनिक लागू आकडेवारी विकसित केली जात आहे, म्हणजे. पाच "वाढीचे बिंदू": नॉन-पॅरामेट्रिक्स, मजबूतपणा, बूटस्ट्रॅप, मध्यांतर आकडेवारी, संख्यात्मक नसलेल्या वस्तूंची आकडेवारी. चला या वर्तमान ट्रेंडची थोडक्यात चर्चा करूया.
नॉन-पॅरामेट्रिक्स, किंवा नॉन-पॅरामेट्रिक आकडेवारी, तुम्हाला सांख्यिकीय निष्कर्ष काढण्याची, वितरण वैशिष्ट्यांचे मूल्यमापन करण्याची, नमुना घटकांचे वितरण कार्य एक किंवा दुसर्या पॅरामेट्रिक कुटुंबात समाविष्ट आहे अशा कमकुवतपणे सिद्ध केलेल्या गृहितकांशिवाय सांख्यिकीय गृहीतके तपासण्याची परवानगी देते. उदाहरणार्थ, असा एक व्यापक विश्वास आहे की आकडेवारी सहसा सामान्य वितरणाचे अनुसरण करते. तथापि, निरीक्षणांच्या विशिष्ट परिणामांचे विश्लेषण, विशेषतः, मोजमाप त्रुटी, असे दर्शविते की बहुसंख्य प्रकरणांमध्ये, वास्तविक वितरणे सामान्यपेक्षा लक्षणीय भिन्न असतात. सामान्यतेच्या गृहीतकेचा अविवेकी वापर केल्याने अनेकदा लक्षणीय त्रुटी निर्माण होतात, उदाहरणार्थ, निरीक्षणे (बाह्य) नाकारताना, सांख्यिकीय गुणवत्ता नियंत्रण आणि इतर प्रकरणांमध्ये. म्हणून, नॉनपॅरामेट्रिक पद्धती वापरणे हितकारक आहे, ज्यामध्ये निरीक्षणांच्या परिणामांच्या वितरण कार्यांवर केवळ अत्यंत कमकुवत आवश्यकता लागू केल्या जातात. सहसा फक्त त्यांची सातत्य गृहीत धरली जाते. आजपर्यंत, नॉनपॅरामेट्रिक पद्धतींच्या मदतीने, पॅरामेट्रिक पद्धतींनी पूर्वी सोडवलेल्या समस्यांच्या जवळजवळ समान श्रेणी सोडवणे शक्य आहे.
मजबुती (स्थिरता) वर कार्य करण्याची मुख्य कल्पना: प्रारंभिक डेटामधील लहान बदल आणि मॉडेलच्या गृहितकांमधील विचलनांसह निष्कर्ष थोडेसे बदलले पाहिजेत. येथे चिंतेचे दोन क्षेत्र आहेत. एक म्हणजे सामान्य डेटा विश्लेषण अल्गोरिदमच्या मजबूततेचा अभ्यास करणे. दुसरे म्हणजे काही समस्या सोडवण्यासाठी मजबूत अल्गोरिदम शोधणे.
स्वतःच, "मजबूतपणा" या शब्दाचा अस्पष्ट अर्थ नाही. विशिष्ट संभाव्य-सांख्यिकीय मॉडेल निर्दिष्ट करणे नेहमीच आवश्यक असते. त्याच वेळी, Tukey-Huber-Hampel "clogging" मॉडेल सहसा व्यावहारिकदृष्ट्या उपयुक्त नाही. हे "पुच्छांचे वजन" करण्याकडे केंद्रित आहे आणि वास्तविक परिस्थितींमध्ये "पुच्छ" निरिक्षणांच्या परिणामांवर प्राथमिक निर्बंधांद्वारे कापले जातात, उदाहरणार्थ, वापरल्या जाणार्या मोजमाप यंत्रांसह.
च्या गहन वापरावर आधारित बुटस्ट्रॅप नॉन-पॅरामेट्रिक आकडेवारीची एक शाखा आहे माहिती तंत्रज्ञान. मुख्य कल्पना "नमुने गुणाकार" आहे, म्हणजे. प्रयोगात मिळालेल्या नमुन्यांसारखे अनेक नमुन्यांचा संच मिळवण्यासाठी. हा संच विविध सांख्यिकीय प्रक्रियेच्या गुणधर्मांचे मूल्यमापन करण्यासाठी वापरला जाऊ शकतो. सर्वात सोपा मार्ग"नमुन्याचे पुनरुत्पादन" मध्ये निरीक्षणाच्या एका निकालाचा समावेश होतो. आम्ही पहिले निरीक्षण वगळतो, आम्हाला मूळ निरिक्षणासारखाच नमुना मिळतो, परंतु व्हॉल्यूम 1 ने कमी केला जातो. मग आम्ही पहिल्या निरीक्षणाचा वगळलेला निकाल देतो, परंतु दुसरे निरीक्षण वगळतो. आम्हाला मूळ नमुना सारखा दुसरा नमुना मिळतो. मग आम्ही दुसऱ्या निरीक्षणाचा परिणाम परत करतो आणि असेच. "नमुने गुणाकार" करण्याचे इतर मार्ग आहेत. उदाहरणार्थ, प्रारंभिक नमुन्यावरून वितरण कार्याचा एक किंवा दुसरा अंदाज बांधणे शक्य आहे आणि नंतर, सांख्यिकीय चाचण्यांच्या पद्धतीचा वापर करून, घटकांच्या नमुन्यांची मालिका तयार करणे, लागू केलेल्या आकडेवारीमध्ये, तो एक नमुना आहे, म्हणजे स्वतंत्रपणे वितरित यादृच्छिक घटकांचा संच. या घटकांचे स्वरूप काय आहे? शास्त्रीय गणितीय आकडेवारीमध्ये, नमुन्याचे घटक संख्या किंवा सदिश असतात. आणि नॉन-न्यूमेरिक स्टॅटिस्टिक्समध्ये, नमुन्याचे घटक नॉन-न्यूमेरिक निसर्गाच्या वस्तू आहेत ज्यांना संख्यांनी जोडले आणि गुणाकार करता येत नाही. दुस-या शब्दात सांगायचे तर, संख्यात्मक नसलेल्या वस्तू अशा जागेत असतात ज्यांची वेक्टर रचना नसते.