परिस्थितीनुसार निर्णय घेणेअनिश्चितता
1. मॅक्सिमिन वाल्ड निकष.
2. जंगली निकष (कमीतकमी धोका).
3. Hurwitz निकष (निराशावाद-आशावाद).
1. मॅक्सिमिन वाल्ड निकष (अत्यंत निराशावादाचा निकष)
("सर्वात वाईट अपेक्षा")
इष्टतम रणनीती निवडण्यासाठी निकषांच्या गटामध्ये, आकडेवारी यासाठी वापरली जाते अज्ञात पूर्व संभाव्यता निसर्गाच्या अवस्था , निकषांचा समावेश आहे वाल्ड, सेवेज आणि हर्विट्झ. ते पेमेंट मॅट्रिक्स किंवा जोखीम मॅट्रिक्स विश्लेषण वापरतात.
जर वितरण निसर्गाच्या भविष्यातील अवस्थांची संभाव्यता अज्ञात आहे, नंतर निसर्गाची सर्व माहिती खाली येते त्याच्या संभाव्य राज्यांची यादी.
कमाल वाल्ड निकष- हे अत्यंत निराशावादाचा निकष,किंवा सावध निरीक्षकाचा निकष.हे शुद्ध आणि मिश्रित दोन्ही धोरणांसाठी तयार केले जाऊ शकते.
वाल्ड निकष आहे अत्यंत निराशावादाचा निकष, कारण सांख्यिकीशास्त्रज्ञ असे गृहीत धरतात की निसर्गाला अशा अवस्थेची जाणीव होते ज्यामध्ये त्याच्या नफ्याचे मूल्य सर्वात लहान मूल्य घेते.
निकष समान आहे कमाल (निराशावादी) निकष,शुद्ध रणनीतींमध्ये मॅट्रिक्स गेम सोडवण्यासाठी वापरले जाते.
प्रत्येकाकडून ओळीनिवडले जातात किमानघटक, म्हणजे जे "निसर्ग" च्या ज्ञात अवस्थेतील निर्णयकर्त्याच्या सर्वात वाईट परिणामाशी संबंधित आहे. नंतर निवडा धोरणसंबंधित निर्णयकर्ता जास्तीत जास्त निवडलेल्या किमानमधून घटक:
. (1)
अशा प्रकारे निवडलेले पर्याय जोखीम पूर्णपणे काढून टाकतात, कारण निर्णय घेणारा तो लक्ष्य करत असलेल्या परिणामापेक्षा वाईट परिणामांना सामोरे जाऊ शकत नाही.
या निकषाचा अर्जज्या परिस्थितीत निर्णय घेतला गेला आहे ते खालील वैशिष्ट्यांद्वारे वैशिष्ट्यीकृत असल्यास न्याय्य आहे:
"निसर्ग" च्या राज्यांच्या संभाव्यता अज्ञात आहेत;
उपाय फक्त एकदा किंवा थोड्या वेळा लागू केला जातो;
जोखीम पूर्णपणे अस्वीकार्यता.
अशा प्रकारे, वाल्ड निकषानुसार, शुद्ध धोरण इष्टतम मानले जाते, जे सर्वात वाईट परिस्थितीत जास्तीत जास्त जिंकण्याची हमी देते. म्हणजे, इष्टतम शुद्ध धोरण maximin आहे, आणि कमाल मोबदला ही शून्य-सम जोडी गेममध्ये खेळण्याची कमी निव्वळ किंमत आहे.
उदाहरण १.
गेम "पुरवठादार".
कंपनीचे उत्पादन नाशवंत पदार्थांवर लक्षणीयरीत्या अवलंबून असते, उदाहरणार्थ, दूध किंवा बेरी, 100 युनिट्सच्या बॅचमध्ये पुरवल्या जातात.
डिलिव्हरी वेळेवर न आल्यास, फर्म 400 युनिट गमावते. कमी उत्पादनातून.
कंपनी स्वतःची वाहतूक पुरवठादाराकडे पाठवू शकते (किंमत 50 युनिट्स), परंतु अनुभव दर्शवितो की अर्ध्या प्रकरणांमध्ये वाहतूक रिकाम्या हाताने परत केली जाते.
तुम्ही प्रथम तुमचा प्रतिनिधी पाठवल्यास सामग्री मिळण्याची शक्यता 80% पर्यंत वाढवू शकता, परंतु खर्च आणखी 50 युनिट्सने वाढेल.
दुसर्या, पूर्णपणे विश्वासार्ह पुरवठादाराकडून अधिक महाग (50%) पर्यायी सामग्री खरेदी करणे शक्य आहे, तथापि, वाहतूक खर्च (50 युनिट्स) व्यतिरिक्त, 30 युनिट्सच्या प्रमाणात सामग्रीचा अतिरिक्त संचयन खर्च शक्य असल्यास त्याचे प्रमाण वेअरहाऊसमध्ये परवानगी असलेल्या प्रमाणापेक्षा जास्त आहे, एका बॅचच्या बरोबरीने.
या परिस्थितीत वनस्पतीने कोणती रणनीती पाळली पाहिजे?
उपाय
निसर्गाच्या दोन अवस्था आहेत: एक विश्वासार्ह पुरवठादार आणि एक अविश्वसनीय पुरवठादार. कंपनीकडे चार धोरणे आहेत: 1) कोणतीही अतिरिक्त कृती करू नका, 2) स्वतःची वाहतूक पुरवठादाराकडे पाठवा, 3) प्रतिनिधी पाठवा आणि पुरवठादाराकडे वाहतूक करा, 4) दुसर्या पुरवठादाराकडून पर्यायी सामग्री खरेदी करा आणि आणा.
चला गणनेचे सारणी तयार करूया:
निर्मात्याचा खर्च आणि तोटा |
||||||
परिस्थिती |
साहित्याचा खर्च |
कमी उत्पादन |
वाहतूक |
प्रवास खर्च |
स्टोरेज खर्च |
एकूण रक्कम |
उपाय
प्राप्त केलेल्या गणना परिणामांवर आधारित, आपण पेमेंट मॅट्रिक्स तयार करू शकता:
उत्तर द्या. तुम्हाला तिसर्या रणनीतीचे पालन करणे आवश्यक आहे आणि जर तुम्ही पुरवठादाराला प्रतिनिधी आणि वाहतूक पाठवली तर खर्च 260 युनिट्सपेक्षा जास्त होणार नाही.
1 . इष्टतम उपाय शोधण्यासाठी विचारात घेतलेली पद्धत आहे निकषवाल्डा ( कमाल निकषनिर्णय घेणे). एक उपाय निवडला आहे जो maxmin पेक्षा कमी विजयाची हमी देतो:
युनिट्स
हा निकष लागू करून, आम्ही निसर्गाच्या जागी सक्रिय आणि दुर्भावनापूर्ण शत्रूचे प्रतिनिधित्व करतो. या निराशावादी एक दृष्टीकोन .
2. मॅक्सिमॅक्स निकष. सर्वात अनुकूल केस:
युनिट्स
जर कंपनीने काहीही केले नाही तर ती 100 युनिट्सपेक्षा जास्त खर्च करणार नाही. हा निकष आहे निरपेक्ष आशावाद.
वाल्ड निकष च्या साठी मिश्र रणनीती
इष्टतम एक मिश्रित धोरण आकडेवारी मानली जाते , ज्यावर किमान सरासरी नफा जास्तीत जास्त असेल:
.
(2)
वाल्ड निकष सांख्यिकीशास्त्रज्ञांद्वारे निसर्गाच्या सर्वात प्रतिकूल स्थितींवर लक्ष केंद्रित करण्यासाठी वापरला जातो, म्हणजेच ते परिस्थितीचे निराशावादी मूल्यांकन व्यक्त करतात.
2. जंगली निकष (किमान धोका )
प्रॅक्टिसमध्ये, संभाव्य उपायांपैकी एक निवडताना, ते बर्याचदा स्थिर होतात ज्याच्या अंमलबजावणीमुळे कमीतकमी गंभीर परिणाम होतीलजर निवड चुकीची ठरली. उपाय निवडण्याचा हा दृष्टीकोन 1954 मध्ये अमेरिकन सांख्यिकीशास्त्रज्ञ सॅवेज यांनी गणितीय पद्धतीने तयार केला होता आणि त्याला म्हणतात. जंगली तत्त्व. हे विशेषतः आर्थिक समस्यांसाठी उपयुक्त आहे आणि बर्याचदा निसर्गासह मानवी खेळांमध्ये उपाय निवडण्यासाठी वापरले जाते.
सावज तत्त्वानुसार या निर्णयाची अंमलबजावणी करताना होणार्या अतिरिक्त नुकसानाच्या प्रमाणात प्रत्येक निर्णयाचे वैशिष्ट्य आहे, दिलेल्या निसर्गाच्या स्थितीसाठी योग्य असलेल्या समाधानाच्या अंमलबजावणीच्या तुलनेत.ते स्वाभाविक आहे योग्य उपायकोणतेही अतिरिक्त नुकसान होत नाही आणि त्यांचे मूल्य शून्य आहे.
निसर्गाच्या विविध अवस्थेला अनुकूल असे समाधान निवडताना, एखाद्याने केवळ हे अतिरिक्त नुकसान विचारात घेतले पाहिजे, जे मूलत: निवड त्रुटींचे परिणाम असतील.
समस्येचे निराकरण करण्यासाठी, एक तथाकथित " जोखीम मॅट्रिक्स", त्यातील घटक हे दर्शवितात की खेळाडूला (DM) नॉन-इष्टतम उपाय पर्याय निवडल्यामुळे काय नुकसान होईल.
त्याची आठवण करून द्या धोका निसर्गाच्या परिस्थितीत (राज्य) धोरण निवडताना खेळाडूकमाल विजयांमधील फरक आहे, जे उपलब्धया परिस्थितीत, आणि फायदा प्राप्त होईलसमान परिस्थितीत खेळाडू, धोरण लागू.
सॅवेज निकष हा मिनिमॅक्स जोखीम, "खेद" कमी करण्याचा निकष आहे.हा निकष, वाल्ड निकषांप्रमाणे, सर्वात सावध आणि निराशावादी आहे.
सेवेजच्या निकषानुसार, निराशावाद स्वतःला वेगळ्या प्रकारे प्रकट करतो: सर्वात वाईट म्हणजे किमान नफा नाही, परंतु दिलेल्या परिस्थितीत (जास्तीत जास्त जोखीम) जे साध्य केले जाऊ शकते त्या तुलनेत नफ्याचे जास्तीत जास्त नुकसान.
जंगली निकष परिणामांवर नव्हे तर जोखमीवर लक्ष केंद्रित करते(नुकसान किंवा दंड).
इष्टतम रणनीती ही अशी आहे की ज्यामध्ये सर्वात वाईट परिस्थितीत नुकसानीचे प्रमाण कमी असते.सेवेज निकष म्हणून निवडण्याची शिफारस करतो इष्टतमते जास्तीत जास्त धोका कमी करणारी रणनीती:
आवश्यकताज्या परिस्थितीत सेवेज निकष वापरून निर्णय घेतला जातो त्या परिस्थितीची आवश्यकता वाल्ड निकष वापरण्याच्या आवश्यकतेशी जुळते. सेवेजचा निकष, वाल्ड निकषांप्रमाणे, निसर्गाच्या सर्वात प्रतिकूल अवस्थांवर आकडेवारीवर लक्ष केंद्रित करतो.
उदाहरण २."पुरवठादार" समस्येसाठी, किमान जोखीम दोन धोरण A 2 आणि A 3 सह ताबडतोब साध्य केली जाते:
गेमसाठी इष्टतम उपाय शोधा , सेवेजचा निकष लागू करत आहे.
उपाय.
आम्ही "निसर्ग" च्या सर्वात प्रतिकूल परिस्थितीवर लक्ष केंद्रित करतो. चला जोखीम आकडेवारीची गणना करूया.
पहिल्या स्तंभासाठी:
दुसऱ्या स्तंभासाठी:
तिसऱ्या स्तंभासाठी:
चला ते लिहून घेऊ जोखीम मॅट्रिक्स.
रणनीती आकडेवारी |
|||
व्याख्या करूया प्रत्येक ओळीतसर्वात मोठी संख्या ही संख्याशास्त्रज्ञाची सर्वात मोठी जोखीम असते जर त्याने धोरण लागू केले आणि निसर्गाने त्याची स्थिती बदलली , , . चला जोखीम मॅट्रिक्सला शेवटच्या स्तंभात "सर्वात मोठे धोका" सह पूरक करू.
जोखीम मॅट्रिक्स आणि सर्वात मोठी जोखीम
रणनीती आकडेवारी |
सर्वात मोठे धोके |
|||
चला सर्वात कमी धोका शोधूया: .
याचा अर्थ सॅवेजच्या निकषानुसार इष्टतम धोरण आहे धोरण .
४.३. Hurwitz निकष (निराशावाद-आशावाद)
Hurwitz निकष हा सामान्यीकृत कमाल किंवा निराशावाद-आशावादाचा निकष आहे.
हे तार्किक वाटते की उपाय निवडताना, परिस्थितीचे मूल्यांकन करताना दोन टोकांऐवजी, सर्वात वाईट आणि सर्वोत्तम, निसर्गाच्या अनुकूल वर्तनाची शक्यता लक्षात घेऊन काही मध्यवर्ती स्थितीचे पालन करा.
हा तडजोड पर्याय हर्विट्झ यांनी प्रस्तावित केला होता. या दृष्टिकोनानुसार, प्रत्येक निर्णयासाठी किमान आणि कमाल पेऑफचे एक रेषीय संयोजन निर्धारित करणे आणि हे मूल्य सर्वात मोठे आहे अशी रणनीती घेणे आवश्यक आहे.
हा निकष प्रदान करतो मध्यवर्ती उपाय अत्यंत आशावाद आणि अत्यंत निराशावाद यांच्यात, जे तत्त्वानुसार निर्धारित केले जाते:
. (4)
क्रमांक () - आशावादाची डिग्री , अट पूर्ण करते आणि व्यक्तिनिष्ठ विचारांवर आधारित निवडली जाते, पर्यावरणीय वैशिष्ट्ये, साधी गोष्ट, निर्णय घेणाऱ्याच्या अनुभवावर आधारित, त्याची जोखीम घेण्याची वृत्ती इ. आशावादाच्या पदवीची निवड जबाबदारीच्या प्रमाणात प्रभावित होते: चुकीच्या निर्णयाचे परिणाम जितके गंभीर असतील तितकेच निर्णय घेणार्याची विमा काढण्याची इच्छा जास्त असते, म्हणजेच आशावादाची डिग्री शून्याच्या जवळ असते.
प्रत्येकासाठी ओळीगणना केली सरासरी(निवडलेले मूल्य विचारात घेऊन) सर्वात लहान आणि सर्वात मोठे परिणाम, ज्यानंतर तुम्ही निवडता कमाल मूल्यासह स्ट्रिंग.
जेव्हा आमच्याकडे असते अत्यंत आशावादाचा निकष, म्हणजे वातावरणातील सर्वात अनुकूल स्थितीची अपेक्षा करणाऱ्या जुगाराची स्थिती प्रतिबिंबित करते.
Hurwitz निकष मध्ये वळते तेव्हा वाल्डचा अत्यंत निराशावादाचा निकष.
जर 0 ही संभाव्य जोखमींबाबत निर्णय घेणाऱ्याची मध्यवर्ती वृत्ती असेल. जर तुम्हाला या परिस्थितीत सुरक्षित खेळायचे असेल तर ते एकाच्या जवळ घ्या.
अर्थाची निवड व्यक्तिनिष्ठ आहे, आणि म्हणूनच, समाधानाची निवड व्यक्तिनिष्ठ आहे, जी अनिश्चिततेच्या परिस्थितीत पूर्णपणे अपरिहार्य आहे.
परिस्थिती जितकी धोकादायक असेल तितकी अधिक निर्णय घेणारे संभाव्य जोखमींविरूद्ध स्वतःचा विमा काढण्याचा प्रयत्न करतात, 0 च्या जवळ. आणि तो जितका कमी उत्कट असेल तितका 1 च्या जवळ.
Hurwitz इष्टतम रणनीतीने सांख्यिकीशास्त्रज्ञाने अंतर्ज्ञानाने किंवा अनुभवाच्या आधारे स्वीकारलेल्या मोबदल्याच्या तुलनेत सांख्यिकीशास्त्रज्ञाला अधिक मोबदल्याची हमी देणे आवश्यक आहे.
हर्विट्झ निकषाचा वापर न्याय्य आहे जर निर्णय घेतला गेला असेल तर चिन्हे:
निसर्गाच्या स्थितीची संभाव्यता अज्ञात आहे;
उपाय थोड्या प्रमाणात सोल्यूशनमध्ये अंमलात आणला जातो;
काही धोका स्वीकार्य आहे.
उदाहरण ३. Hurwitz निकष वापरून पेऑफ मॅट्रिक्सद्वारे दिलेल्या सांख्यिकीय गेमसाठी इष्टतम समाधान शोधा.
उपाय.
वापरासाठी Hurwitz निकषतुम्हाला संभाव्यता मूल्य माहित असणे आवश्यक आहे. चला, उदाहरणार्थ, . याचा अर्थ असा आहे की आम्हाला इव्हेंट "सर्वात लहान संभाव्य विजयाची आकडेवारी" अधिक प्रशंसनीय बनवायची आहे (एकाच्या जवळ), म्हणजेच आम्ही गेममधील प्रतिकूल परिस्थितींपासून स्वतःचा विमा काढतो. मग
चला सर्व इंटरमीडिएट निकाल टेबलमध्ये लिहू.
सारणीच्या शेवटच्या स्तंभावरून हे पाहिले जाऊ शकते की कमाल मूल्य (–7.2) आहे आणि नेटशी संबंधित आहे धोरणे ; Hurwitz निकषानुसार ते इष्टतम असेल.
व्यावहारिक परिस्थितींचे विश्लेषण अनेक निकषांनुसार केले जाते एकाच वेळी, जे आपल्याला घटनेचे सार सखोलपणे एक्सप्लोर करण्यास आणि निवडण्याची परवानगी देते सर्वात माहितीपूर्ण व्यवस्थापन निर्णय. आधारित इष्टतम म्हणून एकत्रित संशोधनसर्व निकषांनुसार इष्टतम म्हटली जाणारी रणनीती घेतली जाते.
निकषांची निवड (तसेच अनुकूलतेच्या तत्त्वाची निवड) हे निर्णय घेण्याच्या सिद्धांतातील सर्वात कठीण आणि महत्त्वाचे कार्य आहे. तथापि, एक विशिष्ट परिस्थिती कधीही इतकी अनिश्चित नसते की निसर्गाच्या राज्यांच्या संभाव्यतेच्या वितरणासंबंधी किमान आंशिक माहिती प्राप्त करणे अशक्य आहे. या प्रकरणात, निसर्गाच्या राज्यांच्या संभाव्यतेच्या वितरणाचा अंदाज घेतल्यानंतर, बेस-लॅप्लेस पद्धत वापरली जाते किंवा निसर्गाचे वर्तन स्पष्ट करण्यासाठी एक प्रयोग केला जातो.
प्रश्नांवर नियंत्रण ठेवा
- परिस्थिती अनिश्चितताअस्पष्ट उपकरण वापरून...
दत्तक उपायव्ही परिस्थितीअनिश्चितता (5)
गोषवारा >> राज्य आणि कायदाजोखमीची परिस्थिती आणि दुसर्यासाठी - अनिश्चितता. धोका स्वीकृतीसर्वात वाईट उपायव्ही परिस्थिती, जेव्हा सर्व प्रारंभिक ओळखले जातात... कारण प्रक्रियेत स्वीकृती उपायनिवड करावी लागेल परिस्थिती अनिश्चितता.. प्रणालीची प्रक्रिया आणि पद्धती...
दत्तकव्यवस्थापकीय उपायव्ही परिस्थितीधोका आणि अनिश्चितता
गोषवारा >> व्यवस्थापन... दत्तकव्यवस्थापकीय उपायव्ही परिस्थितीधोका आणि अनिश्चितता. योजना: परिचय. स्रोत आणि अनिश्चिततेचे प्रकार. दत्तक उपायव्ही परिस्थिती अनिश्चितता... आणि अनिश्चिततेचे प्रकार. दत्तक
निसर्गाशी खेळणे म्हणजे काय?
अनिश्चिततेच्या परिस्थितीत आपली इष्टतम रणनीती ठरवण्यासाठी सांख्यिकीशास्त्रज्ञ कोणते निकष वापरतात?
खेळाडू जोखीम म्हणजे काय?
मध्ये गेम थिअरी मॉडेल्स वापरण्याची तत्त्वे स्पष्ट करा आर्थिक कार्येअनिश्चिततेच्या परिस्थितीत (निसर्गाशी खेळणे).
1.4.निराशावाद-आशावादाचा हर्विट्झ निकष.
हे तार्किक वाटते की उपाय निवडताना, परिस्थितीचे मूल्यांकन करताना दोन टोकांऐवजी, सर्वात वाईट आणि सर्वोत्तम, निसर्गाच्या अनुकूल वर्तनाची शक्यता लक्षात घेऊन काही मध्यवर्ती स्थितीचे पालन करा. हा तडजोड पर्याय हर्विट्झ यांनी प्रस्तावित केला होता. या दृष्टिकोनानुसार, प्रत्येक निर्णयासाठी किमान आणि कमाल पेऑफचे एक रेषीय संयोजन निर्धारित करणे आणि हे मूल्य सर्वात मोठे आहे अशी धोरणे घेणे आवश्यक आहे, म्हणजे. संतुलित स्थिती घेण्याचा प्रयत्न करताना, हर्विट्झने एक निकष (HW) प्रस्तावित केला, ज्याचे मूल्यमापन कार्य अत्यंत आशावाद आणि अत्यंत निराशावादाच्या बिंदूंमध्ये कुठेतरी आहे. मूल्यमापन कार्याचे दोन लिखित स्वरूप आहेत: Z H W =, (5) जेथे "निराशावादाची पदवी" ("निराशावाद गुणांक", वजन घटक), 0 1 आहे. Hurwitz निकष (HW निकष) नुसार निवड नियम खालीलप्रमाणे तयार केला आहे: निर्णय मॅट्रिक्स प्रत्येक पंक्तीच्या सर्वात लहान आणि सर्वात मोठ्या परिणामांची भारित सरासरी असलेल्या स्तंभाद्वारे पूरक आहे. ते पर्याय निवडले आहेतशी, ज्याच्या पंक्तींमध्ये सर्वात मोठे घटक आहेतa ir हा स्तंभ.जेव्हा = 1, Hurwitz निकष (5) वाल्ड निकषाशी समान असतो, आणि जेव्हा = 0, तेव्हा तो अत्यंत आशावादाचा निकष बनतो (जुगाराचा निकष), जो रणनीती निवडण्याची शिफारस करतो जी ओळीतील सर्वात मोठी विजय मिळवते. . तांत्रिक अनुप्रयोगांमध्ये, योग्य घटक निवडणे निकष निवडण्याइतकेच कठीण असू शकते. निर्णय घेताना उपस्थित असलेल्या आशावाद आणि निराशावादाचे प्रमाणात्मक वैशिष्ट्य शोधणे क्वचितच शक्य आहे. म्हणून, बहुतेकदा वजन घटक =0.5 हा काही “सरासरी” दृष्टिकोन म्हणून आक्षेपाशिवाय स्वीकारला जातो. निराशावादाच्या पदवीच्या मूल्याची निवड जबाबदारीच्या प्रमाणात प्रभावित होते: चुकीच्या निर्णयाचे परिणाम जितके गंभीर असतील तितकेच निर्णय घेणार्याची विमा उतरवण्याची इच्छा जास्त असते, म्हणजेच निराशावादाची पदवी एखाद्याच्या जवळ असते. . टेबल 1 मधील डेटासाठी हर्विट्झ निकष आणि निराशावादाची डिग्री =0.6 च्या वापराचा विचार करूया. धोरण X 1 साठी, किमान मूल्य 1 आहे आणि कमाल 10 आहे. सूत्र (6) वापरून, आम्ही 1 r = 0.6*1+0.4*10=4.6 काढतो. त्याचप्रमाणे दुसऱ्या रणनीतीसाठी. स्तंभ a ir चे कमाल मूल्य शोधा. परिणामी, आम्हाला टेबल 11 मिळते. टेबल 11 |
|||||
![](https://i1.wp.com/refdb.ru/images/670/1338802/20bd7195.gif)
- Bj च्या संभाव्यतेबद्दल काहीही माहिती नाही; Bj राज्यांचे स्वरूप लक्षात घेतले पाहिजे; फक्त काही उपायांची अंमलबजावणी केली जाते; काही धोका स्वीकार्य आहे.
1.5. जंगली निकष (जोखीम किमान निकष).
सराव मध्ये, एक निवडणे संभाव्य उपाय, अनेकदा निवड चुकीची ठरल्यास ज्याच्या अंमलबजावणीमुळे कमीतकमी गंभीर परिणाम होतील त्याच्यावर निर्णय घ्या . उपाय निवडण्याचा हा दृष्टीकोन 1954 मध्ये अमेरिकन सांख्यिकीशास्त्रज्ञ सॅवेज यांनी गणितीय पद्धतीने तयार केला होता आणि त्याला सेवेज तत्त्व म्हटले गेले. हे विशेषतः आर्थिक समस्यांसाठी उपयुक्त आहे आणि बर्याचदा निसर्गासह मानवी खेळांमध्ये उपाय निवडण्यासाठी वापरले जाते. सेवेजच्या तत्त्वानुसार, दिलेल्या निसर्गाच्या स्थितीसाठी योग्य असलेल्या सोल्यूशनच्या अंमलबजावणीच्या तुलनेत, हे समाधान अंमलात आणताना उद्भवलेल्या अतिरिक्त नुकसानाच्या प्रमाणात प्रत्येक समाधानाचे वैशिष्ट्य आहे. स्वाभाविकच, योग्य निर्णयामुळे कोणतेही अतिरिक्त नुकसान होत नाही आणि त्यांचे मूल्य शून्य आहे. निसर्गाच्या विविध अवस्थेला अनुकूल असे समाधान निवडताना, एखाद्याने केवळ हे अतिरिक्त नुकसान विचारात घेतले पाहिजे, जे मूलत: निवड त्रुटींचे परिणाम असतील. समस्येचे निराकरण करण्यासाठी, तथाकथित "जोखीम मॅट्रिक्स" तयार केले गेले आहे, ज्याचे घटक हे दर्शवितात की खेळाडूला (डीएम) गैर-इष्टतम उपाय निवडल्यामुळे काय नुकसान होईल. धोकाएक धोरण निवडताना खेळाडू r ij iनिसर्गाच्या परिस्थितीत (अवस्था). jया परिस्थितीत मिळू शकणारे कमाल मोबदला आणि रणनीती वापरून खेळाडूला त्याच परिस्थितीत मिळणारे मोबदला यातील फरक आहे. जर खेळाडूला भविष्यातील निसर्ग j ची स्थिती आधीच माहित असेल, तर तो या स्तंभातील कमाल घटकाशी सुसंगत धोरण निवडेल:![](https://i0.wp.com/refdb.ru/images/670/1338802/m289316ff.gif)
![](https://i2.wp.com/refdb.ru/images/670/1338802/m349441cd.gif)
![](https://i1.wp.com/refdb.ru/images/670/1338802/266c3e61.gif)
1.6. Laplace निकष.
बर्याच प्रकरणांमध्ये, खालील तर्क प्रशंसनीय वाटतात: निसर्गाच्या भविष्यातील अवस्था अज्ञात असल्याने, ते तितकेच संभाव्य मानले जाऊ शकतात. हा उपाय दृष्टिकोन निकषात वापरला जातो “ अपुरे कारण"लॅपेस. समस्येचे निराकरण करण्यासाठी, प्रत्येक सोल्यूशनसाठी फायद्याची गणितीय अपेक्षा मोजली जाते (निसर्गाच्या अवस्थांची संभाव्यता q j = 1/n, j = 1:n च्या समान गृहीत धरली जाते), आणि समाधान निवडले जाते ज्यासाठी मूल्य हा नफा जास्तीत जास्त आहे. Z L =![](https://i1.wp.com/refdb.ru/images/670/1338802/m61b4c882.gif)
1.7.Bayes-Laplace निकष.
हा निकष संपूर्ण अनिश्चिततेच्या अटींपासून दूर जातो - असे गृहीत धरले जाते की निसर्गाच्या संभाव्य स्थितींना त्यांच्या घटनेची एक विशिष्ट संभाव्यता नियुक्त केली जाऊ शकते आणि प्रत्येक निर्णयासाठी नफ्याची गणितीय अपेक्षा निश्चित केल्यावर, लाभाचे सर्वात मोठे मूल्य प्रदान करणारे एक निवडा: Z BL =![](https://i2.wp.com/refdb.ru/images/670/1338802/m334d8f91.gif)
- Bj राज्यांच्या दिसण्याच्या संभाव्यता ज्ञात आहेत आणि वेळेवर अवलंबून नाहीत; उपाय अंमलात आणला जातो (सैद्धांतिकदृष्ट्या) अमर्यादपणे अनेक वेळा; समाधानाच्या थोड्या प्रमाणात अंमलबजावणीसाठी, काही जोखीम स्वीकार्य आहे.
उपाय | निकष |
|||||
रणनीती | वाल्डा | कमाल कमाल | गुरवित्सा,=0.6 | जंगली | लाप्लेस | बायस-लॅप्लेसq 1 =0.4, q 2 =0.2, q 3 =0.4 |
a ij = 100 ´ मि (५´ एक्स i ; बी j ) - 170 ´ एक्स i - 730
त्या. आमच्या समस्येतील निर्णायक नियम "उत्पन्न - खर्च" म्हणून तयार केला जातो. साधी गणना केल्यानंतर, आम्ही निर्णय मॅट्रिक्स भरतो (a ij) (तक्ता 15 पहा): तक्ता 15. पेमेंट मॅट्रिक्स
झेड एमएम = कमाल(-70 ; -240; -410; -580)= -70
निष्कर्ष : वाल्ड निकषानुसार निर्णय घेताना, यॉट क्लबने 2 नौका खरेदी केल्या पाहिजेत आणि कमाल अपेक्षित तोटा CU 70 पेक्षा जास्त नसावा. Hurwitz निकष(सर्वात वाईट परिणाम आणि अती आशावादी दरम्यान एक तडजोड उपाय). आशावाद गुणांकाच्या मूल्यांवर अवलंबून आपल्या समस्येच्या निराकरणातील बदलाचा विचार करूया (सारणी 16 भिन्न मूल्यांसाठी हर्विट्झ निकष पूर्ण करणारी मूल्ये हायलाइट करते. ): तक्ता 16. विविध साठी Hurwitz उपाय निर्णय सिद्धांत हे गणित, सांख्यिकी, अर्थशास्त्र, व्यवस्थापन आणि मानसशास्त्राच्या संकल्पना आणि पद्धतींचा समावेश असलेले एक लागू शिस्त आणि संशोधनाचे क्षेत्र आहे, जे आर्थिक अनुप्रयोगांच्या स्वरूपात पद्धती आणि नमुन्यांची अभ्यास करते.
अनिश्चिततेच्या परिस्थितीत उपाय निवडण्याची समस्या सर्वात सहजपणे सोडवली जाते, जेव्हा आम्हाला ऑपरेशन करण्याच्या अटी माहित नसल्या तरी (निसर्गाची स्थिती), आम्हाला त्यांच्या संभाव्यता माहित आहेत:
या प्रकरणात, कार्यक्षमतेचे सूचक म्हणून, जे आम्ही जास्तीत जास्त वाढवण्याचा प्रयत्न करतो, सर्व संभाव्य परिस्थितींच्या संभाव्यता लक्षात घेऊन, सरासरी मूल्य घेणे किंवा जिंकण्याची गणिती अपेक्षा करणे स्वाभाविक आहे.
खेळाडूच्या रणनीतीसाठी हे सरासरी मूल्य द्वारे दर्शवूया
किंवा थोडक्यात,
साहजिकच, kes सह घेतलेल्या ओळीच्या विजयाच्या भारित सरासरीपेक्षा अधिक काही नाही. इष्टतम रणनीती म्हणून, ज्यासाठी मूल्य जास्तीत जास्त पोहोचेल अशी रणनीती निवडणे स्वाभाविक आहे.
या तंत्राच्या मदतीने, अनिश्चिततेच्या परिस्थितीत उपाय निवडण्याची समस्या निश्चिततेच्या परिस्थितीत समाधान निवडण्याच्या समस्येत बदलते; प्रत्येक वैयक्तिक प्रकरणात केवळ घेतलेला निर्णय इष्टतम नाही तर सरासरी आहे.
उदाहरण 1. पूर्वीच्या अज्ञात हवामान परिस्थितीत ऑपरेशनचे नियोजन केले आहे; या परिस्थितींसाठी पर्याय: अनेक वर्षांच्या हवामान अहवालानुसार, या पर्यायांची वारंवारता (संभाव्यता) अनुक्रमे समान आहेत:
वेगवेगळ्या हवामान परिस्थितीत ऑपरेशन्स आयोजित करण्यासाठी संभाव्य पर्याय भिन्न फायदे आणतात. वेगवेगळ्या परिस्थितीत प्रत्येक सोल्यूशनसाठी "उत्पन्न" मूल्ये टेबलमध्ये दिली आहेत. १३.१
तक्ता 13.1
शेवटची ओळ परिस्थितीची संभाव्यता देते. सरासरी विजय शेवटच्या स्तंभात दर्शविले आहेत. हे दर्शविते की खेळाडूची इष्टतम रणनीती ही त्याची रणनीती आहे जी सरासरी जिंकते (तारकाने चिन्हांकित).
ज्ञात संभाव्यतेसह अज्ञात परिस्थितीत इष्टतम धोरण निवडताना, आपण केवळ सरासरी पेऑफ वापरू शकत नाही
पण मध्यम धोका
जे, अर्थातच, जास्तीत जास्त नाही तर किमान मध्ये बदलणे आवश्यक आहे.
चला दाखवूया की सरासरी मोबदला वाढवणारी रणनीती सरासरी जोखीम कमी करणार्या रणनीतीशी एकरूप आहे. या दोन्ही निर्देशकांची गणना करू आणि त्यांना जोडू:
(13.2)
दिलेल्या मॅट्रिक्ससाठी ही बेरीज (स्तंभ मॅक्सिमाची भारित सरासरी) एक स्थिर मूल्य आहे; चला याला C म्हणूया:
जेथून सरासरी धोका समान आहे
साहजिकच, हे मूल्य कमीत कमी वळते जेव्हा a, - जास्तीत जास्त, म्हणून, किमान सरासरी जोखमीच्या अटींमधून निवडलेली रणनीती कमाल सरासरी लाभाच्या अटींमधून निवडलेल्या धोरणाशी एकरूप होते.
लक्षात घ्या की जेव्हा निसर्गाशी खेळ सोडवताना निसर्गाच्या अवस्थेची संभाव्यता ओळखली जाते, तेव्हा तुम्ही मिश्रित न वापरता, केवळ शुद्ध रणनीती वापरून नेहमीच पुढे जाऊ शकता. खरंच, जर आपण काही प्रकारचे मिश्र धोरण लागू केले तर
म्हणजे, संभाव्यतेसह एक धोरण, संभाव्यतेसह एक धोरण, इत्यादी, नंतर आमचा सरासरी नफा, दोन्ही परिस्थिती (निसर्गाच्या स्थिती) आणि आमच्या धोरणांवर सरासरी, असेल:
आमच्या शुद्ध रणनीतींशी संबंधित विजयांची ही भारित सरासरी आहे.
परंतु हे स्पष्ट आहे की कोणतीही सरासरी सरासरी मूल्यांपेक्षा जास्त असू शकत नाही:
म्हणून, कोणत्याही संभाव्यतेसह मिश्रित धोरण वापरणे एखाद्या खेळाडूसाठी शुद्ध धोरण वापरण्यापेक्षा अधिक फायदेशीर असू शकत नाही.
परिस्थितीची संभाव्यता (निसर्गाची अवस्था) समान ऑपरेशन्सच्या पुनरावृत्तीच्या कामगिरीशी संबंधित सांख्यिकीय डेटावरून किंवा फक्त निसर्गाच्या अवस्थेच्या निरीक्षणासह निर्धारित केले जाऊ शकते. उदाहरणार्थ, जर रेल्वेदिलेल्या कालावधीसाठी, वाहतुकीचे संपूर्णपणे ज्ञात नसलेले खंड पूर्ण करणे आवश्यक आहे, नंतर परिस्थितीच्या वितरणावरील डेटा मागील वर्षांच्या अनुभवावरून घेतला जाऊ शकतो. जर, मागील उदाहरणाप्रमाणे, ऑपरेशनचे यश हवामानाच्या परिस्थितीवर अवलंबून असेल, तर त्यावरील डेटा हवामान अहवालाच्या आकडेवारीवरून घेतला जाऊ शकतो.
तथापि, अनेकदा अशी प्रकरणे असतात जेव्हा, ऑपरेशन सुरू करताना, निसर्गाच्या स्थितीच्या संभाव्यतेबद्दल आपल्याला कल्पना नसते; आमची सर्व माहिती भिन्न अवस्थांच्या सूचीमध्ये कमी केली आहे, परंतु आम्ही त्यांच्या संभाव्यतेचा अंदाज लावू शकत नाही. उदाहरणार्थ, पुढील k वर्षात एक महत्त्वाचा तांत्रिक आविष्कार प्रस्तावित केला जाईल आणि त्याची अंमलबजावणी केली जाईल या संभाव्यतेचा आम्ही वाजवी अंदाज लावू शकू अशी शक्यता नाही.
अर्थात, अशा प्रकरणांमध्ये, परिस्थितीच्या संभाव्यतेचे (निसर्गाची अवस्था) व्यक्तिनिष्ठपणे मूल्यांकन केले जाऊ शकते: त्यापैकी काही आपल्यासाठी अधिक प्रशंसनीय वाटतात, तर काही कमी प्रशंसनीय वाटतात. एका किंवा दुसर्या गृहितकाच्या मोठ्या किंवा कमी "प्रशंसनीयतेबद्दल" आमच्या व्यक्तिनिष्ठ कल्पनांना संख्यात्मक अंदाजांमध्ये रूपांतरित करण्यासाठी, विविध तांत्रिक तंत्रे वापरली जाऊ शकतात. म्हणून, जर आपण कोणत्याही गृहीतकाला प्राधान्य देऊ शकत नाही, जर ते सर्व आपल्यासाठी समान असतील, तर त्यांच्या संभाव्यता एकमेकांना समान वाटणे स्वाभाविक आहे:
हे Laplace चे तथाकथित "अपुऱ्या कारणाचे तत्व" आहे. आणखी एक वारंवार समोर येणारी घटना म्हणजे जेव्हा आपल्याला कल्पना असते की कोणत्या परिस्थितीची शक्यता जास्त आहे आणि कोणती शक्यता कमी आहे, म्हणजे आपण विद्यमान गृहितके त्यांच्या संभाव्यतेच्या उतरत्या क्रमाने मांडू शकतो: सर्वात प्रशंसनीय प्रथम गृहितक (PO, नंतर दुसरा) कमीतकमी वाजवी गृहीतक (). तथापि, त्यापैकी एकाची शक्यता दुसऱ्यापेक्षा किती जास्त आहे हे आम्हाला माहीत नाही. या प्रकरणात, आपण, उदाहरणार्थ, घटत्या अंकगणित प्रगतीच्या अटींच्या प्रमाणात गृहितकांच्या संभाव्यता नियुक्त करू शकता:
किंवा, दिले
काहीवेळा हे शक्य आहे, अनुभव आणि सामान्य ज्ञानावर आधारित, गृहितकांच्या संभाव्यतेच्या अंशांमधील अधिक सूक्ष्म फरकांचे मूल्यांकन करणे.
निसर्गाच्या स्थितीबद्दलच्या विविध गृहितकांच्या "संभाव्यता-प्रशंसनीयता" च्या व्यक्तिनिष्ठ मूल्यांकनाच्या अशा पद्धती कधीकधी उपाय निवडण्यात मदत करू शकतात. तथापि, आपण हे विसरू नये की "व्यक्तिनिष्ठ संभाव्यतेच्या आधारे निवडलेला इष्टतम उपाय अपरिहार्यपणे व्यक्तिनिष्ठ देखील असेल. एखाद्या व्यक्तीने अनियंत्रितपणे नियुक्त केलेल्या संभाव्यतेऐवजी, आम्ही पात्र व्यक्तींच्या ("तज्ञ") गटाद्वारे स्वतंत्रपणे, एकमेकांपासून स्वतंत्रपणे नियुक्त केलेल्या अशा संभाव्यतेची सरासरी ओळख केल्यास, निर्णयाची आत्मीयता कमी केली जाऊ शकते. तज्ञांची मुलाखत घेण्याची पद्धत सामान्यतः मोठ्या प्रमाणात वापरली जाते आधुनिक विज्ञान, जेव्हा अनिश्चित परिस्थितीचे मूल्यांकन करण्याची वेळ येते (उदाहरणार्थ, भविष्यशास्त्रात). अशा पद्धती वापरण्याचा अनुभव शिकवतो की बहुतेकदा तज्ञांचे मूल्यांकन (एकमेकांपासून स्वतंत्रपणे स्वीकारलेले) आधीच गृहित धरले जाऊ शकते तितके विरोधाभासी नसतात आणि त्यांच्याकडून काही पूर्व-आवश्यकता प्राप्त करणे शक्य आहे. वाजवी निर्णय.
वर, आम्ही निसर्गाच्या अवस्थेच्या वस्तुनिष्ठपणे गणना केलेल्या किंवा व्यक्तिनिष्ठपणे नियुक्त केलेल्या संभाव्यतेवर आधारित उपाय निवडण्याचा मुद्दा हायलाइट केला आहे. निर्णय सिद्धांतातील हा दृष्टिकोन एकमेव नाही. या व्यतिरिक्त, अनिश्चिततेच्या परिस्थितीत इष्टतम उपाय निवडण्यासाठी आणखी बरेच "निकष" किंवा दृष्टिकोन आहेत. त्यापैकी काही पाहू.
1. मॅक्सिमिन वाल्ड निकष
या निकषानुसार, खेळाडू A ची इष्टतम रणनीती निवडली जाते ज्यासाठी किमान मोबदला जास्तीत जास्त आहे, म्हणजे, अशी रणनीती जी हमी देते, कोणत्याही परिस्थितीत, जास्तीत जास्त मोबदला कमी नसेल:
(13.4)
जर तुम्ही या निकषानुसार मार्गदर्शन करत असाल, तर तुम्ही नेहमी सर्वात वाईट परिस्थितीवर लक्ष केंद्रित केले पाहिजे आणि सर्वात वाईट परिस्थितीत जिंकण्यासाठी जास्तीत जास्त रणनीती निवडावी. निसर्गासोबतच्या खेळांमध्ये हा निकष वापरून, आम्ही या अवैयक्तिक आणि रस नसलेल्या अधिकाराच्या जागी सक्रिय आणि दुर्भावनापूर्ण शत्रू आणू असे दिसते. साहजिकच, असा दृष्टिकोन केवळ परिस्थितीचे मूल्यांकन करताना अत्यंत निराशावादाद्वारे निर्धारित केला जाऊ शकतो - "तुम्ही नेहमी सर्वात वाईट गोष्टींवर विश्वास ठेवला पाहिजे!" - परंतु एक संभाव्य दृष्टीकोन म्हणून ते विचारात घेण्यासारखे आहे.
2. सेवेजचा किमान जोखीम निकष
निर्णय घेताना कोणत्याही प्रकारे मोठा धोका टाळणे हे या निकषाचे सार आहे.
वॉल्ड निकषांप्रमाणे सावज निकष, अत्यंत निराशावादाचा निकष आहे, परंतु निराशावाद येथे वेगळ्या प्रकारे समजला जातो: हा सर्वात वाईट घोषित केलेला किमान नफा नाही, परंतु दिलेल्या परिस्थितीत जे साध्य केले जाऊ शकते त्या तुलनेत जास्तीत जास्त नफा हा आहे ( जास्तीत जास्त धोका).
3. निराशावाद-आशावादाचा हर्विट्झ निकष
हा निकष शिफारस करतो की अनिश्चिततेच्या परिस्थितीत, निर्णय निवडताना, तुम्ही अत्यंत निराशावाद (नेहमी सर्वात वाईट मानू नका!) किंवा अत्यंत, फालतू आशावाद (सर्व काही उत्तम प्रकारे कार्य करेल!) हर्विट्झ निकषाने मार्गदर्शन करू नये. फॉर्म आहे:
शून्य आणि एक दरम्यान गुणांक कुठे निवडला आहे.
चला अभिव्यक्तीच्या संरचनेचे विश्लेषण करूया (13.6). केव्हा, हर्विट्झ निकष निराशावादी वाल्ड निकषात बदलतो आणि केव्हा, "अत्यंत आशावाद" निकषात बदलतो, जे सर्वोत्तम परिस्थितीत जिंकण्यासाठी जास्तीत जास्त रणनीती निवडण्याची शिफारस करते. परिणाम म्हणजे आत्यंतिक निराशावाद आणि आत्यंतिक आशावाद (संशोधकाच्या "निराशावादाचे माप" असे गुणांक व्यक्त करतो) यांच्यातील काहीतरी आहे. हे गुणांक व्यक्तिनिष्ठ कारणांसाठी निवडले गेले आहे - परिस्थिती जितकी धोकादायक असेल तितकी जास्त आपण त्यात "स्वत:चा विमा" घेऊ इच्छितो, एकता i च्या जवळ निवडली जाते.
तुमची इच्छा असल्यास, सेवेजच्या निकषांप्रमाणे तुम्ही हर्विट्झच्या आशावाद-निराशावादाच्या निकषांप्रमाणे एक निकष तयार करू शकता, जो लाभावर आधारित नाही, परंतु जोखमीवर आधारित आहे, परंतु आम्ही यावर विचार करणार नाही.
जरी निकषाची निवड, हर्विट्झ निकषातील पॅरामीटरच्या निवडीप्रमाणे, व्यक्तिनिष्ठ असली तरीही, या निकषांच्या दृष्टिकोनातून परिस्थिती पाहणे उपयुक्त ठरू शकते. विविध निकषांवरून उद्भवलेल्या शिफारशी एकरूप झाल्यास, तितकेच चांगले; तुम्ही त्यांनी शिफारस केलेले उपाय सुरक्षितपणे निवडू शकता. जर, अनेकदा घडत असेल, तर शिफारशी एकमेकांच्या विरोधाभासी असतील, तर त्याबद्दल विचार करणे आणि त्याची ताकद लक्षात घेऊन अंतिम निर्णय घेणे नेहमीच अर्थपूर्ण आहे. कमजोरी. वेगवेगळ्या निकषांच्या दृष्टीकोनातून निसर्गासह खेळाच्या मॅट्रिक्सचे विश्लेषण केल्याने मॅट्रिक्सचा थेट विचार करण्यापेक्षा परिस्थितीची, प्रत्येक सोल्यूशनचे फायदे आणि तोटे यांची चांगली कल्पना येते, विशेषत: जेव्हा त्याचे परिमाण मोठे असतात.
उदाहरण 2. निसर्गासह 4X3 खेळ चार खेळाडूंच्या रणनीतीसह विचारात घेतला जातो: आणि परिस्थितीचे तीन रूपे (निसर्गाची स्थिती): पेऑफ मॅट्रिक्स टेबलमध्ये दिलेले आहे. १३.२.
तक्ता 13.2
वाल्ड आणि सेव्हेज निकष आणि Hurwitz निकष वापरून इष्टतम उपाय (रणनीती) शोधा
उपाय. 1. वाल्ड निकष.
मॅट्रिक्सच्या प्रत्येक पंक्तीमध्ये आपण सर्वात लहान लाभ घेतो (टेबल 13.3).
मूल्यांपैकी, कमाल (तारकाने चिन्हांकित) 0.25 आहे, म्हणून, वाल्ड निकषानुसार, धोरण इष्टतम आहे
2. जंगली निकष.
आम्ही जोखीम मॅट्रिक्स तयार करतो आणि उजव्या अतिरिक्त स्तंभामध्ये प्रत्येक पंक्तीमध्ये जास्तीत जास्त जोखीम ठेवतो (तक्ता 13.4).
किमान मूल्य 0.60 आहे (तारकाने चिन्हांकित केलेले); म्हणून, सेवेजच्या निकषानुसार, कोणतीही रणनीती इष्टतम आहे
तक्ता 13.3
3. Hurwitz निकष
आम्ही मॅट्रिक्सच्या उजव्या तीन स्तंभांमध्ये (तक्ता 13 5) नफ्याचे "निराशावादी" मूल्यांकन लिहितो; "आशावादी" अ); आणि सूत्रानुसार त्यांची भारित सरासरी (13.6):
कमाल मूल्य (तारकाने चिन्हांकित) रणनीतीशी संबंधित आहे. म्हणून, हर्विट्झच्या निकषानुसार, निराशावादाच्या दिशेने थोडासा फायदा घेऊन, इष्टतम धोरण आहे अशा प्रकारे, तीनही निकष धोरणाच्या बाजूने सहमत आहेत की आमच्याकडे प्रत्येक कारणे आहेत. निवडा. (किमान सर्वांवर घेतले जाते हे मिनिमॅक्स शोधा (किंवा वाल्ड निकषात जास्तीत जास्त) पारंपारिक पद्धती वापरून केले जाऊ शकते रेखीय प्रोग्रामिंग. अशी प्रकरणे असू शकतात जेव्हा Wald, Savage आणि Hurwitz निकषांचा वापर करून मिश्रित रणनीतींचा वापर केल्याने केवळ शुद्ध रणनीती वापरल्या जाणार्या समाधानावर फायदा मिळेल, परंतु आम्ही या निकषांचा केवळ शुद्ध धोरणांसाठीच विचार करू.
याचे एक कारण असे आहे की आम्ही जटिल गणना टाळू इच्छितो जेथे परिस्थितीबद्दल माहिती नसल्यामुळे (परिस्थितीची संभाव्यता माहित नसल्यामुळे) परिणाम नाकारला जाऊ शकतो. आणखी एक, अधिक महत्त्वाचे कारण म्हणजे सिद्धांताची मुख्य सामग्री सांख्यिकीय उपाय(आम्ही पुढील परिच्छेदात यावर स्पर्श करू) प्राप्त करण्याची आणि वापरण्याची योजना आहे अतिरिक्त माहितीनिसर्गाच्या स्थितीबद्दल, जे प्रयोगाद्वारे प्राप्त केले जाऊ शकते. संशोधन असे दर्शविते की ठराविक प्रकरणांमध्ये, जेव्हा ते प्राप्त होते लक्षणीय रक्कमअतिरिक्त माहिती, निकष जे राज्य संभाव्यता (Wald et al.) वापरत नाहीत ते राज्य संभाव्यतेवर आधारित निकषाच्या जवळपास समतुल्य बनतात. परंतु असे निकष वापरून मिश्र रणनीती वापरण्यात अर्थ नाही हे आपल्याला माहीत आहे; म्हणून, जर आपण कितीही अतिरिक्त माहिती मिळवू शकलो, तर मिश्रित धोरणांचा वापर त्याचा अर्थ गमावून बसतो (आम्ही वापरतो तो उपाय निवडण्यासाठी कोणते निकष असले तरीही). जर आम्ही प्रयोगांद्वारे नवीन माहिती मिळवू शकत नसल्यास, तर भिन्न मापदंड विरोधाभासी शिफारशी देऊ शकतात, जसे की आम्ही उदाहरण ३ मध्ये पाहिले.
![](https://i0.wp.com/scask.ru/advertCommon/france.jpg)
सेवेजचा निकष जोखीम मॅट्रिक्स वापरतो || r ij ||. या मॅट्रिक्सचे घटक सूत्र (23), (24) द्वारे निर्धारित केले जाऊ शकतात, जे आम्ही पुढील स्वरूपात पुन्हा लिहितो:
याचा अर्थ r ij हा स्तंभ i मधील सर्वोत्तम मूल्य आणि त्याच i साठी V ji च्या मूल्यांमधील फरक आहे. V ji हे उत्पन्न (नफा) किंवा तोटा (खर्च) असले तरीही, दोन्ही प्रकरणांमध्ये r ji निर्णय घेणाऱ्याच्या तोट्याचे प्रमाण ठरवते. म्हणून, r ji ला फक्त minimax निकष लागू केला जाऊ शकतो. सेवेज निकष अनिश्चिततेच्या परिस्थितीत, Rj धोरण निवडण्याची शिफारस करतो ज्यामध्ये जोखीम मूल्य सर्वात प्रतिकूल परिस्थितीत (जेव्हा जोखीम जास्तीत जास्त असते) सर्वात लहान मूल्य घेते.
उदाहरण 6. उदाहरणाचा विचार करा 4. दिलेले मॅट्रिक्स तोटा (खर्च) निर्धारित करते. सूत्र (31) वापरून, आम्ही जोखीम मॅट्रिक्सच्या घटकांची गणना करतो || r ij ||:
आम्ही खालील तक्त्यामध्ये सेवेजचा किमान जोखीम निकष वापरून प्राप्त गणना परिणाम सादर करतो:
जोखीम मूल्य r ji च्या परिचयामुळे प्रथम धोरण R 1 ची निवड झाली, सर्वात प्रतिकूल परिस्थितीत (जेव्हा धोका जास्तीत जास्त असतो) कमीत कमी तोटा (खर्च) प्रदान केला.
सेवेज निकष लागू केल्याने तुम्हाला रणनीती निवडताना कोणत्याही प्रकारे मोठा धोका टाळता येतो आणि त्यामुळे मोठे नुकसान (नुकसान) टाळता येते.
4. Hurwitz निकष.
Hurwitz निकष खालील दोन गृहितकांवर आधारित आहे: "निसर्ग" संभाव्यतेसह (1 - α) सर्वात प्रतिकूल स्थितीत असू शकतो आणि संभाव्यता α सह सर्वात फायदेशीर स्थितीत असू शकतो, जेथे α हा आत्मविश्वास गुणांक आहे. जर परिणाम V j i नफा, उपयुक्तता, उत्पन्न इ. असेल, तर Hurwitz निकष खालीलप्रमाणे लिहिलेला आहे:
जेव्हा V ji खर्च (तोटा) दर्शवतो, तेव्हा देणारी कृती निवडा
α = 0 असल्यास, आम्हाला निराशावादी वाल्ड निकष प्राप्त होतो.
जर α = 1 असेल, तर आपण max max V ji या तथाकथित "निरोगी आशावादी" धोरणाच्या निर्णयाच्या नियमावर पोहोचतो, म्हणजे निकष खूप आशावादी आहे.
हर्विट्झ निकष अत्यंत निराशावाद आणि आत्यंतिक आशावादाच्या प्रकरणांमध्ये समतोल प्रस्थापित करतो आणि दोन्ही वर्तनांना योग्य वजन (1 - α) आणि α, जेथे 0≤α≤1 सह वजन करतो. 0 ते 1 मधील α चे मूल्य निर्णयकर्त्याच्या निराशावाद किंवा आशावादाच्या प्रवृत्तीवर अवलंबून निश्चित केले जाऊ शकते. उच्चारित प्रवृत्तीच्या अनुपस्थितीत, α = 0.5 सर्वात वाजवी वाटते.
उदाहरण 7. उदाहरण 4 मध्ये आपण Hurwitz निकष वापरतो. α = 0.5 सेट करू या. आवश्यक गणनेचे परिणाम खाली दिले आहेत:
इष्टतम उपाय म्हणजे डब्ल्यू निवडणे.
अशाप्रकारे, उदाहरणामध्ये आपल्याला संभाव्य उपायांपैकी कोणता पर्याय श्रेयस्कर आहे हे निवडावे लागेल:
Laplace निकषानुसार - रणनीती R 2 ची निवड,
वाल्ड निकषानुसार - रणनीती R 3 ची निवड;
सेवेजच्या निकषानुसार - रणनीती R 1 ची निवड;
α = 0.5 वरील Hurwitz निकषानुसार - रणनीती R 1 ची निवड, आणि निर्णय घेणारा निराशावादी असल्यास (α = 0), तर R 3 ची निवड.
हे योग्य निकष (लॅप्लेस, वाल्ड, सेवेज किंवा हर्विट्झ) च्या निवडीद्वारे निर्धारित केले जाते.
अनिश्चिततेच्या परिस्थितीत निर्णय घेण्याचा निकष निवडणे ही ऑपरेशन्स संशोधनातील सर्वात कठीण आणि गंभीर अवस्था आहे. तथापि, कोणत्याही सामान्य टिपा किंवा शिफारसी नाहीत. निकषांची निवड निर्णय निर्मात्याने (डीएम) केली पाहिजे, ज्या समस्येचे निराकरण केले जात आहे त्याचे विशिष्ट तपशील लक्षात घेऊन आणि त्याच्या उद्दिष्टांनुसार तसेच मागील अनुभवावर आणि त्याच्या स्वतःच्या अंतर्ज्ञानावर अवलंबून राहून.
विशेषतः, जर किमान जोखीम देखील अस्वीकार्य असेल, तर वाल्ड निकष लागू केला पाहिजे. जर, त्याउलट, एखादी विशिष्ट जोखीम स्वीकार्य असेल आणि निर्णय घेणारा एखाद्या विशिष्ट एंटरप्राइझमध्ये इतके पैसे गुंतवण्याचा विचार करत असेल जेणेकरून नंतर त्याला खूप कमी गुंतवणूक केल्याबद्दल खेद वाटू नये, तर सेव्हेज निकष निवडला जातो.
स्वतंत्र समाधानासाठी कार्य करा: Laplace, Wald, Savage आणि Hurwitz निकष वापरून उत्पादनासाठी सर्वात कार्यक्षम प्रवासी कार डिझाइन निवडण्यासाठी C++ प्रोग्राम लिहा.
प्रवासी कारचे मोठ्या प्रमाणावर उत्पादन करण्याचे नियोजित आहे. चार कार डिझाइन पर्याय आहेत
प्रत्येक प्रकल्पाची आर्थिक कार्यक्षमता V ji उत्पादनाच्या नफ्यावर अवलंबून होती. तीन पदांनंतर पर्यावरणाच्या (निसर्ग) काही अवस्था मानल्या जातात. विविध प्रकल्पांसाठी किंमत-प्रभावी मूल्ये आणि निसर्गाची स्थिती खालील तक्त्यामध्ये दिली आहे (युनिट):
निसर्गाची अवस्था |
|||
निवडणे आवश्यक आहे सर्वोत्तम प्रकल्पɑ=0.1 सह Laplace, Wald, Savage आणि Hurwitz निकष वापरून उत्पादनासाठी. उपायांची तुलना करा आणि निष्कर्ष काढा.
1. निसर्गाच्या प्रत्येक अवस्थेसाठी j (मॅट्रिक्स स्तंभ) आम्ही जास्तीत जास्त विजयी मूल्य निर्धारित करतो y j :
y j = कमाल( x ij)
2. मूळ मॅट्रिक्सच्या प्रत्येक सेलसाठी एक्स कमाल विजयांमधील फरक शोधा r j निसर्गाच्या दिलेल्या स्थितीसाठी आणि विचाराधीन सेलमधील परिणामांसाठी x ij :
r ij = y j - x ij
प्राप्त मूल्यांमधून आम्ही एक नवीन मॅट्रिक्स तयार करतो आर - "पस्तावाचे मॅट्रिक्स" किंवा, ज्याला हे देखील म्हटले जाऊ शकते, गमावलेल्या नफ्याचे मॅट्रिक्स.
3. नवीन मॅट्रिक्समधील प्रत्येक पर्यायासाठी आर चला सर्वात मोठा संभाव्य गमावलेला फायदा ("कमाल खेद") शोधू. हे सेव्हज निकषानुसार या पर्यायाचे मूल्यांकन असेल S i :
S i = कमाल( r ij), j=1..M
4. कमीत कमी (!) कमाल गमावलेल्या विजयांसह पर्याय इष्टतम मानला जाऊ शकतो:
Х* = Х k , S k = min( S i), i=1..N
सेवेज निकष लागू करण्याचे उदाहरण
टेबलवरून समस्येच्या परिस्थितीत निर्णय घेण्यासाठी वर वर्णन केलेल्या क्रियांचे अल्गोरिदम लागू करूया. 3.
1. प्रत्येक प्रादेशिक विकास परिस्थितीसाठी सर्वाधिक संभाव्य नफा शोधूया:
y 1 = कमाल (x 11 , x 21) =कमाल (45, 20) = 45
y 2 = कमाल (x १२ , x २२) =कमाल (25, 60) = 60
y 3 = कमाल (x 13 , x 23) =कमाल (50, 25) = 50
2. प्रत्येक परिस्थिती अंतर्गत प्रत्येक प्रकल्पासाठी “खेद” च्या मूल्यांची गणना करूया (म्हणजेच, दिलेल्या विकास परिस्थितीमध्ये जास्तीत जास्त शक्यतेच्या तुलनेत आम्हाला गमावलेला नफा मिळेल). प्राप्त मूल्यांमधून "खेदांचे मॅट्रिक्स" संकलित करूया (सारणी 4).
प्रकल्पासाठी X १ :
r 11 = y 1 - x 11 = 45 - 45 = 0
r 12 = y 2 - x 12 = 60 - 25 = 35
r 13 = y 3 - x 13 = 50 - 50 = 0
प्रकल्पासाठी X 2 :
r 21 = y 1 - x 21 = 45 - 20 = 25
r 22 = y 2 - x 22 = 60 - 60 = 0
r 23 = y 3 - x 23 = 50 - 25 = 25
तक्ता 4
खेद मॅट्रिक्स आर (उदाहरणार्थ).
4. परिणामी मॅट्रिक्समध्ये, प्रत्येक पंक्तीसाठी आम्ही शोधतो सर्वात महानप्रत्येक प्रकल्पासाठी "खेद" ची रक्कम (तक्ता 4 मधील शेवटचा स्तंभ). हे मूल्य सेवेज निकषानुसार या पर्यायाच्या मूल्यांकनाशी संबंधित आहे.
S 1 = कमाल (0, 35, 0) = 35
S 2 = कमाल (25, 0, 25) = 25
5. मिळवलेल्या मूल्यांची तुलना करू आणि एक प्रकल्प शोधू किमान (!) निकष मूल्य. हे इष्टतम असेल:
35 > 25 => S 1 > S 2 => X* = X 2
निर्णय घेताना सेवेज निकषानुसार निर्णय घेणारा, प्रकल्पाची निवड करेल X 2 .
आपण पुन्हा एकदा यावर जोर देऊ या की, इतर निकषांप्रमाणे, सर्वोत्तम पर्याय हा आहे ज्यासाठी सॅवेज निकषाचे मूल्य आहे. कमीत कमी, कारण निकष दिलेल्या पर्यायासाठी सर्वात मोठी संभाव्य कमतरता प्रतिबिंबित करते. अर्थात, आपण जितके कमी गमावू शकता तितके चांगले.
नियमित (किंवा साधे) Hurwitz निकषकेवळ अत्यंत परिणाम लक्षात घेते x iकमालआणि x iमिप्रत्येक पर्यायी:
x मी कमाल = कमाल( x ij),xiमि = मि( x ij), j = 1..M
हे तुम्हाला या निकालांना वेगवेगळे "वजन" देऊन हा निकष लागू करणार्या निर्णयकर्त्याची व्यक्तिनिष्ठ वृत्ती विचारात घेण्यास अनुमती देते. या हेतूने, निकष मोजले गेले "आशावाद भागफल" λ, 0 ≤ λ ≤ 1 . साठी Hurwitz निकष मोजण्यासाठी सूत्र i -आशावाद गुणांकासह पर्याय λ पुढीलप्रमाणे:
हाय ( λ )= λ x iकमाल + (1 - λ)x iमि
जर परिणाम दर्शवितात संभाव्य विजय, नंतर Hurwitz निकषाच्या कमाल मूल्यासह पर्याय इष्टतम मानला जातो:
Х* = Х k , H k ( λ ) = कमाल( हाय(λ )), i = 1..N
सूत्रावरून पाहिले जाऊ शकते, योग्य निवडआशावाद गुणांक λ निकष लागू करण्याच्या परिणामावर लक्षणीय परिणाम होतो. निवडीचे तर्कशास्त्र जवळून पाहू λ .
जर निर्णय घेणारा निराशावादी असेल तर त्याच्यासाठी वाईट घडामोडींच्या बाबतीत कमी गमावणे अधिक महत्वाचे आहे, जरी याचा अर्थ यशस्वी परिस्थितीत इतका मोठा फायदा नसला तरीही. म्हणजे, विशिष्ट गुरुत्वसर्वात वाईट केस परिणाम x iमिपर्यायी मूल्यमापन मध्ये साठी पेक्षा जास्त असणे आवश्यक आहे x मी कमाल . हे सुनिश्चित केले जाते जेव्हा λ च्या मर्यादेत आहे 0 आधी 0.5 , शेवटचे मूल्य वगळून.
येथे λ=0 Hurwitz निकष वाल्ड निकषात "अधोगती" होतो आणि केवळ अत्यंत निराशावादी निर्णय घेणाऱ्यांसाठी योग्य आहे.
एक आशावादी निर्णय घेणारा, त्याउलट, सर्वोत्तम परिणामांवर लक्ष केंद्रित करतो, कारण त्याच्यासाठी कमी गमावण्याऐवजी अधिक जिंकणे अधिक महत्वाचे आहे. सर्वोत्तम परिणामाचे मूल्यांकन करण्यात मोठा वाटा जेव्हा प्राप्त होतो λ अधिक 0.5 आणि पर्यंत 1 समावेशक. येथे λ=१ हर्विट्झ निकष हा "मॅक्सिमॅक्स" निकष बनतो, जो प्रत्येक पर्यायाचा सर्वात मोठा परिणाम विचारात घेतो.
जर निर्णय घेणार्याचा निराशावाद किंवा आशावाद यांच्याकडे स्पष्ट पूर्वग्रह नसेल तर गुणांक λ च्या बरोबरीने घेतले जाते 0.5 .
हर्विट्झ निकष लागू करण्याचे उदाहरण
टेबलवरून कार्याच्या अटींनुसार. 3, आशावादी निर्णय घेणाऱ्या व्यक्तीसाठी हर्विट्झ निकष वापरून निर्णय घेण्याचा विचार करू. λ = ०.८ ), आणि निराशावादी निर्णय घेणारा ( λ = ०.३ ). प्रक्रिया खालीलप्रमाणे आहे.
1. जास्तीत जास्त शोधूया x iकमालआणि किमान x iमिप्रत्येक प्रकल्पाचे परिणाम:
x 1 कमाल = कमाल (४५, २५, ५०) = ५० x १मि = मि (45, 25, 50) = 25
x 2 कमाल = कमाल (२०, ६०, २५) = ६० x २मि = मि (20, 60, 25) = 20
2. आशावाद गुणांकाच्या दिलेल्या मूल्यांसाठी Hurwitz निकषाच्या मूल्याची गणना करा:
आशावादी निर्णय घेणारा ( λ=०.८ ):
H1( 0.8 )= λ x १कमाल + (1 - λ)x १मि = ०.८×५० +(1 - 0.8 )×२५ = ४५
H2( 0.8 )= λ x २कमाल + (1 - λ)x 2मि = 0.8×60 +(1 - 0.8 )×२० = ५२
निराशावादी निर्णय घेणारा ( λ=0.3 ):
H1( 0.3 )= λ x १कमाल + (1-λ)x १मि = ०.३×५० +(1 - 0.3 )×२५ = ३२.५
H2( 0.3 )= λ x २कमाल + (1-λ)x 2मि = ०.३×६० +(1 - 0.3 )×२० = ३२
3. प्राप्त मूल्यांची तुलना करूया. प्रत्येक निर्णय घेणाऱ्यासाठी इष्टतम पर्याय असतील कमाल मूल्य Hurwitz निकष:
आशावादी निर्णय घेणारा ( λ = ०.८ ):
45 < 52 =>H 1 (0.8)< H 2 (0.8) =>X* = X2
निराशावादी निर्णय घेणारा ( λ = ०.३ ):
32.5 < 32 =>H 1 (0.3) > H 2 (0.3) => X* = X 1
जसे आपण पाहतो, त्याच परिस्थितीत इष्टतम पर्यायाची निवड निर्णय घेणाऱ्याच्या जोखीम घेण्याच्या वृत्तीवर अवलंबून असते. जर निराशावादी व्यक्तीसाठी दोन्ही प्रकल्प अंदाजे समान असतील, तर एक आशावादी जो सर्वोत्तमची अपेक्षा करतो तो दुसरा प्रकल्प निवडेल. त्याचा उच्च सर्वोत्तम नफा ( 60 ) गुणांकाच्या मोठ्या मूल्यांसाठी λ Hurwitz निकषानुसार या प्रकल्पाचे मूल्य लक्षणीयरीत्या वाढवते.
नेहमीच्या Hurwitz चाचणीचा तोटा म्हणजे अत्यंत मूल्यांमधील परिणामांच्या वितरणासाठी त्याची "संवेदनशीलता" होय. यामुळे चुकीचे निर्णय होऊ शकतात. उदाहरणार्थ, एक पर्याय A(100; 150; 200; 1000) "आशावादी" गुणांक असलेल्या Hurwitz निकषानुसार λ = ०.७ पर्यायांपेक्षा चांगले B(100; 750; 850; 950) , कारण:
H A (0.7) = 0.7×1000 + (1 - 0.7)×100 = 730
H B (0.7) = 0.7×950 + (1 - 0.7)× 100 = 695
तथापि, आपण ते प्रदान करणार्या संधींकडे अधिक बारकाईने पाहिले तर IN , नंतर हे लक्षात येते की ते अधिक फायदेशीर आहे. त्याचे "अंतर्गत" परिणाम ( 750 आणि 850 ) त्यापेक्षा लक्षणीयरित्या चांगले आहे A (150 आणि 200) , आणि कमाल नफा फक्त किंचित वाईट आहे ( 950 विरुद्ध 1000 ). वास्तविक जीवनात ते निवडणे अधिक तर्कसंगत असेल IN .
बांधकाम तत्त्व सामान्यीकृत Hurwitz निकषमागील प्रमाणेच. विचारात घेतलेल्या सर्व परिणामांना विशिष्ट "विशिष्ट वजन" नियुक्त केले जाते. पर्यायासाठी निकष मूल्य त्याच्या परिणामांची भारित बेरीज म्हणून मोजले जाते. तथापि, "पूर्ववर्ती" च्या उणीवा टाळण्यासाठी, सामान्यीकृत निकष प्रत्येक पर्यायाचे सर्व परिणाम विचारात घेतात.
त्यानंतर, साठी सामान्यीकृत निकष मोजण्याचे सूत्र i -पर्यायी खालीलप्रमाणे लिहिता येतील:
λq- साठी गुणांक q -वे मूल्य i वा पर्यायी,
0≤λ q ≤1, λ 1 + ... + λ q + ... + λ M = 1
असे दिसून आले की सामान्यीकृत हर्विट्झ निकष वापरण्यासाठी नियुक्त करणे आवश्यक आहे एम (!) गुणांक λq . अर्थात, हे अनियंत्रितपणे केले जाऊ शकते. परंतु मोठ्या संख्येने अटींसह एम हे खूप श्रम-केंद्रित बनते, कारण गुणांकांनी किमान दोन अटी पूर्ण करणे आवश्यक आहे:
1) सर्व भारांकन गुणांकांची बेरीज एक समान असणे आवश्यक आहे:
2) गुणांकांची मूल्ये अनिश्चिततेकडे निर्णय घेणाऱ्याची वृत्ती प्रतिबिंबित करतात:
अ) आशावादी निर्णय घेणार्यासाठी, सर्वोत्तम परिणामांचे "वजन" जास्त असावे आणि परिणाम जितके चांगले तितके "वजन" जास्त असावे;
b) निराशावादी निर्णय घेणार्यासाठी - उलट सत्य आहे - सर्वात वाईट परिणामांचे "वजन" जास्त असते आणि परिणाम जितके वाईट तितके जास्त "वजन" असते:
स्वैरपणे गुणांक स्वतंत्रपणे नियुक्त न करण्यासाठी, त्यांच्या गणनासाठी औपचारिक पद्धती प्रस्तावित केल्या गेल्या, त्यापैकी एक आम्ही खाली विचार करू.