टेक्सास होल्डम ज्ञान केंद्र

पोकर में मोंटे कार्लो सिमुलेशन का अनुप्रयोग: हैंड इक्विटी गणना के सिद्धांतों को समझना

गाइड9 व्यू

मोंटे कार्लो सिमुलेशन व्यापक यादृच्छिक नमूने के माध्यम से हैंड इक्विटी का अनुमान लगाता है, और पोकर गणित और सॉफ्टवेयर का मूल है। यह लेख इसके सिद्धांतों, व्यावहारिक उपयोग और सामान्य गलतफहमियों की व्याख्या करता है।

परिभाषा

मोंटे कार्लो सिमुलेशन एक सांख्यिकीय विधि है जो बार-बार यादृच्छिक नमूनाकरण के माध्यम से संख्यात्मक परिणामों का अनुमान लगाती है। पोकर में, इसका व्यापक रूप से हाथ की इक्विटी का अनुमान लगाने के लिए उपयोग किया जाता है—यह संभावना कि आपका वर्तमान हाथ किसी दिए गए बोर्ड पर प्रतिद्वंद्वी के संभावित रेंज के खिलाफ जीतेगा (या बराबरी करेगा)। टेक्सास होल्डम में हाथों के संयोजनों की संख्या बहुत अधिक होने के कारण (फ्लॉप के बाद की संभावनाएं लाखों से अधिक हो सकती हैं), सटीक गणना संभव नहीं है, जिससे इक्विटी की गणना के लिए मोंटे कार्लो सिमुलेशन मानक दृष्टिकोण बन जाता है।

सिद्धांत

मूल प्रक्रिया

  1. वर्तमान स्थिति निर्धारित करें: इसमें आपके होल कार्ड, ज्ञात कम्युनिटी कार्ड, खिलाड़ियों की संख्या, और प्रतिद्वंद्वी की संभावित "रेंज" (संभावित शुरुआती हाथों का एक सेट) शामिल है।

  2. यादृच्छिक नमूनाकरण: शेष डेक से अज्ञात कार्ड (प्रतिद्वंद्वी के हाथ, बाद के कम्युनिटी कार्ड) को यादृच्छिक रूप से निकालें ताकि हाथ रिवर तक पूरा हो सके। प्रत्येक निकासी एक समान वितरण का पालन करती है।

  3. परिणाम निर्धारित करें: अंतिम हाथ की ताकत के आधार पर तय करें कि आपका हाथ जीतता है, बराबरी करता है या हारता है।

  4. दोहराएं और गणना करें: उपरोक्त चरणों को N बार (आमतौर पर 100,000 से लेकर करोड़ों तक) दोहराएं और जीत और बराबरी की संख्या गिनकर इक्विटी का अनुमान लगाएं:

    [ \text{इक्विटी} \approx \frac{\text{जीत} + 0.5 \times \text{बराबरी}}{\text{कुल सिमुलेशन}} ]

अभिसरण और सटीकता

बड़ी संख्याओं के नियम के अनुसार, जैसे-जैसे सिमुलेशन की संख्या N बढ़ती है, अनुमान वास्तविक संभावना की ओर अभिसरित होता है। त्रुटि का विचरण ( \sqrt{p(1-p)/N} ) के समानुपाती होता है (जहाँ p वास्तविक इक्विटी है)। उदाहरण के लिए, लगभग 50% इक्विटी के साथ, 1 मिलियन बार सिमुलेशन करने पर मानक विचलन लगभग 0.05% (0.0005) होता है, जिसका अर्थ है कि वास्तविक त्रुटि आमतौर पर 0.1%–0.2% के भीतर होती है। इसलिए, अधिकांश पोकर सॉफ्टवेयर पर्याप्त सटीकता सुनिश्चित करने के लिए डिफ़ॉल्ट रूप से 1 से 10 मिलियन सिमुलेशन का उपयोग करते हैं।

प्रतिद्वंद्वी रेंज का प्रतिनिधित्व

रेंज मोंटे कार्लो सिमुलेशन के लिए एक महत्वपूर्ण इनपुट है। इसे आमतौर पर हाथों के संयोजनों की सूची के रूप में दर्शाया जाता है, जैसे "सभी पॉकेट पेयर, सूटेड कनेक्टर, A-हाई हैंड्स" आदि। सिमुलेशन के दौरान, प्रत्येक पुनरावृत्ति में रेंज से यादृच्छिक और समान रूप से एक हाथ चुना जाता है जो प्रतिद्वंद्वी के होल कार्ड के रूप में काम करता है। रेंज जितनी अधिक सटीक होगी, सिमुलेशन परिणाम उतने ही मूल्यवान होंगे।

व्यावहारिक उदाहरण

उदाहरण: फ्लॉप पर इक्विटी का मूल्यांकन

मान लीजिए कि हमारे पास A♠K♠ है और फ्लॉप पर बोर्ड Q♠J♠3♦ है। प्रतिद्वंद्वी की रेंज इस प्रकार निर्धारित की गई है: सभी पॉकेट पेयर, फ्लश ड्रॉ और ओपन-एंडेड स्ट्रेट ड्रॉ। हम जानना चाहते हैं कि हमारी वर्तमान इक्विटी क्या है।

संदर्भ: KEPU मल्टी-फुल: मोंटे-कार्लो-सिमुलेशन-पोकर-इक्विटी-गणना बॉडी (भाग 2/2)

  1. शेष डेक (47 अज्ञात कार्ड) से यादृच्छिक रूप से एक प्रतिद्वंद्वी हाथ (रेंज के अनुरूप) निकालें, फिर यादृच्छिक रूप से टर्न और रिवर (प्रत्येक एक कार्ड) निकालें।
  2. दोनों पक्षों के लिए अंतिम हाथ की ताकत की गणना करें और जीत/टाई/हार रिकॉर्ड करें।
  3. इसे 1 मिलियन बार दोहराएं और मान लीजिए, 62.5% की इक्विटी प्राप्त करें।

यह आंकड़ा दर्शाता है कि हम आगे हैं और बेटिंग या रेज़िंग पर विचार कर सकते हैं। यदि इक्विटी 50% से कम होती, तो हम चेक या फोल्ड पर विचार कर सकते थे।

सामान्य परिदृश्य: ऑल-इन निर्णय

कैश गेम या टूर्नामेंट में, ऑल-इन का सामना करने पर, आपको इक्विटी की तुलना पॉट ऑड्स से करनी होती है। उदाहरण के लिए, पॉट 1000 है, प्रतिद्वंद्वी 500 की बेट लगाता है, और आपको 500 कॉल करना है। पॉट ऑड्स (1000+500)/500 = 3:1 हैं, जिसके लिए ब्रेक-ईवन के लिए कम से कम 25% इक्विटी चाहिए। यदि मोंटे कार्लो सिमुलेशन दिखाता है कि हमारे हाथ में प्रतिद्वंद्वी की रेंज के खिलाफ 30% इक्विटी है, तो कॉल करना सकारात्मक EV वाला कदम है।

सामान्य गलतफहमियाँ

  1. बहुत कम सिमुलेशन: 10,000 से कम रन में परिणामों में काफी उतार-चढ़ाव हो सकता है, जिससे पक्षपातपूर्ण निर्णय हो सकते हैं। कम से कम 100,000 सिमुलेशन का उपयोग करने की सिफारिश की जाती है, और महत्वपूर्ण निर्णयों के लिए 1 मिलियन से अधिक।
  2. गलत रेंज सेटिंग: प्रतिद्वंद्वी की फोल्डिंग रेंज को अधिक आंकना या उनकी रेज़िंग रेंज को कम आंकना इक्विटी गणनाओं को विकृत करता है। प्रतिद्वंद्वी के ऐतिहासिक व्यवहार के आधार पर

अक्सर पूछे जाने वाले प्रश्न

अधिकांश स्थितियों में, 100,000 सिमुलेशन लगभग 0.3% की त्रुटि मार्जिन प्रदान करते हैं, जो निर्णय लेने के लिए पर्याप्त है। यदि उच्च सटीकता की आवश्यकता है (जैसे, 0.1% के भीतर), तो 1 मिलियन से अधिक बार सिमुलेशन करने की सिफारिश की जाती है। प्री-फ्लॉप या जब प्रतिद्वंद्वी की रेंज बहुत संकीर्ण हो, तो आप संख्या को उचित रूप से कम कर सकते हैं, लेकिन 10,000 से कम नहीं।