نمونه هایی از حل مسئله بازی های ماتریسی: نمونه هایی از حل مسئله

نظریه بازی های ریاضی، که در دهه چهل قرن بیستم ظهور کرد، بیشتر در اقتصاد استفاده می شود. اما چگونه می توان از مفهوم بازی برای الگوبرداری از رفتار افراد جامعه استفاده کرد؟ دانیل فدوروویخ، مدرس ارشد بخش تجزیه و تحلیل اقتصاد خرد HSE در سخنرانی خود توضیح داد که چرا اقتصاددانان مطالعه می کنند، بازیکنان فوتبال در کدام گوشه بیشتر ضربات پنالتی می زنند و چگونه می توانند در «سنگ، کاغذ، قیچی» برنده شوند.

جان نش و یک بلوند در یک بار

بازی هر موقعیتی است که در آن سود یک نماینده نه تنها به اقدامات خود، بلکه به رفتار سایر شرکت کنندگان نیز بستگی دارد. اگر در خانه بازی یک نفره بازی می کنید، از دیدگاه یک اقتصاددان و نظریه بازی، این یک بازی نیست. این به معنای وجود اجباری تضاد منافع است.

در فیلم «ذهن زیبا» درباره جان نش، برنده جایزه نوبلدر اقتصاد، صحنه ای با یک بلوند در یک بار وجود دارد. این ایده ای را نشان می دهد که دانشمند برای آن جایزه دریافت کرد - این ایده تعادل نش است که خودش آن را دینامیک کنترل نامید.

یک بازی- هر موقعیتی که در آن سود نمایندگان به یکدیگر بستگی دارد.

استراتژی توصیفی از اقدامات بازیکن در تمام موقعیت های ممکن است.

نتیجه ترکیبی از استراتژی های انتخاب شده است.

بنابراین، از نظر تئوریک، بازیکنان در این شرایط فقط مردان هستند، یعنی کسانی که تصمیم می گیرند. ترجیحات آنها ساده است: یک بلوند بهتر از یک سبزه است و یک سبزه بهتر از هیچ است. شما می توانید به دو صورت عمل کنید: به سراغ یک بلوند بروید یا به سبزه "خود". بازی از یک حرکت تشکیل شده است، تصمیمات به طور همزمان گرفته می شود (یعنی شما نمی توانید ببینید بقیه کجا رفتند و سپس به تنهایی حرکت کنید). اگر هر دختری مردی را رد کند، بازی به پایان می رسد: بازگشت به او یا انتخاب دیگری غیرممکن است.

نتیجه احتمالی این وضعیت بازی چیست؟ یعنی پیکربندی پایدار آن چیست که همه از روی آن بفهمند چه کرده اند بهترین انتخاب? اولا، همانطور که نش به درستی اشاره می کند، اگر همه به سمت بلوند بروند، پایان خوبی نخواهد داشت. بنابراین، دانشمند بیشتر پیشنهاد می کند که همه باید به سراغ سبزه ها بروند. اما اگر معلوم است که همه به سمت سبزه ها می روند، باید به سراغ بلوند برود، زیرا او بهتر است.

این تعادل واقعی است - نتیجه ای که در آن یکی به سمت بلوند می رود و بقیه به سبزه ها می رسد. این ممکن است ناعادلانه به نظر برسد. اما در شرایط تعادل، هیچ‌کس نمی‌تواند از انتخاب خود پشیمان شود: کسانی که به سراغ سبزه‌ها می‌روند می‌دانند که به هر حال از یک بلوند چیزی دریافت نمی‌کنند. بنابراین، تعادل نش پیکربندی است که در آن هیچ کس به تنهایی نمی‌خواهد استراتژی انتخاب شده توسط همه را تغییر دهد. یعنی با بازتاب در پایان بازی، هر شرکت‌کننده می‌فهمد که حتی اگر می‌دانست که دیگران چگونه کار می‌کنند، همان کار را می‌کرد. راه دیگری برای نامیدن آن نتیجه است که در آن هر شرکت کننده به طور بهینه به اقدامات دیگران پاسخ می دهد.

"سنگ کاغذ قیچی"

برای تعادل به بازی های دیگر نگاه می کنیم. به عنوان مثال، راک، کاغذ، قیچی تعادل نش ندارند: در تمام نتایج احتمالی آن، هیچ گزینه ای وجود ندارد که در آن هر دو شرکت کننده از انتخاب خود راضی باشند. با این حال، یک قهرمانی جهانی و انجمن جهانی قیچی کاغذ سنگ وجود دارد که آمار بازی ها را جمع آوری می کند. بدیهی است که اگر چیزی در مورد رفتار عمومی افراد در این بازی بدانید، می توانید شانس برنده شدن خود را افزایش دهید.

یک استراتژی خالص در یک بازی، استراتژی است که در آن یک فرد همیشه یکسان بازی کند و حرکات یکسانی را انتخاب کند.

طبق انجمن جهانی RPS، سنگ بیشترین انتخاب را دارد (37.8٪). 32.6 درصد از کاغذ، 29.6 درصد از قیچی استفاده می کنند. اکنون می دانید که باید کاغذ را انتخاب کنید. با این حال، اگر با کسی بازی کنید که این را هم می داند، دیگر مجبور نیستید کاغذ را انتخاب کنید، زیرا از شما نیز همین انتظار می رود. یک مورد معروف وجود دارد: در سال 2005، دو خانه حراج ساتبیز و کریستیز تصمیم گرفتند که چه کسی مبلغ بسیار زیادی به دست آورد - مجموعه ای از پیکاسو و ون گوگ با قیمت اولیه 20 میلیون دلار. مالک به آنها پیشنهاد داد سنگ، کاغذ، قیچی بازی کنند و نمایندگان خانه ها گزینه های خود را به او ایمیل کردند. ساتبیز، همانطور که بعداً گفتند، بدون فکر زیاد مقاله را انتخاب کرد. در کریستیز برنده شد. هنگام تصمیم گیری، آنها به یک متخصص مراجعه کردند - دختر 11 ساله یکی از مدیران ارشد. او گفت: "به نظر می رسد سنگ قوی ترین است، به همین دلیل است که بیشتر مردم آن را انتخاب می کنند. اما اگر با یک مبتدی کاملا احمق بازی نکنیم، او سنگ را دور نمی اندازد، از ما انتظار دارد که این کار را انجام دهیم و خودش کاغذ را دور می اندازد. اما یک قدم جلوتر فکر می کنیم و قیچی را دور می اندازیم.»

بنابراین، می توانید از قبل فکر کنید، اما این لزوما شما را به پیروزی نمی رساند، زیرا ممکن است از صلاحیت حریف خود آگاه نباشید. بنابراین، گاهی به جای استراتژی های ناب، انتخاب ترکیبی، یعنی تصمیم گیری تصادفی، صحیح تر است. بنابراین، در «سنگ، کاغذ، قیچی»، تعادلی که قبلاً پیدا نکرده بودیم دقیقاً در استراتژی‌های ترکیبی است: انتخاب هر یک از سه گزینه حرکت با احتمال یک سوم. اگر سنگ را بیشتر انتخاب کنید، حریف شما انتخاب خود را تنظیم می کند. با دانستن این موضوع، خود را تنظیم خواهید کرد و تعادل حاصل نخواهد شد. اما اگر همه به سادگی سنگ، قیچی یا کاغذ را با احتمال مساوی انتخاب کنند، هیچ یک از شما شروع به تغییر رفتار نخواهید کرد. این به این دلیل است که در استراتژی های ترکیبی اقدامات قبلیپیش بینی حرکت بعدی شما غیرممکن است.

استراتژی ترکیبی و ورزش

نمونه های جدی تری از استراتژی های مختلط وجود دارد. به عنوان مثال، جایی که می توان در تنیس خدمت کرد یا در فوتبال پنالتی گرفت. اگر در مورد حریف خود چیزی نمی دانید یا همیشه در برابر حریف های مختلف بازی می کنید، بهترین استراتژیکم و بیش به صورت تصادفی عمل خواهد کرد. استاد دانشکده اقتصاد لندن، ایگناسیو پالاسیوس-هورتا، مقاله ای را در American Economic Review در سال 2003 منتشر کرد که ماهیت آن یافتن تعادل نش در استراتژی های ترکیبی بود. Palacios-Huerta فوتبال را به عنوان موضوع تحقیق خود انتخاب کرد و به همین دلیل بیش از 1400 ضربه پنالتی را بررسی کرد. البته در ورزش همه چیز با حیله گری تر از "سنگ، کاغذ، قیچی" چیده می شود: پای قوی ورزشکار، ضربه زدن به زوایای مختلف هنگام ضربه زدن با قدرت کامل و مواردی از این دست را در نظر می گیرد. تعادل نش در اینجا شامل محاسبه گزینه ها می شود، به عنوان مثال، تعیین گوشه های دروازه که در آن شوت کنید تا با احتمال بیشتری برنده شوید، با دانستن ضعف خود و نقاط قوت. آمارهای مربوط به هر بازیکن فوتبال و تعادلی که در استراتژی‌های ترکیبی در آنها یافت می‌شود نشان داد که بازیکنان فوتبال تقریباً همانطور که اقتصاددانان پیش‌بینی می‌کنند عمل می‌کنند. به سختی می توان گفت که افرادی که پنالتی می گیرند کتاب های درسی تئوری بازی ها را خوانده اند و ریاضیات بسیار پیچیده ای انجام داده اند. به احتمال زیاد وجود دارد راه های مختلفرفتار بهینه را بیاموزید: می‌توانید فوتبالیست درخشانی باشید و احساس کنید چه کاری باید انجام دهید، یا می‌توانید یک اقتصاددان باشید و به دنبال تعادل در استراتژی‌های ترکیبی باشید.

در سال 2008، پروفسور ایگناسیو پالاسیوس-هورتا با آبراهام گرانت، مربی چلسی که در آن زمان در فینال لیگ قهرمانان اروپا در مسکو بازی می کرد، ملاقات کرد. این دانشمند یادداشتی به مربی نوشت و توصیه هایی برای ضربات پنالتی داشت که مربوط به رفتار دروازه بان حریف، ادوین فن در سار از منچستریونایتد بود. به عنوان مثال، طبق آمار، او تقریباً همیشه در سطح متوسط ​​ضربات خود را دفع می کرد و اغلب برای گرفتن پنالتی خود را در جهت طبیعی پرتاب می کرد. همانطور که در بالا مشخص کردیم، درست تر است که رفتار خود را با در نظر گرفتن دانش در مورد حریف خود تصادفی کنید. وقتی امتیاز پنالتی 6 بر 5 بود، نیکلاس آنلکا، مهاجم چلسی باید گل می زد. وان در سار با اشاره به گوشه سمت راست قبل از ضربه، به نظر می رسید از آنلکا می پرسد که آیا قرار است در آنجا شوت بزند.

نکته اینجاست که تمام شوت های قبلی چلسی به سمت گوشه سمت راست مهاجم بود. ما دقیقاً نمی دانیم چرا، شاید به دلیل توصیه یک اقتصاددان، به سمتی بروند که برای آنها غیرطبیعی است، زیرا طبق آمار، ون در سار کمتر برای این کار آماده است. اکثر بازیکنان چلسی راست دست بودند: ضربه به گوشه راست غیرطبیعی، همه آنها به جز تری گل زدند. ظاهراً استراتژی این بود که آنلکا در آنجا شوت کند. اما به نظر می رسید وان در سار این را درک می کرد. او عالی عمل کرد: به گوشه سمت چپ اشاره کرد و گفت: "آیا می خواهی آنجا شلیک کنی؟" که احتمالا آنلکا را وحشت زده کرده است، زیرا آنها او را حدس زده بودند. او در آخرین لحظه تصمیم گرفت متفاوت عمل کند و در جهت طبیعی خود ضربه بزند، چیزی که فان در سار به آن نیاز داشت که این ضربه را زد و پیروزی منچستر را تضمین کرد. این وضعیت انتخاب تصادفی را آموزش می دهد، زیرا در غیر این صورت ممکن است تصمیم شما محاسبه شود و ضرر کنید.

"معضل زندانی"

احتمالاً بیشترین بازی معروف، که با آن دوره های دانشگاهی در مورد نظریه بازی ها آغاز می شود، معضل زندانی است. طبق افسانه، دو مظنون برای یک جنایت جدی دستگیر و در سلول های جداگانه حبس شدند. شواهدی وجود دارد که آنها اسلحه نگه داشته اند و این باعث می شود که آنها برای مدت کوتاهی زندانی شوند. با این حال، هیچ مدرکی مبنی بر ارتکاب این جنایت وحشتناک وجود ندارد. بازپرس شرایط بازی را به هر فرد می گوید. اگر هر دو جنایتکار اعتراف کنند، هر دو به سه سال زندان خواهند رفت. اگر یکی اعتراف کند و شریک جرم سکوت کند، اعتراف کننده فوراً آزاد می شود و دیگری به پنج سال زندان محکوم می شود. اگر برعکس اولی اعتراف نکند و دومی او را تحویل دهد، اولی پنج سال به زندان می‌رود و نفر دوم بلافاصله آزاد می‌شود. اگر هیچ کس اعتراف نکند، هر دو به دلیل داشتن سلاح به یک سال زندان محکوم خواهند شد.

تعادل نش در اینجا در ترکیب اول نهفته است، زمانی که هر دو مظنون ساکت نمی مانند و هر دو به مدت سه سال به زندان می روند. استدلال همه این است: «اگر حرف بزنم، سه سال زندان می‌روم، اگر سکوت کنم، پنج سال به زندان می‌روم. اگر دومی سکوت کرد، بهتر است من هم بگویم: بهتر است به زندان نرویم تا یک سال زندان.» این استراتژی غالب است: صحبت کردن سودمند است، مهم نیست طرف مقابل چه کاری انجام می دهد. با این حال، یک مشکل در آن وجود دارد - گزینه بهتری وجود دارد، زیرا سه سال زندانی شدن بدتر از یک سال زندان است (اگر داستان را فقط از دیدگاه شرکت کنندگان در نظر بگیرید و در نظر نگیرید. مسائل اخلاقی). اما نشستن یک سال غیرممکن است، زیرا همانطور که در بالا فهمیدیم، سکوت برای هر دو جنایتکار سودی ندارد.

بهبود پارتو

استعاره معروفی در مورد دست نامرئی بازار وجود دارد که متعلق به آدام اسمیت است. وی با بیان اینکه اگر قصابی بخواهد برای خودش پول دربیاورد برای همه بهتر است گفت: گوشت خوش طعمی درست می کند که نانوا با پول فروش نان می خرد و خودش هم باید آن را درست کند. خوشمزه تا بفروشند . اما معلوم می شود که این دست نامرئی همیشه کار نمی کند و موقعیت های زیادی وجود دارد که همه برای خود عمل می کنند و همه احساس بدی می کنند.

بنابراین، گاهی اوقات اقتصاددانان و نظریه پردازان بازی به رفتار بهینه هر بازیکن فکر نمی کنند، یعنی به تعادل نش فکر نمی کنند، بلکه به نتیجه ای می اندیشند که در آن کل جامعه وضعیت بهتری خواهد داشت (در معضل، جامعه از دو جنایتکار تشکیل شده است). . از این منظر، یک نتیجه زمانی کارآمد است که هیچ پیشرفت پارتو در آن وجود نداشته باشد، یعنی غیرممکن است که کسی را بهتر کند بدون اینکه دیگران را بدتر کند. اگر مردم صرفاً کالاها و خدمات را مبادله کنند، این یک پیشرفت پارتو است: آنها داوطلبانه این کار را انجام می دهند و بعید است که کسی نسبت به آن احساس بدی داشته باشد. اما گاهی اوقات، اگر شما فقط به افراد اجازه تعامل داشته باشید و حتی مداخله نکنید، چیزی که آنها به دست می آورند بهینه پارتو نخواهد بود. این همان چیزی است که در دوراهی زندانی رخ می دهد. در آن، اگر به همه اجازه دهیم به گونه ای عمل کنند که به نفع آنهاست، معلوم می شود که این باعث می شود همه احساس بدی کنند. اگر همه برای خودشان کمتر از حد بهینه عمل کنند، یعنی سکوت کنند، برای همه بهتر است.

تراژدی منابع مشترک

معمای زندانی یک داستان اسباب بازی است. این موقعیتی نیست که شما انتظار داشته باشید در آن قرار بگیرید، اما اثرات مشابهی در اطراف ما وجود دارد. "معضل" را در نظر بگیرید مقدار زیادبازیکنان، گاهی اوقات به آن تراژدی عوام می گویند. به عنوان مثال، ترافیک در جاده ها وجود دارد، و من تصمیم می گیرم که چگونه به سر کار بروم: با ماشین یا اتوبوس. بقیه هم همین کار را می کنند. اگر من با ماشین بروم و همه تصمیم بگیرند همین کار را بکنند، ترافیک ایجاد می شود، اما ما راحت به آنجا می رسیم. اگر با اتوبوس بروم، باز هم ترافیک وجود خواهد داشت، اما سواری ناخوشایند خواهد بود و خیلی سریعتر نیست، بنابراین این نتیجه حتی بدتر خواهد بود. اگر به طور متوسط ​​همه سوار اتوبوس شوند، اگر من هم همین کار را انجام دهم، خیلی سریع بدون ترافیک به آنجا خواهم رسید. اما اگر در چنین شرایطی با ماشین بروم، به سرعت و در عین حال راحت به آنجا خواهم رسید. بنابراین، وجود ترافیک به اقدامات من بستگی ندارد. تعادل نش در اینجا در شرایطی است که همه رانندگی را انتخاب می کنند. مهم نیست که دیگران چه کاری انجام می دهند، برای من بهتر است یک ماشین انتخاب کنم، زیرا معلوم نیست ترافیک ایجاد می شود یا نه، اما در هر صورت من راحت به آنجا خواهم رسید. این استراتژی غالب است، بنابراین در نهایت همه یک ماشین می‌رانند و ما آنچه را داریم داریم. وظیفه دولت این است که با اتوبوس سفر کند بهترین گزینهحداقل برای برخی، به همین دلیل است که ورودی های مرکز، پارکینگ ها و غیره پولی وجود دارد.

دیگر داستان کلاسیک- جهل عقلانی رأی دهنده. تصور کنید از قبل از نتیجه یک انتخابات مطلع نیستید. شما می توانید برنامه های همه نامزدها را مطالعه کنید، به مناظره ها گوش دهید و سپس به بهترین آنها رای دهید. راهبرد دوم این است که به شعبه رای بیایید و به طور تصادفی یا به کسی که بیشتر از تلویزیون نشان داده شده است رای دهید. اگر رای من هیچ وقت تعیین نکند که چه کسی برنده می شود (و در کشوری با 140 میلیون نفر، یک رای هرگز هیچ تصمیمی نخواهد گرفت) بهترین رفتار چیست؟ البته من می‌خواهم کشور رئیس‌جمهور خوبی داشته باشد، اما می‌دانم که دیگر هیچ‌کس برنامه‌های نامزدها را با دقت مطالعه نخواهد کرد. بنابراین، تلف نکردن زمان برای این استراتژی رفتار غالب است.

وقتی از شما خواسته می شود که به یک روز پاکسازی بیایید، تمیز بودن یا نبودن حیاط به تنهایی به کسی بستگی ندارد: اگر من به تنهایی بیرون بروم، نمی توانم همه چیز را تمیز کنم، یا اگر همه بیرون بیایند. ، پس من بیرون نمی روم، زیرا همه چیز بدون من انجام می شود. حذف خواهد شد. مثال دیگر حمل و نقل کالا در چین است که در کتاب فوق العاده استفان لندزبورگ، اقتصاددان روی نیمکت، با آن آشنا شدم. 100-150 سال پیش در چین یک روش رایج برای حمل و نقل کالا وجود داشت: همه چیز را در یک بدنه بزرگ تا می کردند که توسط هفت نفر کشیده می شد. در صورتی که کالا به موقع تحویل داده شود، مشتریان پرداخت می کنند. تصور کنید که شما یکی از این شش نفر هستید. شما می توانید تلاش کنید و تا جایی که می توانید بکشید، و اگر همه این کار را انجام دهند، بار به موقع می رسد. اگر یک نفر این کار را انجام ندهد، همه به موقع می‌رسند. همه فکر می کنند: "اگر دیگران به درستی می کشند، چرا من باید این کار را انجام دهم، و اگر دیگران تا آنجا که می توانند کشش نمی دهند، پس من نمی توانم چیزی را تغییر دهم." در نتیجه، همه چیز با زمان تحویل بسیار بد بود و خود لودرها راهی برای خروج پیدا کردند: آنها شروع به استخدام نفر هفتم کردند و به او پول پرداخت کردند تا افراد تنبل را با شلاق شلاق بزند. وجود چنین شخصی همه را مجبور کرد تا آنجا که می توانند تلاش کنند، زیرا در غیر این صورت همه در تعادل بدی قرار می گرفتند که هیچ کس نمی توانست سودآور از آن فرار کند.

همین مثال را می توان در طبیعت مشاهده کرد. درختی که در باغ رشد می کند با درختی که در جنگل رشد می کند در تاج آن متفاوت است. در حالت اول، کل تنه را احاطه کرده است، در حالت دوم، فقط در بالا قرار دارد. در جنگل این یک تعادل نش است. اگر همه درختان موافق بودند و به یک اندازه رشد می کردند، تعداد فوتون ها را به طور مساوی توزیع می کردند و همه وضعیت بهتری داشتند. اما انجام این کار برای هیچ فردی سودی ندارد. بنابراین، هر درختی می خواهد کمی بالاتر از درختان اطراف خود رشد کند.

دستگاه تعهد

در بسیاری از موقعیت ها، یکی از شرکت کنندگان در بازی ممکن است به ابزاری نیاز داشته باشد که دیگران را متقاعد کند که بلوف نمی زند. به آن دستگاه تعهد می گویند. به عنوان مثال، قانون در برخی کشورها، پرداخت باج به آدم ربایان را ممنوع می کند تا انگیزه مجرمان کاهش یابد. با این حال، این قانون اغلب کار نمی کند. اگر بستگان شما اسیر شود و شما فرصت داشته باشید که با دور زدن قانون او را نجات دهید، این کار را انجام خواهید داد. بیایید شرایطی را تصور کنیم که می توان قانون را دور زد، اما بستگان فقیر هستند و چیزی برای پرداخت باج ندارند. مجرم در این شرایط دو راه دارد: آزاد کردن یا کشتن قربانی. او دوست ندارد بکشد، اما دیگر زندان را دوست ندارد. قربانی آزاد شده به نوبه خود یا می تواند شهادت دهد تا آدم ربا مجازات شود یا سکوت کند. بهترین نتیجه برای مجرم این است که اگر قربانی را تحویل ندهد، او را رها کند. مقتول می خواهد آزاد شود و شهادت بدهد.

تعادل در اینجا این است که تروریست نمی خواهد دستگیر شود، یعنی قربانی می میرد. اما این یک تعادل پارتو نیست، زیرا گزینه ای وجود دارد که در آن وضعیت همه بهتر است - قربانی در آزادی ساکت می ماند. اما برای این کار باید مطمئن شد که سکوت برای او مفید است. در جایی من گزینه ای را خواندم که در آن او می تواند از یک تروریست بخواهد که یک عکس شهوانی ترتیب دهد. اگر مجرم زندانی شود، همدستانش عکس هایی را در اینترنت منتشر می کنند. حالا، اگر آدم ربا آزاد بماند، این بد است، اما عکس‌های موجود در حوزه عمومی بدتر هستند، بنابراین تعادل وجود دارد. برای قربانی، این راهی برای زنده ماندن است.

نمونه های دیگر بازی:

مدل برتراند

از آنجایی که ما در مورد اقتصاد صحبت می کنیم، بیایید در نظر بگیریم مثال اقتصادی. در مدل برتراند، دو فروشگاه یک محصول را به فروش می‌رسانند و آن را با همان قیمت از سازنده خریداری می‌کنند. اگر قیمت ها در فروشگاه ها یکسان باشد، سود آنها تقریباً یکسان است، زیرا در این صورت خریداران به صورت تصادفی یک فروشگاه را انتخاب می کنند. تنها تعادل نش در اینجا فروش محصول به قیمت تمام شده است. اما فروشگاه ها می خواهند پول در بیاورند. بنابراین، اگر یکی قیمت را 10 روبل تعیین کند، دومی آن را یک پنی کاهش می دهد و در نتیجه درآمد او را دو برابر می کند، زیرا همه خریداران به سمت او می روند. بنابراین، برای فعالان بازار سودمند است که قیمت ها را کاهش دهند و از این طریق سود را بین خود تقسیم کنند.

رانندگی در یک جاده باریک

بیایید به نمونه هایی از انتخاب بین دو تعادل ممکن نگاه کنیم. تصور کنید پتیا و ماشا در امتداد جاده ای باریک به سمت یکدیگر رانندگی می کنند. جاده آنقدر باریک است که هر دو باید به کنار جاده بروند. اگر تصمیم بگیرند به چپ یا راست بپیچند، به سادگی از هم دور می شوند. اگر یکی به راست بپیچد و دیگری به چپ بپیچد و یا بالعکس تصادفی رخ می دهد. چگونه انتخاب کنیم کجا حرکت کنیم؟ برای کمک به یافتن تعادل در چنین بازی هایی، برای مثال، قوانینی وجود دارد ترافیک. در روسیه همه باید به راست بپیچند.

در بازی مرغ زمانی که دو نفر با سرعت زیاد به سمت یکدیگر رانندگی می کنند، دو حالت تعادل نیز وجود دارد. اگر هر دو به کنار جاده بپیوندند، موقعیتی به وجود می‌آید که مرغ بیرون می‌آید؛ اگر هر دو از کنار جاده خارج نشوند، در یک تصادف وحشتناک می‌میرند. اگر بدانم حریفم مستقیم پیش می رود، برای زنده ماندن به نفع من است که از آن طرف حرکت کنم. اگر بدانم حریفم می رود، برای من سود دارد که مستقیم بروم تا بعداً 100 دلار بگیرم. پیش بینی اینکه واقعا چه اتفاقی خواهد افتاد دشوار است، با این حال، هر بازیکن روش خاص خود را برای برنده شدن دارد. تصور کنید فرمان را طوری درست کردم که قابل چرخش نباشد و این را به حریفم نشان دادم. حریف با دانستن این که چاره ای ندارم از آنجا می پرد.

اثر QWERTY

گاهی اوقات حرکت از یک تعادل به تعادل دیگر بسیار دشوار است، حتی اگر به معنای سود برای همه باشد. طرح QWERTY برای کاهش سرعت تایپ طراحی شده است. چون اگر همه خیلی سریع تایپ می کردند، سرهای ماشین تحریر که روی کاغذ می خورد به هم می خورد. بنابراین کریستوفر اسکولز حروفی را که اغلب در مجاورت یکدیگر بودند در دورترین فاصله ممکن قرار داد. اگر به تنظیمات صفحه کلید رایانه خود بروید، می توانید طرح Dvorak را در آنجا انتخاب کنید و بسیار سریعتر تایپ کنید، زیرا در حال حاضر مشکلی در دستگاه های تایپ آنالوگ وجود ندارد. دووراک انتظار داشت که دنیا به کیبورد او روی بیاورد، اما ما هنوز با QWERTY زندگی می کنیم. البته اگر به طرح دووراک روی بیاوریم، نسل های آینده از ما سپاسگزار خواهند بود. همه ما تلاش می‌کنیم و دوباره یاد می‌گیریم، و نتیجه تعادلی خواهد بود که همه به سرعت تایپ می‌کنند. اکنون ما نیز در تعادل هستیم - به طرز بدی. اما این برای کسی مفید نیست که تنها کسی باشد که بازآموزی می کند، زیرا کار بر روی هر رایانه ای غیر از رایانه شخصی ناخوشایند خواهد بود.

اگر چندین طرف (افراد) متعارض وجود داشته باشد، هر یک از آنها تصمیمی را می گیرند که توسط مجموعه ای از قوانین مشخص شده است و هر یک از افراد وضعیت نهایی را می دانند. وضعیت درگیریبا پرداخت های از پیش تعیین شده برای هر یک از طرفین، گفته می شود که یک بازی برگزار می شود.

وظیفه تئوری بازی ها انتخاب یک خط رفتار برای یک بازیکن معین است که انحراف از آن فقط می تواند بردهای او را کاهش دهد.

برخی از تعاریف بازی

ارزیابی کمی از نتایج بازی پرداخت نامیده می شود.

دوبل (دو نفر) در صورتی که مجموع پرداخت ها صفر باشد، یک بازی مجموع صفر نامیده می شود. اگر ضرر یک بازیکن برابر با سود دیگری باشد.

توصیف بدون ابهام از انتخاب یک بازیکن در هر یک از موقعیت های ممکن که در آن او باید یک حرکت شخصی انجام دهد نامیده می شود. استراتژی بازیکن .

استراتژی یک بازیکن در صورتی بهینه نامیده می شود که، زمانی که بازی چندین بار تکرار می شود، حداکثر بازدهی متوسط ​​ممکن را برای بازیکن فراهم کند (یا همان چیزی است که حداقل میانگین بازده ممکن را برای بازیکن فراهم کند).

بازی توسط یک ماتریس تعریف شده است آداشتن مترخطوط و nستون ها را یک بازی جفت محدود ابعاد می نامند متر* n;

جایی که من=
- استراتژی بازیکن اول با mstrategy. j=- استراتژی بازیکن دوم که n استراتژی دارد. ij- بردهای بازیکن اول مناستراتژی زمانی که توسط دوم استفاده می شود jاستراتژی ام (یا همان چیزی است که از دست دادن دومی در آن است jاستراتژی -ام، زمانی که برای اولین بار استفاده می شود من th)؛

A =  ij– ماتریس پرداخت بازی.

1.1 بازی با استراتژی های ناب

قیمت پایین بازی (برای بازیکن اول)

= حداکثر (دقیقه ij). (1.2)

من j

قیمت برتر بازی (برای بازیکن دوم):

= دقیقه (حداکثر ij) . (1.3)

جی من

اگر = ، بازی را بازی نقطه زینی (1.4) یا بازی با استراتژی های ناب می نامند. که در آن V = = به نام یک بازی ارزشمند ( V- قیمت بازی).

مثال.ماتریس پرداخت بازی 2 نفره A داده شده است.تعیین کنید استراتژی های بهینهبرای هر بازیکن و قیمت بازی:

(1.4)

حداکثر 10 9 12 6

من

دقیقه 6

j

- استراتژی بازیکن اول (ردیف).

استراتژی بازیکن دوم (ستون ها).

- قیمت بازی

بنابراین، بازی دارای یک نقطه زینتی است. استراتژی j = 4 - استراتژی بهینه برای بازیکن دوم من=2 - برای اولین. ما یک بازی با استراتژی های ناب داریم.

1.2 بازی با استراتژی های ترکیبی

اگر ماتریس پرداخت نقطه زینی نداشته باشد، یعنی.
و هیچ کس در بازی نمی تواند یک برنامه را به عنوان استراتژی بهینه خود انتخاب کند، بازیکنان به "استراتژی های ترکیبی" روی می آورند. علاوه بر این، هر بازیکن از هر یک از استراتژی های خود چندین بار در طول بازی استفاده می کند.

برداری که هر یک از اجزای آن بسامد نسبی استفاده بازیکن از استراتژی خالص مربوطه را نشان می دهد، استراتژی مختلط این بازیکن نامیده می شود.

ایکس= (ایکس 1 …ایکس من …ایکس متر) – استراتژی ترکیبی بازیکن اول.

U= (در 1 ...y j ...y n) – استراتژی ترکیبی بازیکن دوم.

ایکسمن ، y j- فرکانس های نسبی (احتمالات) بازیکنانی که از استراتژی های خود استفاده می کنند.

شرایط استفاده از استراتژی های ترکیبی

. (1.5)

اگر ایکس* = (ایکس 1 * ….ایکسمن*… ایکس متر*) - استراتژی بهینه انتخاب شده توسط بازیکن اول. Y* = (در 1 * …در j*... در n*) استراتژی بهینه ای است که توسط بازیکن دوم انتخاب می شود، سپس تعداد آن هزینه بازی است.

(1.6)

به منظور شماره Vقیمت بازی بود و ایکس* و در* - راهبردهای بهینه، برای ارضای نابرابری ها لازم و کافی است

(1.7)

اگر یکی از بازیکنان از استراتژی ترکیبی بهینه استفاده کند، سود او برابر با هزینه بازی است Vصرف نظر از فراوانی که بازیکن دوم از استراتژی های موجود در استراتژی بهینه، از جمله استراتژی های خالص استفاده می کند.

کاهش مسائل تئوری بازی ها به مسائل برنامه ریزی خطی.

مثال. یک راه حل برای بازی تعریف شده توسط ماتریس پرداخت پیدا کنید آ.

A = (1.8)

y 1 y 2 y 3

راه حل:

بیایید یک جفت مسئله برنامه ریزی خطی دوگانه ایجاد کنیم.

برای بازیکن اول

(1.9)

در 1 +در 2 +در 3 = 1 (1.10)

خود را از متغیر آزاد کنید V(قیمت بازی)، سمت چپ و راست عبارات (1.9)، (1.10) را به V. پذیرفتن در j /Vبرای یک متغیر جدید z من، ما گرفتیم سیستم جدیدقیود (1.11) و تابع هدف (1.12)

(1.11)

. (1.12)

به همین ترتیب، مدل بازی را برای بازیکن دوم دریافت می کنیم:

(1.13)

ایکس 1 +ایکس 2 +ایکس 3 = 1 . (1.14)

کاهش مدل (1.13)، (1.14) به یک فرم بدون متغیر V، ما گرفتیم

(1.15)

, (1.16)

جایی که
.

اگر نیاز به تعیین استراتژی رفتار بازیکن اول داشته باشیم، یعنی. فراوانی نسبی استفاده از استراتژی های او ( ایکس 1 ….ایکس من …ایکس متر) از مدل پخش دوم استفاده خواهیم کرد، زیرا این متغیرها در مدل پرداخت او (1.13)، (1.14) هستند.

اجازه دهید (1.15)، (1.16) را به شکل متعارف کاهش دهیم

(1.17)

مطالب 1 اطلاعات کلی 2 1.1 بازی. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 حرکت می کند. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 استراتژی ها. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 بازی ماتریکس. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 نقطه مسیر. استراتژی های خالص 7 2.1 مثال ها. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 مثال 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 مثال 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 استراتژی های ترکیبی 9 3.1 بازی 2×2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 مثال. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 مثال 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 مثال 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 تفسیر هندسی. . . . . . . . . . . . . . . . . . . . 12 بازی 3.2 2×n و m×2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 مثال 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. اطلاعات کلی از نظریه بازی ها 1.1. بازی ها تئوری بازی ها یک نظریه ریاضی از موقعیت های تعارض است، به عنوان مثال. موقعیت هایی که در آن منافع دو یا چند طرف که اهداف متفاوتی را دنبال می کنند، با هم برخورد می کنند. یک بازی یک موقعیت درگیری است، تنظیم شده است قوانین خاص، که باید نشان دهد: گزینه های ممکن برای اقدامات شرکت کنندگان؛ نتیجه کمی بازی یا پرداخت (برد، باخت) که مجموعه معینی از حرکات به آن منتهی می شود؛ میزان اطلاعات هر طرف در مورد رفتار طرف مقابل. بازی دو نفره بازی ای است که فقط دو طرف (دو بازیکن) در آن شرکت می کنند. یک بازی زوجی با مجموع صفر، یک بازی زوجی است که در آن مجموع پرداخت‌ها صفر است، یعنی. از دست دادن یک بازیکن برابر با سود بازیکن دوم است. بسته به نگرش هر بازیکن به ارزش تابع بازده، بازی های زوجی تقسیم می شوند: بازی زوجی با مجموع صفر (آنتاگونیستی) - یک بازی زوجی که در آن میزان پرداخت ها برابر با صفر است، یعنی. از دست دادن یک بازیکن برابر با سود بازیکن دوم است. یک بازی غیر متضاد یک بازی زوجی است که در آن بازیکنان اهداف متفاوتی را دنبال می‌کنند، اما دقیقاً مخالف آن نیستند. 2 1.2. Moves Move - انتخاب یکی از اقدامات پیش بینی شده توسط قوانین بازی؛ اجرای این انتخاب. از این انتخاب حرکت تصادفی - یک حرکت تصادفی انتخابی از تعدادی احتمال است که با تصمیم بازیکن انجام نمی شود، بلکه توسط مکانیزمی از انتخاب تصادفی انجام می شود. در زیر بازی‌های زوجی با مجموع صفر را در نظر می‌گیریم که فقط شامل حرکات شخصی هستند. هر یک از طرفین فاقد اطلاعات در مورد رفتار طرف مقابل است. 3 1.3. استراتژی ها استراتژی یک بازیکن مجموعه ای از قوانین است که بسته به موقعیتی که در طول بازی ایجاد می شود، انتخاب اقدامات را برای هر حرکت شخصی این بازیکن تعیین می کند. بسته به تعداد استراتژی های ممکن، بازی ها به محدود و بی نهایت تقسیم می شوند. بازی بی نهایت بازی ای است که در آن حداقل یکی از بازیکنان دارای بی نهایت استراتژی باشد. یک بازی متناهی بازی ای است که در آن هر بازیکن فقط تعداد محدودی استراتژی دارد. تعداد حرکات متوالی برای هر بازیکن، تقسیم بازی ها به تک حرکتی و چند حرکتی یا پوزیشنی را تعیین می کند. + در یک بازی یک نوبتی، هر بازیکن تنها یک انتخاب از بین گزینه های ممکن انجام می دهد و سپس نتیجه بازی را مشخص می کند. + یک بازی چند حرکتی یا موقعیتی در طول زمان توسعه می یابد که نشان دهنده مجموعه ای از مراحل متوالی است که هر کدام پس از حرکت یکی از بازیکنان و تغییر متناظر در موقعیت رخ می دهد. در یک بازی یک نوبتی، هر بازیکن تنها یک انتخاب از میان آن ها انجام می دهد گزینه های ممکنو سپس نتیجه بازی را مشخص می کند. استراتژی بهینه یک بازیکن، استراتژی است که وقتی بازی به دفعات تکرار می‌شود، حداکثر برد متوسط ​​ممکن را برای این بازیکن به ارمغان می‌آورد (یا همان چیزی است که حداقل باخت متوسط ​​ممکن). در تئوری بازی ها، همه توصیه ها بر اساس فرض رفتار معقول بازیکنان ارائه می شود. اشتباهات محاسباتی و اشتباهات بازیکنان، اجتناب ناپذیر در هر موقعیت درگیری، و همچنین عناصر هیجان و ریسک در تئوری بازی ها لحاظ نمی شود. 4 1.4. بازی ماتریس بازی ماتریسی یک بازی مجموع صفر محدود با یک حرکت است.بازی ماتریسی یک مدل تئوری بازی از یک موقعیت درگیری است که در آن حریفان برای دستیابی به اهداف کاملاً متضاد، یک انتخاب (حرکت) از یک محدود انجام می دهند. تعداد دوره های عملی ممکن مطابق با روش های عمل انتخاب شده (استراتژی ها)، نتیجه به دست آمده تعیین می شود. بیایید به یک مثال نگاه کنیم. بگذارید دو بازیکن A و B وجود داشته باشند که یکی از آنها می تواند انتخاب کند استراتژی i-ام از m از استراتژی های ممکن A1، A2، ...Am، و دومی استراتژی j ام را از بین استراتژی های ممکن B1، B2، ...Bm انتخاب می کند. در نتیجه، بازیکن اول مقدار aij را برنده می شود و بازیکن دوم این ارزش را از دست می دهد. از اعداد aij یک ماتریس   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. ..   ایجاد می کنیم. . . .  am1 am2 · · · amn ماتریس A = (aij)، i = 1، m، j = 1، n ماتریس پرداخت یا m × n ماتریس بازی نامیده می شود. در این ماتریس، ردیف ها همیشه برای استراتژی های بازیکن برنده (به حداکثر رساندن) A است، یعنی بازیکنی که برای به حداکثر رساندن برد خود تلاش می کند. ستون ها برای استراتژی های بازیکن بازنده B، یعنی بازیکنی که تلاش می کند تا معیار کارایی را به حداقل برساند، اختصاص داده شده است. عادی سازی یک بازی فرآیند کاهش یک بازی موقعیتی به یک بازی ماتریسی است. یک بازی در فرم معمولی یک بازی موقعیتی است که به یک بازی ماتریس کاهش می یابد. بیایید به یاد بیاوریم که یک بازی چند حرکتی موقعیتی یک مدل تئوری بازی از یک بازی است. موقعیت درگیری که در آن مخالفان به طور متوالی یک انتخاب (حرکت) از تعداد محدودی از اقدامات ممکن در هر مرحله از توسعه این وضعیت انجام می دهند. راه حل بازی یافتن استراتژی های بهینه هر دو بازیکن و تعیین قیمت بازی است.قیمت بازی سود (زیان) مورد انتظار بازیکنان است. راه‌حل بازی را می‌توان در استراتژی‌های خالص یافت - زمانی که بازیکن باید یک استراتژی واحد را دنبال کند، یا در استراتژی‌های مختلط، زمانی که بازیکن باید از دو یا چند استراتژی خالص با احتمالات خاص استفاده کند. دومی در این مورد فعال نامیده می شود. 5 استراتژی مختلط یک بازیکن یک برداری است که هر جزء آن تعداد دفعات استفاده بازیکن از استراتژی خالص مربوطه را نشان می دهد. حداکثر قیمت یا قیمت پایین بازی - عدد α = حداکثر حداقل aij i j استراتژی Maximin (خط) - استراتژی که بازیکن برای به حداکثر رساندن حداقل برد خود انتخاب می کند. بدیهی است که هنگام انتخاب محتاطانه ترین استراتژی حداکثر، بازیکن A برای خود (صرف نظر از رفتار حریف) بازده تضمین شده حداقل α را فراهم می کند. Maximin یا قیمت بالای بازی - عدد β = حداقل حداکثر aij j i استراتژی Minimax (ستون) - استراتژی که بازیکن برای به حداقل رساندن حداکثر ضرر خود انتخاب کرد. بدیهی است که هنگام انتخاب محتاطانه ترین استراتژی مینیمکس، بازیکن B تحت هیچ شرایطی به بازیکن A اجازه نمی دهد که بیشتر از β برنده شود. قیمت پایین تر بازی همیشه از قیمت بالای بازی تجاوز نمی کند α = max min aij 6 min max aij = β i j j i قضیه 1 (قضیه اصلی تئوری بازی های ماتریسی). هر بازی متناهی دارد حداقلیک راه حل ممکن است در حوزه استراتژی های ترکیبی باشد. 6 2. بازی با نقطه زین. راه حل در استراتژی های خالص بازی با نقطه زینی بازی ای است که برای آن α = حداکثر حداقل aij = حداقل حداکثر aij = β i j j i برای بازی های دارای نقطه زینی، یافتن راه حل شامل انتخاب استراتژی های حداکثر و حداقل حداکثر است که بهینه هستند. هزینه خالص بازی - معنی کلیقیمت های پایین تر و بالاتر بازی α=β=ν 2.1. مثال‌ها مثال 1 در استراتژی‌های خالص بازی که با ماتریس   8 4 7 A= 6 5 9  7 7 8 ارائه شده است، راه‌حلی پیدا کنید: قیمت بالا و پایین بازی را تعیین کنید. برای انجام این کار، حداقل اعداد aij در را پیدا می کنیم خط i-امαi = min aij j و حداکثر اعداد aij in ستون j βj = max aij i اعداد αi (حداقل ردیف) را در کنار ماتریس پرداخت سمت راست به شکل یک ستون اضافی می نویسیم. اعداد βi (حداکثر ستون) را زیر ماتریس به شکل یک خط اضافی می نویسیم: αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 حداکثر اعداد αi α = max αi = را بیابید. 7 i و حداقل اعداد βj β = min βj = 7 j α = β - بازی دارای نقطه زین است. استراتژی بهینه برای بازیکن استراتژی A3 و برای بازیکن B استراتژی B2 است، قیمت خالص بازی ν = 7 مثال 2 ماتریس پرداخت داده شده است:   2 2 1 1 2  0 1 1 1 1  A=  1 1 1 1 2   1 2 1 1 2 راه حلی برای بازی در استراتژی های خالص پیدا کنید. راه حل: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. بازی دارای شش نقطه زین است. استراتژی های بهینه عبارتند از: A1 و B3 یا B4 A3 و B3 یا B4 A4 و B3 یا B4 8 3. راه حل بازی در استراتژی های ترکیبی زمانی که α = β. در شرایطی که هر دو بازیکن هنگام انتخاب استراتژی خود هیچ اطلاعی از انتخاب دیگری نداشته باشند، بازی راه حلی در استراتژی های ترکیبی دارد. SA = (p1, p2, ..., pm) - استراتژی ترکیبی بازیکن A که در آن استراتژی های A1, A2, ..., Am با احتمالات ∑ m p1, p2, ..., pm, pi = اعمال می شود. 1, pi > 0, i = 1, m i=1 SB = (q1, q2, ..., qn) - استراتژی مختلط بازیکن B که در آن استراتژی های B1, B2, ..., Bm با احتمالات اعمال می شود ∑ n q1، q2، ...، qm، qi = 1، qi > 0، i = 1، n i=1 اگر: SA∗ استراتژی بهینه بازیکن A باشد، SB∗ استراتژی بهینه بازیکن B است، پس هزینه بازی ∑ n ∑ m ν = aij · p∗i · qi∗ j=1 i=1 است قضیه زیر به این سوال پاسخ می دهد که چگونه برای بازی های 2 × 2، 2 × n، m × راه حل پیدا کنیم. 2 قضیه 2 (نحوه یافتن راه حل برای بازی های 2 × 2، 2 × n، m × 2). اگر یکی از بازیکنان از یک استراتژی ترکیبی بهینه استفاده کند، بدون توجه به احتمالاتی که بازیکن دوم از استراتژی های موجود در استراتژی بهینه (از جمله استراتژی های خالص) استفاده می کند، بازده او برابر است با هزینه بازی ν. 9 3.1. بازی 2 × 2 یک بازی 2 × 2 با ماتریس در نظر بگیرید: () a11 a21 a21 a22 اجازه دهید بازی در استراتژی های خالص راه حلی نداشته باشد. اجازه دهید استراتژی های بهینه SA∗ و SB∗ را پیدا کنیم. ابتدا استراتژی SA∗ = (p∗1، p∗2) را تعریف می کنیم. طبق قضیه، اگر طرف A به استراتژی ν پایبند باشد، بدون توجه به روند عمل طرف B، بازده برابر با هزینه بازی ν باقی خواهد ماند. در نتیجه، اگر طرف A به استراتژی بهینه SA∗ = (p∗1، p∗2) پایبند باشد، طرف B می تواند هر یک از استراتژی های خود را بدون تغییر بازده خود اعمال کند. سپس، وقتی بازیکن B از استراتژی خالص B1 یا B2 استفاده می کند، بازیکن یک بازده متوسط ​​برابر با هزینه بازی دریافت می کند: a11 p∗1 + a21 p∗2 = ν ← برای استراتژی B1 a12 p∗1 + a22 p∗ 2 = ν ← برای استراتژی B2 با در نظر گرفتن اینکه p∗1 + p∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a22 −a12 −a21 قیمت بازی: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 استراتژی بهینه بازیکن B به طور مشابه یافت می شود: SB∗ = (q1∗ , q2∗). با در نظر گرفتن اینکه q1∗ + q2∗ = 1: q1∗ = a2 2−a1 2 a11 +a22 −a12 −a21 q2∗ = a1 1−a2 1 a11 +a22 −a12 −a21 3.1.1. مثال ها مثال 3 با ماتریس () −1 1 A= 1 −1 10 راه حلی برای بازی پیدا کنید، زیرا α= -1، β = 1، α ̸= β. ما به دنبال راه حلی در استراتژی های ترکیبی هستیم. با استفاده از فرمول های p∗ و q∗، p∗1 = p∗2 = 0.5 و q1∗ = q2∗ = 0.5، ν = 0، بنابراین، SA∗ = (0.5، 0.5) SB∗ = (0.5، 0.5) ) مثال 4 با ماتریس () راه حلی برای بازی پیدا کنید 2 5 A= 6 4 راه حل: بازی نقطه زینی ندارد، زیرا α= 4، β = 5، α ̸= β. ما به دنبال راه حلی در استراتژی های ترکیبی هستیم. با استفاده از فرمول های p∗ و q∗، p∗1 = 0.4، p∗2 = 0.6 و q1∗ = 0.2 q2∗ = 0.8، ν = 4.4 بنابراین، SA∗ = (0.4، 0.6) SB∗ = ( 0.2، 0.8) 11 3.1.2. تفسیر هندسی بازی 2 × 2 را می توان یک تفسیر هندسی ساده داد. اجازه دهید یک بخش از محور آبسیسا را ​​در نظر بگیریم که هر نقطه آن را با یک استراتژی ترکیبی مرتبط می کنیم S = (p1, p2) = (p1, 1 - p1) و احتمال p1 استراتژی A1 برابر با فاصله از نقطه SA به انتهای سمت راست بخش، و احتمال p2، استراتژی A2 - فاصله تا انتهای سمت چپ. .y .I .I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ به طور خاص، انتهای سمت چپ بخش (نقطه با ابسیسا = 0) مطابقت دارد. به استراتژی A1، انتهای سمت راست بخش (x = 1) - استراتژی A2 در انتهای بخش، دو عمود بر محور x بازیابی می شود: محور I - I - سود استراتژی A1 به تعویق افتاده است؛ محور II - II - سود استراتژی A2 به تعویق افتاده است اجازه دهید بازیکن B استراتژی B1 را اعمال کند. به ترتیب روی محورهای I - I و II - II نقاطی با مختصات a11 و a21 می دهد. یک خط مستقیم B1 − B1′ از میان این نقاط می کشیم. برای هر استراتژی مختلط SA = (p1، p2)، بازده بازیکن با نقطه N در خط مستقیم B1 - B1'، مربوط به نقطه SA در محور x که بخش را به نسبت p2: p1 تقسیم می‌کند، تعیین می‌شود. بدیهی است که خط مستقیم B2 - B2' که سود استراتژی B2 را تعیین می کند، می تواند دقیقاً به همین روش ساخته شود. 12 .y .I .I I .B2 .N .a21 .B2′ a . ۲۲ .I I .I به طوری که حداقل بازده بازیکن A (با توجه به بدترین رفتار بازیکن B برای او) به حداکثر تبدیل شود. برای انجام این کار، یک کران پایین برای بازده بازیکن A برای استراتژی های B1، B2، یعنی. خط شکسته B1 N B2′ ;. در این مرز حداقل بازده بازیکن A برای هر یک از استراتژی های ترکیبی او قرار دارد، نقطه N، که در آن این بازده به حداکثر می رسد و تصمیم و قیمت بازی را تعیین می کند. .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S. 1∗ P مختصات نقطه N چیزی بیش از هزینه بازی ν نیست، ابسیسا آن برابر با ∗2 است، و فاصله تا انتهای سمت راست قطعه برابر با ∗1 است، یعنی. فاصله از نقطه SA∗ تا انتهای قطعه برابر است با احتمالات ∗2 و ∗1 استراتژی های A2 و A1 استراتژی ترکیبی بهینه بازیکن A. در این حالت، راه حل بازی توسط نقطه تقاطع استراتژی های B1 و B2. در زیر موردی است که استراتژی بهینه بازیکن، استراتژی خالص A2 است. در اینجا استراتژی A2 (برای هر استراتژی دشمن) سود بیشتری نسبت به استراتژی A1، 13 .y .y .I .I I .I I. I .B2' دارد. 1′ B .B1′ B . 2 .B2′ B. 2 .B1 .ν = a21 .B1 .ν = a21 I. I I. I. I. I. .x .من . .ایکس. 2∗ پ. A∗S = A2. 2∗ پ. A∗ S = A2 در سمت راست حالتی نشان داده شده است که بازیکن B یک استراتژی آشکارا بی سود دارد.تفسیر هندسی همچنین امکان تجسم قیمت پایین تر بازی α و قیمت بالاتر β .y .I .I I .B2 را فراهم می کند. .B1′ .N .B1. B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 . A∗ S. 1∗ P در همان نمودار، می توانیم یک تفسیر هندسی از استراتژی های بهینه بازیکن B نیز ارائه دهیم. به راحتی می توان تأیید کرد که سهم q1∗ استراتژی B1 استراتژی ترکیبی بهینه SB∗ = (q1∗، q2∗) برابر است با نسبت طول قطعه KB2 به مجموع طول قطعات KB1. و KB2 در محور I − I: .y .I .I I .B2. B1′ .N .K .L .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S. 1∗ P 14 KB2 q1∗ = KB2 + KB1 یا LB2′ q1∗ = LB2′ + LB1′ استراتژی بهینه SB∗ = (q1∗ , q2∗) را می توان به روش دیگری یافت، اگر بازیکنان B و B را با هم عوض کنیم، و در عوض حداکثر حد پایین برد، حداقل حد بالایی را در نظر بگیرید. .y .I .I I .A2 .A'1 .N .A1 .A'2 .I I .I . .x .q2∗ . B∗ S .q1∗ 15 3.2. 2 × n و m × 2 بازی راه حل بازی های 2 × n و m × 2 بر اساس قضیه زیر است. قضیه 3. هر بازی متناهی m × n راه حلی دارد که در آن تعداد استراتژی های فعال هر طرف از کوچکترین اعداد m و n تجاوز نمی کند. طبق این قضیه، یک بازی 2×n همیشه راه حلی دارد که در آن هر بازیکن حداکثر دو استراتژی فعال دارد. هنگامی که این استراتژی ها را پیدا کردید، بازی 2 × n به یک بازی 2 × 2 تبدیل می شود که می توان آن را به روش ابتدایی حل کرد. یافتن استراتژی های فعال می تواند انجام شود به صورت گرافیکی: 1) در حال ساخت تفسیر گرافیکی; 2) حد پایین برد تعیین می شود. 3) دو استراتژی بازیکن دوم در حد پایین بازده مشخص می شود که مربوط به دو خط متقاطع در نقطه با حداکثر ارتین است (اگر بیش از دو خط در این نقطه قطع شود، هر جفتی گرفته می شود) - این استراتژی ها راهبردهای فعال بازیکن B را نشان می دهد. بنابراین، بازی 2×n به بازی 2×2 کاهش می یابد. بازی m×2 نیز قابل حل است، با این تفاوت که نه حد پایین، بلکه حد بالایی سود است. ساخته شده است، و نه حداکثر، بلکه حداقل در آن جستجو می شود. مثال 5 برای بازی راه حل پیدا کنید () 7 9 8 A= 10 6 9 راه حل: با استفاده از روش هندسی، استراتژی های فعال را انتخاب می کنیم. خطوط مستقیم B1 - B1'، B2 - B2' و B3 - B3' با استراتژی های B1، B2، B3 مطابقت دارند. خط شکسته B1 N B2 حد پایین برد بازیکن است. بازی دارای یک راه حل S∗A = (23, 31) است. S∗B = (0.5; 0.5; 0); v = 8. 16 .y .I .I I . 1′ B B. 2 .B3′ .N .B3 .B1 .B2′ .I I .I . .ایکس. 2∗ پ. A∗ S. 1∗ P 17 بازی شاخص، 2 حرکت، 3 2 × 2، 10 شخصی، 3 2 × 2، 9 تصادفی، 3 هندسه، 12 قیمت خالص بازی، 7 نمونه، 10 2 × n، 9، 16 متر × 2، 9 16 نامتناهی، 4 در حالت عادی، 5 متناهی، 4 چند حرکتی، 4 تک حرکتی، 4 ماتریس، 5 زوج، 2 مجموع صفر، 2 آنتاگونیست، 2 غیر متضاد، 2 راه حل، 5 در استراتژی های ترکیبی، 5 9 در استراتژی خالص، 5 با نقطه زین، 7 قیمت، 5 بالا، 6 پایین، 6 خالص، 7 ماکسیمین، 6 ماتریس بازی، 5 بازده، 5 مینی مکس، 6 نرمال سازی بازی، 5 استراتژی، 4 ماکسیمین، 6 مینی مکس، 6 بهینه، 4 ترکیبی، 5 نظریه بازی، 2 18

  • استراتژی بازیکن مختلط استراتژی ترکیبی بازیکنان را پیدا کنید.
  • مدل سازی مدار بازی در نظریه بازی ها این شرکت توانایی برنامه ریزی مستقل حجم تولید محصولات فصلی P 1 ، P 2 ، P 3 را دارد.
  • حل یک بازی ماتریسی با استفاده از روش گرافیکی

    حل یک بازی ماتریسی با استفاده از روش های برنامه ریزی خطی

    1. بازی ماتریکس. با استفاده از روش سیمپلکس ما سود تضمین شده را با قیمت پایین‌تر بازی a = max(a i) = 2 تعیین می‌کنیم که نشان‌دهنده حداکثر استراتژی خالص A 1 است.
    2. نمونه ای از حل یک بازی ماتریسی با استفاده از روش برنامه ریزی خطی. یک بازی ماتریسی را با استفاده از برنامه نویسی خطی حل کنید.

    یک نمایش گرافیکی ارائه دهید، به شکل عادی کاهش دهید و راه حل دقیق یک بازی موقعیتی را با تابع سود زیر بیابید:
    بازیکن A اولین حرکت را انجام می دهد: او عدد x را از مجموعه دو عدد انتخاب می کند.
    حرکت دوم توسط بازیکن B انجام می شود: او بدون اطلاع از انتخاب بازیکن A در حرکت اول، عدد y را از مجموعه دو عدد انتخاب می کند.
    حرکت سوم توسط بازیکن A انجام می شود: او عدد z را از مجموعه دو عدد انتخاب می کند، با دانستن مقادیر y انتخاب شده توسط بازیکن B در حرکت دوم، اما انتخاب x خود را در حرکت اول به خاطر نمی آورد.

    بازی با طبیعت

    1. بازی های آماری
      یک شرکت کشاورزی می تواند برخی از محصولات را بفروشد:
      A1) بلافاصله پس از تمیز کردن؛
      الف2) در ماه های زمستان؛
      الف3) در ماه های بهار.
      سود به قیمت فروش در یک دوره زمانی معین، هزینه های ذخیره سازی و زیان های احتمالی بستگی دارد. مقدار سود محاسبه شده برای حالت های مختلف - نسبت های درآمد و هزینه (S1، S2 و S3)، در کل دوره اجرا، در قالب یک ماتریس (میلیون روبل) ارائه می شود.
    2. این شرکت لباس و کت و شلوار تولید می کند که فروش آنها بستگی به شرایط آب و هوایی دارد. هزینه های این شرکت به ازای هر واحد تولید طی ماه های آوریل-اردیبهشت خواهد بود...
    3. حل مشکل ذخایر مواد اولیه. در یک دوره زمانی معین در شرکت، مصرف مواد اولیه بسته به کیفیت آن، 1، 2، 3 و 4 است.
    4. استراتژی های بدبینی افراطی، خوش بینی افراطی و خوش بینی-بدبینی

    بازی های Bimatrix

    درخت تصمیم در نظریه بازی ها (نمونه ای از حل مسئله).

    همچنین مجموعه ای از راه حل ها در تئوری بازی ها (حل بازی های ماتریسی)، مسائل معمولی در EMM ( برنامه ریزی خطی، نظریه بازی).

    سه شرکت تلویزیونی در این شهر فعال هستند: ABC، СВSو NBC. این شرکت ها ممکن است برنامه خبری عصر خود را از ساعت 6:30 یا 7:00 آغاز کنند. 60 درصد از بینندگان تلویزیون ترجیح می دهند اخبار عصر را ساعت 6.30 تماشا کنند و 40 درصد ترجیح می دهند اخبار عصر را ساعت 7.00 تماشا کنند. محبوب ترین برنامه خبری عصرگاهی این شرکت ABC، کمترین محبوبیت، اخبار تهیه شده توسط این شرکت است NBC. سهم بینندگان تلویزیونی عصر برنامه های خبریارائه شده در جدول (NBC، СВS، АВС)

    ABC: 6.30

    نآفتاب

    NEاس

    ABC: 7.00

    N.B.با

    NEاس

    استراتژی های بهینه شرکت را برای زمان بندی برنامه های خبری پیدا کنید

    راه حل: یک استراتژی غالب در بازی وجود دارد

    از وبلاگ معروف آمریکایی کرک شده.

    تئوری بازی در مورد مطالعه روش‌هایی است که می‌توان بهترین حرکت را انجام داد و در نتیجه، با جدا کردن برخی از آن‌ها از سایر بازیکنان، تا آنجایی که ممکن است پای برنده به دست آورد. به شما می آموزد که بسیاری از عوامل را تجزیه و تحلیل کنید و نتایج منطقی متعادلی بگیرید. به نظر من باید بعد از اعداد و قبل از حروف الفبا مطالعه شود. صرفاً به این دلیل که افراد زیادی بر اساس شهود، پیشگویی های مخفی، مکان ستارگان و مواردی از این دست تصمیمات مهمی می گیرند. من تئوری بازی ها را به طور کامل مطالعه کرده ام و اکنون می خواهم در مورد اصول اولیه آن به شما بگویم. شاید این اضافه کند حس مشترکبه زندگی شما

    1. دوراهی زندانی

    برتو و رابرت پس از ناکامی در استفاده صحیح از ماشین دزدیده شده برای فرار به دلیل سرقت از بانک دستگیر شدند. پلیس نمی تواند ثابت کند که آنها کسانی بودند که از بانک سرقت کردند، اما آنها را در یک ماشین سرقتی دستگیر کردند. آن‌ها را به اتاق‌های مختلف بردند و به هر کدام پیشنهاد دادند که یک همدست را تحویل دهند و او را به مدت 10 سال به زندان بفرستند و خودش آزاد شود. اما اگر هر دو به یکدیگر خیانت کنند، هر کدام 7 سال می گیرند. اگر کسی چیزی نگوید هر دو فقط به خاطر سرقت ماشین 2 سال زندان می روند.

    معلوم می شود که اگر برتو ساکت بماند، اما رابرت او را تحویل دهد، برتو 10 سال به زندان می رود و رابرت آزاد می شود.

    هر زندانی یک بازیکن است و منفعت هرکسی را می توان به صورت یک «فرمول» بیان کرد (آنچه هر دو به دست می آورند و دیگری چه می گیرد). به عنوان مثال، اگر من به شما ضربه بزنم، الگوی برنده من به این شکل می شود (من یک پیروزی بی ادبانه می گیرم، شما از آن رنج می برید درد شدید). از آنجایی که هر زندانی دو گزینه دارد، می توانیم نتایج را در جدولی ارائه کنیم.

    کاربرد عملی: شناسایی جامعه شناسی

    در اینجا کاربرد اصلی نظریه بازی ها را می بینیم: شناسایی افراد اجتماعی که فقط به خود فکر می کنند.تئوری واقعی بازی یک ابزار تحلیلی قدرتمند است و آماتوریسم اغلب به عنوان یک پرچم قرمز عمل می کند که کسی را که هیچ احساس شرافتی ندارد، نشان می دهد. افرادی که محاسبات شهودی انجام می دهند، معتقدند که بهتر است کار زشتی انجام دهید، زیرا بدون توجه به آنچه بازیکن دیگر انجام می دهد، مجازات زندان کوتاه تری را در پی خواهد داشت. از نظر فنی این درست است، اما فقط در صورتی که فرد کوته فکری باشید و اعداد را بالاتر قرار دهید زندگی انسان. به همین دلیل است که نظریه بازی ها در امور مالی بسیار محبوب است.

    مشکل واقعی دوراهی زندانی این است که داده ها را نادیده می گیرد.به عنوان مثال، امکان ملاقات شما با دوستان، اقوام یا حتی طلبکاران فردی که به مدت 10 سال به زندان فرستاده اید را در نظر نمی گیرد.

    بدترین قسمت این است که هرکسی که درگیر معضل زندانی است طوری رفتار می کند که گویی هرگز در مورد آن چیزی نشنیده است.

    و بهترین حرکت سکوت است و بعد از دو سال همراه با دوست خوباز پول مشترک استفاده کنید

    2. استراتژی غالب

    این موقعیتی است که اعمال شما در آن به ارمغان می آورد بزرگترین برد، بدون توجه به اقدامات حریف.مهم نیست چه اتفاقی می افتد، شما همه چیز را درست انجام دادید. به همین دلیل است که بسیاری از افراد مبتلا به دوراهی زندانی بر این باورند که خیانت بدون توجه به آنچه طرف مقابل انجام می دهد به "بهترین" نتیجه می رسد و ناآگاهی از واقعیت ذاتی این روش باعث می شود که این روش بسیار آسان به نظر برسد.

    اکثر بازی‌هایی که انجام می‌دهیم استراتژی‌های کاملاً غالبی ندارند، زیرا در غیر این صورت وحشتناک خواهند بود. تصور کنید همیشه همین کار را می کردید. هیچ استراتژی غالبی در بازی سنگ-کاغذ-قیچی وجود ندارد. اما اگر با شخصی بازی می‌کردید که دستکش‌های اجاقی به تن داشت و فقط می‌توانست سنگ یا کاغذ را نشان دهد، یک استراتژی غالب خواهید داشت: کاغذ. کاغذ شما سنگ او را می پیچد یا به تساوی می انجامد و شما نمی توانید ببازید زیرا حریف شما نمی تواند قیچی نشان دهد. اکنون که یک استراتژی مسلط دارید، احمق خواهید بود اگر چیزی متفاوت را امتحان کنید.

    3. نبرد بین دو جنس

    بازی ها زمانی جالب تر می شوند که استراتژی کاملاً غالبی نداشته باشند. مثلاً نبرد بین دو جنس. آنجلی و بوریسلاو قرار ملاقات می گذارند، اما نمی توانند بین باله و بوکس یکی را انتخاب کنند. انجلی عاشق بوکس است زیرا از دیدن جریان خون برای شادی جمعیتی از تماشاگران که فریاد می زنند و فکر می کنند متمدن هستند، لذت می برد فقط به این دلیل که برای شکستن سر کسی پول داده اند.

    بوریسلاو می‌خواهد باله تماشا کند زیرا می‌داند که بالرین‌ها آسیب‌های زیادی را پشت سر می‌گذارند و تمرینات سختی را پشت سر می‌گذارند، زیرا می‌دانند که یک آسیب می‌تواند به همه چیز پایان دهد. رقصندگان باله بزرگترین ورزشکاران روی زمین هستند. یک بالرین می تواند به سر شما لگد بزند، اما هرگز این کار را نمی کند، زیرا ارزش پای او بسیار بیشتر از صورت شماست.

    هر یک از آنها می خواهند به رویداد مورد علاقه خود بروند، اما نمی خواهند به تنهایی از آن لذت ببرند، بنابراین در اینجا نحوه برنده شدن آنها آمده است: بالاترین ارزش- کاری را که دوست دارند انجام دهند، کوچکترین ارزش- فقط با شخص دیگری بودن، و صفر - تنها بودن.

    برخی از افراد لبه پرستی سرسخت را پیشنهاد می کنند: اگر هر کاری را که می خواهید انجام دهید، طرف مقابل باید مطابق با انتخاب شما باشد یا همه چیز را از دست بدهد. همانطور که قبلاً گفتم، تئوری بازی های ساده شده در شناسایی احمق ها عالی است.

    کاربرد عملی: از گوشه های تیز خودداری کنید

    البته این استراتژی ایرادات قابل توجهی نیز دارد. اول از همه، اگر قرار ملاقات خود را به عنوان یک "نبرد جنسیت ها" در نظر بگیرید، کارساز نخواهد بود. جدا شوید تا هر کدام از شما کسی را که دوست دارد پیدا کنید. و مشکل دوم این است که در این شرایط شرکت کنندگان آنقدر نسبت به خود نامطمئن هستند که نمی توانند این کار را انجام دهند.

    استراتژی واقعاً برنده برای همه این است که آنچه را که می خواهند انجام دهند.و بعد یا روز بعد که آزاد شدند با هم به کافه بروید. یا به طور متناوب بین بوکس و باله تا زمانی که انقلابی در دنیای سرگرمی رخ دهد و باله بوکس اختراع شود.

    4. تعادل نش

    تعادل نش مجموعه‌ای از حرکات است که در آن هیچ‌کس نمی‌خواهد کاری متفاوت انجام دهد.و اگر بتوانیم آن را عملی کنیم، نظریه بازی ها جایگزین همه فلسفی، مذهبی و سیستم مالیدر این سیاره، زیرا "میل به نسوختن" به نیروی محرکه قوی تر از آتش برای بشریت تبدیل شده است.

    بیایید به سرعت 100 دلار را تقسیم کنیم. من و شما تصمیم می گیریم که چه تعداد از صدها مورد نیاز را داریم و در عین حال مبلغ را اعلام می کنیم. اگر ما مبلغ کلکمتر از صد، هر کس به آنچه می خواست می رسد. اگر مجموع آنها از صد نفر بیشتر باشد، کسی که کمترین مقدار را درخواست کرده است، مقداری را که می‌خواهد می‌گیرد، و شخص حریص‌تر، آنچه را که باقی مانده است، می‌گیرد. اگر همین مقدار را بخواهیم، ​​همه 50 دلار می گیرند. چقدر می خواهید بپرسید؟ چگونه پول را تقسیم خواهید کرد؟ تنها یک حرکت برنده وجود دارد.

    نیاز به 51 دلار بدون توجه به اینکه حریف شما انتخاب می کند، حداکثر مقدار را به شما می دهد. اگر او بیشتر بخواهد، 51 دلار دریافت خواهید کرد. اگر او 50 یا 51 دلار بخواهد، 50 دلار دریافت خواهید کرد. و اگر کمتر از 50 دلار درخواست کند، 51 دلار دریافت خواهید کرد. در هر صورت هیچ گزینه دیگری برای شما وجود ندارد پول بیشتراز این یکی تعادل نش - وضعیتی که در آن هر دو 51 دلار را انتخاب می کنیم.

    کاربرد عملی: اول فکر کن

    این تمام نکته تئوری بازی هاست. شما مجبور نیستید برنده شوید، حتی به سایر بازیکنان آسیب بزنید، اما باید بهترین حرکت را برای خود انجام دهید، صرف نظر از اینکه اطرافیان شما چه چیزی برای شما در نظر گرفته اند. و حتی بهتر است که این حرکت برای سایر بازیکنان مفید باشد. این همان ریاضیاتی است که می تواند جامعه را تغییر دهد.

    یک تنوع جالب از این ایده نوشیدن است که می توان آن را تعادل نش وابسته به زمان نامید. وقتی به اندازه کافی مشروب می خورید، هر کاری که دیگران انجام می دهند برایتان اهمیتی ندارد، اما روز بعد واقعاً پشیمان می شوید که کاری را متفاوت انجام نداده اید.

    5. بازی پرتاب

    بازی پرتاب بین بازیکن 1 و بازیکن 2 انجام می شود. هر بازیکن به طور همزمان سر یا دم را انتخاب می کند. اگر درست حدس بزنند، بازیکن 1 پنی بازیکن 2 را دریافت می کند و در غیر این صورت، بازیکن 2 سکه بازیکن 1 را دریافت می کند.

    ماتریس برنده ساده است...

    ... استراتژی بهینه: بازی کاملاً تصادفی.سخت تر از آن چیزی است که فکر می کنید زیرا انتخاب باید کاملا تصادفی باشد. اگر شما یک اولویت برای سر یا دم دارید، حریف شما می تواند از آن برای گرفتن پول شما استفاده کند.

    البته مشکل اصلی اینجاست که اگر فقط یک پنی به طرف هم پرتاب کنند خیلی بهتر است. در نتیجه، سود آنها یکسان خواهد بود و آسیب های ناشی از آن ممکن است به این افراد بدبخت کمک کند چیزی غیر از کسالت وحشتناک را احساس کنند. بالاخره این بدترین بازیهمیشه موجود است. و این مدل ایده آل برای ضربات پنالتی است.

    کاربرد عملی: پنالتی

    در فوتبال، هاکی و بسیاری از بازی های دیگر، وقت اضافه یک ضربات پنالتی است. و اگر بر اساس تعداد بازیکنان باشد، جالب تر خواهند بود فرم کاملمی توانند چرخ دستی را انجام دهند زیرا حداقل نشانه ای از توانایی بدنی آنها خواهد بود و تماشای آن لذت بخش خواهد بود. دروازه بان ها نمی توانند حرکت توپ یا پوک را در همان ابتدای حرکت آن به وضوح مشخص کنند، زیرا متاسفانه هنوز ربات ها در مسابقات ورزشی ما شرکت نمی کنند. دروازه بان باید جهت چپ یا راست را انتخاب کند و امیدوار باشد که انتخاب او با حریفی که به سمت دروازه شوت می کند مطابقت داشته باشد. این چیزی شبیه به بازی سکه دارد.

    با این حال، لطفا توجه داشته باشید که این نیست مثال کاملشباهت با بازی سر و دم، زیرا حتی با انتخاب درستجهت، دروازه بان ممکن است توپ را نگیرد و مهاجم ممکن است به دروازه ضربه نزند.

    پس نتیجه گیری ما بر اساس تئوری بازی ها چیست؟ بازی‌های توپ باید به شیوه‌ای «چند توپی» به پایان برسد، جایی که در هر دقیقه به بازیکنان یک به یک، یک توپ/پاک اضافی داده می‌شود تا زمانی که یک طرف به یک نتیجه خاص دست یابد، که نشان‌دهنده مهارت واقعی بازیکنان است. یک تصادف تصادفی دیدنی نیست.

    در پایان باید از تئوری بازی ها برای هوشمندتر کردن بازی استفاده کرد. یعنی بهتره

    داریا زولوتیخ 09.02.2015

    آیا اون پست را دوست داشتی؟
    از Faktrum حمایت کنید، کلیک کنید:





    با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

    بارگذاری...