1930'larda John von Neumann ve Oscar Morgenstern, "oyun teorisi" adı verilen yeni ve ilginç bir matematik dalının kurucuları oldular. 1950'lerde genç matematikçi John Nash bu yöne ilgi duymaya başladı. Denge teorisi, 21 yaşında yazdığı tezinin konusu oldu. Böylece, yıllar sonra - 1994'te Nobel Ödülü'nü kazanan "Nash Dengesi" adlı yeni bir oyun stratejisi doğdu.
Tez yazmakla genel tanınma arasındaki uzun boşluk, bir matematikçi için bir sınav haline geldi. Tanınmayan deha, ciddi zihinsel bozukluklara neden oldu, ancak John Nash, mükemmel mantıksal zekası sayesinde bu sorunu çözmeyi başardı. Nash Dengesi teorisi Nobel Ödülü kazandı ve hayatı Güzel Akıl'da çekildi.
Oyun teorisi hakkında kısaca bilgi
Nash dengesi teorisi insanların etkileşim koşullarındaki davranışlarını açıkladığı için oyun teorisinin temel kavramlarını göz önünde bulundurmaya değer.
Oyun teorisi, sonuçların birkaç kişinin kararına ve davranışına bağlı olduğu durumlarda, katılımcıların (aracıların) davranışlarını bir oyun gibi birbirleriyle etkileşim açısından inceler. Katılımcı, oyun stratejisi olarak adlandırılan başkalarının davranışları hakkındaki tahminlerine dayanarak kararlar verir.
Katılımcının diğer katılımcıların herhangi bir davranışı için en iyi sonucu aldığı baskın bir strateji de vardır. Bu, oyuncunun en iyi kazan-kazan stratejisidir.
Tutuklunun ikilemi ve bilimsel buluş
Tutuklunun ikilemi, alternatiflerin çatışması karşısında ortak bir hedefe ulaşarak, katılımcıların rasyonel kararlar almaya zorlandığı bir oyun örneğidir. Soru, bu seçeneklerden hangisini seçeceği, kişisel ve genel çıkarların yanı sıra her ikisini birden elde etmenin imkansızlığıdır. Oyuncular zorlu bir oyun ortamına hapsolmuş gibi görünüyor, bu da bazen çok verimli düşünmelerini sağlıyor.
Bu ikilem Amerikalı matematikçi John Nash tarafından keşfedildi. Kurduğu denge kendi yolunda devrim niteliğindeydi. Özellikle bu yeni düşünce, ekonomistlerin, piyasa oyuncularının, başkalarının çıkarlarını göz önünde bulundurarak, yakın etkileşim ve çıkarların kesişimiyle nasıl seçimler yaptığı konusundaki görüşlerini etkiledi.
Oyun teorisini somut örneklerle incelemek en iyisidir, çünkü bu matematiksel disiplinin kendisi kuru teorik değildir.
Tutuklunun ikilemi örneği
Örnek, soygun yapan iki kişi polisin eline geçti ve ayrı hücrelerde sorgulanıyor. Aynı zamanda, polis memurları, her katılımcıya, ortağı aleyhine tanıklık etmesi halinde serbest bırakılacağı uygun koşullar sunar. Her birisuçluların dikkate alacağı aşağıdaki stratejiler vardır:
- İkisi de aynı anda ifade verir ve 2,5 yıl hapis cezası alır.
- İkisi de aynı anda sessizdir ve her biri 1 yıl alır, çünkü bu durumda suçlarının kanıt temeli küçük olacaktır.
- Biri ifade verir ve serbest bırakılır, diğeri ise susar ve 5 yıl hapis cezasına çarptırılır.
Açıkçası davanın sonucu her iki katılımcının kararına bağlı, ancak farklı hücrelerde oturdukları için anlaşamıyorlar. Ortak bir çıkar mücadelesinde kişisel çıkarlarının çatışması da açıkça görülmektedir. Mahkumların her birinin eylem için iki seçeneği ve sonuçlar için 4 seçeneği vardır.
Mantıksal çıkarımlar zinciri
Yani, suçlu A şu seçenekleri değerlendiriyor:
- Ben sessizim ve eşim sessiz - ikimiz de 1 yıl hapis cezası alacağız.
- Ortağımı teslim ediyorum ve o beni teslim ediyor - ikimiz de 2,5 yıl hapis yatıyoruz.
- Sessizim ve eşim bana ihanet ediyor - 5 yıl hapis cezası alacağım ve o özgür olacak.
- Ortağımı teslim ediyorum ama o sessiz - Ben özgürlüğümü alıyorum ve o 5 yıl hapis cezasına çarptırılıyor.
Netlik için olası çözümlerin ve sonuçların bir matrisini verelim.
Tutuklunun ikileminin olası sonuçları tablosu.
Soru şu ki, her yarışmacı ne seçecek?
"Sessiz ol, konuşamazsın" veya "Sessiz olamazsın, konuşamazsın"
Katılımcının seçimini anlamak için onun düşünce zincirinden geçmeniz gerekir. Suçlu A'nın gerekçesine göre: Ben sessiz kalırsam ve eşim sessiz kalırsa, asgari bir süre (1 yıl) alırız, ancak benNasıl davranacağını bilmiyorum. Benim aleyhime tanıklık ederse, benim için tanıklık etmem daha doğru olur, yoksa 5 yıl oturabilirim. 5 yıl yerine 2,5 yıl oturmayı tercih ederim. Eğer sessiz kalırsa, daha çok tanıklık etmem gerekecek çünkü bu şekilde özgürlüğüme kavuşacağım. Katılımcı B.
Faillerin her biri için baskın stratejinin tanıklık etmek olduğunu görmek zor değil. Bu oyunun en iyi noktası, her iki suçlunun da ifade vermesi ve "ödüllerini" alması - 2,5 yıl hapis cezası. Nash oyun teorisi buna denge diyor.
Optimal olmayan optimal Nash çözümü
Nashian görüşün devrimci doğası, bireysel katılımcı ve onun kişisel çıkarı düşünüldüğünde böyle bir dengenin optimal olmadığıdır. Sonuçta, en iyi seçenek sessiz kalmak ve özgür olmaktır.
Nash dengesi, her bir katılımcının yalnızca diğer katılımcılar belirli bir strateji seçmesi durumunda kendisi için en uygun seçeneği seçtiği, çıkarların birleştiği bir noktadır.
Her iki suçlunun da sessiz kaldığı ve sadece 1 yıl süre aldığı seçeneği düşünürsek, buna Pareto-optimal seçenek diyebiliriz. Ancak, ancak suçlular önceden anlaşabilirse mümkündür. Ancak bu bile bu sonucu garanti etmez, çünkü anlaşmadan geri çekilme ve cezadan kaçınma cazibesi büyüktür. Birbirlerine tam güven eksikliği ve 5 yıl alma tehlikesi, tanıma ile seçeneği seçmek zorunda kalıyor. Katılımcıların neye bağlı kalacağını düşününSessizlik seçeneği, konserde hareket etmek, sadece mantıksızdır. Nash dengesini incelersek böyle bir sonuç çıkarılabilir. Örnekler yalnızca haklı olduğunuzu kanıtlar.
Bencil veya mantıklı
Nash Dengesi Teorisi, daha önce var olan ilkeleri çürüten şaşırtıcı sonuçlar verdi. Örneğin Adam Smith, katılımcıların her birinin davranışını tamamen bencil olarak değerlendirdi ve bu da sistemi dengeye getirdi. Bu teoriye “piyasanın görünmez eli” deniyordu.
John Nash, tüm katılımcılar kendi çıkarları doğrultusunda hareket ederse, bunun asla optimal bir grup sonucuna yol açmayacağını gördü. Rasyonel düşünmenin her katılımcının doğasında olduğu göz önüne alındığında, Nash dengesi stratejisinin sunduğu seçim daha olasıdır.
Tamamen erkek deneyi
Önemli bir örnek, görünüşte yerinde olmasa da Nash oyun teorisinin nasıl çalıştığının açık bir örneği olan sarışın paradoks oyunudur.
Bu oyunda özgür adamlardan oluşan bir şirketin bir bara geldiğini hayal etmeniz gerekiyor. Yakınlarda, biri diğerlerine göre tercih edilen bir kız şirketi var, bir sarışın diyor. Erkekler kendilerine en iyi kız arkadaşını bulmak için nasıl davranırlar?
Yani, erkeklerin mantığı: herkes sarışınla tanışmaya başlarsa, büyük olasılıkla kimse onu anlamayacak, o zaman arkadaşları tanışmak istemeyecek. Kimse ikinci yedek olmak istemez. Ama eğer çocuklar kaçınmayı seçersesarışın, o zaman erkeklerin her birinin kızlar arasında iyi bir kız arkadaş bulma olasılığı yüksektir.
Nash dengesi durumu erkekler için uygun değildir, çünkü yalnızca kendi bencil çıkarlarının peşinden koşan herkes sarışını seçer. Sadece bencil çıkarların peşinde koşmanın, grup çıkarlarının çöküşüyle eş anlamlı olacağı görülebilir. Nash dengesi, her erkeğin tüm grubun çıkarlarıyla temas halinde olan kendi çıkarları doğrultusunda hareket etmesi anlamına gelecektir. Bu, kişisel olarak herkes için en iyi seçenek değil, genel başarı stratejisine dayalı olarak herkes için en iyisidir.
Tüm hayatımız bir oyundur
Gerçek dünyada karar verme, diğer katılımcılardan da belirli rasyonel davranışlar beklediğiniz bir oyuna çok benzer. İş yerinde, işte, takımda, şirkette ve hatta karşı cinsle ilişkilerde. Büyük anlaşmalardan sıradan yaşam durumlarına kadar her şey şu ya da bu yasaya uyar.
Elbette, suçlular ve bir bar ile yukarıdaki oyun durumları, Nash dengesini gösteren mükemmel örneklerdir. Bu tür ikilemlerin örnekleri sıklıkla gerçek piyasada ortaya çıkar ve bu, özellikle iki tekelcinin piyasayı kontrol ettiği durumlarda işe yarar.
Karma Stratejiler
Çoğu zaman aynı anda bir değil birkaç oyuna dahil oluyoruz. Rasyonel bir strateji tarafından yönlendirilen bir oyunda seçeneklerden birini seçmek, ancak sonunda başka bir oyundasınız. Birkaç mantıklı karardan sonra sonucunuzun hoşunuza gitmediğini görebilirsiniz. Neal?
İki tür stratejiyi ele alalım:
- Saf strateji, katılımcının diğer katılımcıların olası davranışları hakkında düşünmekten kaynaklanan davranışıdır.
- Karma strateji veya rastgele strateji, saf stratejilerin rastgele sıralanması veya belirli bir olasılıkla saf bir stratejinin seçilmesidir. Bu stratejiye ayrıca randomize denir.
Bu davranışı göz önünde bulundurarak, Nash dengesine yeni bir bakış atıyoruz. Daha önce oyuncunun bir kez strateji seçtiği söylenmişse, o zaman başka bir davranış hayal edilebilir. Oyuncuların belirli bir olasılıkla rastgele bir strateji seçtikleri varsayılabilir. Nash dengesini saf stratejilerde bulamayan oyunlarda her zaman karma stratejiler bulunur.
Karma stratejilerdeki Nash dengesine karma denge denir. Bu, diğer katılımcıların belirli bir sıklıkta stratejilerini seçmeleri koşuluyla, her katılımcının kendi stratejilerini seçmek için en uygun sıklığı seçtiği bir dengedir.
Pen altılar ve karma strateji
Karma stratejinin bir örneği futbol oyununda bulunabilir. Karışık bir stratejinin en iyi örneği belki de bir pen altı atışlarıdır. Yani sadece bir köşeye atlayabilen bir kalecimiz ve pen altıyı kullanacak bir oyuncumuz var.
Öyleyse, oyuncu ilk defa sol köşeye şut çekme stratejisini seçerse ve kaleci de bu köşeye düşer ve topu yakalarsa, ikinci seferde işler nasıl gelişebilir? eğer oyuncukarşı köşeden vuracak, bu büyük olasılıkla çok açık, ancak aynı köşeye vurmak daha az belirgin değil. Bu nedenle, hem kalecinin hem de vurucunun rastgele seçime güvenmekten başka seçeneği yoktur.
Böylece, rastgele seçimi belirli bir saf stratejiyle değiştirerek, oyuncu ve kaleci maksimum sonucu almaya çalışır.