OYUN TEORİSİ VE UYGULAMALARI Dr. Sanlı ATEŞ 2 Bu dersin amacı, oyun teorisini teknik olarak tanıtıp, başta ekonomi alanı uygulanabileceğini olmak üzere tartışmaktır. değişik alanlara Günümüzde nasıl bireylerden firmalara, yerel kurumlardan evrensel kurumlara kadar her noktada karar verme süreçleri stratejik düşünme biçimine giderek oturmuştur. Karar birimleri daha sağlıklı kararlara ulaşabilmek için rakiplerinin davranışlarını daha yakından izlemekte, daha çok bilgi toplamaktadırlar. Bu sürecin bilimsel düzeyde anlaşılması, oyun teorisinin ilgi alanı içindedir. 3 Haftalar Konular 1 Tümel Bilgiye Dayalı Statik Oyunlar: Normal Biçimli 2 Tümel Bilgiye Dayalı Statik Oyunlar: Başat-altı Stratejiler 3 Tümel Bilgiye Dayalı Statik Oyunlar: Nash Dengesi 4 Tümel Bilgiye Dayalı Statik Oyunlar: Karma Stratejiler 5 Tümel Bilgiye Dayalı Statik Oyunlar: Uygulamalar 6 Tümel Bilgiye Dayalı Statik Oyunlar: Uygulamalar 7 Tümel Bilgiye Dayalı Dinamik Oyunlar: Oyun Ağacı Kavramı 8 Tümel Bilgiye Dayalı Dinamik Oyunlar: Yayvan Biçimli Oyunlar 9 Tümel Bilgiye Dayalı Dinamik Oyunlar: Alt Oyunlarda Nash Dengesi 10 Tümel Bilgiye Dayalı Dinamik Oyunlar: İki Aşamalı ve Yinelenen Oyunlar 11 Tümel Bilgiye Dayalı Dinamik Oyunlar: Pazarlık Modelleri 12 İşbirlikçi Oyunlar 13 Tümel Bilgiye Dayalı Dinamik ve İşbirlikçi Oyunlar: Uygulamalar 14 Tümel Bilgiye Dayalı Dinamik ve İşbirlikçi Oyunlar: Uygulamalar 4 Ders Materyali Bu ders için şu yayınlardan yararlanılmıştır. 1. M.J. Osborne, A. Rubinstein, A Course in Game Theory, The MIT Press, Mass., 1994. 2. Edward T. Dowling, Introduction to Mathematical Economics, Mc Graw Hill, 1992. 3. A.K. Dixit, B.J. Nalebuff, Stratejik Düşünme, Sabancı Ünv. Yay., İst., 2003. 4. A.M. Brandenburger, B.J. Nalebuff, Ortaklaşa Rekabet, Scala Yay., İst., 1998. 5 Sınavlara İlişkin Yapılması planlanan sınavlar, dekanlıkça belirlenen tarihlerdeki vize ve final sınavları olmak üzere iki tanedir. Ara sınavın (vize) %40’ı, yarıyıl sonu (final) sınavının da %60’ı toplanarak başarı notu belirlenecektir. İletişim Görüşme Günleri: Cuma, 10.00 -12.00 I. Blok, Ofis No.221 e-mail: [email protected] WEB: http://idari.cu.edu.tr/sanli TÜMEL BİLGİYE DAYALI STATİK OYUNLAR 7 Mikro iktisadi analizin bazı konularında ekonomik karar birimleri, diğer birimlerin davranışlarını dikkate almaksızın karar verirler. Örneğin fayda teorisinde bireyler faydalarını maksimize ederlerken, yalnızca veri fiyatlar ve gelir çerçevesinde, diğer bireylerin kararlarından soyutlanmış olarak optimal mal seçimini yaparlar. Benzer şekilde tam rekabetçi ya da monopol piyasalardaki firma davranışını da söyleyebiliriz. 8 Ancak iktisat biliminde, karar süreçlerinin karşılıklı bağımlılık içerdiğini gösteren çok sayıda örnek vardır: 1. Duopol piyasada farklılaştırılmış ürün satan iki firma karar verirken, ürün kalitesini, fiyatı ve reklamı dikkate almalıdır. 2. İki ülke ithalat gümrük oranları, ihracat desteklemeleri gibi dış ticaret politikalarını belirlemelidirler. 9 3. Bir firma, yöneticilerinin performansını artıracak prim politikasını belirlemelidir. Bu örneklerdeki ortak nokta, karşılıklı bağımlılığın varlığıdır. Bir karar biriminin en iyi seçimi, diğerinin (diğerlerinin) seçimine bağlıdır. 10 Oyun teorisi, bir karar biriminin kazançlarının, diğerlerinin kararlarına bağlı olduğu karşılıklı stratejik karar almanın yer aldığı durumları inceleyen uygulamalı matematiğin bir dalıdır. Oyunları değişik biçimlerde sınıflandırabiliriz. Bir yaklaşıma göre statik oyunlar ve dinamik oyunlar biçiminde bir sınıflama yapılabilir. 11 Statik oyunlar, oyunlar veri bir zaman dilimi içerisinde tüm kararların eşanlı verildiği türden oyunlardır. Yani oyuncular bir kerelik karar verirler ve oyun sona erer. Dinamik oyunlar, oyunlar karar almanın bir dizimselliğe sahip olduğu türden oyunlardır. Bu anlamda, çok sayıda zaman diliminde kararlar alınmaktadır. 12 Statik ve dinamik oyunlar arasındaki farkı daha iyi anlayabilmek için, Cournot duopol piyasa modelini dikkate alalım. Temel mikro ders kitaplarında büyük ölçüde statik oyun çerçevesinde model anlatılmaktadır. Yani her iki firma kendi kârını maksimize edecek şekilde, aynı anda ve tek üretim kararı vermektedir. 13 Ancak bu modeli, firmaların birkaç aşamada karar alarak kârı maksimize eden üretim düzeylerine ulaştıklarını da düşünerek inceleyebiliriz. oturacaktır. Bu durumda oyun dinamik bir çerçeveye 14 Oyunları, oyuncuların sahip oldukları bilgi açısından da sınıflayabiliriz. Eğer tüm oyuncular oyunun yapısını tamamıyla biliyorlarsa, tümel bilgi altında oyun (complete information) dan söz ederiz. Tikel bilgi altında oyunda oyun (incomplete information) ise, oyunculardan bir kısmı, diğerlerinin sahip olmadığı özel bir bilgiye sahiptir. 15 Buna benzeyen, ancak biraz farklı bir başka yaklaşıma göre, tüm oyuncular karar aşamasından önceki tüm davranışları biliyorsa, oyun tam bilgiye (perfect information) dayalıdır. Oyunculardan bazıları bunu bilmiyorsa, oyun eksik bilgiye bilgi (imperfect information) dayalıdır. 16 Oyunları, sınıflamanın yanında, betimleme ve çözüm yollarını da sınıflayabiliriz. Bir betimleme yöntemi olan normal biçim, im stratejiler ve kazançlar üzerine odaklanır. Diğer betimleme yöntemi olan yayvan (extensive game) biçim, im davranışların ve kararların dizilimiyle ilgilenir. Her iki biçimde birbirini dışlayan bir yapıda değildir. 17 Hangi yöntemin seçileceği, yöntemin kolaylığına ve sezgi gücüne bağlıdır. Statik oyunlarda daha çok normal biçim, dinamik oyunlarda da yayvan biçim kullanılmaktadır. Çözüm yöntemlerine baktığımızda, statik oyunların Nash dengesi bulunarak çözüldüğünü, dinamik oyunların da ikincil oyun-mükemmel Nash dengesi üzerine kurulduğunu görebiliriz. 18 Normal Biçimde Oyunlar Her oyunun kendine özgü elemanları ve özelliği vardır. Statik oyunlarda bu elemanlar, küme ve fonksiyon kavramıyla temsil edilmektedir. Normal biçimde ifade edilen bir oyunda, bir oyuncu kümesi, mesi her bir oyuncu için strateji kümesi ve her bir oyuncu için bir kazanç fonksiyonu yer alır. Her bir oyuncuyu bir rakamla gösterebileceğimiz yazabiliriz: N = {1, 2, 3, ....., n} bir oyuncu kümesini şöyle 19 Her oyuncu, bir strateji kümesine dayanarak karar verir. Strateji, bir oyunda gerçekleşmesi mümkün olan oyuncu davranışını tanımlar. Bazı durumlarda strateji kümesi çok küçük olabilir. Örneğin ya yüksek ya da düşük fiyat uygulama kararı gibi. Ya da satranç oyunundaki gibi çok sayıda strateji var olabilir. sij, i. oyuncu için olanaklı j. stratejiyi göstersin. i bireyi için tüm olası stratejilerin kümesi: { Si = si 1 , si 2 , si 3 , ....., siti } 20 Tüm oyuncuların stratejilerinin oluşturduğu küme: S = { S1 , S2 , S 3 , ....., S n } Son olarak, oyunun sonuç göstergesi olan kazanç fonksiyonlarını tanımlayalım. Genel olarak bir oyuncunun bir oyundan elde edeceği seçimlerine bağlıdır. kazanç, tüm oyuncuların strateji i. birey için kazanç fonksiyonunu yazalım. Π i = Π i { s1 , s2 , s3 , ....., sn } 21 Normal Biçimde Oyunlar için Örnekler Firmaların reklam stratejisini seçtikleri bir duopol piyasa düşünelim. Modelin varsayımları şöyledir: 1. Firmalar ürünlerini sabit (dışsal) bir fiyattan satıyorlar. 2. Reklam, piyasa toplam talep düzeyini etkilememektedir. 3. Firmalar iki reklam düzeyi seçip uygulayabilirler. Yüksek (Y) ve düşük (D) 4. Firmaların bağlıdır. piyasa payları, seçecekleri reklam düzeyine 22 Şimdi bu varsayımları, oyun teorisinin simgeleriyle yazalım. Her iki oyuncu, ikişer stratejiye sahiptir: Si = { RY , RD } , i = 1, 2 Kazanç matrislerini yazabilmek için bazı ek değişkenlere gerek var. Π0 endüstrinin kâr düzeyini; mjk , rakip firma k stratejisini (k=Y , k=D) seçtiğinde, firmanın j stratejisini (j=Y , j=D) seçmesi durumunda oluşacak piyasa payını göstersin. Değişik reklam düzeyi seçimlerinde piyasa payı toplamı bire eşittir: m jk + mkj = 1 23 Dört olası reklam bileşimi vardır. Kazanç fonksiyonu, dört olası reklam bileşiminin sonuçlarını gösterir. Birinci ve ikinci firma için kazanç fonksiyonlarını yazalım: Π 1 ( RY , RY ) = mYY Π 0 − RY Π 2 ( RY , RY ) = mYY Π 0 − RY Π 1 ( RY , RD ) = mYD Π 0 − RY Π 2 ( RY , RD ) = mYD Π 0 − RY Π 1 ( RD , RY ) = m DY Π 0 − RD Π 2 ( RD , RY ) = m DY Π 0 − RD Π 1 ( RD , RD ) = m DD Π 0 − RD Π 2 ( RD , RD ) = m DD Π 0 − RD 24 Şimdi sayısal bir örnek de kullanarak, kazançları matris biçimde yazalım. Matrisin satır ve sütunları, strateji seçimlerini gösterecektir. Aşağıdaki değerlere sahip bir piyasa düşünelim. Π 0 = 1000 , mYY 1 = 2 , RY = 400 m DD 1 = 2 , , RD = 200 mYD 4 = 5 , m DY 1 = 5 Örneğin her iki firma yüksek reklam harcaması yaparsa, piyasayı yarı yarıya paylaşırlar. Her bir firma 1000 birimlik endüstri kârının 500’ünü elde eder, reklam harcaması (400) çıkarıldıktan sonraki net kâr 100’dür. 25 Yukarıda hesapladığımız gibi, diğer kazançları da her bir firma için hesaplayalım ve kazanç matrisini oluşturalım. 1 Π 1 ( RY , RY ) = mYY Π 0 − RY = 1000 − 400 = 100 2 4 Π 1 ( RY , RD ) = mYD Π 0 − RY = 1000 − 400 = 400 5 1 Π 1 ( RD , RY ) = m DY Π 0 − RD = 1000 − 200 = 0 5 1 Π 1 ( RD , RD ) = m DD Π 0 − RD = 1000 − 200 = 300 2 26 1 Π 2 ( RY , RY ) = mYY Π 0 − RY = 1000 − 400 = 100 2 4 Π 2 ( RY , RD ) = mYD Π 0 − RY = 1000 − 400 = 400 5 1 Π 2 ( RD , RY ) = m DY Π 0 − RD = 1000 − 200 = 0 5 1 Π 2 ( RD , RD ) = m DD Π 0 − RD = 1000 − 200 = 300 2 27 Firma 2 D Firma 1 Y D ⎡ Π 1 ( RDD ) , Π 2 ( RDD ) ⎢ Y ⎢⎣ Π 1 ( RYD ) , Π 2 ( RDY ) Π 1 ( RDY ) , Π 2 ( RYD ) ⎤ ⎥ Π 1 ( RYY ) , Π 2 ( RYY ) ⎥⎦ Firma 2 D Firma 1 D ⎡ 300 , 300 ⎢ Y ⎢⎣ 400 , 0 Y 0 , 400 ⎤ ⎥ 100 ,100 ⎥⎦ 28 Şimdi Firma 1’in kararını dikkate alalım. Firma 2 düşük reklam harcamasını seçtiğinde, Firma 1 düşük reklam harcaması kararında 300, yüksek harcamada 400 net kâr elde edecektir. Buna göre, Firma 2’nin düşük reklam harcaması stratejisi karşısında Firma 1’in en iyi seçimi yüksek harcamadır. 29 Firma 2 yüksek reklam harcamasını seçtiğinde, Firma 1 düşük reklam harcaması kararında 0, yüksek harcamada 100 net kâr elde edecektir. Bu durumda da Firma 1 için en iyi strateji yüksek reklam harcamasıdır. Benzer durum Firma 2 için de geçerlidir. Aynı anda her ki firma için de en iyi strateji yüksek reklam harcamasıdır. 30 Yukarıdaki örnek oyunun genel biçimi, “tutsaklar açmazı” dır (prisoner’s dilemma). dilemma Bu oyunda suç işlemiş olan iki bireyin suçun itiraf etmesi ile sessiz kalması arasındaki durumlar incelenmektedir. karşısındaki yaygın Mahkumiyet kazançları olan tutsaklar kararları, oluşturmaktadır. açmazı değişik stratejiler İktisatta biçimindeki oldukça oyunlar şu durumlarda oluşur: 1. Ekonomik karar birimleri işbirliği ve işbirliğinden kaçınma arasında seçim yaparlarsa. 2. İşbirliği ortak optimalken, işbirliğinden kaçınma bireysel rasyoneldir. 31 Duopolda reklam modeli, firmalararası rekabete iyi bir tutsaklar açmazı örneğidir. Benzer biçimde kamu maliyesi teorisinden kamusal mallara katkı yapmak (işbirliği) ve yararlanmak (işbirliğinden kaçınma) örneği verilebilir. bedava 32 Reklam örneğinde dengeyi şöyle tanımlayabiliriz. (Y,Y) durumu, diğer firmanın seçimi belirliyken, hiçbir firmanın kendini seçimini değiştirmek için hiçbir neden olmaması anlamında bir dengedir. Her bir firma, rakibinin stratejisine en iyi tepkiyi vermektedir. Bu denge kavramı, Nash Dengesi olarak ifade edilmektedir. 33 Kesin Başat Altı Stratejilerin Yinelemeli Eleme Yoluyla Çözümü Tutsaklar açmazında olduğu gibi, bazı oyunlarda tüm başat altı stratejileri eleyerek bir dengeye ulaşılabilir. Eleme işlemi sürecinin sonunda bir çift strateji kalırsa, bu denge değeridir. 34 n oyunculu bir oyunda, si′′ koşul sağlanıyorsa, gibi bir strateji mevcutken aşağıdaki i. oyuncu için si′ stratejisinin kesin başat altı olduğunu söyleyebiliriz. Π i ( s1 , s2 , ....., si′′, ....., sn ) > Π i ( s1 , s2 , ....., si′ , ....., sn ) 35 Yukarıdaki koşul şunu söylemektedir: Daima daha yüksek kazanç sağlayan başka bir strateji varken, bir strateji başat altıdır. Buna göre bir strateji karşısında daha egemen bir stratejinin varlığı yeterlidir. 36 Rasyonel birey başat-altı stratejiyi seçmeyeceğinden, bunu karar sürecinde eleyebiliriz. Aslında daha kesin olarak söylersek, ortak bir rasyonalite varsayımı gereklidir. Bu, tüm oyuncuların rasyonel olması anlamına gelmemektedir. Oyuncular, kendileri dışında kalanların dominant-altı stratejiyi seçmeyeceklerinin farkındadırlar. 37 Şimdi bu koşulu ve başat-altı stratejilerin elenerek denge değerlerine ulaşılmasına bir örnek verelim. İki oyuncu ve her birinin seçebileceği üç strateji olsun. Başlangıçtaki bu duruma G oyunu diyelim. 2. Oyuncu L T ⎡ 3, 3 ⎢ 1. Oyuncu M ⎢ 2, 4 ⎢ B ⎢⎣ 1, 5 C 2, 6 1, 4 0, 2 R 3,1 ⎤ ⎥ 0, 4 ⎥ ⎥ 6, 0 ⎥⎦ 38 1. oyuncu için M stratejisi, T stratejisine göre başat altıdır. Diğer bir ifadeyle, T stratejisi M ’ye başattır. B stratejisinin M ’ye başat olduğunu söyleyemeyiz. 2. oyuncunun stratejisini seçtiği durumlarda, stratejilerini kıyaslayalım: 1. oyuncu için L , C, R T ve M 39 3>2 , 2>1 , 3>0 : T, M ’ye kesin başattır. Şimdi de T ve B stratejilerini kıyaslayalım: 3>1 , 2>0 , 3<6 : T, B ’ye kesin başat değildir. 40 Kesin başat-altı strateji olan sürdürelim. Bu yeni oyuna M stratejisini eleyerek oyunu G′ diyelim. 2. Oyuncu L T ⎡ 3, 3 ⎢ 1. Oyuncu B ⎢⎣ 1, 5 C 2, 6 0, 2 R 3,1 ⎤ ⎥ 6, 0 ⎥⎦ Bu durumda 1. oyuncunun hiçbir stratejisi kesin başat değildir. Ancak 2. oyuncunun stratejilerine bakarsak, hem ’nin L hem de C R ’ye başat olduğunu görürüz. Bu nedenle R stratejisini eleyebiliriz. 41 R ’nin elenmesi sonucu oluşan oyuna G″ diyelim. 2. Oyuncu L T ⎡ 3, 3 ⎢ 1. Oyuncu B ⎢⎣ 1, 5 C 2, 6 ⎤ ⎥ 0, 2 ⎥⎦ 42 Bu durumda 1. oyuncunun T stratejisi, B ’ye kesin başattır. B ’yi eledikten sonra, 2. oyuncu için C başat olduğundan L ’yi eleriz. En sonunda denge değerine (G*) ulaşmış oluruz. 2. Oyuncu 1. Oyuncu C T [ 2, 6] 43 Nash Dengesi İktisat bilimindeki çoğu oyunlarda peşi sıra eleme yöntemiyle denge değerine ulaşmak mümkün değildir. Bu tür durumlarda daha güçlü bir çözüm yöntemine gerek duyarız. Nash dengesi, bu aracı sağlar. Diğer oyuncuların strateji seçimleri belirliyken, hiçbir oyuncu seçimini değiştirmek için bir neden görmüyorsa, strateji bileşimi bir Nash dengesidir. dengesidir Bu tanımı biçimsel olarak verelim. 44 n oyuncu için biçiminde bir vektörel strateji seçim kümesi olsun. Aşağıdaki koşulu sağlayan strateji bileşimi, dengesidir. Π i ( s1* , s1* , ....., si* , ....., sn* ) ≥ Π i ( s1* , s1* , ....., si′ , ....., sn* ) Nash 45 Nash dengesinde istemeyecektir. si* hiçbir stratejisi, oyuncu stratejisini değiştirmek i. oyuncu için var olan stratejilerin içinde daha iyisidir. Zayıf eşitsizlik, en az si* stratejisi kadar iyi oyunların da olabileceğini ifade etmektedir. Ayrıca bir oyuncu için aynı anda birden çok strateji vektörü Nash dengesini sağlayabilir. 46 Yinelemeli eleme yöntemi ile Nash dengesi arasındaki bağı şu iki teoremle kurabiliriz: Teorem 1: Başat-altı stratejiler eleme yöntemiyle bir denge değerine ulaşabiliniyorsa, bu değer aynı zamanda oyunun tek Nash dengesidir. 47 Teorem 2: Herhangi bir Nash dengesi, kesin başat-altı strateji eleme yöntemine de olanak sağlar. Burada dikkat edilmesi gereken nokta şudur: Ne eleme yöntemi Nash dengesinin bir parçası olabilir ne de Nash dengesi bir eleme yöntemi çözümü değildir. 48 Nash dengesini anlatmanın bir başka yolu, en iyi tepki fonksiyonudur. fonksiyonudur Bu yöntem özellikle strateji kümesi sürekli biçimdeyse yararlı olur. Örneğin iki oyunculu bir oyunda, 2. oyuncunun her seçimi karşısında 1. oyuncu için en iyi olan stratejiyi seçeriz. 2. oyuncunun stratejisi biliniyorken, aşağıdaki problemi çözerek en iyi tepkiyi belirleriz. max Π 1 ( s1 , s2 ) 49 Bu problemi maksimizasyon için gereken birinci ve ikinci sıra koşulları elde ederek ve sınayarak çözebiliriz. Kazanç fonksiyonları, türev alma yoluyla belirlenmiş olacaktır. Birinci sıra koşuldan elde edilen en iyi tepki fonksiyonlarının eşanlı çözümünden, denge değerlerine ulaşılır. 50 Nash Dengesine Örnekler Aşağıdaki iki oyunculu örneği dikkate alalım. 2. Oyuncu L T ⎡ 3, 3 ⎢ 1. Oyuncu M ⎢ 2, 4 ⎢ B ⎢⎣ 1, 5 C 2,1 2, 4 0, 2 R 3,1 ⎤ ⎥ 0, 4 ⎥ ⎥ 6, 5 ⎥⎦ 51 Bu matriste hiçbir oyuncunun kesin başat-altı stratejisinin bulunmadığına dikkat edin. Dolayısıyla çözüm yöntemi olarak en iyi tepki yoluyla Nash dengesinin belirlenmesi olacaktır. 1. oyuncunun en iyi tepkilerini 2. oyuncunun seçimi belirliyken bulacağız. Aşağıdaki matriste altı çizgili mavi değerler, 1. oyuncunun en iyi strateji seçimlerini göstermektedir. Örneğin 2. oyuncunun seçimi ği en iyi strateji L stratejisiyken, 1. oyuncunun seçebilece- T ’dir. 52 2. Oyuncu L T ⎡ 3, 3 ⎢ 1. Oyuncu M ⎢ 2, 4 ⎢ B ⎢⎣ 1, 5 C 2 ,1 2, 4 0, 2 R 3,1 ⎤ ⎥ 0, 4 ⎥ ⎥ 6 , 5 ⎥⎦ Yukarıdakine benzer biçimde, 2. oyuncu için de en iyi tepkileri belirleriz (altı çizgili kırmızı seçenekler). Aynı anda her iki oyuncunun birden en iyi seçiminin oluştuğu strateji, Nash dengesini verecektir. 53 Aşağıdaki kazanç matrisi, 2. oyuncunun da seçimlerini içermektedir. Her iki oyuncuya en iyiyi sağlayan (T,L), (M,C) ve (B,R) stratejileri Nash dengesini göstermektedir. 2. Oyuncu L T ⎡ 3, 3 ⎢ 1. Oyuncu M ⎢ 2, 4 ⎢ B ⎢⎣ 1, 5 C 2 ,1 2, 4 0, 2 R 3,1 ⎤ ⎥ 0, 4 ⎥ ⎥ 6 , 5 ⎥⎦ 54 Şimdi iki oyunculu sürekli biçimdeki bir oyunu inceleyelim. Her bir oyuncu için strateji kümesinin şöyle olduğunu varsayalım: Si = { si : si ≥ 0} Bunun anlamı şudur: Her bir oyuncu strateji değişkeninin negatif olmayan düzeyini seçmelidir. Örneğin iktisatta miktar, fiyat, tüketim gibi değişkenlerin seçimi negatif değerler alamaz. 55 1. ve 2. oyuncunun kazanç fonksiyonlarının şu şekilde bildiğini varsayalım. Π 1 = 10 s1 − s12 − s1 s2 − 3 s1 Π 2 = 10 s2 − s − s1 s2 − 2 s2 2 2 Oyun sürekli biçimde olduğundan, kazanç matrisini önceki örnekteki gibi oluşturamayız. Bunun yerine, her ki kazancı da aynı anda maksimize edecek olan s1 ve s2 değerlerini ararız. 56 ∂Π 1 = 10 − 2 s1 − s2 − 3 ∂s1 ∂Π 2 = 10 − 2 s2 − s1 − 2 ∂s2 , 1 s1 = R1 ( s2 ) = ( 7 − s2 ) 2 , 1 s2 = R2 ( s1 ) = ( 8 − s1 ) 2 En iyi tepki fonksiyonları s1* = 2 , s2* = 3 57 Şekil 1. Nash Dengesi s2 7 En iyi tepki R1 fonksiyonları 4 s * 2 E R2 s1* 3.5 8 s1 58 Karma Stratejilere Giriş Tüm oyunlar, her bir oyuncunun %100 olasılıkla yalnızca tek strateji seçtiği bir saf-strateji Nash dengesi biçiminde değildir. Bazı iktisadi uygulamalarda oyuncular, olanaklı saf stratejileri tesadüfi (olasılıklara dayalı) seçerler. Bu tür oyunlar karma stratejiye sahiptir. 59 Şimdi her bir oyuncunun m kadar saf stratejiye sahip olduğu, iki oyunculu, sürekli olmayan bir durum düşünelim. sij, için i. oyuncu j. stratejiyi göstersin. Bir karma strateji, strateji i. oyuncunun her bir olanaklı saf stratejiyi oynayacağı olasılığı tanımlamaktadır. 60 pj, 1. oyuncunun saf j stratejisini seçme olasılığını; qk, 2. oyuncunun saf k stratejisini seçme olasılığını; p ve q da olasılık vektörlerini göstersin. 1. ve 2. oyuncular için karma strateji kümesini şöyle yazabiliriz: ⎧ S1 = ⎨p : 0 ≤ p j ≤ 1 , ⎩ ⎫ p j = 1⎬ ∑ j =1 ⎭ ⎧ S 2 = ⎨ q : 0 ≤ qk ≤ 1 , ⎩ ⎫ qk = 1 ⎬ ∑ k =1 ⎭ m m 61 Bir saf strateji, karma stratejinin alt kümesidir. sij saf stratejisi, p j = 1 ve pi = 0 ( i ≠ j ) olduğunda karma stratejiye özdeştir. Karma stratejili oyuncuların Nash kazanç dengesini matrisinin nitelendirebilmek beklenen için, değerlerini hesaplamamız gerekir. 1. oyuncu j , 2. oyuncu da k saf stratejilerini seçtiklerinde edelim. i. oyuncunun kazancının Πijk olduğunu kabul 62 i. oyuncunun beklenen kazancı, ortaya çıkacak her bir sonucun kazancı ile bu sonucun çıkma olasılığının çarpımının toplamına eşittir: E ( Π 1 ) = p1q1Π 111 + p1q2 Π 112 + ..... + p1qm Π 11m + p2 q1Π 121 + p2 q2 Π 122 + ..... + p1qm Π 12 m + pm q1Π 1m 1 + pm q2 Π 1m 2 + ..... + pm qm Π 1mm 63 Bunu kısaltılmış (toplama) simgeleri kullanarak yeniden yazalım: m m E ( Π 1 ) = ∑∑ p j qk Π 1 jk j =1 k =1 Şimdi tanım olarak Karma Strateji Nash Dengesini yazalım. 64 Aşağıdaki koşullar sağlanırsa, p* ve q* olasılık vektörleri Nash dengesidir. m m m m * * * ′ p q p q Π ≥ ∑ ∑ j k 1 jk ∑ ∑ j k Π 1 jk j =1 k =1 m m j =1 k =1 m m * * * p q p Π ≥ ∑∑ j k 2 jk ∑∑ j qk′ Π 2 jk j =1 k =1 j =1 k =1 Diğer bir ifadeyle bu iki koşul, daha yüksek kazanç sağlayan karma strateji mevcut değilse, dengesi olduğunu söylemektedir. p* ve q* vektörlerinin Nash 65 Teorem 3: Sonlu sayıda saf strateji kümesine sahip her n oyunculu oyun, en azından bir saf ya da karma strateji Nash dengesine sahiptir. Bu teorem, her oyunun bir çözümü olacağını garanti etmektedir. Şimdi iki oyunculu ve iki stratejili bir oyunu dikkate alalım. Bunun kazanç matrisi aşağıda verilmiştir. 66 2. Oyuncu 1. Oyuncu L T ⎡ A, a ⎢ B ⎢⎣ C , c R B, b ⎤ ⎥ D , d ⎥⎦ Bu oyunda her bir oyuncu bir olasılığı seçmektedir. Strateji 1 olasılığı ile oynanırsa, strateji 2 p (1-p) stratejisiyle oynanacaktır. Buna göre 1. oyuncunun beklenen (olasılıklı) kazanç matrisini yazalım: E ( Π 1 ) = pqA + p(1 − q ) B + (1 − p )qC + (1 − p )(1 − q ) D 67 Şimdi kazanç matrisinin p ’ye göre türevini alalım. ∂E ( Π 1 ) ∂p = qA + (1 − q ) B + − qC − (1 − q ) D Bu sonuca göre, türevde p yer almadığından, 1. oyuncu türevin işaretini belirleyemez. Türev pozitif ise, p ’deki artış, 1. oyuncunun kazancının beklenen değerini artırır. Bu nedenle 1. oyuncu en yüksek p değeri olan 1’i seçmelidir. Bu saf strateji anlamına gelir. Türevin işareti negatifse, 1. oyuncunun en uygun seçimi p=0 ‘dır. Böyle bir durum, 2. oyuncu için saf strateji seçimi anlamına gelir. 68 Türev sıfıra eşitse, tüm p düzeylerinde 1. oyuncunun kazancı aynıdır. Bu nedenle 1. oyuncu tüm karma strateji seçimleri karşısında kayıtsızdır ve dengeyi göstermektedir. Karma stratejinin çözümünü bulmak için, yukarıdaki süreci 2. oyuncu içinde yaparız. E ( Π 2 ) = pqa + p(1 − q )b + (1 − p )qc + (1 − p )(1 − q )d ∂E ( Π 2 ) ∂q = pa + pb + (1 − p )c − (1 − p )d 69 Her ikisi için eşitlenmesi ve anda ∂p ∂E ( Π 2 ) birinci türevlerin = qA + (1 − q ) B + − qC − (1 − q ) D = 0 = pa + pb + (1 − p )c − (1 − p )d = 0 d −c p = a−b−c+d * denge, p ile q değerlerinin çözülmesiyle belirlenir. ∂E ( Π 1 ) ∂q aynı , D−B q = A− B −C + D * sıfıra 70 Yukarıdaki oyuna sayısal bir örnek verelim. Aşağıdaki oyunu inceleyelim. 2. Oyuncu 1. Oyuncu L T ⎡ 3,1 ⎢ B ⎢⎣ 2, 2 R 2, 4 ⎤ ⎥ 3,1 ⎥⎦ Dikkat edilirse bu oyunun saf strateji Nash dengesi yoktur. Ancak teorem 3, karma stratejili bir Nash dengesinin elde edilebileceğini söylemektedir. Çözüme ulaşabilmek için ilk olarak her iki oyuncuya ait beklenen kazanç fonksiyonlarını yazalım. 71 E ( Π 1 ) = 3 pq + 2 p(1 − q ) + 2(1 − p)q + 3(1 − p )(1 − q ) E ( Π 2 ) = pq + 4 p(1 − q ) + 2(1 − p )q + (1 − p )(1 − q ) ∂E ( Π 1 ) ∂p 1 p = 4 * = 2q − 1 = 0 1 q = 2 * , E ( Π 1 ) = 2.5 , ∂E ( Π 1 ) , E ( Π 2 ) = 1.75 ∂p = −4 p + 1 = 0 72 Doğal Tekel Yatırım Oyunu Bir piyasada doğal tekel oluşmasının ana nedeni, yalnızca bir firmanın ekonomik kâr elde edebilecek kadar piyasa ölçeğinin büyük olmasıdır. Piyasa ölçeği, hem talep düzeyine hem de firma maliyet düzeyine bağlıdır. Aşağıdaki Şekil 2, bir doğal tekeli göstermektedir. ½D talep eğrisi, iki firmalı bir durumda, her iki firmanın da zarar edeceğine dikkat çekmektedir. 73 Şimdi iki firmalı bir durumu dikkate alalım. Ancak bu iki firma yeni bir ürün geliştirmek, fabrika binası kurmak gibi bir alanda ortak yatırım kararı almış olsunlar. 74 Şekil 2. Doğal Tekel P AC 1 2 D D Q 75 Bu durumda her bir firmanın karşısında iki strateji vardır: 1.Firmanın piyasaya kararının verilmesi: girişine olanak sağlayan bir yatırım E 2.Yatırım kararından vazgeçilmesi ve piyasadan uzak kalmak: Piyasaya bir firma girerse pozitif bir kâr elde edecek: firma girerse, zarar elde edecekler: Buna göre kazanç matrisi: -L<0. S Π>0; iki 76 2. Oyuncu 1. Oyuncu E E ⎡ − L, − L ⎢ S ⎢⎣ 0, Π S Π , 0⎤ ⎥ 0, 0 ⎥⎦ İlk çözüm denemesi olarak başat altı strateji eleme yöntemine baktığımızda, hiçbir firmanın başat altı stratejiye sahip olmadığını görebiliriz. Ancak her iki firma açısından birer saf strateji Nash dengesi vardır: (E,S) ve (S,E). Bunun dışında oyunda vardır. bir de karma strateji dengesi Bunu belirleyebilmek için, beklenen kazanç fonksiyonlarını yazarak başlayalım. E ( Π 1 ) = − pqL + p(1 − q )Π + (1 − p )0 = − pqL + p(1 − q )Π E ( Π 2 ) = − qpL + q(1 − p )Π + (1 − q )0 = − pqL + q(1 − p )Π ∂E ( Π 1 ) ∂p ∂E ( Π 1 ) ∂p = − qL + (1 − q )Π = 0 = − pL + (1 − p )Π = 0 Π p =q = Π+L * * E ( Π1 ) = 0 , E (Π2 ) = 0 77 78 Yukarıdaki sonucun anlamı şudur: Eğer piyasaya giriş yüksek kârlar ya da düşük zararlar nedeniyle çok cazipse, firma giriş olasılığını artırır. Ancak giriş olasılığının cazibesini azaltacağı için kârlar sıfırlanır. artması, giriş 79 Cournot Duopol Modeli Cournot modelinde bir firmanın stratejisi, çıktı miktarının seçimidir. i. firma için strateji kümesini yazalım. S i = {qi : qi ≥ 0} Buna göre, firmanın strateji uzayı, negatif olmayan tüm çıktı kümesidir. Aşağıdaki talep ve maliyet fonksiyonlarına göre, kazanç fonksiyonu şöyle oluşacaktır: P = a − bQ 80 TC = ( c + t ) qi , Π i = Pqi − ( c + t ) qi = [ a − bQ ] qi − ( c + t ) qi n ⎡ ⎤ Π i = ⎢ a − b ∑ q j ⎥ qi − ( c + t ) qi j =1 ⎣ ⎦ Diğer firmaların strateji seçimi belirliyken, fonksiyonuna bulabilmek sahip için, maksimize ederiz. olacaktır. diğer En firmaların iyi i. firma en iyi tepki tepki stratejileri fonksiyonlarını sabitken kârı n ⎡ ⎤ Π i = ⎢ a − b ∑ q j ⎥ qi − ( c + t ) qi = j =1 ⎣ ⎦ n ⎡ ⎤ 2 Π i = ⎢ aqi − bqi − b∑ q j qi ⎥ − ( c + t ) qi j=2 ⎣ ⎦ n ∂Π i = a − 2bqi − b∑ q j − ( c + t ) = 0 ∂ qi j=2 a−c−t 1 n qi = − ∑ qj 2b 2 j=2 81 82 Nash dengesi, n tane en iyi tepki fonksiyonunun eşanlı çözümüyle elde edilir. Her bir firmanın oynayacağı Nash denge stratejisi (optimal üretim düzeyi) : a−c−t q = ( n + 1)b * i Nash denge fonksiyonundaki hesaplayabiliriz. stratejisini, yerine her yazarak, bir denge firmanın kazanç kazanç değerlerini 83 n ⎛ ⎞ * * * * * * * Π i = ⎜ a − b∑ q j ⎟ qi − ( c + t ) qi = ( a − bnqi ) qi − ( c + t ) qi j =1 ⎝ ⎠ ⎛ a−c−t ⎞a−c−t a−c−t = ⎜ a − bn − (c + t ) ⎟ ( n + 1)b ⎠ ( n + 1)b ( n + 1)b ⎝ (a − c − t ) = 2 ( n + 1) b 2 84 Bu çözüm, her bir firmanın, diğer firmaların üretim düzeyi sabitken karar aldığı biçimindeki Cournot varsayımı üzerine kuruludur. Bu nedenle denge, literatürde Cournot-Nash dengesi olarak anılmaktadır. 85 Bertrand Duopol Modeli Cournot duopol modeli firmaların strateji seçimini üretim miktarı üzerine oturtmaktadır. Cournot’un makalesinden 45 yıl sonra Joseph Bertrand, aksak rekabet nedeniyle firmaların üretim belirlemek yerine, fiyat stratejisine göre hareket edeceklerini öne sürmüştür. Bertrand’ın bu yaklaşımı, piyasa dengesi üzerinde yaratmaktadır. Cournot’ya göre önemli bir farklılık 86 Bertrand modeli (Cournot modelindeki gibi) ürünü homojen varsaymıştır. Ancak firmalar fiyat farklılaştırmasına gitmektedirler. Ürünler homojen olduğundan, tüketiciler ucuz malı alacak, yüksek fiyattan satan firmanın satış miktarı sıfır olacaktır. Bertrand modelinde firmalar fiyat stratejisi seçerler. i. firma için strateji kümesini yazalım. Si = { pi : pi ≥ 0} 87 Kazanç fonksiyonlarını fonksiyonuna ihtiyaç yazabilmek duyarız. tanımlayalım: p = min( p1 , p2 ) Piyasa talep fonksiyonu: Q = Q( p) İlk için, olarak piyasa fiyat talep değişkenini 88 Bireysel firma için talep miktarı üç olasılığa sahiptir. Örneğin i. firma için bu üç olasılığı yazalım: pi < p j ⇒ qi = Q ( p ) pi = p j ⇒ Q( p) qi = 2 pi > p j ⇒ qi = 0 89 Her iki firmanın da aynı marjinal maliyetle (c) çalıştığını varsayalım. i. firmanın kâr fonksiyonu: pi < p j ⇒ Π i = pi Q( pi ) − cQ( pi ) pi = p j ⇒ Π i = 12 ⎡⎣ pi Q( pi ) − cQ( pi )⎤⎦ pi > p j ⇒ Πi = 0 90 Kâr fonksiyonu süreksiz biçimde olduğundan en iyi tepki fonksiyonlarını türev yoluyla elde edemeyiz. Nash dengesini, tüm olası sonuç uzayı içinde arayacağız. Potansiyel denge, her iki firmanın da tüm pozitif fiyat bileşimlerini içerir. Uygulanacak fiyat, tekelci fiyattan (pm) küçük, marjinal maliyetten (c) büyük olamaz. Diğer olasılıklar, aşağıdaki Şekil 3’de mavi alanla belirtilmiştir. L biçimindeki Şekil 3. Bertrand Duopol Modelinde Fiyatlama Kararları p2 pm c c pm p1 91 92 İki tür denge durumunu dışarıda bırakarak modelin çözümünü yaparız. Birincisi, pozitif kâr sonuçları denge değildir. Her iki firmanın fiyatı eşitse, bir firma çok küçük bir fiyat indirimiyle piyasanın tamamını eline geçirir ve iki kat kâr elde eder. Fiyatlar eşit değilse, yüksek fiyatlı firma, diğer firma fiyatının biraz altına fiyatı çekerek sıfır kârdan pozitif kâra geçebilir. Bu nedenle, pozitif sağlayamaz. kâr Nash dengesi için gereken koşulu 93 Denge, her iki firmanın da sıfır kâr elde etmesini gerektirmektedir. Yani düşük fiyat uygulayan firma, marjinal maliyete eşit bir fiyatlama yapmalıdır. Yüksek fiyat uygulayan firma marjinal maliyetten yüksek bir fiyatlama yapsaydı, marjinal maliyetten büyük, pozitif kâr elde etmiş olan ilk firmanın yüksek fiyatından küçük bir fiyat aralığı oluşurdu. Bu nedenle, Nash dengesi olmaya aday tek olası durum şudur: p = p =c * 1 * 1 , Π =Π =0 * 1 * 1 94 Bunun bir denge olduğunu görebilmek için, bir firma fiyatını düşürdüğünde negatif kâr elde edeceğini, fiyatını yükselttiğinde de sıfır düzeyinde kalacağına dikkat edelim. Nash dengesi, dengedeki stratejiden daha yüksek bir kazanç sağlayan strateji çiftinin olmamasını gerektirmektedir. Görüldüğü gibi Bertrand-Nash dengesi, Cournot-Nash dengesinden çok farklıdır. Şimdi de ürün farklılaştırması altında Bertrand modelini inceleyelim. 95 Ürün Farklılaştırması Ürün farklılaştırması varsa, düşük ve yüksek fiyat stratejisi önemini yitirir. i. firmanın üretiminin, fiyatın doğrusal bir fonksiyonu olduğunu varsayalım: qi = a − pi + bp j , 0<b<1 96 Her iki firma için de marjinal maliyetin sabit ve aynı (c) olduğunu varsayıyoruz. i. firmanın kâr fonksiyonu: ( Π i = pi qi − cqi = ( pi − c ) qi = ( pi − c ) a − pi + bp j ) Maksimizasyon birinci sıra koşulu oluşturalım ve buradan en iyi tepki fonksiyonunu bulalım. ∂Π i = a − 2 pi + bp j + c = 0 ∂pi → a+c ⎛b⎞ pi = + ⎜ ⎟ pj 2 ⎝ 2⎠ 97 Her iki firmaya ait tepki fonksiyonları aşağıdaki Şekil 4’de gösterilmiştir. maliyetten a>c olduğundan, her iki firma fiyatı, marjinal büyüktür. Ayrıca tepki fonksiyonları, Cournot modelindekinin tersine, pozitif eğimlidir. Her bir firma rakibinin fiyat artışına, kendi fiyatını artırarak tepki veriyor. Fiyatlama stratejisi, piyasa payına da değil, kârı korumaya yöneliktir. Şekil 4. Fiyat Farklılaştırması Modelinde Tepki Fonksiyonları p2 R1 R2 Q E a+c 2 450 a+c 2 p1 98 99 Birinci sıra koşullardan elde ettiğimiz tepki fonksiyonlarını eşanlı olarak çözersek, denge fiyatlarını elde ederiz. a+c ⎛b⎞ + ⎜ ⎟ p2 p1 = 2 ⎝ 2⎠ a+c p = p = 2−b * 1 * 2 , a+c ⎛b⎞ + ⎜ ⎟ p1 p2 = 2 ⎝ 2⎠ 100 Rant Kollama Davranışı Bu uygulamada, belirli miktardaki bir iktisadi pastanın, rekabetçi çerçevede paylaşımını inceleyeceğiz. Bazı durumlarda iktisadi karar birimleri ranttan pay alabilmek için rekabetçi davranış sergilerler. Örneğin vergi indirimlerini ya da gümrük koruma oranlarının düşürülmesini isteyen sanayi lobilerinin bu davranışı birer rant kollama davranışıdır. 101 Bu türden rantlar elde edebilmek için, girişimciler bir de harcamaya katlanırlar. Elde edilecek rantın büyüklüğü, bunun için yapılacak harcamaya bağlıdır. Rant kollama davranışı bireysel olarak rasyonel açısından kazanç azaltıcıdır. olmakla birlikte, tüm oyuncular 102 İlk olarak iki oyunculu bir modeli dikkate alalım, daha sonra bunu n oyunculu duruma genelleştirelim. R kadar bir iktisadi rantı paylaşan iki oyuncu varsayalım. Her bir oyuncu ranttan pay alabilmek için belirli bir harcama da yapmaktadır. Sırasıyla x1 ve x2 birinci ve ikinci oyuncunun bu harcamasını göstersin. Her bir oyuncunun ranttan alacağı pay, rant için yapılan toplam harcamadaki harcama payına eşit olsun: xi si = xi + x j 103 i. oyuncunun kazanç fonksiyonu: ⎛ xi Π i = si R − x i = ⎜ ⎜x +x j ⎝ i ⎞ ⎟⎟ R − xi ⎠ Birinci sıra koşul: ( ) ⎛ x +x −x ∂Π i ⎜ i j i = ∂x i ⎜ x + x 2 i j ⎝ ( ) ⎞ ⎟ R−1 = 0 ⎟ ⎠ → xi = xjR − xj 104 Oyuncular simetrik olduğundan, harcama düzeyleri dengede eşit olacaktır. x= xR − x → R x = 4 * Aşağıdaki Şekil 5, oyuncuların en iyi tepki fonksiyonlarını ve dengeyi göstermektedir. olmadığına dikkat edelim. Tepki fonksiyonlarının doğrusal 105 Bunu yorumlayabilmek için 2. oyuncuyu dikkate alalım. Tepki eğrisinin pozitif eğime sahip bölümünde 2. oyuncu rantın yarısından çoğunu alır. Eğrinin negatif eğimli bölümünde ise, bunun tersi geçerlidir. Dengede toplam rantların yarısı, iki oyuncu arasında eşit paylaşılmıştır. Geri kalan yarı ise, verimsiz rant harcamasına gitmiştir. Şekil 5. Rant Kollama Davranışı Modelinde Tepki Fonksiyonları x2 R R2 x2* = R 4 Q E R1 450 R x = 4 * 1 R x1 106 107 Şimdi rant kollama davranışı modelini n genelleştirelim. Her bir oyuncunun rant payı: xi si = X n , X = ∑ xj j =1 i. oyuncunun kazanç fonksiyonu: ⎛ xi Πi = ⎜ n ⎜ ∑ xj ⎜ ⎝ j =1 ⎞ ⎟R− x i ⎟ ⎟ ⎠ oyunculu duruma 108 Birinci sıra koşul: ⎛ n ⎜ ∑ x j − xi ∂Π i ⎜ j =1 =⎜ n 2 ⎛ ⎞ ∂x i ⎜ ⎜ ∑ xj ⎟ ⎜ j =1 ⎠ ⎝⎝ ⎞ ⎟ ⎟ R−1 = 0 ⎟ ⎟ ⎟ ⎠ Tüm oyuncuların simetrik olduğunu düşünerek nx − x ( nx ) 2 R−1 = 0 → x ’i çözelim. n−1 x = 2 R n * 109 Toplam rant harcaması ve oyuncuların kazanç fonksiyonları da şöyle oluşacaktır. n−1 X = nx = R n * * * x R * Π = * R− x = 2 X n * 110 Şimdi karşılaştırmalı durağanlığı kullanarak, oyuncu sayısındaki değişimin denge değerini nasıl değiştirdiğine bakalım: 2− n ∂x * n 2 − 2n( n − 1) R= 3 R<0 , n>2 = 4 n n ∂n 1 n − ( n − 1) ∂X R= 2 R>0 = 2 n n ∂n * ∂Π −2 R = 3 <0 n ∂n * 111 Kamusal Mallar Yukarıda incelediğimiz rant kollama davranışı modelinde sabit miktardaki bir ekonomik kaynak (çıkar) oyuncular arasında, her bir oyuncunun bu ranttan pay almak için yaptığı rekabetçi harcama ölçüsünde bölüşülmekteydi. Buradaki uygulamada rant oyuncuların niteliğindedir. harcamasına bağlıdır ve kamusal mal 112 Tam kamusal mallar (örneğin devlet televizyonu) iki özelliğe sahiptir: Birincisi, oyunculardan birinin tüketim artışı, diğerinin tüketim düzeyini düşürmez. İkincisi, bu tür malın üretimine katkı yapmayanlar, tüketimden dışlanamazlar. 113 Bu uygulamada şu sorulara yanıt arayacağız. 1. Bireysel olarak seçilen Nash dengesi katkısı, toplumsal ola- rak optimal midir? 2. Oyuncu sayısındaki değişim, Nash dengesindeki ve toplumsal optimal olan kamusal mallar düzeyini nasıl etkilemektedir? 114 xi , i. oyuncunun harcama ya da kamusal mala katkı düzeyini göstersin. Kamusal malın sağlayacağı toplam yarar (B), toplam harcamanın bir fonksiyonudur: B = B( X ) n , X = ∑ xj j =1 115 Yarar fonksiyonunun konkav olduğunu, yani kamusal mallara yapılan harcama artışının azalan marjinal getiriye sahip olduğunu varsayalım. ∂B ∂B = = B ′( X ) > 0 ∂X ∂ x i , ∂B 2 ∂ 2 B = 2 = B′′( X ) < 0 2 ∂X ∂x i Bir bireyin kazancı, kamusal malın yararı eksi kamusal malı sağlamak için oyuncu tarafından yapılan harcamadır: Π i = B( X ) − xi 116 Kazancın maksimizasyonu için gereken birinci ve ikinci sıra koşullara bakalım: ∂Π i = B ′( X ) − 1 = 0 ∂x i , ∂ 2Π i = B′′( X ) < 0 2 ∂x i 117 Birinci sıra koşulların çözümünden, Birinci sıra koşulda X* değerini elde ederiz. n yer almadığından, toplam harcama kamusal malın denge düzeyi, oyuncu sayısından bağımsızdır. Toplumsal optimalite için de, kamusal maldan kaynaklanan toplam net yararların maksimize edilmesi gerekir. Toplam net yararlar, her bir bireyin kazançlarının toplamıdır: n n j =1 j =1 ( ) Π = ∑ Π j = ∑ B( X ) − x j = nB( X ) − X 118 Birinci ve ikinci sıra koşullara bakalım: ∂Π j ∂X ∂ 2Π j ∂X 2 = nB′( X ) − 1 = 0 = nB′′( X ) < 0 → B′( X ** ) = B ′( X * ) = 1 1 n Toplumsal Optimal Nash Dengesi Birinci sıra koşulun çözümünden elde ettiğimiz sonuç, Nash dengesi ile toplumsal optimalın farklı olduğunu göstermektedir. Şekil 6, kamusal mal düzeylerini göstermektedir. Şekil 6. Kamusal Mallar Durumunda Toplumsal Optimalite ve Nash Dengesi B ′( X ) 1 Q 1 n Q B ′( X ) X* X ** X 119 120 B(X) içbükey olduğundan, marjinal yarar fonksiyonu negatif eğimlidir. Özel Nash dengesinin (X*), B′(X), toplumsal optimaldan (X**) küçük olmasının nedeni, her bireyin kamusal mal için yaptığı katkının, diğer bireyler için dışsal yararlar yaratmasıdır. Bireysel maksimizasyon önünde bulundurulmamaktadır. da bu yararlar göz 121 Ayrıca etkinsizlik derecesi (iki çözüm arasındaki fark), n arttıkça büyür. Tüketici sayısının artması, bireysel tüketicinin diğer katkı yapanlar üzerinden bedavacılığını artırır. Bunun sonucu olarak da fark büyür. TÜMEL BİLGİYE DAYALI DİNAMİK OYUNLAR 123 Önceki bölümde, oyuncuların eşanlı seçim yaptıkları statik oyunları inceledik. Şimdi oyuncuların peşi sıra seçim yaptıkları dinamik oyunları inceleyelim. Bu tür oyunlar, iktisadi ilişkilerin tarihsel bir süreçte geliştiği durumlara uygundur. Bir piyasada yerleşik olan firmaların, kararlarını piyasa için potansiyel firmaların girip girmeyeceği hesapları üzerine kurması buna bir örnektir. 124 Ayrıca piyasadaki yerleşik firmalar arasındaki pazarlık süreci de dinamik oyunlar ile incelemeye uygundur. Statik oyunlarda kazanç matrisi, tepki fonksiyonu gibi araçları kullandık. Ancak bu araçlar dinamik oyunlara uygun değildir. Dinamik oyunda strateji bir hareket değil, oyun anında oluşabilecek tüm olası durumlar karşısında bir oyuncunun hareketlerinin bütünsel bir tanımıdır. 125 Statik oyundaki kullandığımızda, normal peşi sıra biçimi gelen dinamik hareketleri bir oyunda göstermemiz olanaksızlaşır. Bu nedenle yayvan biçim adını verdiğimiz bir araç kullanırız. Yayvan biçim, oyundaki dizimsel hareketleri en iyi anlatabilecek olan oyun ağacı ile betimlenmektedir. 126 Statik ve dinamik oyunlar arasındaki fark yukarıda söz ettiğimiz bir araç yöntemi farkından ibaret değildir. Statik oyunlarda çözüm Nash dengesi ile ifade edilmektedir. Ancak bu kavram dinamik oyunlar için çok yetersizdir. Dinamik oyunlarda Nash dengesi, oyuncuların başat altı hareketleri (stratejileri değil) seçmelerine olanak sağlanması anlamında mantıksız sonuçları içerebilir. 127 Dinamik oyunlarda Nash dengesinin güçlü biçimi, alt oyunlutam Nash dengesi olarak ifade edilmektedir. Şimdi yayvan biçime ilişkin tanımdan başlayarak, girişelim. Oyunlarda oyuncular dırılmıştır. ayrıntılı incelemesine 0,1,.....,n biçiminde numaralan- 0 doğayı, yani n sayıda oyuncu asıl kararları alırken, oluşabilecek tesadüfi olayları temsil etmektedir. 128 Bir oyunun yayvan biçimi şunları tanımlar: 1. Oyuncular kümesini. 2. Hareketlerin sırasını. 3. Oyuncunun yer alabileceği her bir hareketteki olası davranışlarını ve bu olası davranışları ile olasılık dağılım fonksiyonunca hareketleri. tanımlanmış olan doğa karşısındaki 129 4. Her bir harekette bir oyuncunun sahip olacağı bilgiyi. 5. Her olası hareket bileşimlerine karşılık gelen n oyuncunun kazançları. Oyun ağacının en basit biçimini tanımlayarak başlayalım: İki seçim ve bir oyuncu. Oyun ağacı, çok sayıda dallar ve bu dalların birleştiği (ya da alt dallara ayrıldığı) noktalardan oluşur. Bağlantı noktaları kararları ya da sonuçları, dallar da mevcut kararları gösterir. 130 Şekil 7’de bir oyunculu oyun ağacı gösterilmiştir. Oyuncu iki olası karara sahiptir. L ve R. Başlangıç noktası, 1. oyuncunun karar noktası olması anlamında 1’dir. Sol ve sağ dalların ucundaki noktalar, varış noktalarıdır ve kazançları göstermektedir. Bu oyunda denge, bireye en yüksek kazancı sağlayan davranışın seçilmesidir. 131 Şekil 7. Tek Oyunculu Modelde Oyun Ağacı 1 Q L Q ΠL R Q ΠR 132 Buna benzer biçimde, iki oyunculu dinamik oyunu da oluşturabiliriz. Bir yatırım kararı oyununu dikkate alalım. Her bir firma piyasaya girişe olanak sağlayan bir yatırımı yapıp yapmama kararı karşısında seçim yapma durumunda bulunsun. Firma yatırım yapmazsa, piyasa dışında kalır ve sıfır kâr elde eder. Bu örneği eşanlı kararların verildiği bir statik oyun olarak görmüştük. 133 Kararlar peşi sıra (dizimsel) verilirse ne olur? 1. oyuncunun ilk karar veren olduğunu kabul edelim. 2. oyuncu, 1. oyuncunun davranışını öğrendikten sonra kendi kararını verecektir. Bu oyunun ağacı Şekil 8 ile verilmiştir. Şekilde piyasa dışında kalma kararını; E piyasaya girişi, S Π kârı, -L zararı simgelemek- tedir. Kazanç bileşimlerindeki ilk kazanç 1. oyuncuyu, diğeri 2. oyuncuyu göstermektedir. 134 Şekil 8. Dizimsel Oyun 1 E Q S 2Q E Q − L, − L Q S E Q Q Π, 0 0, Π 2 S Q 0, 0 135 Bu oyunda dengeyi bulabilmek için geriye doğru tümevarım tekniğini kullanacağız. Bu teknik şunları içerir: 1. Oyundaki son karar noktasının incelenmesi. 2. Oynanmamış davranışların elenmesi. 3. Bu elenmiş davranışların silinmesi. 4. Oyun ağacının yeniden çizilmesi. 5. Yukarıdaki sürecin yinelenmesi. 136 Yukarıda ele aldığımız iki oyunculu (firmalı) yatırım oyununda son karar noktası, 2. oyuncununkidir. 1. firma (oyuncu) piyasaya giriş kararı aldığında (ağacın sol dalı), 2. firma için en iyi seçim piyasa dışında kalmaktır (çünkü piyasaya giriş kararı verirse, L kadar zarar edecektir). 1. firma piyasa dışında kalma kararı aldığında (sağdaki dal), 2. firma için en iyi karar piyasaya giriş yapmaktır. Şekil 9, bu durumlar dikkate alınarak yeniden çizilmiş olan budanmış oyun ağacını göstermektedir. 137 Şekil 9. Dizimsel Oyun: Geriye Doğru Tümevarım ve Budama 1 E Q S 2Q Q S E Q Q Π, 0 0, Π 2 138 Şimdi oyunu çözebiliriz. Her iki oyuncunun da rasyonel olduğunu ve rasyonelliğin de herkesçe bilindiğini varsayıyoruz. Bu durumda, 2. firmanın rasyonel davranışı gerçekleştireceğini bilen 1. firma, kendisi için rasyonel olan piyasaya girişi seçecektir. Çünkü bu durumda, kendisi Π kadar bir pozitif kâr, rakibi de sıfır kâr elde etmektedir. Bu nedenle denge, 1. firmanın piyasaya girme kararı, 2. firmanın piyasa dışında kalma kararıdır. 139 Bilgi Kümesi Yukarıdaki piyasaya giriş kararı örneğinde 2. firma, 1. firma kararından sonra karar alacağını bilmekteydi. Fakat 2. firma bunu başından bilmeseydi ne olurdu? Şimdi eşanlı bir karar verme süreci çerçevesinde oyun ağacını inceleyelim. Bunun için bilgi kümesi kavramını tanıyalım. 140 Bir bilgi kümesi, aynı karar dallarına sahip olan fakat oyunun hangi karar noktasına ulaşıp ulaşmadığını bilmeyen bir oyuncunun karar noktaları bütünüdür. Tüm bilgi kümesinin tek karar noktalarından oluştuğu oyunlar, tam bilgiye dayalı oyunlar olarak ifade edilmektedir. Eğer bazı oyunlarda karar noktaları tek değilse, eksik bilgiye dayalı oyunlar söz konusudur. 141 Şekil 10, piyasaya giriş oyununun eşanlı-hareket durumunu göstermektedir. Bu, eksik bilgiye dayalı statik oyunun yaygın biçimdeki gösterimidir. Kesikli çizgi, 2. oyuncu için bir bilgi kümesidir. Kesikli çizgi, 2. oyuncunun piyasaya giriş yapma ya da yapmama kararlarından birini seçeceği bir karar noktasında bulunduğunu, ancak 1. firmanın hangi kararı almış olduğunu bilmediğini göstermektedir. Şekil 11, Şekil 10’un alternatif bir gösterimidir. Her iki şekilde özdeştir. 142 Şekil 10. Eşanlı Yatırım Oyunu: I 1 E Q S 2Q E Q − L, − L Q S E Q Q Π, 0 0, Π 2 S Q 0, 0 143 Şekil 11. Eşanlı Yatırım Oyunu: II 2 E Q S 1Q E Q − L, − L Q S E Q Q Π, 0 0, Π 1 S Q 0, 0 144 Belirsizlik ve Tesadüfi Durumlara Göre Hareket Yeniden yukarıdaki piyasaya giriş örmeğimizi dikkate alalım ve potansiyel tüketici talebinde bir belirsizlik olduğunu varsayalım. İki piyasa ölçeği dikkate alalım. Büyük ölçekli piyasa (L) ve orta ölçekli piyasa (M). 145 Büyük ölçekli piyasaya her iki firmanın da giriş yaparak pozitif kâr elde edebileceğini; orta ölçekli piyasada ise yalnızca bir firmanın pozitif kâr elde edebileceğini varsayalım. piyasa olma olasılığını; göstersin. q , büyük 1-q , orta ölçekli piyasa olma olasılığını 146 Şekil 12-15, bu oyunun dört olası durumunu göstermektedir. İlk iki şekil dizimsel oyunu (1. oyuncu ilk karar veren ve açıklayandır), diğer ikisi eşanlı oyunu betimlemektedir. Sonuç noktalarında pozitif kazançlar (+), zarar (-) ile simgelenmiştir. Şekil 12, tüm bilgi kümelerinin tek karar noktasından oluştuğu bir durumu göstermektedir. Bu nedenle, bu oyunda: 147 1. Piyasa büyüklüğü (ölçeği) tesadüfi olarak belirlenmektedir. 2. Firmalar piyasa büyüklüğünü (L ya da M) öğrenmektedir. 3. 1. firma piyasaya giriş (E) ya da piyasa dışında kalma (S) seçeneklerinden birini seçmektedir. 4. 2. firma, 1. firmanın kararını öğrendikten sonra piyasaya girme ya da dışında kalmaya karar vermektedir. 148 Şekil 12. Tesadüfi (Bilinen) Talep N q Q 1− q M L 1Q Q S E 2Q E E S E 2Q 2Q S 1 S E Q Q Q Q Q +, + + ,0 0, + 0,0 −, − 2Q S Q E Q + ,0 0, + S Q 0,0 149 Şekil 13 firmaların yine dizimsel seçim yaptıkları, ancak bu sefer piyasa büyüklüğünü bilmeden karar aldıkları bir oyunu göstermektedir. Bu durumda 1. firma için iki karar noktası tek bilgi kümesi anlamına gelir. 2. firma içinse iki bilgi kümesi vardır. Bunlardan birisi, 1. firmanın piyasaya girmesi (ancak piyasa kalması büyüklüğünü (yine oluşmaktadır. piyasa bilmiyor), ikincisi büyüklüğünü de piyasa bilmiyor) dışında durumlarında 150 Şekil 13. Tesadüfi (Bilinmeyen) Talep N q Q 1− q M L 1Q Q S E 2Q E E S E Q2 2Q S 1 S Q E S Q Q Q Q Q Q +, + + ,0 0, + 0,0 −, − E Q + ,0 0, + 2 S Q 0,0 151 Şekil 14. Eşanlı Hareketler ve Bilinen Talep N q Q 1− q M L 1Q Q S E 2Q E E S E Q S 1 2Q 2 S E Q Q Q Q Q +, + +,0 0, + 0,0 −, − Q S Q E Q +,0 0, + 2 S Q 0,0 152 Şekil 15. Eşanlı Hareketler ve Bilinmeyen Talep N q Q 1− q M L 1Q Q S E Q E E 2 2 Q Q S S E 2 2 1 S E Q Q Q Q Q +, + +,0 0,+ 0,0 −, − Q S Q E Q +,0 0,+ S Q 0,0 153 Yayvan Biçimli Oyunlarda Denge Statik oyunlarda olduğu gibi, dinamik oyunlarda da Nash dengesi vardır. Ancak çok zayıf olması nedeniyle, dinamik oyunların çözümünde Nash dengesi kavramını kullanamayız. Nash dengesinin çok zayıf olmasından, bazı yayvan oyunların anlamsızlığını kastediyoruz. Anlamlı ve anlamsız Nash dengesini ayırt edebilmek için, altoyun kavramını tanımamız ve stratejiyi tanımlamamız gerekir. yayvan biçimli bir oyunda 154 Alt-Oyunlar Bir oyunun bir bölümü olan alt-oyun, şu özelliklere sahiptir: 1. Tek bir bilgi kümesine sahip bir karar noktasında başlar. 2. Başlangıç karar noktasından sonra, asıl oyunun tüm karar noktalarını ve dallarını kapsar. 3. Asıl oyunun hiçbir bilgi kümesini kesmez. 155 Şimdi yukarıda verdiğimiz alt-oyun tanımına bakarak, önceki örneklerimizde yer alan alt oyunları görebiliriz. Örneğin, Şekil 12’de altı tane alt-oyun vardır. İki tanesi 1. firmanın her bir tek karar noktasında, Dört tanesi 2. firmanın her bir tek karar noktasında. Şekil 13’de yalnızca 1. firmanın her bir tek karar noktasında olmak üzere iki tanedir. 156 Şekil 13 ve 14’de tek karar noktaları bulunmadığından, alt-oyun yoktur. Üçüncü özelliği vurgulamak açısından, piyasaya giriş oyununun son bir olası durumunu dikkate alalım. 1. firmanın piyasa büyüklüğünü öğrendiğini, ancak 2. firmanın ne piyasa büyüklüğünü ne de 1. firmanın kararını bilmediğini varsayalım. 1. firma için tek karar noktası vardır. Fakat asıl oyunun altoyunu yoktur. Bu, Şekil 16’da gösterilmiştir. 157 Şekil 16. Birinci Firma İçin Tam, İkinci Firma İçin Eksik Bilgi Altında Oyun N q Q 1− q M L 1Q Q S E Q E E 2 2 Q Q S S E 2 2 1 S E Q Q Q Q Q +, + + ,0 0, + 0,0 −, − Q S Q E Q + ,0 0, + S Q 0,0 158 Stratejiler Eşanlı hareketli bir oyunda strateji, doğrudan yapılan eylemdir. Örneğin Cournot duopol modelinde firmanın stratejisi, üretim miktarının seçilmesiydi. Buna karşın dinamik oyunlarda oyuncular yalnızca bir eylemi değil, aynı zamanda karşı eylemi de gerçekleştirirler. Aynı zamanda, oyunun ilerleyen aşamalarında oluşabilecek tüm durumlarda nasıl bir karşı eylemde bulunacağını da planlar. Dolayısıyla oyunda strateji tanımı, bu unsurları içerir. dinamik bir 159 Buna göre dinamik oyunda strateji; Bir oyuncunun oyun ağacındaki tüm olası karar noktalarını dikkate aldığı eylemleri tanımlayan geniş kapsamlı bir plandır. Bu tür bir plan oyunun kronolojik sürecine bağımlı olabilir ve karma stratejileri içerebilir. 160 Yayvan biçimli bir oyunda strateji kavramını, farklı bir piyasaya giriş oyunuyla görelim. 1. firma hali hazırda piyasada faaliyet gösteriyor olsun. 2. firma ise piyasaya giriş yapıp yapmama kararını verecektir. 2. firmanın piyasaya giriş kararı karşısında, 1. firma yüksek fiyat (H) ve düşük fiyat (L) stratejilerini seçebilecektir. 161 Şekil 17’de bu oyun yer almaktadır. 2. firma bir karar noktasına, iki de eyleme sahiptir. Strateji seçimleri piyasaya giriş (E) ve piyasa dışında kalmaktır (S). 1. firma iki eyleme (H ya da L), dört stratejiye sahiptir. Tüm olasılıklar çerçevesinde bir strateji, bir eylem tanımlar. 162 Burada 1. firma için bir strateji, bir çift olası eylem demektir: Birincisi 2. firma piyasaya giriş yaparsa, ikincisi de piyasa dışında kalırsa ortaya çıkmaktadır. 1. firma için olası strateji kümesini yazalım: S1 = {( H , H ) , ( H , L ) , ( L, H ) , ( L, L )} 163 Şekil 17. İkinci Firmanın Yatırım Kararı Ardından Birinci Firmanın Fiyatlama Kararı 2 Q E S 1Q H Q +, + Q H L Q −, − 1 L Q Q +, 0 −, 0 164 Alt-Oyun Tam Nash Dengesi Nash dengesinin dinamik oyundaki tanımı, statik oyundakiyle aynıdır: Eğer oyuncular farklı bir strateji seçmek için bir neden görmüyorlarsa, bu durum Nash dengesidir. Nash dengesini bulabilmek için normal biçimli bir oyundan yararlanalım. 165 Kazanç matrisi şöyledir: 2. Firma H 1. Firma H L L E H ⎡+, + ⎢ L ⎢+, + ⎢ H ⎢ −, − ⎢ L ⎢⎣ − , − S +, 0⎤ ⎥ −, 0 ⎥ ⎥ +, 0⎥ ⎥ − , 0 ⎥⎦ 166 Yukarıdaki kazanç matrisinde her bir oyuncunun rakibinin strateji seçimi karşısındaki en iyi tepkisi altı çizgili (renkli) gösterilmiştir. Aynı dengesidir. Bunları anda altı çizili olan üç E1, E2 ve E3 olarak gösterelim. 1. Firma 2. Firma E1 : (H , H ) E E2 : ( H , L) E E3 : ( L, H ) S seçim, Nash 167 Bu oyunda üç Nash dengesi olmasına karşın, E2 ve E3 sorunlu dengelerdir. Şekil 17’yi yeniden inceleyerek bunu görebiliriz. 2. firma piyasaya giriş kararı aldığında, 1. firma için en iyi alt- oyun yüksek fiyat uygulamaktır. Aynı durum, 2. firma piyasa dışında kalmaya karar verdiğinde de geçerlidir. 168 Dolayısıyla her iki alt-oyunda da H başattır. Ancak E2 ve E3 Nash dengesi olmakla beraber, potansiyel olarak başat-altı oyunları da (düşük fiyatlama) içermektedir.Her hangi bir nedenle 2. firma kendisi için en iyi olan stratejiden sapma gösterirse, 1. firmanın rasyonel seçim yapması olanak dışı olur. 169 Asıl oyunun tüm alt oyunlarında bir strateji kümesine dayanarak yapılan eylemler Nash dengesine yol açıyorsa, yayvan biçimli oyundaki bu strateji kümesi alt-oyun tam Nash dengesidir. Statik oyunlar için kullandığımız Nash dengesi kavramını, dinamik oyunlarda alt-oyun tam Nash dengesi olarak kullanıyoruz. Bir tam bilgiye dayalı oyunda geriye doğru tümevarım tekniğiyle, alt-oyun tam Nash dengesi aynı şeylerdir. Dinamik oyunlar, karma strateji dengesine sahip olabilirler. 170 Alt-Oyun Tam Nash Dengesi için Örnek Şimdiki örneğimiz iki oyunculu, sürekli değişkenler içeren bir biçime sahiptir. Oyunun kurgusu şöyledir: 1. 1. oyuncu x1 eylemini seçer. 2. 2. oyuncu bunu izler ve ardından x2 eylemini seçer. 3. Oyuncular П1(x1,x2) ve П2(x1,x2) fonksiyonlarınca tanımlanan kazançları elde ederler. 171 Bu problemi çözmek için, asıl oyunun alt-oyunu olan 2. oyuncunun x2 seçimiyle başlarız. 2. oyuncunun kazancının maksimizasyonu problemini çözeriz. 2. Oyuncu için birinci sıra koşul: ∂Π 2 ( x1 , x2 ) =0 ∂x 2 172 Bu denklemin çözümünden, yonunu sonra, bulabiliriz. 1. 2. oyuncunun x2* = R2 ( x1 ) biçimindeki tepki fonksi- oyuncunun kararına stratejisini bakarız. Ortak belirledikten rasyonellik varsayımını benimsersek, 1. oyuncu, 2. oyuncunun rasyonel seçim yapacağını düşünecektir. Buna göre 1. oyuncunun kazanç fonksiyonunu ve birinci sıra koşulu yazalım: Π 1 ( x1 , x2* ) = ( x1 , R2 ( x1 ) ) d Π 1 ( x1 , R2 ( x1 ) ) dx1 ∂Π 1 ∂Π 1 ∂R2 = + =0 ∂x1 ∂x2 ∂x1 173 Yukarıdaki birinci sıra koşul iki etkiyi barındırmaktadır. Birinci terim statik oyun dengesi (eşanlı), ikinci terim dizimsel seçimlere sahip dinamik oyun dengesini yansıtmaktadır. Şimdi daha önce verdiğimiz bir örnekteki sayısal kazanç fonksiyonlarını kullanarak açık çözüm elde edelim. 174 Π 1 = 10 x1 − x12 − x1 x2 − 3 x1 Π 2 = 10 x2 − x − x1 x2 − 2 x1 2 2 Statik oyundaki en iyi tepki fonksiyonları şöyleydi:. x1 = R1 ( x2 ) = x =2 , * 1 1 2 ( 7 − x2 ) Π1 = 4 , , x2 = R2 ( x1 ) = x =3 , * 2 1 2 ( 8 − x1 ) Π2 = 9 175 Şimdi de ilk olarak 1. oyuncunun oyuna başladığı bir dinamik model düşünelim. Statik oyunda elde ettiğimiz (2. oyuncuya ait) tepki fonksiyonu, 2. oyuncunun strateji kuralını oluşturur. Bu fonksiyonu 1. oyuncunun kazanç fonksiyonuna uygulayarak, denge değerini bulabiliriz. 176 Π 1 = 10 x1 − x − x1 x2 − 3 x1 2 1 Π 1 ( x1 , R2 ( x1 ) ) = 10 x1 − x12 − x1 ⎡⎣ 12 ( 8 − x1 ) ⎤⎦ − 3 x1 Π 1 ( x1 , R2 ( x1 ) ) = 3 x1 − x 1 2 d Π 1 ( x1 , R2 ( x1 ) ) dx1 x1* = 3 , 2 1 = 3 − x1 = 0 Π 1 = 4.5 , x2* = 2.5 , Π 2 = 6.25 177 Statik ve dinamik oyunların sonuçlarını karşılaştırdığımızda, dinamik oyunda 1. oyuncunun oyuna ilk başlayan olma avantajıyla daha iyi bir sonuç elde ettiğini görebiliriz. Ancak buradaki sonuçtan, tüm oyunlarda ilk hareket eden olmanın avantaj sağladığı sonucunu çıkaramayız. Sonuçlar, oyunun yapısına bağlıdır. 178 İki Aşamalı Oyunlar İki aşamalı oyun, bir oyunun diğerini izlediği biçimde bir oyundur. İktisadi uygulamalara baktığımızda, genellikle ilk oyun aşamayı ya da oyun ortamını oluşturur; ikinci aşamada da oyun oynanır. Örneğin ilk aşamada firmalar ürün kalitesini, ikinci aşamada da fiyatı belirlerler. Bir başka örneği de dış ticaretten verebiliriz. İlk aşamada hükümet, dış ticarete katılan firmalar için birinci aşama (ya da çevresel koşullar) olan dış ticaret politikasını belirler, ikinci aşamada firmalar ihracat ve ithalat kararlarını verirler. 179 Şimdi her aşamada eşanlı, ancak aşamalar arasında dizimsel olan oyunlar üzerinde duracağız. Hareketlerin de kesikli değil, sürekli olduğunu varsayıyoruz. İlk aşamada 1. ve 2. oyuncular sırasıyla x1 ve x2 seçimlerini yaparlar. 3. ve 4. oyuncular bu seçimi izledikten sonra, ikinci aşamada eşanlı olarak kendi seçim kararlarını (x3 ve x4) verirler. 180 Alt-oyunun tamlığı, asıl oyunda dengenin var olabilmesi için, ikinci aşamadaki alt-oyunda da Nash dengesinin var olmasını gerektirir. İkinci aşama alt-oyunu x1 ve x2 seçimlerini veri almaktadır. Bu nedenle 3. ve 4. oyuncular, kendi kazanç fonksiyonlarını maksimize edecek olan gerçekleştirirler. x3 ve x4 seçimlerini 181 Π 3 = Π 3 ( x1 , x2 , x3 , x4 ) Π 4 = Π 4 ( x1 , x2 , x3 , x4 ) ∂Π 3 =0 ∂x 3 , ∂Π 4 =0 ∂x 4 x = R3 ( x1 , x2 ) , * 3 x = R4 ( x1 , x2 ) * 4 182 Burada dikkati çeken nokta, x1 ve x2 seçimleri içsel olmakla beraber, x3 ve x4 seçimleri yıldız (asteriks) işaretiyle gösterilmiş olmasıdır. Bu sanal sıkıntıyı aşmanın yolu, yeniden birinci aşamaya dönerek, maksimizasyonunu, 1. x3* ve ve x4* 2. oyuncular için veriyken belirlemektir. kazanç 183 Π 1 = Π 1 ( x1 , x2 , R3 ( x1 , x2 ) , R4 ( x1 , x2 ) ) Π 2 = Π 2 ( x1 , x2 , R3 ( x1 , x2 ) , R4 ( x1 , x2 ) ) d Π 1 ∂Π 1 ∂Π 1 ∂R3 ∂Π 1 ∂R4 = + * + * =0 dx1 ∂x1 ∂x3 ∂x1 ∂x4 ∂x1 d Π 2 ∂Π 1 ∂Π 1 ∂R3 ∂Π 1 ∂R4 = + * + * =0 dx2 ∂x 2 ∂x 3 ∂x 2 ∂x 4 ∂x 2 184 1. ve 2. oyuncular arasında oynanan basit statik oyunla, birinci aşamada seçim yapılan dinamik oyun arasındaki farka dikkat edelim. Dinamik oyun, birinci aşamadaki oyuncuların kararlarının, ikinci aşama kararları üzerindeki dolaylı ya da stratejik etkilerini içerir. 185 Tüm oyunun çözümü, dört oyuncunun da birinci sıra koşullarından elde edilen stratejileri sağlayan alt-oyun tam Nash dengesidir. Bu dengeyi şöyle yazabiliriz: { E = x , x , x = R3 ( x , x ) , x = R4 ( x , x * 1 * 2 * 3 * 1 * 2 * 4 * 1 * 2 )} 186 Yinelenen Oyunlar Yinelenen oyunlar, bir başka önemli oyunlar türüdür. Örneğin tutsaklar açmazı ya da Cournot duopol modelini yeniden dikkate alalım. Bu oyunlar, bir statik oyunda oyuncuların birbirlerini bir kerelik etkilemelerine izin vermektedir. 187 Gerçek iktisadi yaşamda oyun belirli bir dönemde oynanmasına karşın, alınan kararların etkileri izleyen dönemlerde de sürebilmektedir. Yani statik oyunun yinelenen oyunlarından oluşan bir dinamik oyundan söz ediyoruz. Yinelemeler, izleyen oyunlarda yeni beklentilerin oluşmasına yol açması bakımından önemlidir. 188 Örneğin tutsaklar açmazında her bir oyuncunun önünde iki strateji vardır: işbirliği yapmak ya da işbirliğinden kaçınmak. Yinelenen tutsaklar açmazında, strateji uzayı daha karmaşıktır. Bir oyuncu, diğer oyuncunun geçmişte verdiği kararların etkisi altındadır. 189 Şimdi G olarak adlandıracağımız bir statik oyunu dikkate alalım. G(T), T kere yinelenen bir dinamik oyun olsun. Örneğin G oyununu iki oyunculu bir tutsaklar açmazı olarak düşünelim. Kazanç matrisi şöyledir: 2. Oyuncu 1. Oyuncu C C ⎡ R, R ⎢ D ⎢⎣W , L D L, W ⎤ ⎥ P , P ⎥⎦ 190 C, işbirliği yapma; D, işbirliğinden kaçınma; R, ödül; L, kayıp, W, kazanma; P, ceza olarak kullanılmıştır. Aynı zamanda şu eşitsizliklerin de sağlanması gerektiğini varsayalım: W > R> P> L , W +L R> 2 191 Yukarıdaki ilk eşitsizlik tutsakların çıkmazı oyununu tanımlamakta, ikincisi de oyuncunun işbirliğine gitmekle elde edeceği kazancının, işbirliği ve işbirliğinden kaçınma kararları arasında değişikliğe gitmekle elde edeceği kazancını aşacağını söylemektedir. Daha önce ele aldığımız statik oyunda her iki tutsak için işbirliğinden kaçınmak tek Nash dengesiydi. 192 Şimdi oyunun T sayıda yineleme ile oynandığını varsayalım ve son dönemi dikkate alalım. Artık bu dönemde iki tutsağın birbiriyle işbirliğine girip girmeyeceği davranışlarının ne olacağının bir önemi yoktur. Yani adete bir statik tutsak çıkmazı oyunuyla karşı karşıyayızdır. Bu nedenle her iki tutsak için de bu alt oyunun seçimidir. dengesi, işbirliği yapmamak stratejilerinin 193 Şimdi de (T) T-1 dönemini dikkate alalım. Tutsaklar son dönemde işbirliğine girmeyeceklerinden, T-1 dönemi için de işbirliğine gitmemek davranışı tek dengedir. Bu süreci geriye doğru tümevarım dinamik oyunun tekniğiyle alt-oyun götürürsek, tam Nash tüm dönemlerde dengesinin yapmamak stratejisi olduğunu söyleyebiliriz. işbirliği 194 Teorem 4: G, T kere yinelenen bir statik oyun olsun. G tek Nash dengesine sahipse, tek alt-oyun tam Nash dengesi, tüm dönemlerinde G ’nin bu statik denge stratejisini oynamaktır. T 195 Eğer yinelenen oyunun zaman ufku sınırsızsa, gelecekte oluşacak kazançların bugünkü değerine indirgenmesi gerekir. Sınırsız zaman ufkunda yinelemeli bir oyunda bir oyuncunun kazancı, her bir dönemde elde edilen kazançların toplamının bugünkü değeridir. 196 Oyuncunun oranına da t döneminde elde ettiği kazanca Πt ve indirgeme δ diyelim. Buna göre bugünkü değer: ∞ V = ∑ δ Πt t =0 t , 1 δ= <1 1+ r 197 Sınırsız zaman ufkuna sahip bir oyunda son dönem belirli olmadığından, denge değerine geriye doğru tümevarım yoluyla ulaşamayız. Bunun yerine, şimdi tanımlayacağımız farklı bir yöntem kullanırız. Bu yöntemde stratejiyi, her bir yaptıklarının özeti olarak tanımlayabiliriz. Yani t döneminde t dönemindeki durum, oyuncunun tüm geçmiş davranışlarını göstermektedir. 198 Ancak dengenin bu şekildeki aranışı bizi sonsuz sayıda dengeye götürebilir. Bu türden sorunlardan uzak kalmak için genellikle belirli bir sonuca odaklanırız. Örneğin Pareto optimal sonuca göre, herkesin kazancını aynı anda artıramayız. Tutsaklar açmazı oyunu açısından bakarsak bu, tutsakların işbirliğine girmesi demektir. her bir dönemde 199 İlk olarak iki oyunculu bir pazarlık modelini inceleyelim. Örneğin firmalar ile sendikalar arasındaki ücret pazarlık süreci. Önce ister al ister alma biçiminde bir sürece bakalım. Ardından, bir anlaşmaya ulaşıncaya kadar kıyasıya bir pazarlığı ele alalım. İkinci uygulama olarak dış ticaret teorisi çerçevesinde iki aşamalı bir oyuna bakıyoruz. Üçüncü uygulamamız, önce birinci firmanın ve ardından ikincinin karar aldığı bir duopol piyasada liderlik konusu inceleniyor. Son olarak statik oligopol teori, yinelemeli oyun olarak ele alınıyor. 200 Dizimsel Pazarlık Modeli Bu oyunda oyuncular, vermektedirler. Ortak önerilerini bir girişim zaman içinde yapacak olan peşi iki sıra firma düşünelim. Her bir firma teknolojisi ya da uzmanlığıyla bu girişime katılabilir ve girişimin başarısında etkili olabilir. Girişimin belirli bir kâr sağladığını ve bunu firmaların bildiğini varsayalım. Firmalar açısından sorun, bu kârın nasıl paylaşılacağıdır. Firmalar paylaşımda anlaşabilirlerse, girişim gerçekleşir, aksi halde iptal edilir. 201 Pazarlık modelinin ilk dönemini ele alalım. x ve y oyuncularının bir liralık bir kazancı pazarlık yoluyla nasıl paylaşacaklarına bakalım. t0 anında x ’in s0 kadar bir pay alma önerisinde bulunduğunu varsayalım. Buna göre y, 1-s0 kadar pay alacaktır. bu öneriyi kabul ederse, bu kazanç paylaşımı y üzerinde anlaşırlar. Reddederse, anlaşma olmaz ve oyun t1 döneminde yeniden başlar. Ancak t1 dönemindeki kazancın, indirgenmesi gerekir. Bu, anlaşma geciktikçe, taraflara bir yük gelmesi demektir. 202 Şekil 18, bu oyunu göstermektedir. A, önerinin kabulünü, R reddini ifade etmektedir. Oyunu çözmek için geriye doğru tümevarım yöntemini kullanalım. Son karar noktasında oyuncu y, x’in önerisini kabul ederse 1-s0 , reddederse δΠy kadar (indirgenmiş) kazanç elde eder. Eğer, 1 − s0 ≥ δΠ y olursa, oyuncu → s0 ≤ 1 − δΠ y y öneriyi kabul edecektir. 203 Şekil 18. Bir Dönemlik Pazarlık Modelinin Oyun Ağacı x Q s0 y Q R δΠ x , δΠ y Q A Q s0 ,1 − s0 204 Şekil 19, oyuncu y ’nin seçim kuralına göre budanmış olan oyun ağacını göstermektedir. Oyuncu x kendisi için s0 > 1 − δΠ y payını isterse, önerisi reddedilmektedir. edilmektedir. durumu kabul x kabul edilecek bir öneri götürürse, x açısından s0 = 1 − δΠ y optimal öneri dengesidir ve s0 ≤ 1 − δΠ y ‘dir. Bu nedenle, bu öneri oyunun x ile y sırasıyla, 1 − δΠ y , δΠ y kazançlarını etmektedirler. elde 205 Şekil 19. Bir Dönemlik Pazarlık Modelinin Budanmış Oyun Ağacı x Q s0 = 1 − δΠ y yQ s0 > 1 − δΠ y Q A y R Q 1 − δΠ y , δΠ y Q δΠ x , δΠ y 206 Şimdi bir uç durum dikkate alalım. Eğer tüm kazancı alır: s0 = 1 . Bu durum, Π x = Π y = 0 olursa, x y çok zayıf bir pazarlık gücüne sahipse gerçekleşir. Diğer uç durum, bugünkü değer ( δΠ y ) ölçüsünde, Π x = Π y = 1 ‘dir. y x bugünkü değerden daha büyük bir kazanç elde eder: s0 = 1 − δΠ y = 1 − δ(1 − Π x ) = (1 − δ ) + δΠ x > δΠ x 207 İki Dönemli (İki Önerili) Bir Pazarlık Modeli Bu modelde bulunduğunu oyuncuların varsayıyoruz. öneriler Peşi yapabilme sıra fırsatlarının oluşacak hareketler şöyledir: 1. x, s0 kadar bir öneri yapar. 2. y bunu kabul ederse oyun biter, reddederse oyun sürer. 3. y , s0 önerisini reddederse, x ’e s1 önerisini götürür. 208 4. x , y ’nin karşı önerisini kabul ya da reddeder. 5. x karşı öneriyi reddederse, x’in s , y’nin de 1-s kadar bir dışsal pay aldıkları bir paylaşımla oyun biter. 209 5. aşamada kazancın zaman içinde azalmadığı varsayılmıştır. Ancak ödemelerin bugünkü değeri azalacaktır. Bu oyunun ağacı, Şekil 20’dedir. Çözüm geriye doğru tümevarım yöntemiyle yapılmaktadır. Son karar noktasında x , s1 ≥ δs gibi bir öneriyi kabul eder. gereğinden fazla bir miktar önermeyeceğinden, s1 = δs y, önerisi olarak gerçekleşir. Şekil 20, son iki kararı çözdükten sonra çizilmiştir. Bir sonraki aşamada, görmeyeceğine bakıyoruz. s0 önerisinin kabul görüp Şekil 20. İki Dönemlik Pazarlık Modelinin Oyun Ağacı x Q s0 yQ R yQ s1 xQ R Q δ 2 s , δ 2 (1 − s) A A Q s0 ,1 − s0 Q δs1 , δ(1 − s1 ) 210 211 Şu koşullar gerçekleşirse, y, (1-s0) önerisini kabul eder: 1 − s0 ≥ δ ( 1 − δs ) → s0 ≤ 1 − δ + δ s 2 s0 ’ın maksimum değeri (δ2s), x ’in başlangıç önerisinden gelen kazancını aşar. Denge, lırsa ve bu x tarafından s0* = 1 − δ + δ 2 s önerisi yapı- y tarafından kabul edilirse gerçekleşir. x ve y ’nin kazançları da sırasıyla şöyledir: 1 − δ + δ2 s , δ + δ2 s 212 s= 1 2 fazla, ise, pazarlık sürecinin denge sonucuna göre x yarıdan y yarıdan az kazanç elde eder: s0* ≥ 1 − s0* 1 − δ + δ2 s ≥ δ + δ2 s → 1 − δ + 12 δ 2 ≥ δ + 12 δ 2 1 − 2δ + δ ≥ 0 2 Son aşamada dışsal paylaşım eşit olsa da, kazançlar bugünkü değere indirgendiğinde, olacaktır. x daha yüksek bir kazanca sahip 213 Dinamik pazarlık modelindeki son örnek modelimiz, oyuncuların bir anlaşmaya varılıncaya kadar birbirine sürekli öneriler getirdiği bir durumdur. Öneri sayısında herhangi bir sınır yoktur; oyun bir sınırsızlığa sahip olabilir. Ancak ilk öneri kabul edilirse, oyun başlar başlamaz sona erer. Şekil 21, iki dönemli bir pazarlık sürecini, son aşamadaki kazanç noktaları çıkarılmış biçimiyle sunmaktadır. Oyunun bu kısmına G diyelim. Sınırsız bir yinelemeli oyunda, sonsuz sayıda yineleme peşi sıra gelir: G(∞). 214 Şekil 21. Yinelenen Pazarlık Oyununun Bir Aşaması x Q s0 y R yQ s1 xQ Q R Q A A Q s0 ,1 − s0 Q δs1 , δ(1 − s1 ) 215 Çözüm yöntemi olarak geriye doğru tümevarımı kullanamayız. Bu nedenle, oyunu ilk ele alış biçimimizdeki gibi, s ve 1-s oyuncuların dengedeki kazancını göstersin. Şimdi ikinci biçime gidelim ve oyuncuların peşi sıra öneriler yaptığını varsayalım. Eğer bir anlaşmaya sürdürürler. Kazançları varamazlarsa, s ve 1-s olur. Ancak diğer yandan iki dönemli pazarlık modelinde sırasıyla 1 − δ + δ 2 s ve G(∞) sürecinde oyunu x ve y’nin denge kazançlarını δ + δ 2 s olarak elde etmiştik. 216 Aynı modelde görünürdeki bu iki farklı sonuç sıkıntısından kurtulmak için şunu kullanalım: ’nin s = f ( s ) ya da G(∞) oyunu ile G G(∞) oyununu izlemesi özdeş oyunlardır. Buna göre, her iki sonucun da kazançları aynıdır, matematiksel olarak çözelim: Bu denklemi, s* için 217 s = f ( s) = 1 − δ + δ2 s 1− δ s= 2 1− δ Bu sonuca göre, → → 2 1 − δ ( ) s = 1− δ 1 s = 1+ δ * x ’in önerdiği ve y ’nin kabul ettiği s* yinelemeli oyunun dengesidir. Sınırsız bir yineleme söz konusu olsa da, ilk önerinin avantajı devam edecektir. Göreli kazançlar, indirgeme oranına bağlıdır. 218 İndirgeme kazancından oranı 1’den yüksektir. küçükken, İki öneri x ’in kazancı arasındaki zaman küçüldükçe faiz oranı sıfıra, indirgeme oranı da y ’nin dilimi 1’e yaklaşır. Dolayısıyla her iki oyuncunun kazançları eşitlenme eğilimine girer. 219 Yukarıda ele aldığımız pazarlık modeli, tümel bilgi varsayımı üzerine kuruludur. Yani oyuncular birbirlerinin kazanç fonksiyonlarını bilmektedirler. Ancak gerçek dünyada genellikle bu bilgiler ya eksiktir ya da asimetriktir (bakışımsız). Örneğin bir firma ile işçi sendikası arasındaki ücret pazarlığı sürecinde firma, gelecek dönemdeki talep ve kârlar konusunda daha çok bilgiye sahip olabilir. Dolayısıyla firma daha iyi bir pazarlık gücü yakalayabilir. 220 Dış Ticaret Politikası ve Oligopol Burada oligopol piyasadaki ihracat desteğini, iki aşamalı bir oyun çerçevesinde ele almaktayız. Birinci aşamada hükümet dış ticaret politikasını oluşturmakta, ikinci aşamada firmalar yapacakları ihracata karar vermektedirler. Oyunu geriye dönük tümevarımla çözüyoruz. Bu model için aşağıdaki varsayımları yapıyoruz. 221 1. Üç ülke vardır: 2. X, Y ve Z. X ve Y ülkelerinde, homojen mal üreten birer firma vardır (x ve y firmaları). Z ülkesinde üretim yoktur. 3. Her bir firmanın toplam maliyet fonksiyonu: TC i = ci qi , i = x, y . 222 4. X ve Y ülkelerinde mal tüketimi yoktur. Tüm üretim Z ’ye ihraç edilmektedir. P = a−Q , Q = qx + q y 5. Z ’deki talep fonksiyonu: 6. X ve Y ülkeleri, birim ürün başına ihracat desteği (sx ve sy) uygulamaktadır. uygulamaktadır. Z ülkesi tamamen serbest dış ticaret 223 Yukarıdaki varsayımlara göre x ve y firmalarının kâr fonksiyonlarını şöyle yazabiliriz: ( ) ( ) Π x = Pq x − c x q x + s x q x = a − q x − q y q x − c x q x + s x q x Π y = Pq y − c y q y + s y q y = a − q x − q y q y − c y q y + s y q y 224 Birinci sıra koşullar: ∂Π x = a − 2q x − q y − c x + s x = 0 ∂q x ∂Π y ∂q y = a − 2q y − q x − c y + s y = 0 225 Birinci sıra koşulları çözelim: q = * x q = * y a − 2c x + 2 s x + c y − s y 3 a − 2c y + 2 s y + c x − s x 3 Q =q +q = * * x * y P = a−Q = * * 2a − c x − c y + s x + s y 3 a + cx + c y − sx − s y 3 226 Bu çözümler, firmalar için ikinci aşamadaki dengelerdir. Birinci aşamada ülke hükümetleri, iktisadi refah düzeyini maksimize edebilmek için dış ticaret politikasını belirlemektedirler. Her bir ülkenin mal ihracatından elde ettiği özel kazanç, firma kârlarıdır. Tüm ülkedeki net refah artışını ise, toplam kâr düzeyinden toplam ihracat desteğini düşerek buluruz. 227 X ve Y ülkelerinin iktisadi refah fonksiyonları: Wx = Π x − sx qx = ( P − cx + sx ) qx − sx qx = ( P − cx ) qx ( ) ( ) W y = Π y − s yqy = P − c y + s y qy − s yqy = P − c y qy 228 İkinci aşamada elde ettiğimiz optimal değerleri, bu refah fonksiyonlarındaki tümüyle yerlerine parametrelere ve yazarak, refah fonksiyonlarını dış ticaret politikalarına bağlayabiliriz: ⎛ a − 2c x + c y − s x − s y ⎞ ⎛ a − 2c x + 2 s x + c y − s y ⎞ Wx = ⎜ ⎟⎜ ⎟ 3 3 ⎝ ⎠⎝ ⎠ ⎛ a − 2c y + c x − s y − s x ⎞ ⎛ a − 2c y + 2 s y + c x − s x ⎞ Wy = ⎜ ⎟⎜ ⎟ 3 3 ⎝ ⎠⎝ ⎠ 229 Her bir ülke, refah düzeyini maksimize edecek olan dış ticaret politikasını seçecektir. ∂W x = a − 2c x + c y − 4 s x − s y = 0 ∂s x ∂W y ∂s y s = * x = a − 2c y + c x − 4 s y − s x = 0 a − 3c x + 2 c y 5 , s = * y a − 3c y + 2 c x 5 230 Bu sonuçtan ilk olarak şunu çıkarabiliriz: Her iki ülke pozitif miktarda ihracat yaparsa, destekleme oranları da pozitif olacaktır. Bunu görebilmek için, yukarıdaki değerleri, ikinci aşamadaki üretim miktarlarının yerlerine yazmalıyız. 231 Her iki ülkenin üretim maliyetleri aynıysa, pozitif denge destek değeri, dış ticaret politikası seçiminde tutsaklar açmazı durumunu yansıtır. İhracat desteği olmazsa, her bir firma toplam piyasayı eşit paylaşırlar ve pozitif bir kâr elde ederler. 232 Ancak her iki ülke destek politikası uygularsa, firmalar yine piyasayı eşit paylaşırlar ve daha yüksek kârlar elde ederler. Ancak fiyatların düşmesi sonucu, sübvansiyon maliyeti kâr artışını aşacağından, ihracatçı ülke refah kaybına uğrar. Tek kazançlı, Z ülkesidir.