14.12 Oyun Teorisi

advertisement
14.12 Oyun Teorisi
Muhamet Yıldız
Güz 2005
Ders 16: Eksik Bilgi Statik Durum
Yol haritası
1. Bayesyen nash Dengesi
2. Örnekler
3. Cournot Duopolü
4. Ufak sınav
5. Karma stratejiler
1
Bayesyen Oyun (Normal Biçim)
Bayesian Game (Normal Form)
Bir Bayesyen oyun,
A Bayesian game is a list
G = {A1,…,An;T1,…,Tn;p1,…,pn;u1,…,un}
where
action
• A
şeklinde bir
listedir,
ki,space of i (ai in Ai)
i is the öyle
• Ti is the type space of i (ti)
pi(teylem
beliefaiabout
• Ai , i• için
kümesi
∈ Ai the other players
-i|ti) is i’s
• ui(a1,…,an;t1,…,tn) is i’s payoff.
• Ti , i için tip kümesi ti
• pi (t−i |ti ), i’nin diğer oyuncular hakkındaki inanışları
• ui (a1 , .., an ; t1 , ..tn ), i’nin kazancı
An Example
Firm
W
Work
(1, 2)
Hire
Shirk
High p
(0, 1)
Do not (0, 0)
hire
Nature
Low 1-p
Hire
W
Work
Shirk
Do not
hire
TFirm={tf};
TW = {High,Low}
AFirm = {Hire, Don’t}
AW = {Work,Shirk}
pF(High) = p
pF(Low) = 1-p
(1, 1)
(-1, 2)
(0, 0)
2
2
Bir Örnek
1,2
calis
I
Firma
Ise al
calisma
yuksek
p
0,1
Ise alma
0,0
Doga
I
1-p
calis
1,1
Ise al
dusuk
calisma
-1,2
Ise alma
0,0
Bir oyuncunun özel bilgisine, o oyuncunun ”tip”i deniyor. Mesela, yukarıdaki örnekte,
işçinin iki tipi
var: =Yüksek
Tf irma
{tf } ve Düşük. Firmanın özel bilgisi olmadığından, firmanın tek
bir tipi vardır. Yukarıdaki örnekte olduğu gibi, eksik bilgli oyunlar, Doğa’nın her bir
Tisci =seçtiği
{Y uksek,
Dusuk}özel olarak bilgilendirdiği kusurlu bilgili oyunlarla
oyuncunun tipini
ve oyuncuları
modellenmiştir.
Bu=tip
oyunlar
eksik bilgili oyunlar ya da Bayezyen oyunlar olarak adAf irma
{Iseal,
Isealma}
landırılırlar.
Ai = {Calis,
Calisma}
Formel olarak,
eksik bilgili
statik bir oyun şöyledir. Ilk olarak, Doğa bir t = (t1 , t2 , . . . , tn ) ∈
T seçer, öylepFki,
her t ∈ T
(yuksek)
= p(t)
p olasıliğıyla seçilir. Burada, ti ∈ Ti oyuncu i’nin, i ∈ N =
1, 2, ..., n, tipidir. Sonra, her oyuncu kendi tipini öğrenir, ama diğer oyuncuların tiplerini
p (dusuk) = 1 − p
F
öğrenmez. Son
olarak, oyuncular, sadece kendi tiplerini bilerek, eylemlerini eşzamanlı
olarak seçerler. Tüm oyuncuların eylemlerinin herhangi bir listesini a = (a1 , a2 , . . . , a2 ) ∈
A ile ifade ediyoruz, öyle ki, ai ∈ Ai oyuncu i’nin eylemidir. Oyun (N, T, A, p) ile gösterilir.
Her zamanki gibi, bir oyuncunun stratejisi her bilgi kümesinde hangi eylemi seçeceğini
belirler. Burada, bilgi kümeleri tiplere, ti ∈ Ti , denk gelir. Dolayısıyla, oyuncu i’nin bir
stratejisi si : Ti → Ai şeklinde, oyuncunun tiplerini eylemlerine atayan bir fonksiyondur.
Mesela, yukarıdaki örnekte, işçinin dört stratejisi vardır: (Çalış,Çalış) - yüksek veya düşük
kabiliyetli olmasından bağımsız olarak çalışacağı anlamına gelir, (Çalış, Kaytar) - yüksek
kabiliyetli ise çalışacağıve düßük kabiliyetli ise kaytaracağı anlamına gelir, (Kaytar, Çalış)
ve(Kaytar, Kaytar).
3
2
Bayesyen Nash Dengesi
Bir Bayesyen Nash Dengesi Bayesyen bir oyunun Nash denge-
Bayesian
Nash equilibrium
Bayesian Game (Normal Form)
sidir.
Verili bir Bayesyen oyun için
A Bayesian
Nash equilibrium
A Bayesian
game is a list is a Nash equilibrium of
a Bayesian
game.
G = {A
1,…,An;T1,…,Tn;p1,…,pn;u1,…,un}
Given anywhere
Bayesian game G =
için
bir strateji
sii):}Ti → Ai fonksiythe
action
spaceherhangi
of i (ai bir
in A
• Ai nis;T
,…,A
{Ai1oyuncusu
1,…,Tn;p1,…,pn;u1,…,u
n
is a
theplayer
type space
onudur;• Tiof
i) function s :T o A ;
a strategy
i in aofisi (tany
i i
i
∗
∗
∗
•
p
(t
|t
)
is
i’s
belief
about
the
other
players
* Bayesyen Nash deni profile
-i vektörü
i
Bir strateji
..., sns) bir
A strategy
s*s==(s(s1*1,,…,
1 ) is a Bayesian Nash
) is i’s payoff.
• ui(a1,…,an;t1*,…,t
gesidir
ancak ve ancak
alttaki
problemi
çözer to s-i* for
equilibrium
iff si s(t∗i (ti)i)nis
a best
response
each ti, i.e., si*(ti) solves
max ¦ u s t ,..., s t , a , s t ,..., s t ; t p t
ai Ai
ti Ti
i
*
1
*
i1
1
i1
i
*
i1
*
n
i1
n
i
i
| ti An Example
Work
W
Firm
Hire
Shirk
High p
Low 1-p
Firm
(0, 1)
Hire
W
Hire
Work
Work
W
Shirk
Do not
hire
Shirk
(0, 0)
(1, 1)2)
(1,
(-1, 2)
(0, 1)
Do not (0, 0)
hire
Nature
Low 1-p
TFirm={tf};
TW = {High,Low}
AFirm = {Hire, Don’t}
AW = {Work,Shirk}
pF(High) = p
pF(Low) = 1-p
An Example
Do not (0, 0)
hire
Nature
High p
(1, 2)
Hire
W
Work
Do not
hire
(1, 1)
4
Shirk
(0, 0)
TFirm={tf};
TW = {High,Low}
AFirm = {Hire, Don’t}
AW = {Work,Shirk}
pF(High) = p >1/2
pF(Low) = 1-p
(-1, 2)
sF* = Hire
sW* (High) = Work
sW* (Low) = Shirk
Another equilibrium?
2
Bir Örnek
1,2
calis
I
Firma
Ise al
calisma
yuksek
p
0,1
Ise alma
0,0
Doga
I
1-p
calis
1,1
Ise al
dusuk
calisma
-1,2
Ise alma
0,0
Bir oyuncunun özel bilgisine, o oyuncunun ”tip”i deniyor. Mesela, yukarıdaki örnekte,
işçinin iki tipi
var: =Yüksek
Tf irma
{tf } ve Düşük. Firmanın özel bilgisi olmadığından, firmanın tek
bir tipi vardır. Yukarıdaki örnekte olduğu gibi, eksik bilgli oyunlar, Doğa’nın her bir
Tisci =seçtiği
{Y uksek,
Dusuk}özel olarak bilgilendirdiği kusurlu bilgili oyunlarla
oyuncunun tipini
ve oyuncuları
modellenmiştir.
Bu=tip
oyunlar
eksik bilgili oyunlar ya da Bayezyen oyunlar olarak adAf irma
{Iseal,
Isealma}
landırılırlar.
Ai = {Calis,
Calisma}
Formel olarak,
eksik bilgili
statik bir oyun şöyledir. Ilk olarak, Doğa bir t = (t1 , t2 , . . . , tn ) ∈
T seçer, öylepFki,
her t ∈ T
seçilir. Burada, ti ∈ Ti oyuncu i’nin, i ∈ N =
(yuksek)
= p(t)
p > olasıliğıyla
1/2
1, 2, ..., n, tipidir. Sonra, her oyuncu kendi tipini öğrenir, ama diğer oyuncuların tiplerini
p (dusuk) = 1 − p
F
öğrenmez. Son
olarak, oyuncular, sadece kendi tiplerini bilerek, eylemlerini eşzamanlı
olarak seçerler.
Tümal
oyuncuların eylemlerinin herhangi bir listesini a = (a1 , a2 , . . . , a2 ) ∈
s∗F =Işe
A ile ifade ediyoruz,
öyle ki, ai ∈ Ai oyuncu i’nin eylemidir. Oyun (N, T, A, p) ile gösterilir.
∗
s (yuksek) =Çalış
I
Her zamanki
gibi, bir oyuncunun stratejisi her bilgi kümesinde hangi eylemi seçeceğini
belirler. Burada,
bilgi kümeleri
tiplere, ti ∈ Ti , denk gelir. Dolayısıyla, oyuncu i’nin bir
s∗I (dusuk)
=Çalışma
stratejisi si : Ti → Ai şeklinde, oyuncunun tiplerini eylemlerine atayan bir fonksiyondur.
Başka denge var mı?
Mesela, yukarıdaki örnekte, işçinin dört stratejisi vardır: (Çalış,Çalış) - yüksek veya düşük
kabiliyetli olmasından bağımsız olarak çalışacağı anlamına gelir, (Çalış, Kaytar) - yüksek
kabiliyetli ise çalışacağıve düßük kabiliyetli ise kaytaracağı anlamına gelir, (Kaytar, Çalış)
ve(Kaytar, Kaytar).
5
2
Başka bir Another
Örnek example
• T ^` known by Player 1
• J ^`known by Player 1
X
TJ
• All values are equally likely
Y
J
T
• T1 = {0,2}; T2 = {1,3}
• Bayesian Nash Equilibrium:
• s1(0) = s1(2) = X
• θ ∈ {0, 2}, 1. oyuncu tarafından bilinmektedir
• s2(1) = R; s2(3) = L
L
R
• γ ∈ {1, 3}, 2. oyuncu tarafından bilinmektedir
• Her değer eşit olasılığa sahip
• T1 = {0, 2}, T2 = {1, 3}
Cournot
• Bayesyen Nash dengesi:
•
•
• s2 (1) = R; s2 (3) = L•
•
• s1 (0) = s1 (2) = X
Duopoly with Incomplete Info
N = {1,2} firms;
Price: P = 1- (q1+q2)
Marginal cost of Firm 1 is c=0.
Marginal cost of Firm 2 is
– cH with probability T,
– cL with probability 1-T.
• Firm 2 knows its own marginal cost.
• Strategies: q1; (q2(cH),q2(cL))
4
6
Eksik bilgili Cournot Duopolü
• N = {1, 2} firma;
• Fiyat: P = 1 − (q1 + q2 )
• Firma 1 için marjinal maliyet c=0,
• Firma 2 için marjinal maliyet
– cH , θ olasılıkla
– cL , 1 − θ olasılıkla
• 2. Firma kendi marjinal maliyetini bilmektedir.
• Strategies: q1 ; (q2 (cH ), q2 (cL ))
7
Cournot Duopolü - BND
Cournot Duopoly - BNE
Cournot Duopoly - BNE
•
•
•
•
•
•
• q1 = [T(1-q2(cH)) + (1-T)(1-q2(cL))]/2;
(cH) =2(c
(1-q
)/2
q1• =q2[T(1-q
+ H(1-T)(1-q
H))1-c
2(cL))]/2;
= (1-q
-cL)/2
q2•(cqH2)(c=L)(1-q
1-cH1)/2
q2•(cqL1)*==(1-q
(1 +1-c
TcL)/2
H + (1-T)cL)/3
= H(1-2c
+)/3
(1-T)(cH-cL)/6
q1•* q=2*(c
(1 H+)Tc
+ (1-T)c
H)/3 L
q2H*(c
= (1-2c
- T(cH-c
) =L)(1-2c
+ (1-T)(c
q2•*(c
L)/6
H)/3L)/3
H-c
L)/6
q2*(cL) = (1-2cL)/3 - T(cH-cL)/6
Hunt,
MixedStrateji
Strategy
AvStag
oyunu,
Karma
Stag Hunt, Mixed Strategy
(2,2)
(2,2)
(0,2)
(0,2)
(2,0)
(2,0)
(4,4)
(4,4)
Figures by MIT OCW.
Figures by MIT OCW.
5
5
8
Karma Stratejiler
Mixed Strategies
2+t,2+v
2+t,0
0,2+v
4,4
U1(R|t) = 2+t
U1(S|t) = 4(1-q);
U1(R|t) > U1(S|t) Ù t >0
• t and v are iid with
uniform on >HH@
• t and v are privately
known by 1 and 2,
respectively.
• Pure strategy:
– s1(t) = Rabbit iff t > 0;
– s2(v) = Rabbit iff t>0.
• p = Prob(s1(t)=Rabbit|v)
= Prob(t > 0) = 1/2.
• q = Prob(s2(v)=Rabbit|t)
= 1/2
Figures by MIT OCW.
• t ve v [−, ] üzerine tekdüze dağılıma tabi bağımsız ve aynı
dağılımlıdırlar.
• t ve v, sırasıyla, 1. ve 2. oyuncu tarafından özel olarak bilinmektedirler.
• Saf strateji:
– s1 (t) = Tavşan acak ve ancak t > 0;
– s2 (v) = Tavşan acak ve ancak t > 0;
• p = P rob(s1 (t) = T avsan|v) = P rob(t > 0) = 1/2.
• q = P rob(s2 (v) = T avsan|v) = 1/2.
9
6
Download