本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 }9 e! s5 d3 k2 }& A
, j! O" C5 e) O8 e) q: k! v% |) g
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& ?7 F F) p8 r& p; f 以下三个定义:
; G" |! u K' x! N6 q7 B5 ^: N 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 7 }& }% t t! f( ~0 P
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% C2 c# R" \2 O1 B 所谓的双方优势策略则是指双方利益总和最大的策略。 / O3 C# y! ]& A3 ^# Y1 A& B
[编辑本段]严格优势策略举例分析" y/ X6 t" T) t* b) g) A
一、经典的囚徒困境
/ _6 x: ]7 R* i9 ?, h0 ~ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , w8 n# x% i0 `# X/ \' k
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
S; a# X8 @: ]' o e/ h 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
. T* J& O% d. f0 ], L V! d1 I+ w 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 7 {) e, p% {; ?% ^9 _, Z7 K
若二人都互相检举(互相“背叛”),则二人同样判监2年。( ]- ]. d# b8 I8 w/ J4 o. I: p
4 h' e' J9 m. J& {9 @用表格概述如下:
2 k& J# q2 B$ P/ D0 O0 _0 t( X
* n0 B: {; s+ ` 甲沉默(合作) 甲认罪(背叛)
1 O0 _. q ?& W- i+ q4 ]5 H乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 : E# H' b Y* G) [ _3 @
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
' n8 b2 J1 F1 K' u: I3 a
& O: o" m' l2 s6 Z0 i 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 n W3 a/ K9 N8 c8 k6 s 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 i ]! Z+ N) C
若对方沉默、背叛会让我获释,所以会选择背叛。 * J* S7 v' W: `1 E! Q. n
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " z* x) z! S6 F; f9 ]! w
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 \8 m# ]5 t6 C; G1 ~
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
S- s" v! W1 o r7 _4 n! Z8 C, i+ u 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。3 C7 I7 V) d* E. m6 p& Z- n
[编辑本段]二、智猪博弈理论% g) Z( v, y3 o# K* s
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
. k/ ?" I5 N- S8 \( B: K 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
0 L7 j' Q6 n1 @ I* E4 I6 H, { 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 _& V7 J2 x7 g7 o: n1 y7 ` 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 P! w' q8 ^$ D1 I2 Q5 I; ^
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + s# y7 V) r6 ^
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 # f. Y9 j- I$ W) _
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。5 M7 o) R$ y, Z
3 J6 e; }- r X8 K. M2 @+ z三、关于企业价格策略& [ d0 Z3 K# U
5 x2 p; {9 D4 c' p9 q * s" k8 v# B( e+ }1 W, L
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
' } K( s& e1 d5 e+ @: t/ D2 u h+ F 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) j' V' S1 V/ {7 i# d
以下三个定义:
2 X- S( y- \2 Y; W3 A. N" b/ q 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 , F) R- r; J) `; B* t. m, z) Q& K+ \
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
2 x6 v( k* \* z9 R, @3 x \ 所谓的双方优势策略则是指双方利益总和最大的策略。
# h- R$ V3 r" e% O[编辑本段]严格优势策略举例分析/ Q/ E+ }% _- I9 S7 @& z( F, J
一、经典的囚徒困境
0 ]/ ^& L; O# g' z& c+ K/ s8 | 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
3 T0 O* k7 ^- \, U! ~ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: / }0 D; ~& M- y3 S
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 8 z B1 q* O" Y! D b6 ]9 U3 Z
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) [; C/ v" I$ Z
若二人都互相检举(互相“背叛”),则二人同样判监2年。
; J; d4 s( Z5 @" ~7 J) Z9 Y - ~6 U' X) F) _2 M4 V
用表格概述如下:2 V+ o' t4 L: l% E
. K+ X( b) t; J. [) S
甲沉默(合作) 甲认罪(背叛) ; e9 Z: p5 l. Q8 f; a
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
. Z: o5 _/ u$ n/ ?4 \乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 # n: Q5 @9 x, _& q( p
6 v: u6 z/ e9 a3 Z- Z' j7 P: D
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! b" E! `# H' R7 f6 R, }$ P$ r
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' I' j# d; j& |' b
若对方沉默、背叛会让我获释,所以会选择背叛。 ; p! m) ?5 j' B1 a; j C
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; n, U- n- u! Q- e$ g9 @7 K
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
i) ?1 ^5 R5 Q: ^, N$ F, x 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* ?9 w8 ^( C0 ~+ G/ R+ U 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ { }/ D A3 ~. _# `" _4 b[编辑本段]二、智猪博弈理论* U g7 Q. Y. G& l R V& Q
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
1 H! ?$ d4 R3 ]2 N5 @ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 / L8 z. G Q: ?$ {; X$ @
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
- p+ O- h0 v6 j8 |( N/ K 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ _5 \& P" S+ s1 n w4 s( `9 }* T
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 3 X: g7 M" e# Z- Q3 b) w* m6 J
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 8 [& ]9 W; @% i& j6 f9 q) k
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。8 d! R- _+ V5 q; I) x
V6 T0 e! {6 {3 L
三、关于企业价格策略7 y, }- [& X: m0 e
) m7 K/ y6 [. f- j o& ~8 g2 Z
$ A; T' p3 p0 G2 q* p 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( A3 a! `$ L4 c3 H$ w! b+ Y, \
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% T( a- V* y5 b 以下三个定义:. b y4 g0 B% I* U& p$ z
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( ^4 ?$ ~" m1 v* }! y% Q% @2 f 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 3 Z: U5 o3 c8 h. w K! _. E$ Q
所谓的双方优势策略则是指双方利益总和最大的策略。 ) v% M+ O0 K6 I6 w! R& o: P7 I( J
[编辑本段]严格优势策略举例分析! W/ p2 M% o2 ^% c( N
一、经典的囚徒困境
, K7 s |2 l8 o3 ]. F" K: h& H 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 i+ J, p3 w: q9 P4 W' f
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 i* A1 _ e/ }0 z5 @0 s. _' I. I 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 g N- D$ n _( J) ]: p 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
5 ]* V4 A4 p# a/ S |' W* i 若二人都互相检举(互相“背叛”),则二人同样判监2年。
) H. x3 L( `& p- {# ~0 E 9 S/ B" o( `+ N! P' c; m& y
用表格概述如下:
6 V% @9 k7 k/ Z/ x$ q* S/ Q; _8 F; R' _) z* }2 Z4 R
甲沉默(合作) 甲认罪(背叛)
2 u8 I t5 \- ]4 D; U乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 1 C4 s) z8 i5 M+ z Y
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
, r# i" C$ y6 }# Z. {' T+ S2 S
& {. `7 Z" ?, ~, u; c/ @9 P 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
6 ^2 [* [7 W/ e' j8 W( F 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 c( G _2 t K# [! Q8 G 若对方沉默、背叛会让我获释,所以会选择背叛。 ; I8 S# j4 C/ E
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 K1 |$ X+ D. n* X 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
/ J2 @4 _& Z3 | 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 # f c2 m6 ?$ e0 T: \& H1 w
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
, f& H, O. \6 b3 j( g0 {7 ]8 B[编辑本段]二、智猪博弈理论
+ p! m/ H0 B( L3 Q9 @ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% X3 ]3 }0 d4 Q8 Q 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! y0 ]% \* G4 W, x2 H7 ` 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 + t6 K ~* {$ R4 \! D" U! s8 @
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! N" Q# Y/ G8 U
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 6 L0 i, P+ z; m& B) f+ p
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 z0 }2 Q, }9 C! J/ G$ F; y 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。$ [+ o5 `) A$ o/ H7 q' ~
, [/ h% _# H, s* e( a三、关于企业价格策略
) p' W1 N& \) d2 E3 o: @0 v2 p6 v1 P% R* X
- ]# |; ]: @4 L C 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; H1 b. X8 r$ D0 v' G4 K0 q. N 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 |9 M" A) A& O1 l 以下三个定义:, }' [- E# L, E! l0 t- M
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' W6 S- _8 l/ H
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( C- Q! _. |& j" |' Z/ d5 i, q; ^ 所谓的双方优势策略则是指双方利益总和最大的策略。
5 s0 W/ G8 z# t o, r/ j[编辑本段]严格优势策略举例分析
3 P* r% l; l& c* U 一、经典的囚徒困境
9 H& v/ L: x) W0 U' L8 ^6 d 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 3 J- G' Y6 P5 e+ Z! d; K- X4 R% j7 a
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 6 \- y$ J, q! c5 L
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 H* b5 q! h/ ~9 M5 r( p
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* a7 h" Y: R& { 若二人都互相检举(互相“背叛”),则二人同样判监2年。& I. M) @, m* [, K! u Q; c
7 f9 e' n/ ^2 [2 h: B L4 z用表格概述如下:: i4 S q o0 K
, p6 d# z9 I& L) N 甲沉默(合作) 甲认罪(背叛) 1 m4 K7 t7 ~6 _! p. K" y
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
9 m7 {5 C1 H0 ^0 E( {乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 - G6 s5 ?+ j, M; [6 o) O
3 F7 [* U' m4 G# P& g0 ~( l! d
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
' D% g* [4 [ p9 \) E6 o 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 b* K& e( X% j( V
若对方沉默、背叛会让我获释,所以会选择背叛。
) M" y- h6 o6 v8 h9 E9 g5 Z7 s+ u/ ] 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 0 n# u B+ R- K" N
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 + ~6 A' [% `: A/ K& ~
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 & H0 J" S8 f1 R" l0 s; @
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* [) W. i) e7 H+ m- z. @, {3 F* L
[编辑本段]二、智猪博弈理论& l* Y# E/ t$ U! Y9 T0 x" f+ c
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 % N s0 ?7 r7 R6 ~' A. n
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 6 {2 T. ^1 B: e+ g# e. K# O
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " u* o8 P* b, _& o; V& A# p7 s
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 |) y* i {* l
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
: H9 l% I0 s3 z/ h B# D 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
, Q- r+ \( n2 ^, Q1 b4 [ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。+ O5 B! z' x+ L0 V+ r
- G1 y3 J+ \8 D8 ~6 E
三、关于企业价格策略
# @6 h+ H1 I' c5 L
7 c7 c" D/ V& e: n 5 d9 O: L; U l! ]
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 4 i; m$ t- W; ]5 H& D1 h( S B
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |