執筆:mbaSwitch編集部
「ゲーム理論」は、学問の枠を超えて、実際のビジネス現場でも応用される数学理論です。たとえば、Google社では、ゲーム理論の一つである「オークション」理論の知見が収益に寄与しているといわれています。
耳にしたことのある方も多いであろう「囚人のジレンマ」も、ゲーム理論から生まれた定理です。本記事では、ゲーム理論の基本的な知識や代表例などについて解説します。
「ゲーム理論」は、経済学や経営学、社会学など、多くの分野に影響を及ぼした数学理論です。
ゲーム理論を用いると、「ゲームを行う際、相手の手の打ち方を読み、なるべく自分の得点を高くして、失点を少なくするにはどうすべきか」といった方策を求めることができます。
これまで、経済学では完全競争や独占のみを分析していましたが、ゲーム理論の登場以降は、寡占経済の本格的な分析が可能となりました。
ゲーム理論は、物理学者のフォン・ノイマンが発想したといわれています。ゲーム理論の存在は、フォン・ノイマンと経済学者モルゲンシュテルンの共著『ゲームの理論と経済行動』(1944年刊行)によって世に知られ、多くの学術分野に衝撃を与えました。そして、ゲーム理論から「囚人のジレンマ」などのさまざまな定理が生まれました。
ゲーム理論の研究によってノーベル賞を受賞者した学者は10名以上もいます。有名な人物としては、「ゲーム理論家」として初めてノーベル賞を受賞し、映画『ビューティフル・マインド』のモデルにもなったジョン・ナッシュが挙げられます。
ゲーム理論には、ビジネス現場でも応用できる数多くの定理が存在します。代表的な定理をご紹介します。
ゲーム理論の中でも特に有名な定理です。
「複数の合理的意思決定主体の利得が、それぞれの戦略の相互依存関係によって定まる」というゲーム的な状況を分析するための数理的手法です。
この定理では、「互いに望ましい協力行為がありながら、会話と拘束力の欠如のために互いに望ましくない裏切り行為をとる」という特徴があります。
「囚人のジレンマ」として有名なストーリーを見てみましょう。
───────────────────
2人のギャングが逮捕され、刑務所に拘留されている。
2人は、独房に入れられ、お互いに話したり、メッセージを交換したりすることが絶対できない状態である。
警察は、2人を重罪にするだけの十分な証拠はもっていないと認めている。そのため、それより軽微な罪で、ともに1年の禁固刑に処する意向をもっている。
警察は同時に、2人の囚人に魂を売り渡すような取り引きをもちかける。
それは、「もし相手に不利となる証言をするなら釈放してやろう。ただし、パートナーは本件で3年の禁固刑に処せられる」というものだ。
もちろん、ここには落とし穴がある。
もし、両方が相手に不利となる証言をした場合は、2人とも2年の刑になるというのだ。
───────────────────
一般的に、囚人のジレンマでは利得表を用います。
上記のストーリーに対する利得表は、次のように作成します。
ゲームの設定
まずはゲームの設定を行います。
・プレイヤーは2人で、それぞれを容疑者Aと容疑者Bと呼ぶ。
・2人が選択できる戦略は、いずれも「黙秘」と「自白」。
・このゲームでの利得は、以下のように表す。
釈放された場合の利得:0点
1年の禁固刑に処せられた場合の利得:マイナス1点
2年の禁固刑に処せられた場合の利得:マイナス2点
3年の禁固刑に処せられた場合の利得:マイナス3点
利得表の作成
この設定にもとづくと、以下の利得表として表せます。
以下のように、それぞれの空間を、右上から反時計回りに「第1象限」「第2象限」「第3象限」「第4象限」と呼びます。
容疑者Aの利得から見てきましょう。二人の戦略には「黙秘」と「自白」があります。
もし、容疑者Bが「黙秘」を選択した場合、容疑者Aは「黙秘」をとるべきでしょうか、それとも「自白」をとるべきでしょうか。
もし「黙秘」をとれば、容疑者Aの利得は「-1」です。
一方で「自白」をとれば、利得は「0」です。
よって、相手の容疑者Bが「黙秘」をとる場合、容疑者Aは以下のように「自白」をとるべきだとわかります。
同様に、それぞれのパターンを考えていくと、
・容疑者Bが「黙秘」をとる場合は、容疑者Aは「自白」をとるべき
・容疑者Bが「自白」をとる場合は、容疑者Aも「自白」をとるべき
・容疑者Aが「黙秘」をとる場合は、容疑者Bは「自白」をとるべき
・容疑者Aが「自白」をとる場合は、容疑者Bも「自白」をとるべき
ということわかります。
ここから明らかになったのは、容疑者Aのとる戦略は、容疑者Bがどちらの戦略であっても、「自白」を選択していることです。
ゲーム理論では、このようにある戦略がほかの戦略よりも大きな利得を得るとき、その戦略はほかの戦略を「支配(dominant)」すると表現します。
さらに、その戦略がそのプレイヤーのその他すべての戦略を支配するとき、その戦略を「支配戦略(dominant strategy)」と呼びます。
つまり、「自白」の戦略は、容疑者Aにとっての支配戦略であるといえます。
一方の容疑者Bについても、容疑者Aの戦略がどちらであろうと、「自白」の戦略をとるので、「自白」戦略は、容疑者 B にとっても支配戦略となります。
このように整理していくと、上記の表の第4象限(右下)に示されるように、容疑者Aと容疑者Bの支配戦略の組み合わせによる利得の組み合わせが得られます。
こうした組み合わせは、「ナッシュ均衡(Nash equilibrium)」と呼ばれます。「ナッシュ均衡」とは、「自分1人だけが戦略を変えても得をしない(=すべてのプレイヤーについて成り立っている)状態」のことです。これは、「各プレイヤーの戦略が互いに最適反応になっているのが、ナッシュ均衡である」とも言い換えられます。
つまり、第4象限に示された利得の組み合わせ(-2, -2)は、相手の戦略に対する最適反応の組み合わせになっています。
たとえば、もし容疑者Aだけが戦略を変えたとしても、第1象限(右上)に示された利得のマイナス3へと利得が小さくなってしまいます。また、容疑者Bだけが戦略を変えた場合も、第3象限(左下)に示されているように、利得がマイナス3へと減少します。
このように、第4象限(右下)に示された容疑者Aと容疑者Bの支配戦略の組み合わせによる利得の組み合わせを「ナッシュ均衡」と呼びます。
つまり、「支配戦略均衡ならば、ナッシュ均衡である」といえます。ただし、その逆の「ナッシュ均衡ならば、支配戦略均衡である」とは言えない点がゲーム理論の興味深いところです。
(出典:松谷泰樹『<総括>「囚人のジレンマ」について』MACRO REVIEW,Vol.28,No.1, 13-23, 2016より一部加工して引用)
囚人のジレンマと対比されるのが、「チキンゲーム」です。囚人のジレンマでは、相手の行動に関係なく最適となる行動がありますが、チキンゲームでの最適行動は相手の行動に依存します。
「チキンゲーム」は、アニメや映画などのフィクションで観たことがある方も多いのではないでしょうか。日本では「チキンレース」と呼ばれることもあります。
一般的なチキンゲームでは、別々の車に乗った2人のプレイヤーが、互いの車に向かって一直線に走行し、衝突を避けて先にハンドルを切ったプレイヤーが「チキン(臆病者)」と称され“屈辱”を味わい、負けとなります。
ゲーム理論におけるチキンゲームは、交渉の重要な基本原理として捉えられます。
譲歩する猶予が与えられた各プレイヤーがそれぞれの戦略をとる点、そしてプレイヤーの少なくとも一方が譲歩しない限り、悲劇的な結末は避けられない点が特徴です。
衝突を回避するという“屈辱”は、衝突と比べれば小さなことです。よって、衝突を事前に回避する行動が、合理的な行動だといえます。しかし、相手が回避する戦略しかとらないプレイヤーの場合は、必ずしも回避する必要はなくなります。
チキンゲームの利得表は次の通りです。
「協調」はハンドルを切る選択を、「裏切り」は直進する選択を表しています。ここでは、ゲームの開始前に自分の戦略を決定しなければならず、ゲーム開始直後に相手の行動がわかったとしても、最初に決定した戦略は必ず遂行するというルールがあります。
「コーディネーションゲーム」は、「調整ゲーム」「協調ゲーム」とも呼ばれ、簡単にいうと「他人と同じ行動を選ぶことがよい」とされるゲームです。
確率を用いる混合戦略を除けば、結果となるナッシュ均衡は「全員が同じ行動を選ぶ」になるため、結果の候補が複数ある「複数均衡」に該当します。
コーディネーションゲームのわかりやすい単純な例として、次のようなものがあります。
右側に避けるか左に避けるか
細い道を車などですれ違うとき、右側に避けるか左側に避けるかで、別の方向を選べば衝突してしまいますが、互いに同じ方向を選べば衝突を回避できます。
同窓会への参加
みんなが同窓会に参加するなら自分も参加したほうがよく、みんなが参加しないなら、自分も参加しないほうがよいという考え方になります。
どのSNSサービスでアカウントを作るか?
友人の多くがInstagramを選んでいるならInstagramを、Facebookを選んでいるならFacebookを選ぶのがよいということになります。
ゲーム理論の関連用語にはどんなものがあるのでしょうか? 代表的な用語をご紹介します。
本記事内で、すでに何度か出てきた用語ですが、改めて概要を紹介します。
ナッシュ均衡は、ノーベル経済学賞を受賞したジョン・ナッシュが考案した概念で、「ゲーム理論において最も基本的な均衡概念」だといわれています。「どのプレイヤーも、ほかのプレイヤーがある戦略を選んでいる場合は、同じ戦略を選ぶと一番利得が高くなる(ほかの戦略を選ぶと利得が同じか低くなる)」状態を指します。
ゲーム理論は、「協力ゲーム」「非協力ゲーム」の2つに分けられます。
経済学の中で取り扱われるのは、大半が非協力ゲームです。
非協力ゲームでは、プレイヤーの利得が大きくなるような戦略をとります。そして、それぞれのプレイヤーが選んだ戦略の組み合わせに対して、利得が与えられています。その際、プレイヤーがどのように戦略をとるか明らかにすることが非協力ゲームの特長です。
さきほど解説した「囚人のジレンマ」は、代表的な非協力ゲームです。
一方で、協力ゲームは「特性関数形ゲーム」とも呼ばれ、プレイヤーには選ぶべき「戦略」がなく、「提携」に対する利益だけが与えられます。そして、全体の利益を個人にどう配分するべきかを明らかにすることが協力ゲームの特徴です。
経済学者のヴィルフレド・パレートが提唱した概念です。「資源が無駄なく配分された状態のこと」を指します。「パレート効率性」とも呼ばれます。
ゲーム理論は、これからのビジネス環境を生き抜くための武器となります。
ゲーム理論を学ぶ大きなメリットについて、東京大学大学院の柳川範之教授は「自らの生き方やキャリアを戦略的に決めるツール」になる、「企業戦略でライバルと戦う際、基本的な思考の型を知っていないと戦略を誤りかねない」と述べています。
(参考:ダイヤモンド・オンライン『仕事で使える戦略思考最強の武器「ゲーム理論」は何が凄いのか』2018.7.30)
それでは、どうすればゲーム理論をビジネス現場で生かせるようになるのでしょうか。
一つの選択肢として、MBAを取得する経営大学院で学ぶ方法があります。
ゲーム理論を活用するには、ゲーム理論の知識や手法を学ぶことに加えて、経営者視点でビジネスを考えられる体系的な知識・スキルが重要です。
経営やビジネスを体系的に学ぶには、経営大学院でMBAを取得する方法があります。
しかし、働きながらMBAを取得するのは、時間的に厳しいと感じる方が多いかと思います。
そこで、多忙なビジネスパーソンや海外に住んでいる方、近くに通える経営大学院がない方には、100%オンラインでMBAが取得できる、ビジネス・ブレークスルー大学大学院(BBT大学院)がおすすめです。BBT大学院なら、コロナウイルスの感染が心配な現在の状況下でも、安心して学び続けられます。
BBT大学院では、独自の遠隔教育システム「AirCampus(R)」を活用し、オンライン学習の障壁を乗り越え、メリットの最大化を図る工夫をしています。完全オンラインのため、場所の制約から解放されます。
さらに、講義はオンデマンド式の動画なので時間の制約もなく、好きなタイミングで何度でも理論や知識のインプットができます。
講義動画の視聴だけでなく、教員や教務スタッフ、TA(ティーチング・アシスタント)とのやりとり、学生同士でのディスカッション、履修登録、レポート提出など、学習のことはすべてAirCampus(R)上で行えます。
また、テキストベースのディスカッションを採用しているのもBBT大学院の特長です。
テキストベースであれば、他人の意見を読み、よく考えてから発言できます。多くの大学院では掲げたテーマについて授業時間内に議論を終了させますが、BBT大学院では1テーマに対して議論期間が約1週間あるため、自分のペースでじっくり思考したうえで発言し、深い議論を繰り広げられます。情報収集にも時間をかけられるのでファクトベースの意見を述べることができます。
オンラインでのコミュニケーション全般で求められる、簡潔に書く力もこのディスカッションを通して養われます。クラスメイトとは、こうした深いディスカッションやミーティングを重ねることで密にコミュニケーションがとれます。
学術的なフィールドだけでなく、ビジネスパーソン個人にとっても活用できる「ゲーム理論」について解説しました。そして、ゲーム理論を活用できる人材になる方法として、100%オンラインでMBAが取得できるBBT大学院をご紹介しました。
ほかの経営大学院とBBT大学院との違いは、オンラインか通学制かだけではありません。
BBT大学院では、アカデミックな視点以上にビジネス現場の視点を重視し、問題解決の基本プロセスや論理的思考・データ分析について学び、自分の力で答えが出せるようになることを目指します。
たとえば、BBTのカリキュラムには、過去事例ではなく現在進行形の事例を取り扱い、経営者視点で問題発見・解決力などを向上できる「RTOCS(アールトックス)」という独自のケーススタディがあります。今まさに起こっている事例について、「自分が経営者やトップだとしたら?」という視点で将来を予測し、具体的な戦略を考えます。
RTOCSは、世界的なコンサルタントである大前研一学長の担当科目で実施しています。経営者視点や変化に強い対応力と問題解決力を徹底的に鍛えるために、毎週新しいケーススタディに取り組み、在籍中の2年間で合計100回もの思考訓練を重ねます。
提出締切日には「大前研一LIVE」という世界の1週間のニュースを大前学長が解説する番組が講義映像として配信され、その中で大前学長がお題に対して出した「結論」を発表します。
過去事例ではないため、いわゆる「正解」がひとつ存在するのではなく、大前学長の出した結論が正解というわけでもありません。大前学長がどのようなプロセスで結論を導き出したのか、情報の見方や問題を解く視点などを知り、さらに学びを深めます。
そして、大前学長の結論に加え、クラスメイトが出した結論も自分のものと比較し、どこに違いがあったのかを考え、振り返りの投稿をすることで1つのケーススタディが完了します。
15年以上の月日のなかでオンライン学習の知見を蓄積し、オンラインMBAのパイオニアとして試行錯誤を重ねてきたBBT大学院は、毎年高い受講生満足度と修了率を出しています。
世界中のビジネスで通用する「使えるMBA」を取得したい方は、ぜひBBT大学院へ!
100%オンラインのMBAプログラムで、具体的にどのように学ぶのか、なかなかイメージできない方は、まずは説明会にご参加ください。一人ひとりがその場で疑問や不安点を十分に解消できるよう、少人数制による説明会を定期的に開催しています。
「オンライン説明会」なら、どこでもご参加可能です。参加に必要なものはインターネット環境とPC・スマホのみなので、お気軽にご参加いただけます。