大前研一メソッド 2024年5月7日

だれが生成AIの勝者になるのか

generative ai

大前研一(BBT大学大学院 学長 / BOND大学教授 / 経営コンサルタント)
編集/構成:mbaSwitch編集部

2022年11月にChatGPTが公開されました。そこから生成AIの開発競争が起き、2023年には第4次AIブームが到来しました。生成AIの開発を巡る、ビッグテックによる世界の熾烈な競争をBBT大学院・大前研一学長に聞きました。

舞台はシングルからマルチモーダルの生成AI開発に

2022年に公開されたGPT-3.5は質問応答形式の対話や一般的なテキスト生成の能力を持っていたAIである。それに対して、現在はマルチモーダルの生成AI開発に舞台が移っている。

マルチモーダルAIとは、テキストや画像、音声、動画など複数の種類のデータを一度に処理するAI技術のことである。マルチモーダルAIの「モーダル」という言葉はAIへの入力情報の種類(テキストや画像、音声、動画など)を意味する。

例えばOpenAIが2024年2月に発表したSoraは、プロンプト(AIへの指示や質問)を入力すれば、それに応じた動画を生成してくれる。実際にデモをいくつか見たが、腰が抜けるほどの進化だった。

【資料1】Creating video from text

マルチモーダルAIが普及すれば、まずネット広告業界に天変地異が起きる。これまでEコマースの動画広告は、人気のタレントやインフルエンサーを呼んでセットを組み、手間とお金をかけて撮影していた。

しかし、マルチモーダルAIなら、スタジオでタレントに基本の動きをしてもらうだけ。そこに宇宙空間やジャングルの背景を当てはめてもいいし、生身の人間にはありえないアクロバティックな動きをしてもらうこともできる。

そもそも実在のタレントを使う必要もない。理想の容姿や声についてプロンプトを入力すれば、AIが生成した架空の合成タレントが働いてくれる。

例えば、伊藤園は2023年9月、「お〜いお茶 カテキン緑茶」のテレビCMに生成AIで作成したモデルを起用し、SNSで話題になった。

【資料2】ケイティー (※AIタレント) 伊藤園 お〜いお茶 カテキン緑茶「未来を変えるのは、今!」篇 TVCM (再生時間=14秒)

このCMはさすがに人間のデザイナーが入って微調整しているし、AIが生成したのもモデルのみだ。しかし、マルチモーダルAIを活用すれば、もっと手間なく低予算で動画広告を丸ごとつくれる。同社は商品のパッケージデザインもAIで開発していて、AI活用に積極的だ。

AI開発企業が頭を悩ませる倫理問題

とはいえ、万能の生成AIにも問題はある。いまAI開発をしている各社が頭を悩ませているのは倫理問題だ。生成AIはネットで収集できる情報を無秩序に拾って並べるが、ネットの有象無象の情報を基にしていると、時に差別的な内容を回答する場合がある。

そこで各社はAIの回答がポリティカルコレクトネス(政治的正しさ)の範疇に収まるように調整を行っているが、その加減に四苦八苦している。

グーグルは2024年2月、生成AI Geminiの画像生成機能を一時停止させた。ポリティカルコレクトネスの安全マージンを過剰に取った結果、誤った回答をしたり、回答そのものを拒否したことで批判を集めたからだ。

例えば「1943年のドイツ兵の画像を生成して」というプロンプトに対して、Geminiは多様性に配慮するあまり黒人やアジア人の画像を生成した。

「アドルフ・ヒトラーとイーロン・マスクのどちらが、より悪影響の大きい歴史上の人物か?」との質問に至っては回答を拒否。イーロン・マスクに対する評価が現時点で定まっていないのだとしても、そこは「ヒトラー」と断言してもらわなければ、ツールとして使えない。生成AIの利用者は政治家や官僚の答弁を聞きたいわけではないのだから、批判を受けるのは当然だ。

この点、中国のテック企業は方針が明確である。百度(バイドゥ)やテンセント、アリババは優れた技術を持っているが、「習近平は歴史上の誰に似ているか」と質問して、「ヒトラー」と答える生成AIを開発したら中国当局に潰されてしまう。

そこは「毛沢東」と答えるように調整するか、ネット経由で広く情報を収集するのではなく、限定された情報(企業が保有するクローズドなデータなど)をベースに回答を生成させる方向で開発していくしかない。したがって、中国では汎用的な用途ではなく、工場や倉庫の生産性改善やEコマースの動画作成など、特定の領域に特化した生成AIの開発が中心になっている。

米国と中国では事情が異なるが、世界のテック各社は生成AIにどのように秩序を与えるかというところでしのぎを削っている。

アップルは、AI開発競争で2周遅れる

上記のAI開発の先頭集団から一度遅れてしまうと、挽回するのは至難の業だろう。

例えばアップルである。アップルは2011年にiPhoneにAIアシスタントSiriを搭載して、AI時代の先陣を切ったかのように思われた。しかし実際には、世界中がAI開発競争に沸く現在、独自の生成AIすら発表できていない。すでに周回遅れどころか、2周遅れの有り様だ。

アップルがこの遅れを取り戻すのは容易ではない。マイクロソフトがOpenAIに出資したように、外部からAIベンチャーを取り込む手もあるが、いまとなってはそれも手遅れだろう。

アップルは自社開発にこだわらず、マイクロソフトやグーグルに頭を下げて生成AIを使わせてもらう道を模索すべきだ。アップルカーの計画が頓挫してすぐにEV開発に注ぎこんでいた経営リソースを生成AIに移すべく、GeminiをiPhoneに搭載する交渉をグーグルと始めたという報道があった。iPhoneユーザーからすれば、手を組むのはOpenAIのほうが良かっただろうが、自社開発にこだわらないという方向性自体は正しい。

AI開発で見劣りする日本企業、「使う技術」を磨くべき

日本企業も人ごとではない。NTTやソフトバンクなどのテック各社が国産LLM(大規模言語モデル)の開発に取り組んでいるが、世界の最前線と比べて見劣りすることは否めない。

日本企業が生成AIで勝者となる方法は、生成AIを使う技術を磨くことだ。AI時代に従来のプログラミングスキルは不要。プロンプトで指示さえすれば、生成AIがプログラムを書く。これまでプログラミング言語と縁がなかった文系人間にもチャンスがある。

ただ代わりに、「どのように最適な指示を出すか」というプロンプトエンジニアリングのスキルが求められるようになる。この技術はまだ確立されておらず、発展の途上だ。生成AIの開発で出遅れた日本も、プロンプトエンジニアリングについては世界と同じスタートラインに立てる。また、そうしなければならない。

例えば生成AIで動画広告を作成することになったとき、「これまでの制作ノウハウが通用しなくなった」と嘆くのか、「我が社は数行のプロンプトで高品質な動画を廉価に作成できる」と先んじるのか。勝つのは当然、後者だ。

今後多くの業種業界で同じことが起きる。そのことを脅威とみなすのではなく、飛躍の機会ととらえて生成AIを使いこなすことが、日本がAI時代の勝ち組になる道である。

※この記事は、『プレジデント』誌 2024年5月17日号、『大前研一アワー#512』 2024年4月20日配信 を基に編集したものです。

大前研一

プロフィール マサチューセツ工科大学(MIT)大学院原子力工学科で博士号を取得。日立製作所原子力開発部技師を経て、1972年に経営コンサルティング会社マッキンゼー・アンド・カンパニー・インク入社後、本社ディレクター、日本支社長、アジア太平洋地区会長を歴任し、1994年に退社。スタンフォード大学院ビジネススクール客員教授(1997-98)。カリフォルニア大学ロサンゼルス校(UCLA)公共政策大学院総長教授(1997-)。現在、ビジネス・ブレークスルー大学学長。豪州BOND大学教授。