世界中の様々な場面でDX(デジタルトランスフォーメーション/以下:DX)が進められている現在。その中で最も注目を集めているテクノロジーの1つがAI(Artificial Intelligence:アーティフィシャル・インテリジェンス/人工知能)です。
予想される2023年のDXトレンドの1つにも、AIの信頼性とリスクや信頼性を意味するフレームワーク「AT TRiSM」が挙げられているようにAIの急速な進化が、人間社会に大きな影響を及ぼし始めていることは間違いありません。
そこで今回は、前後編の2回にわたって「人とAIの境界線」をテーマに、DXの未来について考えていきます。
前編となる今回は、昨年発表されて大きな話題を呼んだ2つのAIモデル「ChatGPT」と「MidJourney」に着目し、実際の使用例も交えて、これらのAIモデルをビジネスに転用する有効性について解説します。
人とAIの境界線を深掘りした後編の記事とあわせて、どうぞAIについての理解を深めるためのご参考としてください。
目次
ChatGPTとは
「ChatGPT」とは、2022年11月30日(現地時間)に米国にある人工知能(AI)研究所OpenAIが発表した、対話に特化した無料の「テキスト生成AI(対話型言語モデル)」です。
自動学習機能型と呼ばれるタイプのチャットボットであるChatGPTは、ユーザーから寄せられたテキストでの問い合わせに対して、AIがWEB上にあふれる膨大な情報の中から必要な情報を収集・選択し、ユーザーの質問に適切な回答を「テキストとして生成して返す」という仕組みです。
読者の中には、「WEB上の情報からユーザーにとって適切な情報を選び出すシステム」と聞いて、Google社(米)の検索エンジン「GoogleChrome」を思い出す方が多いかもしれません。
確かにGoogleChromeをはじめとするブラウザは、検索ワードをもとに、膨大なWEB情報の中から適切な情報を選び出してくれるという点では、ChatGPTと共通していると言えます。
しかし、GoogleChromeなどは見つけた情報を一覧として表示するだけに留まっているのに対して、ChatGPTは適切な「文章」にして回答してくれるという点が大きく異なります。
ChatGPTの情報収集・選択能力と、テキスト生成の精度はまさに驚嘆すべきものでした。
実際に、人が話したり書いたりするようななめらかで自然な文章が生成できるため、簡単には見分けがつかないほどです。
そのため、米国の一部学校ではChatGPTを学生が勉強や論文執筆に使用することを禁止するなど、大きな波紋も巻き起こしたのです。
驚異的な能力を秘めたChatGPTに対する世界の期待は高く、リリースからわずか5日で登録ユーザー数は100万人を突破しました。
これは、Instagramの2ヶ月半、Facebookの10ヶ月と比較してみると、どれだけ凄まじい速さであるかがわかります。
ChatGPTの登場によって、Googleが自社の検索エンジン事業におけるAI戦略の見直しを迫られたことからも、ChatGPTが業界に与えた衝撃の強さをうかがい知ることができます。
では、Googleが脅威に感じるほどのChatGPTのAI精度とは、いったいどの程度のものなのでしょうか。
ChatGPTのAI精度
出典:ChatDPT
ChatGPTのAIモデルは、2017年に発表された自然言語処理などに用いられる深層学習モデル「Transformer(トランスフォーマー)」のアーキテクチャがもとになっています。
莫大な予算をかけてOpenAIのエンジニアたちが作り上げたChatGPTは、WEB上の情報を適切に収集・選択し、自然なテキストの形にまとめて回答する仕組みです。
試しに、ChatGPTのテキスト入力欄に「チャットボットを接客に利用するアイデアを3つ教えて」と入力してみましょう。
その結果生成された回答は、次の通りです。
この回答の内容自体は、これまでチャットボットによる接客のDXについての記事をいくつか公開してきたDXportal®編集部から見ても同意できる内容であり、このレベルの回答をAIが自動で生成して回答しているというのは驚くべきものです。
続いては「飲食店ならどうかな?」と、かなりファジーな質問を投げかけてみました。
この質問には「何が」という主語はなく、直前のやり取りを前提にした質問であることを理解しないとそもそも何を聞いているのかすらわからない文章です。
人間であれば質問の意図は簡単に分かるかもしれませんが、これまでのAIチャットにおいては新しく主語を入力する必要があったでしょう。
しかし、ChatDPTからは次のような回答が得られました。
このように直前のやりとりの内容を踏まえた上で、新たな質問に対しても正確な答えを返してくれました。
現時点において、すでにAIを相手にこのレベルのやり取りができる時代を迎えているのです。
今後AIが更に学習を重ね、技術も向上していけば、このコンテンツが社会の未来を変えることは想像に難くないでしょう。
この技術が広まっていけば、人の「調べる」「学ぶ」というプロセスは一気に様変わりするかもしれません。
様々な可能性を秘めたChatDPTですが、その一方で、問題がないわけではもちろんありません。
次に、現状で考えられるChatDPTの課題について考えてまいります。
ChatGPTの課題
ChatGPTの課題を考える上で参考になるのが、2022年11月にMeta社(米)が公開したチャットボットAI「Galactica」の事例です。
Galacticaは優秀なAIを搭載していましたが、このチャットボットが根拠のないでたらめな内容や人種差別が含まれた文章を生成した結果、世界的な炎上に繋がり、公開後わずか3日でデモモデルを非公開することを余儀なくされたという事件がありました。
GalacticaはChatGPTと同様、WEB上の情報をもとに高い精度でテキストを生成することができましたが、その内容が科学的・倫理的に正しいかどうかを判断することはできません。
つまり、WEB上に存在する情報そのものが誤っていたり、古かったりすると、そこから生成される文章も不確実なものとなってしまうのです。
これと同様のことは、ChatGPTでも起こり得るでしょう。
ただし、Galacticaの失敗例を教訓にしたと思われるChatGPTは、ヘイトスピーチや差別発言は生成しないようにプログラムされており、そのような生成を求められた時には拒否するようにプログラムされています。
とはいえ、AIに情報の正誤を判断する機能が備わっているわけではありませんし、例えば「個人のプライバシーにかかわる情報は開示しない」などのネットリテラシーに基づく「配慮」ができるわけでもないでしょう。
主張や感情を持たず、ただ機械的にコンテンツを生成するAIにおいて、AIがその情報をどのように扱うのかを判断をすることはできません。
そのため、悪意ある人間がChatGPTを使用することで、世界中の言語でネガティブキャンペーンを展開することも可能となってしまうなど、まだまだ倫理的な問題で解決すべき課題は多そうです。
こうした課題はあるものの、驚きの精度で質問に回答できるAIの登場はこれからのビジネスシーン、ひいては社会そのものに根底から影響を及ぼす可能性があり、目が離せない技術です。
Midjorneyとは
2022年7月に米国のデビット・ホルツ氏を中心とするAIの研究開発チーム(現在はMidJourney社を創業)からオープンベータ版が発表された「MidJourney」は、入力されたキーワードをイメージした画像を自動生成してくれるサービスです。
昨年、Twitterを中心に大いに話題と人気を集めたこともあり、その衝撃を実際に体験した方も多いかもしれません。
AIが画像を作成する、いわゆる「お絵描きAIサービス」はMidJourney以外にも数多く存在します。
しかし、他のソフトやサービスと比較してもMidJourneyの人気は高く、「神絵」と呼ばれるほど高品質の画像を生成できるのはなぜなのでしょうか。
MidJourneyでは、チャットツールの「Discord」を利用し、「プロンプト」と呼ばれる入力欄に描いてもらいたい絵に関する説明を、キーワードとして入力することで、わずか数分でAIが絵を描いてくれます。
この時、「何を描くか」といった生成する画像の対象(モチーフ)とともに、イメージやタッチなどファジーな要素を入力することで4種類の完成品が提示され、それをもとにさらに指示を追加し、より求める画像に近いものを生成できるということが、MidJourneyが爆発的な人気を得た要因の1つでしょう。
では、実際にMidJourneyが描く「神絵」とは、どのようなものなのか。次に、実際にキーワードにもとづいて生成した画像をお見せします。
MidjorneyのAI精度
まずはプロンプトを「Giant skyscrapers, futuristic buildings, futuristic vehicles flying in the sky, colorful and beautiful neon lights」と入力しています。
できあがった絵は、この通りです。
先のプロンプトを日本語訳すると、「巨大な摩天楼、未来的な建物、空に飛んでいる未来的な車両、カラフルで美しいネオン」となりますが、その言葉の通りの近未来的な絵が生成されました。
どこか古き良きアメリカのSF小説の表紙を思わせる、ノスタルジーにあふれた絵ではないでしょうか。
次は、「The vastness of space and colorful stars(広大な宇宙とカラフルな星)」と入力した結果がこちらです。
この2点の絵は、どちらもタッチは特に指定していませんが、例えば「ピカソ」や「ゴッホ」のような世界的有名画家のタッチを指定することで、まるで彼らが描いたかのようなアート作品を生み出すこともできるのです。
AIが生まれた当時、AIの技術が進んでも人間に及ばないものとして「創造性(クリエイティビティ)」が挙げられていました。
もちろん、MidJourneyの絵は、様々なタッチやモチーフの絵を取り込んだ膨大なデータの中から、与えられたテーマに沿った絵を生成しているだけであり、ゼロから一を生み出すこととは厳密には異なります。
しかし、これだけのクオリティの絵をわずか数分で生成できる技術は、AIに対するイメージを刷新するほどの衝撃ではないでしょうか。
しかし、この技術にも当然ながら現時点では多くの問題も発生します。
Midjorneyの課題
例えば、仮に「ピカソ」や「ゴッホ」のようなタッチを指定し、生成された絵が彼らの生み出した作品と似ていれば似ているほど、詐欺などを引き起こす可能性が大きくなってしまうでしょう。
つまり、この技術が進んだ先には、悪用の恐れがついて回るのは確実なのです。
また、「AIが描いた絵の著作権がどこにあるのか?」といった、法的に解決しなければならない問題も残っています。
それにも増して大きな問題となるのは、このような画像生成AIを使いこなすためには、そのAIがどのような「偏見(バイアス)」にもとづいているのかを把握しておかなければならないということです。
2023年1月現在でのMidJourneyで使われるプロンプトは、「英語」でしか指定できません。
その影響で、MidJourneyは「英語圏」のバイアスが強くかかった絵を生成する傾向があります。
例えば「Businessperson」と入力した場合、生成される画像は「ネクタイを締めた西洋風の男性」の絵であることがほとんどです。
つまり、「Businessperson」という英語を頼りに、WEB上の情報から画像生成に必要な要素を集めるMidJourneyには、「ビジネスパーソンは男性」が多く、「ネクタイを締めている」という1つの「偏見」が見て取れるのです。
「西洋風の男性」という要素は、米国産のサービスに英語で記入していることに起因しているのかもしれませんが、例えば日本人を描きたい場合や、日本人画家のタッチで描いてもらいたい場合は、どこかちぐはぐな印象の絵ができあがってしまいます。
ここではこのMidJourneyが生み出す「偏見」について詳しく論じることは控えますが、生成する絵に極端なバイアスがあれば、人種や性別などデリケートな問題の火種となってしまうことは容易に想像ができるでしょう。
もちろん、キーワードを詳細に記載したり、出来上がった絵に別の条件を加えて調整していけば、ユーザーの意図しない偏見にまみれた絵が生成される確率は大きく下がるはずです。
しかし、使い方に慎重な注意が必要なことは事実であり、ユーザーのリテラシーによっては大きな問題を引き起こしてしまうこともありうるのです。
まとめ~AIはビジネスモデルを大きく変える
先ごろ、月間32億PVを誇る米国メディア「BuzzFeed」が、記事制作にChatGPTを導入することを発表しました。
これを受けて、2023年1月26日にBuzzFeedの株価が200%以上も急騰(参考:ニューヨーク・ポスト/2023年1月28日版)するなど、世界中に大きな衝撃を与えました。
また、現在では企業よりも個人利用のほうが多い印象のあるMidJourneyですが、利用方法次第ではロイヤルティフリーの素材の代わりに自社サイトに埋め込むなど、様々な可能性が考えられます。
部分部分によっては人を凌駕する可能性を持ったAIは、もしかしたら今後企業のビジネスに良くも悪くも影響を与え、場合によってはビジネスモデル自体を大きく変える可能性すら持っているでしょう。
次回は本企画の後編として、AIと人の境界線が生み出すDXにおけるAI活用の可能性について考えてまいります。