この記事は米国版ニュースレターを一部再編集したものです。
先週は大騒ぎだった。人工知能(AI)業界の先端を走る複数の企業がそれぞれ製品を大々的に発表した。グーグルは開発者向けに大規模言語モデル「パーム(PaLM:Pathways Language Model)」の機能を提供するAPIを公開し、AIスタートアップのアンスロピック(Anthropic)はAIアシスタントの「クロード(Claude)」を発表した。だが、それらすべてを隅に追いやる発表があった。オープンAIが発表したマルチモーダルな大規模言語モデル「GPT-4」だ。発表に先立ち、本誌のウィル・ダグラス・ヘブン編集者は限定プレビューを試す機会を得て、その感触を記事にまとめている。
オープンAIの大ヒット作であるチャットGPT(ChatGPT)とは異なり、GPT-4を利用できるのは現在のところ有料サービスの登録者と開発者のみだ。この技術はまだ初期段階にあり、新製品や新サービスに結実するにはしばらくかかるだろう。とはいえ、すでにその機能を試し、結果や感想を明らかにしている人たちも多い。GPT-4の試用例のうち、興味深い事例をいくつか紹介しよう。
資金集め
まずは、ツイッターで話題を呼んだ話から。ブランドデザイナーのジャクソン・グレートハウス・フォールは、100ドルの資金から始めて、できるだけ多くのお金を稼ぐようGPT-4に依頼した。フォールは「人間の連絡係」を演じ、コンピューター・プログラムが命じたものを何でも購入したという。
GPT-4は、アフィリエイト・サイトを立ち上げ、他の商品(この事例では、環境に優しい商品)を宣伝するリンクでお金を稼ぐことを提案した。次いでフォールは、オープンAIのAI画像生成モデル「ダリー2(DALL-E 2)」でロゴを作成するためのプロンプトを考案してくれるよう、GPT-4に依頼した。フォールはコンテンツを作成し、ソーシャルメディアに広告を載せるときの資金を配分を決めるよう、GPT-4に依頼した。
一連の行動はソーシャルメディア上で多くの人の注目を集め、GPT-4から着想を得たフォールのマーケティング・ビジネスに投資したいと考える人たちも現れた。フォールは最終的に1378.84ドルを手にした。明らかに宣伝目的の行動ではあるものの、人間がアイデア出しをするときの支援役としてAIシステムをどのように利用できるかを示す洒落た一例でもある。
生産性
大手テック企業は、人々が仕事でAIを利用するようになることを強く望んでいる。多くの人にとって、この新しいテクノロジーを経験し、いじる機会がやって来るとしたら、おそらく仕事中になるだろう。マイクロソフトは、文書の要約やプレゼン用スライドの作成でマイクロソフト・オフィスを使うときに、組み込み型のGPT-4を使ってほしい考えだ。1月に本誌が予想したとおりの展開だが、はるか昔のことのように感じる。
グーグル・ドキュメントやGメールなどのオフィス・スイートに同種のAIテクノロジーを組み込むとグーグルが発表したのは、ただの偶然ではない。メールの下書きや、文章の校正、プレゼンテーション用画像の作成などに役立つだろう。
保健医療
オープンAIが出資するアンビエンス・ヘルスケア(Ambience Healthcare)の共同創業者であるニキル・ブドゥマとマイク・ングに話を聞いた。アンビエンス・ヘルスケアはGPT-4を使用して、医療従事者と患者間の会話を基に医療文書を作成する。データ入力などの細々とした退屈な作業を省くことで、医師の作業負荷を軽減する、というのが彼らの売り込み文句だ。
ブドゥマによると、GPT-4は指示をきっちり守る点で、以前のバージョンよりはるかに優れているという。だが、医療のような正確さが非常に重要な分野でどの程度うまくいくかは、まだ分からない。オープンAIは、大規模言語モデルの欠陥として知られているもののうち、いくつかを改善したと言っているが、GPT-4でその種の欠陥が完全に消え去ったわけではない。でっち上げをするし、自信満々で嘘を真実として提示する。まだバイアスがかかってもいる。このような欠陥があるため、大規模言語モデルを安全に導入する唯一の方法は、人間の専門家が舵取りし、間違いを修正することだとングは言う。
コード作成
プリンストン大学のアーヴィンド・ナラヤナン教授(コンピューター科学)は、特定のURLのページを引用するコードをGPT-4に作成させるのに、10分もかからなかったと述べている。
ナラヤナン教授によると、テキスト、画像、コードの作成でAIツールを試し、コード作成が最も有用な用途だと分かったという。ツイートで、「大規模言語モデル(LLM:Large Language Model)にコードを作らせることで得られるメリットは、時間の節約と心理的なものだと思う」と述べている。
オープンAIの共同創業者、グレッグ・ブロークマンは、自らナプキンに描いた非常にシンプルな図柄のデザインに基づいて、GPT-4でWebサイトを制作するデモを見せた。ナラヤナン教授が指摘するように、この種のAIシステムが力を発揮するのはまさにこのような場面だ。つまり、低リスクの、ありふれた、しかし時間のかかる作業である。
書籍の執筆
リンクトイン(LinkedIn)の共同創業者であり、ベンチャーキャピタルのグレイロック・パートナーズ(Greylock Partners)の無限責任社員であるリード・ホフマンは、『Impromptu: Amplifying Our Humanity through AI(即興詩:AIで人間性を増幅する)』と題する書籍の執筆でGPT-4を使用したと明かしている。オープンAIの初期の出資者でもあるホフマンによると、GPT-4が共同執筆した初めての書籍だという(前バージョンであるチャットGPTは、数多くの書籍の執筆に利用されている)。
昨年夏にGPT-4の試用を認められたホフマンはそれ以降、教育や芸術、司法制度、ジャーナリズムなどでAIモデルを活用するさまざまな方法に関して、自身の思考を書き出していった。GPT-4とのやりとりの抜粋をコピー&ペーストしたものが含まれるこの書籍で、ホフマンはAIの未来について、自身の見方を概説し、GPT-4を新たなアイデアを得るための執筆アシスタントとして使用しつつ、GPT-4の回答を分析している。
◆
GPT-4は、AIコミュニティにとって今話題の、クールで新しいピカピカのおもちゃだ。アイデア出し、文章の要約、概念の説明、ありふれた作業の自動化といったことに役立つ強力な支援テクノロジーであることは否定できない。特にホワイトカラーの知識労働者にとって、歓迎すべき存在だろう。
ただし、オープンAI自身が大規模言語モデルの使用に関して注意を促していることは覚えておきたい。プライバシーを侵害したり、人を騙して人間であると思わせたり、有害コンテンツを作成したりなど、安全性に関する複数のリスクがあると警告している。私たちがまだ遭遇していない、その他の危険な行為に使用される恐れもある。GPT-4の興奮はぜひ味わってもらいたいが、くれぐれも騙されないようにしてほしい。現在のところ、この強力な新モデルを使用して危険な行為に及ぼうする人を押し止めるものはないし、実際にそのような行為に及んだ人の責任を問う術も存在しないのだから。
中国のテック大手バイドゥがチャットGPTに対する回答を発表
あまりに多くの、チャットボットが登場している。AIチャットボット・ゲームに参入してきた最新のプレイヤーは、中国のテック大手であるバイドゥ(Baidu)だ。バイドゥは3月16日、は新たな大規模言語モデル、「アーニー・ボット(Ernie Bot)」を発表した。数学の問題を解いたり、マーケティングコピーを作成したり、中国文学に関する質問に答えたり、マルチメディア対応の回答を作成したりできる。
アーニー・ボット(Ernie Bot)という名称は「Enhanced Representation from kNowledge IntEgration(知識統合による拡張表現)から一字ずつ取ったもので、中国名は「文心一言(Wenxin Yiyan)」という。歴史的事実の説明や、伝統的な詩を書くなどの中国文化特有のタスクで、特に高い能力を発揮する。 詳しくは、本誌のヤン・ズェイ記者の記事をお読みいただきたい。
言語モデルに要求すればバイアスの「自己修正」が可能に
大規模言語モデルは有害なバイアスを吐き出すことで知られている。人間が作り出した大量の不愉快なコンテンツで訓練を受けるせいだ。しかし、モデルに十分な大きさがあり、人間がモデルの訓練を支援した場合、モデルはそのバイアスの一部を自己修正できる可能性がある。驚くことに、人間は要求するだけでいい。
この素晴らしい新発見は、AIスタートアップであるアンソロピック(Anthropic)の研究者によるもので、実験ではさまざまなサイズの大量の言語モデルに、さまざまな量の訓練が施された。この研究からは当然のように、「自己修正」を言語モデルに最初から組み込めるのか、またそうすべきなのかという疑問が生まれる。 本誌のニアル・ファース編集者の記事全体を読んで、詳細を確かめてほしい。
◆
AI関連のその他のニュース
グーグル、生成AIツールを開発者向けに提供。人々がオープンAIに熱い視線を集中させたために、グーグルのもう1つの発表は霞んでしまった。グーグルは、強力なAIテクノロジーの一部を開発者向けにAPIとして提供し、同社の大規模言語モデルであるPaLM上に製品を構築できるようにした。 (グーグル)
ミッドジャーニー(Midjourney)のAI画像生成モデルがついに「手」をマスター。今年はAI画像生成モデルがとてつもなく素晴らししいものになる。AI画像生成モデル「ミッドジャーニー」の最新バージョンは、5本の指を持つ人間の絵を描けるようになった。従来は、おかしな指の描写から、コンピューター・プログラムによって生成された画像だと見分けることができた。今回の進化によって、本物と偽物を見分けるのがますます困難になっていくだろう。(アーズ・テクニカ)
芸術家の画像を人工知能の学習データとしてスクレイピングされることから保護する新ツール 。芸術家が作品にある種のデジタル保護レイヤーを追加できるツールを、シカゴ大学の研究者が発表した。AI画像生成モデルの訓練に使用されるのを防止できる。(シカゴ大学)
ランウェイ(Runway)がさらに強力なAI動画生成モデルをリリース。生成AIはまだまだ進歩する。AI画像生成モデル「ステーブル・ディフュージョン(Stable Diffusion)」を共同開発したスタートアップ企業のランウェイは、前バージョンのリリースからわずか1カ月でAI動画生成モデルの重要なアップデート版をリリースした。新モデルの「Gen-2(ジェン2)」は、本誌のウィル・ダグラス・ヘブン編集者がこちらで紹介した「Gen-1(ジェン1)」を改良したもので、生成する映像の質を高めるとともに、テキストプロンプトのみでいちから映像を生成する機能を新たに加えている。