AudioMook:What will the AI drawing boom bring?

聴くMITTR：「AIお絵描き」ブームは何をもたらすのか？

今週のオーディオ・ムック（β）では、話題の画像生成AIから、マルチモーダルAIの可能性について考える。 by MIT Technology Review Audio Studio2022.08.25

テキストから画像を生成する「AIお絵描きツール」がここ数週間、ネット上で話題になっている。ブームに先鞭をつけたのが、2021年にオープンAI（OpenAI）が発表した「DALL-E（ダリー）」だ。従来のAI技術では、自然言語処理モデルはテキストだけ、画像生成モデルは画像だけといった具合に、1つの処理しかできなかった。両者を結びつけた「マルチモーダル」なAI（MITテクノロジーレビューが2021年の重大技術に選定）は、このブームにとどまらず、今後ますます広がる応用可能性を持っている。

今週のオーディオ・ムック（β）では、話題の画像生成AIからマルチモーダルAIの可能性について考える。

オープンAI、文章から画像を描く「DALL-E2」を100万人に提供

「馬に乗った宇宙飛行士」——文章から画像を描くAIが驚きの進歩

2021重大技術：「マルチモーダル」でAIはもっと柔軟かつ堅牢になる

◆

MITテクノロジーレビューは毎週、旬のテーマを設定し、編集部がピックアップした記事を「オーディオ・ムック（β）」として音声化してお届けします。家事や運動をしながら、通勤しながら、手がふさがっていても記事が読める「聴く」MITテクノロジーレビューをお楽しみください。

なお、本コンテンツは音声合成技術で作成しているため、一部お聞き苦しい点があります。ご容赦ください。バックナンバーはこちら。感想は@techreviewjp まで。

MITテクノロジーレビューオーディオ・スタジオ [MIT Technology Review Audio Studio]日本版オーディオ・スタジオチーム: MITテクノロジーレビューは毎週、旬のテーマを設定し、編集部がピックアップした記事を「オーディオ・ムック（β）」として音声化してお届けします。

▼Promotion

聴くMITTR：「AIお絵描き」ブームは何をもたらすのか？

今週の収録記事

オープンAI、文章から画像を描く「DALL-E2」を100万人に提供

「馬に乗った宇宙飛行士」——文章から画像を描くAIが驚きの進歩

2021重大技術：「マルチモーダル」でAIはもっと柔軟かつ堅牢になる