徳井直生：生成AIは究極の消費ツール　創造的に付き合うには

長らく人工知能（AI）を使った新たな表現の世界を開拓してきた徳井直生氏。アーティスト、DJであると同時にコンピューターによる創造性（computational creativity）の研究者である徳井直生氏は、現代の生成AIをどう捉えているのか。生成AIの「消費」を前提とした創造性と今後どのように向き合い、使っていくべきなのか。 by MIT Technology Review Brand Studio2025.03.31Sponsored

生成AIが登場したとき、「模倣の精度が上がったな」というシンプルな感想をまず抱きました。自分が想像していたよりもだいぶ早く技術が進歩した印象です。精度が高くなったがゆえに、今までアーティストが創ってきた音楽や絵を模倣して、簡単に「それらしいもの」をつくれるようになりました。

2021年に刊行された徳井氏の著書『創るためのAI — 機械と創造性のはてしない物語』（BNN刊）は機械と創作の歴史から先端技術までを俯瞰し、新たな創造性の可能性を提示している。大川出版賞受賞。

今まで絵を描けなかった人が生成AIで絵を出力する、音楽を作れなかった人が音楽制作に関わる体験ができるようになったことは、著作権などの問題を抜きにすれば基本的にはポジティブなことだと受け止めています。ただ、人工知能（AI）を使って絵や音楽を創ることが社会のなかで一般化した半面、僕が『創るためのAI — 機械と創造性のはてしない物語』（2021年、BNN刊）で書こうとした、AIを使うことで人の創造性を拡張すること、人間では思いつかなかいアイデアやスタイルを創造するという方向性からはズレてしまったように思います。
アーティスト、AI研究者として過去20年以上、最先端の技術と向き合いながらずっと創作活動をしてきましたから、より精度が高いモデルが出たからには、それを自分の表現のなかに使いたい思いはありました。僕が創作をする上では、AIをある種のエイリアン、人間とは違う、あるいは不完全な存在と見なし、そこで生まれてくる違和感や差異を大事にしています。

しかし、生成AIは「優等生的」と言いますか、平均的な人間に近づいてしまった。アウトプットに違和感がなく、面白いと思えなかったのです。どこかで聴いたことがあるようなアウトプットが出るようなモデルを、果たしてどう使うのがよいのか。この2年ほどの間、かなり迷っていました。

AIを用いたリアルタイムの音響合成、画像生成を組み合わせた徳井氏のパフォーマンス「Emergent Rhythm」。AIがライブで生成したリズムやメロディーを徳井氏がミックスして新たな音楽を提供する。

とてつもなく広いAIの「てのひら」の外側

AIにはいろいろな定義がありますが、『創るためのAI』を書いた当時は、「人間の知能を人工物、特にコンピューターによって模倣しようとする試み」と定めました。

生成AIは、模倣が上手になり、「それらしいもの」を生成する能力はどんどん高まっています。ただ、人間が考えるプロセスを模倣しているわけではありません。もし創造のプロセスを模倣しているなら、そこから新しい表現が生まれる可能性もある。ですが、生成AIはあくまで過去に人間が生み出してきたテキストや音楽、絵などのアウトプットを模倣しようとしているだけです。

「プロンプトをAIに与える」という主体的な行動を通じて生成される表現物は、それなりに「自分の表現」ができているように思えるでしょう。でも、そのベースにあるのは大量のデータを学習したモデルであり、AIの手のひらで踊っているようなものです。その「手のひら」は釈迦の手のひらのようにとてつもなく広いので、自分の意思でどこへでも行けるように錯覚するかもしれませんが、本当はその外側がある。それを理解しておくことは必要でしょう。

生成AIがもたらす「組み合わせの創造性」

では、生成AIに創造性はないのでしょうか。それに答えるには「どういう創造性の話をしているのか」という前提が必要になります。“生成”AIという言葉から、いかにも未知のもの、今までなかったものがAIによって生み出されるというイメージを持ってしまってはいないか。

「生成（Generative）」という言葉は、ラテン語で「生殖」を意味する「Generatus」が語源です。子は親の遺伝子を受け継ぎますから、ある程度は親に似る部分があります。でも、完全なコピーではなく、そこにはある種の予測不可能性があり、未知の特徴を持ったものが生まれてくるというニュアンスがあります。それに対して、今の生成AIの“生成”は、「もっともらしさ」の再生産に過ぎず、“生成”という言葉を使うには言い過ぎなところがあると思っています。

英国の心理学者であり、Computational Creativity研究の第一人者でもあるマーガレット・ボーデンは、創造性を「組み合わせの創造性」「探索的創造性」「変革的創造性」に分類しています。生成AIに創造性がないとは言い切れませんが、これは既存のアイデアを組み合わせて、ある表現の枠のなかで新しいインスタンスを生み出すような「結合的創造性」と言うべきでしょう。人間も、過去の作品や既存のジャンルの表現を吸収し、インスパイアされて、それらを組み合わせて自分なりに昇華して新しい表現を創ることがあります。

ただ、ローランドのドラムマシン「TR-808」がきっかけとなって、ヒップホップというそれまで誰も想像しなかった新しい音楽ジャンルをアーティストが生んだような「変革的創造性」を、大規模モデルをベースとした生成AIが持つことは、僕はないと思っています。学習データという“枠”のなかでデータの分布を学習し、「それらしいもの」を生成するように作られているからです。少なくとも生成AI単体では、その“枠”の外側には行けないでしょう。

「セレンディピティ」の揺り戻しが来る

僕は最近、生成AIは「創造」のツールではなく、音楽で言えばレコードやCD、Spotify（スポティファイ）のような音楽ストリーミングサービスなどの延長線上にある、「消費」ないし「聴取」のツールだと考えたほうがよいのではないかと考えています。

レコード棚からレコードを取り出して針を落として音楽を聴く。Spotifyでアーティストの名前を検索して聴く。同様に、音楽生成AIの「Suno（スーノ）」でプロンプトを打ち込んで、巨大なライブラリーから何かしらが組み合わされて生成された曲を聴く。

DJがレコードショップでディグる（掘る）のは「消費」行動ですが、これもクリエイティブな行為に違いありません。生成AIが「消費」や「聴取」のためのテクノロジーであることを前提に、それをベースに新しい創作手法を考える。DJ的な創造と言っていいかもしれません。

ただ、僕はこれから“揺り戻し”が来るだろうと思っています。大規模モデルをベースにした生成AIの精度に、最初はみんなびっくりして面白がっていました。でもやがて慣れて、当たり前になっていきます。そうやってツールとして定着する一方で、生成AIではできない表現を探求するアーティストや、またその探求をサポートするツールもいろいろ出てくるでしょう。

僕は常々、「誤用」できるAIが大事だと言っています。想定された用途から外れた使い方をすることで、セレンディピティ、つまり「思いがけない発見」を引き出すことができたらと思っています。以前は、自分のパソコン上でAIモデルを動かして、想定しない使い方ができました。あり得ないようなデータを作って学習させたりもできた。でも現在の生成AIモデルは巨大で、自分でモデルを触れる部分は少なくなっています。

僕が新しく始めた「Neutone（ニュートン）」というプロジェクトでは「DIY AI」の可能性を、特に音楽表現の領域で追求しています。開発している製品は、リアルタイムに音色を変換するソフトウェア（プラグイン）です。例えば、パーカッションの音や人の声など、創りたい音色の音を集めてきてAIに学習させます。モデル自体は小さくて、2時間程度の録音データがあれば1日で学習できてしまいます。何でも生成する大規模モデルとは真逆で「その音」しか出ませんが、代わりに今まで聴いたことがないようなテクスチャーや演奏感を生み出すことができます。

DIY AIの可能性を追求する新しいプロジェクト「Neutone（ニュートン）」。

AIと自分との差、違和感をポジティブに

本のなかでも述べているように、僕は、AIとはサーフィンのように付き合うのが理想だと考えています。サーフィンは、主体性と受動性が入り混じった不思議なアクティビティです。基本的には波に「流される」という受け身の状態でありながら、乗りたい波を取捨選択するところに主体性があります。でも一度波に乗ったら、コントロールを手放して溺れない程度にバランスを取りつつ、流されていきます。

AIと付き合う上でも、主体性と受動性の間を行くのがいいのではないかと思っています。これはアートの世界だけの話でなく、ビジネスで何かの資料を作るときでも同じです。最初から完璧な仕上がりイメージを持ってそれに近づけていく方法もあると思いますが、そうではなく、AIと会話することで、「そういう切り口もあるんだ」という気づきを得ながら作っていく。多分、今ChatGPTを仕事で使っている人は、自然にそうしているのではないでしょうか。

ただ気をつけないといけないのは、AIのいう「それらしいこと」に疑念を挟まず受け入れていると、溺れてしまう可能性もあるということ。適度に自主性をキープしていく必要があります。

最近、面白いなと思った論文に、英グラスゴー大学のマイケル・タウンセン・ヒックス講師らが書いた『ChatGPT is Bullshit』があります。Bullshitとは、哲学者のハリー・G・フランクファートが提唱した概念で、自身が言うことが真実かどうかをまったく関知せずに発する物言いのこと。ChatGPTは、「もっともらしい」テキストを生成しますが、どれだけ精度が高く見えても、ハルシネーション（幻覚）が起こらないようにしようとも、本質的には学習データに見い出したパターンを再生産しているだけ。言い放っているだけということがこの論文では語られています。これは、音楽生成AIも同様です。音楽の構造や理論をまったく無視していて、学習データにある音のパターンを模倣して生成しているだけです。

でも、だからこそ、生成AIのアウトプットを人間の側がどう受け止めるかが重要です。AIがどのように動いているのかをある程度理解できると、必ずしも正解を導き出してくれるわけではないことが分かるはずです。だから、まずはその理解を深めること、客観視することが大事。

サーフィンで波を選び取るときに自主性を発揮する、その際に個人の価値基準や審美眼のようなものが立ち現れます。それこそが、創造における人間の最も大切な部分です。生成AIのアウトプットを見たり聴いたりしたときに感じる違和感や、自分がそのアウトプットを好きなのかどうかということを大事にした方がいい。AIと自分の間に差異があることをネガティブに思うのではなく、むしろポジティブに捉えるべきだと考えています。

徳井直生（とくい・なお）
アーティスト／研究者。株式会社Qosmo代表取締役 / 株式会社Neutone代表取締役
滋賀大学データサイエンス学部客員教授。AIを用いた人間の創造性の拡張を研究と作品制作の両面から模索。アーティスト、デザイナー、AI研究者／エンジニアなどから構成されるコレクティブ、Qosmo（コズモ）を率いて作品制作や技術開発に取り組むほか、23年7月設立のNeutone（ニュートーン）では、人工知能（AI）を用いた新しい「楽器」の開発を手がける。主な著書に『創るためのAI — 機械と創造性のはてしない物語』（大川出版賞受賞）。東京大学工学系研究科電子工学専攻博士課程修了。工学博士。

構成：畑邊康浩　撮影：杉能信介
この記事は、三菱電機 ITソリューション総合サイトとの共同企画です。

人気の記事ランキング

MITテクノロジーレビューブランドスタジオ [MIT Technology Review Brand Studio]日本版ブランドコンテンツ制作チーム: MITテクノロジーレビューブランドスタジオ

▼Promotion

徳井直生：生成AIは究極の消費ツール 創造的に付き合うには

とてつもなく広いAIの「てのひら」の外側

生成AIがもたらす「組み合わせの創造性」

「セレンディピティ」の揺り戻しが来る

AIと自分との差、違和感をポジティブに

徳井直生：生成AIは究極の消費ツール　創造的に付き合うには