グーグルの研究者に聞いた、AIが作曲できてもギャグは苦手なワケ
機械学習によるアートや音楽の制作を研究するグーグルのオープンソース研究プロジェクト「マジェンタ」のリーダーに、プロジェクトの現状を聞いた。まだ準備段階だが、コンピューターに冗談を言わせる研究も始めているという。 by Rachel Metz2017.09.14
AI(人工知能)にとりとめのない即興のようなピアノ曲を作らせたり、猫の絵を際限なく配置させたりする研究は、グーグルのプロジェクトっぽくないかもしれない。しかし、実は大いに意味のあることなのだとダグラス・エック博士はいう。
エック博士はこれまで約15年間にわたってAIと音楽を研究してきた。最近はグーグルのブレイン・チームの研究者であり、機械学習でアートや音楽を制作する、オープンソース研究プロジェクト「マジェンタ(Magenta)」のリーダーを務めている。
エック博士は、マジェンタのAI音楽で深層ニューラルネットワークがいかにして新しいサウンドを制作しているのか、そして、コンピューターが冗談を言うのがひどく苦手なのはなぜなのかをMITテクノロジーレビューに語った。
#
アートの制作にAIを使うのは新しいことではありません。グーグルのアプローチのどこがユニークなのでしょうか。
グーグルでは、深層ニューラルネットワーク、再帰型ニューラルネットワーク(RNN)、さらに他のタイプの機械学習を組み合わせて、非常に独創的な研究をしています。芸術家のコミュニティと、クリエイティブなプログラマーおよびオープンソース・デベロッパーの両方のグループに、同時にオープンソースプロジェクトに参加してもらうため、多大な努力をしています。
マジェンタの活動の大部分は音楽に向けられています。なぜAIが音楽の制作や拡張に適しているのでしょうか。
正直なところ、これは私の信念でしかありません。私の研究経歴すべてが音楽と音声についてのものです。マジェンタの対応範囲はアート全般、つまり読み聞かせ、音楽、物語、画像であり、AIが創造のツールとしてどのように使えるかを理解することでもあります。そうは言っても、どこからか始めてみなければなりません。音楽のように複雑で、私たちにとって大切なものに大きな進歩をもたらすことができれば、他分野への応用のきっかけになると思うのです。
マジェンタで作った曲を聞くことはできますか。
これが「パフォーマンスRNN」というモデルで作った音楽です。
メロディーやリズムなどのテクスチャーすべてに注意して聞いてください。一種の作曲であり、同時に演奏でもあります。というのも、パフォーマンスRNNは音符を生成するだけでなく、演奏のテンポや音の強弱も決定しているのです。実は、あるピアノコンクールでのいろいろなピアノ演奏をニューラルネットワークの訓練に使っていて、そこに含まれる要素が再現されています。
この曲を聞いたところでは、マジェンタで作る曲は今のところ本質的に即興演奏です。AIは、構造を持ち、理路整然とした曲を作れるのでしょうか。
その点については研究中で、将来的に重要な研究方針の一つとなっています。率直に言って、何か新しいものを制作できる機械学習モデル全体の中で、最も重要な研究方針の一つは学習構造です。それが、ここでは音楽という形で表れています。メロディーやリズムがどうなるべきかを決めるような包括的なモデルがないこ …
- 人気の記事ランキング
-
- AI means the end of internet search as we’ve known it 「ググる」時代の終わり、 世界の知識を解き放つ 生成AI検索がもたらすもの
- Promotion Innovators Under 35 Japan × CROSS U 無料イベント「U35イノベーターと考える研究者のキャリア戦略」のご案内
- 10 Breakthrough Technologies 2025 MITTRが選んだ 世界を変える10大技術 2025年版
- Driving into the future 「世界を変える10大技術」の舞台裏、2024年の誤算とは?
- Anthropic’s chief scientist on 5 ways agents will be even better in 2025 アンソロピック主任科学者が語る「AIエージェント」4つの進化