グーグルの研究者に聞いた、AIが作曲できてもギャグは苦手なワケ

機械学習によるアートや音楽の制作を研究するグーグルのオープンソース研究プロジェクト「マジェンタ」のリーダーに、プロジェクトの現状を聞いた。まだ準備段階だが、コンピューターに冗談を言わせる研究も始めているという。 by Rachel Metz2017.09.14

AI（人工知能）にとりとめのない即興のようなピアノ曲を作らせたり、猫の絵を際限なく配置させたりする研究は、グーグルのプロジェクトっぽくないかもしれない。しかし、実は大いに意味のあることなのだとダグラス・エック博士はいう。

エック博士はこれまで約15年間にわたってAIと音楽を研究してきた。最近はグーグルのブレイン・チームの研究者であり、機械学習でアートや音楽を制作する、オープンソース研究プロジェクト「マジェンタ（Magenta）」のリーダーを務めている。

エック博士は、マジェンタのAI音楽で深層ニューラルネットワークがいかにして新しいサウンドを制作しているのか、そして、コンピューターが冗談を言うのがひどく苦手なのはなぜなのかをMITテクノロジーレビューに語った。

＃

アートの制作にAIを使うのは新しいことではありません。グーグルのアプローチのどこがユニークなのでしょうか。

グーグルでは、深層ニューラルネットワーク、再帰型ニューラルネットワーク（RNN）、さらに他のタイプの機械学習を組み合わせて、非常に独創的な研究をしています。芸術家のコミュニティと、クリエイティブなプログラマーおよびオープンソース・デベロッパーの両方のグループに、同時にオープンソースプロジェクトに参加してもらうため、多大な努力をしています。

マジェンタの活動の大部分は音楽に向けられています。なぜAIが音楽の制作や拡張に適しているのでしょうか。

正直なところ、これは私の信念でしかありません。私の研究経歴すべてが音楽と音声についてのものです。マジェンタの対応範囲はアート全般、つまり読み聞かせ、音楽、物語、画像であり、AIが創造のツールとしてどのように使えるかを理解することでもあります。そうは言っても、どこからか始めてみなければなりません。音楽のように複雑で、私たちにとって大切なものに大きな進歩をもたらすことができれば、他分野への応用のきっかけになると思うのです。

マジェンタで作った曲を聞くことはできますか。

これが「パフォーマンスRNN」というモデルで作った音楽です。

メロディーやリズムなどのテクスチャーすべてに注意して聞いてください。一種の作曲であり、同時に演奏でもあります。というのも、パフォーマンスRNNは音符を生成するだけでなく、演奏のテンポや音の強弱も決定しているのです。実は、あるピアノコンクールでのいろいろなピアノ演奏をニューラルネットワークの訓練に使っていて、そこに含まれる要素が再現されています。

この曲を聞いたところでは、マジェンタで作る曲は今のところ本質的に即興演奏です。AIは、構造を持ち、理路整然とした曲を作れるのでしょうか。

その点については研究中で、将来的に重要な研究方針の一つとなっています。率直に言って、何か新しいものを制作できる機械学習モデル全体の中で、最も重要な研究方針の一つは学習構造です。それが、ここでは音楽という形で表れています。メロディーやリズムがどうなるべきかを決めるような包括的なモデルがないこ …

こちらは有料会員限定の記事です。 有料会員になると制限なしにご利用いただけます。

有料会員にはメリットがいっぱい！

毎月120本以上更新されるオリジナル記事で、人工知能から遺伝子療法まで、先端テクノロジーの最新動向がわかる。
オリジナル記事をテーマ別に再構成したPDFファイル「eムック」を毎月配信。
重要テーマが押さえられる。
各分野のキーパーソンを招いたトークイベント、関連セミナーに優待価格でご招待。

人気の記事ランキング