KADOKAWA Technology Review
×
始めるならこの春から!年間サブスク20%オフのお得な【春割】実施中
オープンAI、有名アーティスト風のポップスを深層学習で生成
Getty
These pop songs were written by OpenAI’s deep learning algorithm

オープンAI、有名アーティスト風のポップスを深層学習で生成

オープンAIは、深層学習アルゴリズムを用いてポップスの楽曲を生成する人工知能(AI)を発表した。ケイティ・ペリー、エルビス・プレスリー、ナズといった有名なパフォーマーのスタイルで、そこそこの出来の「歌」を生成できる。 by Will Douglas Heaven2020.05.05

非営利の研究グループであるオープンAI(OpenAI)は、ポップス産業における新たな試みとして、ティーニーバップやカントリーから、ヒップホップ、ヘビーメタルまで、さまざまなスタイルでキャッチーな曲を生成できる「ジュークボックス(JukeBox)」と呼ばれるニューラル・ネットワークを発表した。このニューラルネットは、ちょっとした歌さえ歌うことができる。

ジャンルやアーティスト、歌詞をジュークボックスに入力すると、ジュークボックスはケイティ・ペリーエルビス・プレスリーナズといった有名なパフォーマーのスタイルで、そこそこの出来の寄せ集めの歌を生成する。また、曲の最初の数秒を入力して、残りの部分を自動補完させることもできる。

https://soundcloud.com/openai_audio/jukebox-novel_lyrics-78968609

コンピューターに音楽を生成させる試みは50年以上の歴史がある。人工知能(AI)はこれまで、オーケストラ・クラシックとアンビエント電子音楽の印象的な作品をたくさん生成してきた。ビデオゲームはしばしばバックグラウンド音楽として、コンピューターが生成した音楽を使用し、プレイヤーの操作に応じてその場でループしたり、音の強弱を変えたりしている。

しかし、コンピューターにとっては、ビートルズのような音楽を生成するよりも、バッハのような音楽を生成する方がはるかに簡単だ。多くのクラシック音楽には数学的な下支えがあり、AIが作曲でよく用いる音楽の記号表現に適しているからだ。ポップソングはよりシンプルであるが、そうではない。

ジュークボックスの訓練には、ピッチ、楽器、タイミングといった抽象的な表現ではなく、120万曲の生のオーディオデータ自体を使用した。しかし、そのためには、いわゆる依存関係、すなわち典型的なポップソングの再生時間である3分間から4分間にわたって現れる繰り返しメロディを追跡できるニューラル・ネットワークが必要だった。AIには難しいタスクだ。このタスクの感覚を獲得するため、ジュークボックスは1曲あたり数百万のタイムスタンプを追跡し続ける。これに対し、オープンAIの言語ジェネレータ「GPT-2」が文章を追跡するときに使用するタイムスタンプは1000である。

ジュークボックスの生成するポップソングは、正直に言えば、まだまだのレベルだ。技術的に印象的ではあるものの、不気味な谷のかなり深いところにあると気づくだろう。オープンAIが目標とする汎用人工知能(AGI)からにはまだほど遠い。しかしジュークボックスは、ニューラル・ネットワークがいかに人間を模倣するかを改めて示し、現実のものとそうでないものの境界線を曖昧にしている。たとえば、先週、ラッパーのジェイ・Zは、自身がビリー・ジョエルの曲を歌っているディープフェイクの削除を求める法的措置を開始した。オープンAIは、AIが知的財産権に及ぼす影響に関する研究を計画していると述べている。

人気の記事ランキング
  1. Promotion MITTR Emerging Technology Nite #32 Plus 中国AIをテーマに、MITTR「生成AI革命4」開催のご案内
  2. AI companions are the final stage of digital addiction, and lawmakers are taking aim SNS超える中毒性、「AIコンパニオン」に安全対策求める声
  3. What is vibe coding, exactly? バイブコーディングとは何か? AIに「委ねる」プログラミング新手法
  4. Tariffs are bad news for batteries トランプ関税で米電池産業に大打撃、主要部品の大半は中国製
ウィル・ダグラス・ヘブン [Will Douglas Heaven]米国版 AI担当上級編集者
AI担当上級編集者として、新研究や新トレンド、その背後にいる人々を取材しています。前職では、テクノロジーと政治に関するBBCのWebサイト「フューチャー・ナウ(Future Now)」の創刊編集長、ニュー・サイエンティスト(New Scientist)誌のテクノロジー統括編集長を務めていました。インペリアル・カレッジ・ロンドンでコンピュータサイエンスの博士号を取得しており、ロボット制御についての知識があります。
▼Promotion
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る