ボットのトップ:このAIは冷酷で残酷な殺人マシンではなく、ポップミュージックのヒットマシンです

Table of Contents

ボットのトップ:このAIは冷酷で残酷な殺人マシンではなく、ポップミュージックのヒットマシンです

AIは冷たく計算ばかりする機械で、温かみや人間味が欠けているように思われがちです。AIをより親しみやすく人間らしくする方法の一つは、音楽制作といった人間の活動にAIが参加するように促すことかもしれません。

AIの活用は、楽曲制作における最もオタク的な方法の一つであり、80年代から存在しています。AIは活発な研究分野であり、専用の学会も開かれています。また、近年の機械学習のブームにより、AIによって制作される楽曲の質も向上しているようです。

カナダのトロント大学の研究者たちは、リカレントニューラルネットワークを訓練し、歌って踊れるAIを開発しました。機械学習の学術会議であるICLR 2017に提出された論文は、人工知能ソフトウェアがデータ処理だけでなく、芸術作品も創造できることを示しています。

しかし、機械は人間のように野性的で無限の創造力を持っていません。音楽を作るプロセスは感情的というより分析的です。機械は音楽を理解することはできませんが、数学はできます。

音楽をコンピューターで

音楽理論において、音階とは特定のパターンに従う音符の列であり、開始音に応じて変化します。ニューラルネットワークに特定の音階を入力することで、システムはメロディーを作成するために選択できる音符の列を得ることができます。

「入力されるのは、音階の選択(例えばハ長調)と、いわゆる『プロファイル』です。プロファイルとは、楽曲の『全体的な雰囲気』のことです」と研究チームはThe Registerに説明した。

音階に基づいて演奏できる音は、最初の音から数音に限られます。音楽は様々な音階で演奏され、ジャズやブルースのように耳に心地よい音を作り出します。

ニューラルネットワークは音楽理論のルールをコード化していますが、無から有を生み出すことはできません。例から学習する必要があるため、研究チームは100時間分のポップミュージックのコードを分析し、音符とメロディーの共通パターンを学習しました。

そこでニューラル ネットワークは、処理中の音階に応じて、次にどの音が続くかの確率を計算して音楽を生成します。 音符は 12 個ありますが、通常はそのうち 6 個か 7 個だけが音階の一部となります。

まず、入力音階が選択され、ニューラル ネットワークの最初の層がどのキーで音楽を演奏するかを決定します。音階から可能な音の範囲はすでにわかっており、システムはポップ ミュージックのパターンを学習して組み合わせを選択します。

2番目のレイヤーは、キーをどれくらい長く演奏するかを決定します。演奏がより難しく、予測不可能なジャズとは異なり、ポップミュージックは反復的な構造を持っているため、分析や制作が容易です。

3つ目のレイヤーはメロディーに合わせてコードを選び、4つ目のレイヤーはドラム用です。すべてのレイヤーが同時に動作し、特定のタイミングでノートの組み合わせを出力し、非常にリアルな楽曲を作り出します。

ハン・チュー(博士課程の学生)、ラケル・ウルタサン、サンジャ・フィドラー(ともに准教授)は、トロント大学でコンピュータービジョンの研究者として働いていますが、優れたポップミュージックの根本原理をアルゴリズムで捉えることができるかどうかに興味を持ちました。

「さらに、Pandora や Spotify に AI ポップミュージックチャンネルがあったら楽しいと思いませんか?」と彼らは尋ねました。

AIエンターテインメント

人間はいい音楽を聴くと踊りたくなるもの。AIも踊ってみたいと思いませんか?さて、ついにそれが実現しました。AIの音楽に合わせて、研究チームはコンピューターの棒人間を使った「ニューラルダンス&カラオケ」という機能を開発しました。

スティックマンは、ゲーム「Just Dance」の映像を1時間視聴することで、一般的なダンスの動きを学習します。ニューラルネットワークの音楽レイヤーの上に別のレイヤーが追加され、ビートごとに1つの動きを生成します。

練習時間が限られているため、棒人間は限られた動きしかできず、まるで結婚式に参列する父親のように踊る。腕をバタバタと動かしながら体を様々な角度に回転させる程度しかできないようだ。歌詞もあまり得意ではない。深く意味のある歌詞は生成されず、時折意味不明な文章も出てくる。

このシステムは、インターネット上で歌詞として使用される 50 時間分のテキストのみを収集し、それをJust Danceの 1 時間の音楽と組み合わせた。つまり、システムの語彙は少なく、4 回以上出現する単語のみが登録されている。

カラオケにも同じ語彙が適用されています。ニューラルネットワークが歌を歌い、入力画像を説明する歌詞を生成します。限られた音域で、奇妙なロボットのような声で歌います。

ダンスなどの一部の機能は今のところかなり未熟ですが、AI カラオケ ボットのようなものが望ましいのであれば、改善の余地は十分にあります。

「私たちのAIポップ作曲家には、調整可能なパラメータがいくつか搭載されており、ユーザーは作曲する音楽の種類を非常に直感的に指定できます。そのため、どんな気分であっても、AIカラオケマシンにどんな曲を生成して演奏してほしいかを伝えるだけで済みます」と研究者らは述べています。

コンピューターを人間と同じ動作をするように微調整することは、AI研究者の大きな関心事です。純粋に好奇心から、あるいはAIの進歩をベンチマークするために行われることもあります。特定のタスクにおいて、コンピューターが人間と同等、あるいはそれ以上の性能を発揮できれば、それは素晴らしいことと見なされます。

音楽はそうした課題の一つに過ぎませんが、人気の選択肢となっているようです。Google BrainのMagentaプロジェクトは、多くのコードをGitHubプロフィールでオープンソース化しており、強化学習を用いて音楽の音符を予測するシステムをトレーニングする新しいアルゴリズムを発表しました。

フランスでは、ソニーミュージックのAI作曲家「フローマシン」がポップミュージシャンのブノワ・カレの協力を得て作曲した「ミスター・シャドウ」という曲が、人気ラジオ局FIPで頻繁に流れている。

YouTubeビデオ

「ミスター・シャドウ」は3分強の長さで、歌詞はより意味が通っており、まるで人間が作ったかのような響きだ。パリにあるソニー・コンピュータサイエンス研究所の広報担当者、フィアメッタ・ゲディーニ氏は、The Register紙に対し、 AIが音楽を探求するのは「自然なこと」だと語った。

「人間の活動の多くはすでにAIによって行われており、将来的にはさらに多くの活動が行われるようになるでしょう」とゲディーニ氏は述べた。「AIが音楽で何ができるかを探るのは自然な流れです。私たちが使用するアルゴリズムはシーケンス生成に非常に適しているため、技術的な観点からも自然な流れです。」

AIは音楽業界に進出しているものの、人々の仕事を奪うことはないとゲディーニ氏は述べた。彼女はそれを写真に例える。「写真は、人間の活動としての芸術が死んだことを意味するのではなく、写真と芸術の両方において、新たな創造の可能性を切り開くツールに過ぎなかったのです。」

ソニーは、AIがビートルズのスタイルで作曲した別の曲「Daddy's Car」もリリースした。

YouTubeビデオ

これらの曲はあくまでも模倣ですが、将来的にはAIに昔のバンドに影響を受けた曲を作らせることが可能になるかもしれません。その曲は驚くほど似通ったサウンドになり、リードボーカルの声で歌われることで、昔の音楽に新たな息吹を吹き込むでしょう。これは人々に創造性を発揮する新たな方法を提供し、人間と機械の関係を深めるでしょう。

ここでは、AI のポップミュージックを聴いたり、踊る棒人間の動きを見ることができます。®

Discover More