AIは人間よりもいい曲を作れるのか?②

『AIは人間の壁を超えられない? AI作曲悲観論』

今回は、AIが人間を超える作曲が出来ない理由2つの観点から述べたい。前回は、AIの作曲について楽観的な意見を述べた。蓄積されたデータからパターンを抽出することが得意なAIにとって、人間が好む楽曲パターンを見出すことは容易なはずだ。あとはアルゴリズムの精度を上げていくことで、優れた曲が作られる可能性は高まるだろう。それでも超えられない壁があるとすれば…。

AIが超えられない壁は次の2点と考えられる。

①人間の好み(美の基準)は可変的であること。
②人間が共感するような「切実さ」をAIが持つのは難しいこと。

①美の基準は可変的

例えば、流行の変化を考えてみるといいだろう。ファッションで言えば、ベルボトム。かつてお洒落だったものが、いつしか野暮ったくダサいものになり、そうかと思えば忘れた頃に、また流行りだす。あの時確かにダサく見えたのに、今度は何故かお洒落に見える。つまり、美の基準はかくも移ろいやすいものなのだ。

音楽で言えばリバイバルがそれに当たる。あるアーチストが次のムーブメントに取って変わられ、長らく注目されなかった後に、再び脚光を浴びる。その際、そのアーチストが再び時代の空気(社会的背景とも言える)に何らかの形でマッチしていることに注目したい。

クイーンのドキュメンタリーである「ボヘミアンラプソディー」もいい例だ。このヒットの理由を、リバイバルなどではなく、クイーンの曲が普遍的な魅力を備えているからとする向きもあろう。だとすれば、ビートルズだっていつでもリバイバル出来るはずだが、やはりそうはいかないのが現状だ。

「ボヘミアンラプソディー」がリバイバルしたのにはある大きな要因が考えられる。それは、この作品がライブシーンの魅力に溢れているという点だ。昨今の音楽市場は、作品のデジタル配信化とは裏腹に、ライブ市場が盛り上がっている。つまりこの作品のリバイバルは、時代背景にマッチした内容ゆえに生まれたといえるのだ。

だとすれば、AIが人間に受け入れられるヒット作品を作るには何が必要か? 単にデータベースから抽出した普遍的なパターンだけでは足りない(勿論前回述べたように、ある程度のヒット作品は作れるだろう)。その時、その時代の人間が何を求めているのか。それこそ経済が好況なのか不況なのか等も含め、その時代の空気をつかまなければいけない

膨大なデータベースから予測を立てるにしても、社会背景にまで目を向け、かつ可変的な美の基準まで考慮するとなると、その精度を上げるのは容易ではないだろう。最終手段としては、人類全体にチップを埋め込み、生い立ちから現在までの全ての美的遍歴をモニタリングするぐらいのことをすれば可能かもしれない。が、勿論それは現実的ではない。

②切実さと共感

そもそもなぜ、人は音楽を聴くのか。その作品に何か共感するところがあるから聴くのではないか。つまり音楽を通して、その歌い手に、あるいはその作曲家に共感しているのだ。

共感した作品が、それまで醜いとされていたものだとすればどうなるか。その人にとって、その醜は美となるだろう。そしてそうした体験をした人が多く生まれれば、その醜は社会的にも美となる。つまり、美的基準が変わる。これが正に、美の基準が流動的である理由の一つだろう。

結局、美や醜はものの捉え方のひとつに過ぎず、作者への共感によって、その意味づけは変わってゆく。ということは、作者への共感が作品を価値づける大きな要因となるだろう。

※美を捉えるものとして、崇高という概念がある。普段使う崇高とは異なり、畏れや驚きに近い概念で、醜が美になりうることも説明できる。本稿でこの後触れる、生きる切実さに由来する気づきが、この概念との接点かもしれない。詳しくは「ゆめラジオ」さんの動画を御視聴下さい。

では人間はAIに共感できるのか? 直観的に考えてそれは難しいのではないだろうか。その理由はAIには、人生を生きる「切実さ」がないからだ。生きる上での喜びや悲しみや悩みなどの「切実さ」がないものに、人間は共感できるだろうか。

勿論AIが感情を持つようになれば、ある程度の共感が生まれるかもしれない。だがそこには、人間に対して抱く共感にある「切実さ」がない。なぜなら、その「切実さ」はつまるところ、生命の有限さによってもたらされるはずだからだ。

だとすれば、AIが有限の命を持ち、日々人間のように悩みながら生きていたらどうだろうか。確かに「切実に」共感できるかもしれない。だがそれは、もはや人間なのではないだろうか…。

 

お気軽にコメントを↓

“AIは人間よりもいい曲を作れるのか?②” への10件の返信

  1. 切実さ。日々、感じるストレス、悩み、挫折。。。
    それが芸術を作りだすからには、心うごかす芸術は、AIには、おそらく、ムリ。首肯します。
    できれば逃れたい切迫。けれど、それこそ私たちを芸術存在たらしめる、ということ。それは、芸術のためには悩まねばならない、ということか?

    1. コメント有り難うございます。

      人間は放っておけばお腹がすくように、何らかの欠乏を解消する必要に迫られます。それが実用的な技術を生み、さらに洗練・昇華されると芸術的な側面が現れるとも考えられます。

      この洗練・昇華させるプロセスでは、何かが足りないという感覚が必要で、悩みも含め、芸術の素となるのではないでしょうか。

      また何かが足りないからこそ、様々なものごとにアンテナを張り巡らし、それが芸術的な気づきに繋がるかもしれません。

      そしてこの何かが足りないという感覚は、切実さによって生まれるとも考えられます。

  2. 別トピでお世話になりました。ここでもお邪魔します。

    私自身DTM作曲や宅録を趣味としていた時期があり、良い曲とはどういうものかよく考えたものです。曲を作るからには、少なくとも私にとっては偽りなく良いと思える曲を作ります。良いと言ってくれる第三者もいますし、他人が良いと言ってくれる事を意識した作り方を心掛ける事もあります。ただ独創性があるのかと言われればそうでは無いです。それは自分自身が一番良くわかる事で、良いと言って貰えそうな曲は、何かに似た曲になる傾向が強いものです。私はそれが特定の曲に近づき過ぎる事を避けて、「盗作では無いというだけのオリジナル曲」を作る訳です。コード進行が似ればメロディラインを変えたり、メロディラインが似れば代理コードやテンションを使うなどして参考元の印象をボヤかしていくのです。この代替え方法の引き出しが多ければ多い程、簡易的な方法ではありますが、オリジナル曲を作りやすくなります。でもこれをやるのは私だけでしょうか?恐らく多少なりともコードとメロディの理論的知識があるコンポーザーにとって基本的なやり方じゃないかと思うのです。ヒットメーカーは過去に売れた曲の分析などから多くの類似点を持つ曲を量産します。以下、簡単にまとめます。

    ・評価する人は、既存曲を評価基準にする為に新作が何かしらの曲に似る事を無意識的に好む傾向がある。
    ・上の傾向により、まずAに似たÁという曲を作る
    ・Áのコード進行の一部について、定量的方法で代理コードに差し替える
    ・ÁとAのメロディラインを比較して、定量的方法で差異を付ける
    ・上の行為を複数回行い、AとÁが似て非なる曲で、かつ気に入ったと思えればOK(似ていないとすれば、そもそもÁはAと類似性のある魅力を持っていないといえる)

    上はまだリズムや曲構成や奏法や音色や詞について述べて無いので不完全ですが、それらまで含めると話が長くなるのでここでは割愛します。また、定量的方法について定義していません。これについては個人のさじ加減程度の問題で、あくまで一例ですがある音階の変更はEマイナースケール±2度の範囲でとか、2小節に1回くらいの割合でサブドミナントに代理コードを入れるといった具体性さえあればこの手の変更のルールについてある程度の自由度は持ってよいものとします。定量的方法とはこの場合、個人で定義可能な関数のようなものです。
    これらはアルゴリズムです。こういう事は自動で出来るでしょう。何となればそれらの要素は数値と記号に還元するのが容易だからです。
    管理人様の楽観的意見とはこれに近いんじゃないでしょうか。
    問題は革新性やオリジナリティです。
    長くなるので、次のコメントに譲ります。思う事が多すぎて、2回の長文でも収まらないかもしれません。

    1. コメント有難うございます。

      作曲アルゴリズムについての事例、興味深く読ませて頂きました。〜風の曲作りという形のアルゴリズムですよね。トップダウン型のアルゴリズムのとても分かり易い例だと思います。ただ最近はAIに学習させるボトムアップ型のアルゴリズムも増えつつあるのではないでしょうか。

      ところで、個人的に興味があるのが音色です。というのも、最近は音色のシミュレートが革命的なレベルまできており、今や一台のアンプで高価なビンテージアンプ数十台分の音が再現できるようになりました。

      極端な話、音楽を聴く動機はその人特有の音色が目当てだったりします。これは、ボーカルを考えれば分かりやすいのですが、楽器にも当てはまります。使い古されたスリーコード+ペンタトニックスケールによるブルースセッションを、もし飽きずに聴けるとすれば、そこに演奏者特有の音色とタイム感があるからでしょう。

      黒人のブルースミュージシャンのような音色ニュアンスがどうしても出ないと思っていたところで、普通は薬指でやるチョーキングを強引に人差し指でやっていることを知り衝撃を受けたことがあります。つまり、楽器演奏のニュアンスは身体性に依拠するところがあり、AIの再現対象からは遠かったはずでした。

      ところが最近の音色再現の精度を見るに、近い将来、〜風の音色や〜風のタイム感といったニュアンスシミュレートまで進むかもしれません。つまり、人間の身体性までAIが持ち得るということになります。

      これがポジティブなものなのかネガテイブなものなのか、結論づけるのは難しいところです。ただ、AIでも再現できずに残り続ける何かが人間にあるなら、それはまた興味深いものだと思います。

  3. お返事有難うございます。
    今回はあまりカタイ話は抜きにして、かつての経験や感想を言いたいと思います。音色の事です。
    20年弱遡るとDTMといえばハードウェア音源が主流、DAWがようやく日の目を見始めた頃で、いずれにしても音色を追求するには金が掛かりそうな感じでした。私は趣味にすら金を掛けたくない主義なので、ショボい音源でどうやって曲を作るか大分試行錯誤しました。ショボい音源では、自分のイメージした曲にはどうしても至りません。それどころか、ショボい音源というものは、それ自体が悪い意味で楽曲の個性となってしまいます。特に歪み系のギターサウンドなどは致命的で、ハードロックやメタルなどは聴けたものではなくなります。私は自然と、そうした駄目な音色を避け、比較的まともにシミュレートされたピアノやストリングスなどを用いた曲を作る事が多くなりました。いわゆるMIDI音色とすぐ分かるような楽器はアレンジから除かれる傾向にありました。そのせいで、ギターを曲に入れる場合は止むなく自分で録音して、別パートのドラムやベース等の打ち込み音源にミックスするしか無かったのです。その過程で面白いサウンドカードの存在を知りました。Sound Blasterシリーズです。このサウンドカードは安価で、サウンドフォントという機能を使う事が出来、自ら音のサンプリングを行い、サンプリング音を編集し、MIDIに搭載してDTM楽器を作れる優れものでした。かなりの可能性を感じて多少ハマりましたが、サンプリングや編集作業が大変で、しかも思い通りの音源にするのも難しいので次第にやらなくなってしまいました。今でこそボーカロイドという名称がありますが、それ以前にサウンドフォントで同じ事が出来るという事に気が付き、人の声を録音して楽器にして遊んだ事もあります。ただし、当時のPCではメモリが明らかに足りず、「ウー」というハミングを3オクターブ程度サンプリングしたに過ぎません。が、ドラムキットの作成にはかなりの威力を誇りました。
    上は余談になりましたが、私も、曲にとって音色がかなりの決め手になるという意見には大変賛同致します。かつてメインがサックスの曲を作りたいのに音源が駄目だから作れないというジレンマに陥りましたし、打ち込みギター音がダサいから自分で弾くけれども、上手くないから何十回(何百?)もリテイクする羽目になりました。
    さて、それから時代は過ぎ、私がDTMをやらなくなってから十数年が経ちました。今、打ち込み音源はどうなっているのだろうと思って、ふと調べてみると驚愕しました。楽器音色シミュレートの再現性と奏法の数々。これを知り再びDTMをやりたいと思っている矢先ですが、勉強しなきゃいけないことが沢山ありそうなので二の足を踏んでいるところです。

    ところで、あるミュージシャンの奏法やニュアンスがAIにより再現可能か、という事でありましたが、昨今のAIの進化を見るにつけ、将来可能になるだろうと思いました。
    直接関係は無いのですが、GAN(敵対的生成ネットワーク)について、以下の様な技術が開発されたといいます。
    GANはまず、ある風景の実写画像を参照します。GANは予め、モネやゴッホなどの画家の特徴を学習しています。この事によって、GANは最初に与えられた風景の実写画像に対して、写真をモネ風の絵画調に変化させたり、ゴッホのタッチに似せたりする事が出来ているようでした。
    これと同じ様な事が音楽でも可能かどうかだと思うのですが、何となく出来そう(根拠は特になし)じゃないですか?

    1. コメント有難うございます。

      非常に興味深く読ませて頂きました。
      音色の重要性に賛同頂いたのは嬉しいところ。また、返信致します。

  4. 有難うございます。前々回のコメントの最後に、私は「問題は革新性とオリジナリティ」と申しました。音楽に取って難しい事は、革新性やオリジナリティを獲得しつつも、人々に受入れられる事だと感じます。この事は作り手が人であってもAIであっても変わりはないでしょう。

    オリジナリティについてはもしかしたらボーカリストの声質や楽器の音色、節回しの特徴などの「色付け」をそう解釈する場合もあるかもしれません。仮に編曲自体が平凡であるにも関わらずです。ある意味でセオリーを踏襲しなければ受け入れられる事もまた難しいという悩みが付き纏います。ですから成功したミュージシャンですらファンを意識する為に、実際には実験的な曲を発表したいのにそうした冒険心を阻害されてしまう懸念があります。特にポップス業界はビジネス色が強い為に業界的に保守的な曲作りを優先するようになるのでしょう。

    ブルースギタリストのチョーキングのお話は面白いです。管理人様はそれを聴いて、何かしらのニュアンスの違い、特徴を確かに感じたわけですね。そうしたら人差し指のチョーキングが原因だったのかもしれなかった。この事が身体性に依拠するであろう事は、譜面に起こした時に特徴として表れる可能性があると、私は思います。ギター演奏には運指が重要なので、薬指でしかチョーキングしない人にはそれなりのメロディの流れでしか起こし得ないチョーキング、言うなればありふれた自然なチョーキングをする事で聴き慣れたメロディが生まれます。ところが「薬指でやろうとしても自然な流れではどうしても出来ないような箇所でチョーキングをしている」という、本来ならば技術的要因が黒人ギタリストのニュアンスの正体であるかもしれないし、種明かしとして「実は人差し指だった」事が判れば、運指と連動してメロディラインの特徴が変わる事がかえって当然の結果として理解されるのかもしれません。ピアニストのリストは指が長かったといわれます。指の長い人にしか弾けない曲は、それだけでスコアに特徴が生まれ、そのままオリジナリティやニュアンスに繋がると思うのです。
    AIによるスコア分析や波形分析がこれらの特徴を学習する時代は(私があげた以外の特徴も)、コンピュータの性能の上昇に伴い近い将来に訪れるでしょう。ただし、何故AIがある特徴を再現出来るのかという問いについてはAIの一般的なブラックボックス問題になってしまいます。私はAIの専門家ではないし、音楽から離れてしまうので怒られてしまうかもしれませんが、次のコメントで人間側から見たAIの不可知性について考えてみたいと思います。

    1. コメント有難うございます。

      いつも興味深いコメントを頂きまして、感謝しております。ところで、ご提案です。これだけの筆力がある長文コメントを、この欄に眠らせておくのはもったない。ということで、新しい記事に取り入れつつ、アップしてもよろしいでしょうか?

      もし、ブログ等お持ちでしたら是非リンクを貼らせて頂ければと思います。

  5. 勿体無いお言葉です。
    管理人様がお望みとあればとても光栄な事です。ブログの内容は私の興味と相まって、かつ示唆に富んでいて好奇心が掻き立てられます。
    ブログをやりたいと思った事はあります。しかし私はマメなタイプでなく、どうせ長続きしないで放置プレイ必至だろうからやってません。
    新しい記事に取り入れて頂く事は、私としては全然構いません。今後とも楽しく読ませて頂きたく存じます。

    1. ようやくブログをアップしました。
      トップページから入れます。

      記事になるような題材が多すぎて、まだAI論には達していませんが、お気軽に読んで下されば幸いです。

コメントを残す

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください