土曜にちょっと思い付いて始めたことが結局無駄だったので、週末を潰した。まあ、雨だったし、外出しない予定だったからいいけど、ちょっと気分が悪い。

やりたかったのは、以前から気になっていた、GPMの曲に初出年が入っていない(GPMのページに表示されている年も誤っていることが多い)ので、自分で付ける仕組みを作ることだ。

これが意外に奥が深かったのと、GPMのお節介のせいもあって、意外に難しかった。基本的には、曲・演奏情報の公開DB(今回はMusicBrainzを使おうとした)で検索すればいい。が、そもそも、演奏者名、アルバム名、曲名で検索すると複数の候補が出て来て、どれが「正しい」かの判別が難しい。例えば、同じアルバムが再発された場合である。その場合は最古のものを選べば正しい可能性が高い。一方で、クラシック音楽の演奏のように、同じ人が同じ曲を何度も録音して、同じアルバム名で発売している場合、最古では正しくない。また、ライブ盤の区別もする必要がある。

更に、GPMは表示のモード(日本語/英語)によって、前記の情報をローマ字(英語モードの時の日本語の曲)や片仮名(日本語モードの時の海外の曲)にしてしまうことがあるので、演奏者名などでの比較すらままならないことがある。

かなり苦労して、年を取得する手順・方法は見つかったのだが、やっぱり最後は複数候補の判別が困難なことが分かったので、正式な実装・採用は止めた。

基本的には、音響指紋(fpcalcやffmpegなどのプログラムでAcoustIDが計算できる)を使うことで、ある演奏から、演奏者名と曲名の特定ができる! と思ったのだが、再発などによる複数の候補が出てくるうえに、意外に重複するようで、あるAcoustIDで検索すると、別の人の全く違う曲(演奏)も出て来る(処理時間やデータ量による制限なのだろうが、これで本当に「指紋」と言えるのか?)。そのため、指紋以外に、演奏者名や曲名などでの判定も要ることが分かった。

その場合、上記のGPMのローマ字・片仮名問題以外に、一般的な問題もある。例えば、同じアルバムなのに、異なる名前・表記になっていることがあるのだ。具体的には、リマスター盤のアルバム名や曲名の最後に"(2009 Remaster)"のような文字列が追加されていることが多いが、それが、GPMとDBで記載方法が異なっているのだ。元々、正式には付いていないものなので、どちらが正しいとも言えないし、正式な曲名にも付いていることがある(例: 森高の「ザ・ストレス (ストレス中近東ヴァージョン)」)ので、"("や"["以降を全部無視すればいい訳でもない。そもそも、リマスター盤の初出年をいつにするかも難しい。更に、名前の中の記号の表現が異なる場合(例: "~"と"〜")もある。演奏時間も使えると思ったが、実際には、微妙に(1秒前後)異っている場合が多いので、単純には使えない。

(10/30 21:16追記) リマスターで思い出した。更に重箱の隅をつつく話なのだが、リマスター盤の年をいつにするか(オリジナル盤の発売年か、リマスター盤の発売年か)は、まあ、オリジナル盤の発売年がいいだろう。が、良くリマスター盤のボーナストラックとして、当時未発表だった曲("Previously unreleased" tracks)が入っていることがある。それの年は、いったいいつにすればいいのか?

初出年=初めて発売(リリース・公開)された年という原則では、リマスター盤の発売年が正当だが、それではどうも納得できない。下に書いたように、「これが出た(出てないけど)頃は*してたなあ」や「世の中は*だったなあ」とか思えなくなってしまうのだ。逆に、その曲を録音した年にすると、公開されてもいない年を「初出年」にするから、捏造のようになって、記録の信頼性が下がってしまう。なので、今は、原則として、初公開のボーナストラックはリマスター盤の発売年にしている。なお、ライブ盤は、録音された時に演奏が公開されたのは確かなので、かなり後年に発売された場合には録音=演奏された年にしている。

まあ、記録というのは、本来、情緒とは正反対のものなのだろうから、割り切って、全部、その盤の発売年に統一すればいいのだろうが、趣味のものなので、何とも割り切れない状況が続いている。そして、この問題は、GPMに限らず、CDを買った場合に常に起こ得るので厄介だ。

この問題の原因は、初出年は単なる記録なのに、情緒を絡めていることなのだと思う。更に、「初出」としているからややこしくなる訳で、純粋に「リリース(発売)年」にすればいいのだろう。そうすれば、再発盤だってそれが発売された年にすればいいので、何も悩む必要はない。だから、単純に発売年にしているGPMのやり方は、規則が統一されているという点で、実は正当なのかも知れない(そして、これは、西洋人にはごく自然な論理的な思考から来ているのかも知れないと考えるのは、買いかぶり過ぎか)。ということは、僕は何も悩む必要がなかったのか? (そうではないと思うが) 全く奥が深い・・・

ローマ字や片仮名での表記は、ある程度は「別名」としてDBに入っているのだが、やはり、GPMとDBで異なる場合(例: The Beatlesの片仮名表記は、MusicBrainzでは「ザ・ビートルズ」、GPMでは「ビートルズ」)があって、判定は容易ではない。

そもそも、GPMがちゃんと年を入れてくれればこんな苦労はしないのだが、彼らも多くの人も、こんな些細なことには無頓着なのだろう。確かに、演奏が聴けることが一番重要だ。

では、なぜ演奏の初出年が欲しいかであるが、僕の物好きとしか言いようがない。もちろん、曲や演奏の良し悪しに背景は無関係と思っているのだが、聴きながら、その曲がいつ頃演奏・発売されたのかが分かると、同じ人が同じ曲を複数回録音している場合の違いから、「この人は、*年間でこんな風に成長(退化)したのか」とか思うことがあるし、「これが出た頃は*してたなあ」、「世の中は*だったなあ」とか思えば親近感が湧くような気がするし、郷愁にふけることもできるではないか。物好き以外に、特にクラシック音楽では、(このブログで書いているように)他の人に伝える場合に、「※の*年の版」と指定しなければ正しく伝わらないこともある。

そんな訳で、今はやりのAIを活用して、曲(演奏)を入れたら、音だけでなく、歴史的な情報(webはもちろん、過去の出版物など)を使って考証して、一発で正しい曲・演奏情報(メタデータ)を出してくれるシステムが欲しくなった。誰がいつ何を演奏・発売したという「事実」は、それほど多くのバリエーションは生じないだろうから、文章を理解できるAIに演奏家の経歴などの資料を片っ端から読ませればできそうではないか。Googleなら、やる気を出せばすぐにできるだろうが、こんな情緒的・ニッチなことに価値を見出さないだろうから、まずやらないだろうw

書いていて、「これはドクが西部劇の時代に作った製氷機(大山鳴動して氷一個)だ」と思ったw

更に、現実のことを考えると、GPMの曲(演奏)は一過性のもので、その時聴いたら終わりで、長く残る訳ではないのだから、こんなに手間を掛けて年を自動で付ける(しかも正しいとは限らない)なんてペイしない(元々曲名や演奏者名などは付いているのだから、それで充分だろう)。気になったら自分で調べれば良く、買ったものだけは詳しく調べて付ければいいのだ。が、そこは技術者の性で、理論的にできそうなことや、自分でやると手間が掛かるけど自動でできそうだったら、その仕組みを作りたくなってしまうのだろう・・・

  •   0
  •   1

コメントを書く

名前    

メール 

URL