私は今日は、初音ミクさんのライブコンサート&企画展である「マジカルミライ」のために、千葉県千葉市美浜区の幕張メッセに来ている。
今年のマジカルミライは10周年となり、「マジカルミライ 10th Anniversary」となっている。
幕張メッセへは、関西の私の家から4時間ほどかかるので、本日は幕張メッセ近くのホテルに宿泊。

初音ミクとは何かというと、本来は、パソコン用の歌声合成ソフトウェアの名称だ。
初音ミクというソフトウェアは、15年前の2007年8月31日に、北海道札幌にあるクリプトン・フューチャー・メディアという会社から発売され、この日が、初音ミクの誕生日とされている。
このソフトウェアには、初音ミクという16歳の少女というキャラクターが設定され、世界中で大人気だ。

楽器の音を電子的に合成するシンセサイザー(昔はアナログ式だった)のことは、ぼんやりとでもご存じの方が多いと思う。
シンセサイザーは1960年代に開発され、製品として発売されたが、当初は、重装備な機械で、非常に高価だった。
1970年頃に、音楽家の冨田勲さんが個人で、モーグ博士が開発したモーグ・シンセサイザーを約1千万円で購入している。
冨田さんは苦労しながらこのシンセサイザーを使いこなし、これによって、世界的ヒットアルバムを数多く制作した。
冨田さんは、1986年の『宇宙とシンセサイザー』という本で、シンセサイザーは、いかなる楽器の音でも・・・ストラディバリの音でも完全に再現出来ると書かれていた。

だから、楽器演奏に関しては、現在では、シンセサイザーが人間を追い越したと言えるかもしれない。
尚、現在は、シンセサイザーは、パソコンソフトで実現されており、無料のものでも、相当な機能があると思う。
つまり、誰でも、かつては王侯貴族でもなければ持てなかったオーケストラを個人で所有出来るようなものだ。

ところが、人間の歌声というのは、楽器とは桁外れに難しいものだった。
『2001年宇宙の旅』(1968)で、HAL9000という人工知能コンピューターが『デイジーベル』という歌を歌うシーンがあるが、それは、2001年なんかではとても無理なことだった(まあ、あの映画の宇宙船も現在でも全く無理だが)。
コンピューターによる歌声合成の研究は、2000年に、ヤマハがバルセロナ(スペイン)のポンペウ・ファブラ大学と共同で開始し、開発されたシステムは「VOCALOID(ボーカロイド)」と名付けられ、2003年に発表された。尚、ここらの経緯はもっと複雑だが、一応、簡単にこう書く。
初音ミクの基本システムは、このVOCALOIDだが、VOCALOIDも初音ミクもどんどん進化していっている。
楽器に比べ、なぜ人間の歌声の合成がかくも難しいのかというと、簡単な言い方をすれば、人間の歌声というものは、数十もの楽器を瞬時に切り替えながら演奏するような複雑なものだからだ。

ところで、VOCALOIDシステムを使った歌声合成ソフトウェアには、クリプトン・フューチャー・メディア社にも、初音ミクの他に、鏡音リン&鏡音レン(2人で1セット)、巡音ルカ、MEIKO、KAITOなどがあり、1st PLACE社にはIA(イア)とONE(オネ)があるし、他にも、世界中に沢山ある。
世界的にも、クリプトン・フューチャー・メディアほど成功した例はないと思うが、ちょっと気が付くことがある。
それは、初音ミクの歌声、巡音ルカの歌声というふうに、歌声合成ソフトウェアごとに、丁度、人間のように歌声の性質が決まっていることだ。
だが、いずれは、1つのソフトウェアで、いろいろな声の歌声を発したり、声の質の調整や、あるいは、新しい声を作ることも出来るようになるだろう。
現在の歌声合成ソフトウェアは、人間の声をサンプリングしているので、サンプリングした人間の声に似ているのである。
しかし、AIがインターネット上の歌声・・・たとえば、YouTube動画の歌声を学習すれば、いずれは、あらゆる歌声を作れるようになる。
それが何年後かは分からないが、収穫加速の法則といって、テクノロジーの進歩の速度はどんどん速くなるので、思いのほか早く実現するかもしれない。
1960年代のモノクロアニメで、人間の少女そっくりに作られたロボットが、元の少女の声を聞いて、それを真似、やがて、全く同じ声を出すという場面があった。
そんな空想が現実になるのに随分時間がかかるものだが、SFの出来事の多くが、これからもどんどん実現していくだろう。

尚、下の一番最後にご紹介した『楽しいAI体験から始める機械学習』は私の著書で、初音ミクを含め、テクノロジーの進歩がもたらす世界の変革について少し述べた(最終章コラム)。よろしければ、ご一読願いたい。