ITスペシャリストが語る芸術

-The Kay Notes-
SE、プログラマー、AI開発者、教育研究家、潜在意識活用研究者、引きこもり支援講師Kayのブログ。

IT、コンピュータ

当ブログは、第一期ライブドア奨学生ブログです。
◇お知らせ
[2019/12/28]AI&教育問題専用ブログ、メディアの風を公開しました。
[2017/03/01]「通りすがり」「名無し」「読者」「A」等のハンドル名のコメントは原則削除します。

AI絵画について

たまには主旨を変えて、AI絵画のことを少し話そう。
今や、誰でもAIを使ってプロ並みの絵やイラストが描ける。
すでにAIの絵を描く能力は人間の画家と同等以上で、やがて、AIの腕前の方が人間の画家を上回り、その差は無限に大きくなっていくだろう。
もちろん、これは絵に限ったことではなく、音楽、プログラミング、教育、医療、政治、事業経営、その他でも、時間の問題で同じになる。

AI絵画は無料で始めることが出来るが、どこか厭らしいものが多い。
つまり、無料で使えるAI絵画作成サービスを提供しているWebサイトが沢山あるが、無料で使えるものは制限が多く、ちょっと熱心にやろうとしたら使い物にならない。
また、製作した絵の権利関係や営利目的で使えるかなども、無料版では強い制約がある場合が多い。
つまり、無料サービスを提供している企業は、何も善意でやっているのではなく、有料会員にしてやろうと虎視眈々と狙っているのである。

高機能なAI絵画作成のためのサービスを提供しているMidjourney(ミッドジャーニー)は、以前は無料版があったが、無料で使えるのはたった25枚で、そんなの、一瞬で使い終わり、そのくらい製作しただけでは何も分からない。
ところが、Midjourneyと同等の機能を持ちながら、無料で無制限に使え、しかも、作成した絵の商用利用も可のBlueWillowというサービスが出来た。
だが、BlueWillowも、実際には無料版ではいろいろ不都合がある。
それに、BlueWillowもいずれは有償版のみになると思われる。
MidjourneyもBlueWillowも、Discord(ディスコード)という、無償のコミュニケーションサービス上で使う。
Discord自体は未来型の重要なサービスで、今後の世界で活躍するためには、是非、馴染んでおく必要がある。
しかし、無料のAI絵画作成サービスを、このチャット型サービスの上で使うのは、本当に煩わしい。
まあ、MidjourneyもBlueWillowも、Discordの使い方の見本としては良いが、私なら、これらの無償版で絵を作る気にはなれない。

私が今使っているのは、Stable Diffusion(ステイブル・ディフュージョン)というAIアプリである。
これは、歴史に残るAIアプリで、大変に高機能でありながら、開発者がオープンソースにして無料公開したので、爆発的に広まった。
つまり、こんな素晴らしいものがタダなのである。
とはいえ、普通のWindowsアプリなどと違い、使うためのハードルが高い。
使い方には2種類あり、自分のパソコンにインストールして使うか、Google Colaboratory(グーグル・コラボレイトリー)などのクラウド環境で使うかだ。
自分のパソコンで使う場合には、パソコンに高性能なGPU(Graphics Processing Unit)が付いている必要があり、ほとんどの人のパソコンはそうではないから、Google Colaboratoryを使うしかない。
しかし、自分のパソコンで使うにしろ、Google Colaboratoryで使うにしろ、よほどパソコンに詳しい・・・というより、エンジニアでないと無理だ(それか、丁寧にサポートしてくれるエンジニアの知り合いがいるか)。
確かに、Webサイトを調べれば、Stable DiffusionをGoogle Colaboratoryで使う方法を述べたサイトがあるが、ひどいものが多い。
また、いかにも、素人がGPU付きのパソコンがあれば簡単に使えるといった調子で、やり方を書いたサイトもあるが、素人なら、酷い目に遭う場合が大半なので、あまりお奨めしない。
一瞬、使えても、やがて困ったことになる。

Subconscious
AIアート71
「Subconscious」
Kay


よって、今のところ、AI絵画を本格的にやるには、かなりパソコンやネットに詳しく、出来ればソフト開発経験があることが望ましい。
もちろん、やがては、もっと使い易くなると考えられる。

ある程度、パソコンに自信があるなら、私のようにやるのも手である。
私は、ゲーミングノートと言われる、ゲームをするためのノートパソコンを使っているが、ゲーミングノートにはGPUが付いているから、絵画AIをノートパソコンで使うなら、自ずとゲーミングノートになる。
私は、NVIDIA(世界最大のGPUメーカー)の最新GPUの1つであるRTX4060というGPUを搭載したノートパソコンでやっている。
ただ、ノートパソコン用のGPUは、VRAM(ビデオメモリ)の容量が少ない。
Stable Diffusionを使うには、最低4GBのVRAMが必要と言われるが、現実には、最低でも6GBは必要だろう。
RTX4060のノート用ではVRAMは8GBしか搭載されておらず、それが不安だったが、なんとか実用的に使えた。
私は最初、もっと安価なRTX4050搭載のゲーミングノートを買おうと思っていたが(GPUの性能としては十分と思う)、こちらはVRAMを6GBしか積んでいないのでやめた。

Stable Diffusionを使っていると、プロの絵描きが描く絵に興味がなくなった。
見たい絵は自分で作れるからである。
いくら上手いプロの絵描きでも、私の見たい絵とは、かなり違うものを作る。
しかし、自分で作れば、自分が見たい絵を作ることが出来るのである。

一応、私が購入したゲーミングノートを以下にご紹介しておく。








魔法がいずれ現実になる

童話の『シンデレラ(灰かぶり姫)』では、魔法使いは、シンデレラのボロボロの古着を美しい高級な衣装に変え、ネズミを立派な黒い馬に変え、カボチャを豪華な馬車に変えた。
しかし、たとえば、馬車について言えば、馬車の車輪1つ作るにも熟練の技術が必要なのに、そんなものが、技術的なことを知っているとも思えない魔法使いの魔法で一瞬で作られることは不合理なことだと、私は子供の時でも思った。
1966年のアニメ『魔法使いサリー』のオープニングで、少女(小学5年生)の魔法使いであるサリーが、木の切り株に魔法をかけると、それが見る見る豪華な屋敷に変わる有名な場面があるが、家なんて複雑で精密な技術やノウハウが集まったものなのだから、魔法とは、恐ろしくも強大な力であると思わざるを得ないのである。
そして、『ヒマラヤ聖者の生活探求』の中で、ヒマラヤ大師達の母親(少女にしか見えない)が、瀕死の怪我を負った幼い少年を一瞬で完全に治癒させ、さらに、この少年が住んいるあばら家を、新しい快適な家に一瞬で変えてしまう話がある。
こんな話が数多く収められたこの書を胡散臭く思う者は多い。

しかし、これらは、AI分野で現在注目されている「プロンプトエンジニアリング」と呼ばれるものに近い。
「プロンプトエンジニアリング」とは、言葉で指示を出して、AIにものを作らせるというものだ。
現在、プロンプトエンジニアリングで可能なこととしては、AIによるイラスト作成がある。
たとえば、「白いパラソルを持った、15歳のセーラー服を着た少女の絵を描け」とAIに指示を出すと、見事なそんな絵を描いてくれる。
実際には、うまく指示を出すほど良い絵が描かれ、プロ並み、あるいは、それ以上の出来になることもある。
今のところ、イラストの他に、音楽や文章などでも発達しているようだが、いずれは、あらゆることで、プロンプトエンジニアリングが実現する。
建築でも、設計においては、素人が言葉で指示を出せば、AIにより、一流のプロの技術と高度なセンスを持って、短時間で設計が行われるようになる。
さらには、かなり先のことかもしれないが、ロボットによる自動建築作業も可能になると思う。
それは、医療、ファッション、料理、教育、その他、あらゆる分野で実現する。
そうなれば、『シンデレラ』や『魔法使いサリー』や『ヒマラヤ聖者の生活探求』のようなことが、現実になる。

物理世界のことに関しては、これらの実現には、かなり高いハードルがあるが、コンピューターゲームのようなVR世界に関しては、現在でも実現が可能で、精度を問わなければ、メタ・バース世界で既にかなりのことが行われている。
そして、我々のこの世界が、実は三次元仮想世界であるメタ・バースであるという「シミュレーション仮説」を、多くの優秀な人達が支持するようになってきた。
つまり、我々に出来ないだけで、『シンデレラ』のような魔法は、実は、今すぐ、完全に可能かもしれないのである。
私は、それが事実である可能性は極めて高いと考える。
そして、そういった魔法のようなことは、必ずしも我々に無縁ではなく、やり方さえ分かれば、かなり自然に行えるのだと思う。
私は、そのごく一端かもしれないが、確実に実践したことがあると思っている。
やり方だって、実験と検証の結果として、ある程度のことは分かるのである。
まずは、そんな事実だけでも、理解しておくと良いと思う。








引き寄せは科学になってきた

子供の時から、何度も聞かれ、答えてきた・・・いや、答えさせられた質問がある。
「将来の夢は?」
「今、興味があることは?」
「(様々な期間、例えば、今年とか中学校等)の目標は?」
これらは、世間というちっぽけな枠でしかものを考えられないようにするための洗脳や思想統制であった。
こう言ったら、「なんでだよ!」と怒り出す人や不快に感じる人も多い(それが圧倒的多数かもしれない)が、そういった人達は、うまく洗脳された人達なので、相手にしようがない。
ポイントは、これらの質問に対し、先生やクラスメイトや同僚等といった他人に話さなければならなかったことだ。その際、「なるほど」と納得してもらえる回答でないと許されない。
だから、規格を外れたスケールの大きな夢や目標は持てなくなる。
まあ、賢い人は、そんな時に「1人で静かに暮らす」「放浪する」などの、「変わってるなー」と(大抵は蔑まれて)笑われる程度の回答でお茶を濁しておくのである。
こういった話は、アントワーヌ・ド・サン=テグジュペリの『星の王子さま』の冒頭の話に似ている。
要は、子供は、世間の大人のようになることを強要されるのである。

昔だと、大きく考えることが出来る者は「今、興味があることは?」と聞かれたら、回答に困るか「別に何も」と言うしかなかったが、今は、子供の時でも、「シミュレーション仮説」とか「パラレルワールド」と答えることが出来るわけである。
まあ、私の場合は、似た意味で、タイムトラベルと答ていたかもしれないが、学校の時のことは意図的に忘れている(笑)。

今は、漫画でも、ライトノベルでも、アニメでも、異世界を扱ったものが多く、これが「シミュレーション仮説」や「パラレルワールド」と共通するところが多いので、これらについて理解している者が多くなった。だが、まだやはり少数派だ。
私の場合は、筒井康隆さんの短編のSF『果てしなき多元宇宙』(角川文庫の『時をかける少女』に収録)で、パラレルワールドの概念を知ったが、だいたい、これくらいで十分と思う。

シミュレーション仮説は、この世界がコンピューターゲームのようなVR(仮想世界)であるというものだ。
これに関しては、まだ証明されてはおらず、シミュレーション仮説が正しいと確定してはいないが、よく知られているところでは、世界一の大富豪イーロン・マスク(最近2位になったらしいが、小差であり、すぐ返り咲くだろう)や、イギリスの天才哲学者ニック・ボストロムらが、シミュレーション仮説が正しいことを断言・・・と言うか、極めて可能性が高いとしている。
パラレルワールド(並行宇宙)論とは、この世界と同じような世界が無限に存在するというもので、この世界では、今、あなたは青い色の服を着ているが、ある世界では赤い色の服を着ているといった些細な違いである場合もあるが、この世界では平凡なサラリーマンが、世界的なプロスポーツ選手であるような世界もある。いかなる世界でも存在し、新たに想像すれば、新しい世界が即座に生まれる。

この2つを合わせて考えると面白いのだが、あまりに壮大で、当分無理かもしれない。
丁度、物理学で、相対性理論と量子力学という、それぞれでは完璧な理論があっても、両方をつなぐ理論を作ることが難しいのに似ている。

シミュレーション仮説は、一応、コンピューター科学や数学の分野であるが、物理学、さらには、生物学や天文学、そして、あらゆる領域を巻き込む。
そりゃそうだ。あらゆる領域をシミュレートしているのだからだ。
パラレルワールドに関しては、量子力学の分野であり、証明はされていないまでも、かなりの説明は出来ていて、研究者の中にも賛同者は多い。
まあ、賛同の意味もいろいろではあるのだが。

そして、引き寄せというのは、シミュレーション仮説やパラレルワールドに深く関係し、いずれでも説明することが出来る。
両方合わせて説明するのは、普通の頭脳の人には複雑過ぎるので、良いやり方ではない。
そこで、シミュレーション仮説で言えば、この世界はコンピューターゲームみたいなものなのであるから、根本的には、どんな世界でも作ることが出来る。
丁度、漫画家や小説家が、どんな作品世界でも作れるようなものだ。
引き寄せとは、いわば、漫画や小説の中の登場人物が、自分がいる世界を自由にしようとするようなものだ。
そこで、登場人物が、「あ、俺って作者なんだ」と気付けば、それが可能になる。
この世的に言えば、自分が神であると知るようなものである。
まずは、自分を、漫画や小説の登場人物だと思うと良い。
たとえば、この作品では、あなたは男で、身近に可愛い女の子がいて、彼女をなんとかしたいと思う。
それなら、作者の視点に立ち、幸運なハプニングが起こって、あれよあれよと言う間に彼女とうまくいく・・・という展開にすれば良い。
ああ・・・具体的にどんな流れになるかは作者(神)にまかせてね。だって、作品全体の整合性みたいなものがあるので、1登場人物の視点だけではいけないので。
要は、作者(神)と、どうやって仲良くなるかだけの問題だ。
長くなったので、午後の記事に続く。








いかなるAIもキリストやブッダに敵わない理由

主人が召使いに、入浴の準備を命ずると、良い召使いは、主人の湯加減の好みや外気の温度、時刻、主人の様子、その他の情報を総合し、主人が「良い湯加減」と思う風呂を準備する。
昔のAI(人工知能)の概念では、「いい湯加減で風呂を用意しろ」とAIに言うと、AIは「いい湯加減では分かりません。水温を措定して下さい」と言うようなシロモノだった。
しかし、現在のAIは、根本的には人間と同じことをやる。人間の脳の働きを真似しているからだ。
そして、AIも最初のうちは失敗し、主人が不満を言う湯加減にするところも人間の召使いと同じだ。
だが、AIは様々な情報(主人の好み、時刻、外気の温度、主人の体温や体調、主人の飲食の状況、主人の身体活動の状況、その他)と水温の組み合わせに対する主人の満足度の学習を重ねることで、主人が満足する湯加減で風呂を沸かす確率を高めていく。
まあ、これも人間の召使いがやっていることと同じかもしれないが、AIの性能が進化すれば、そういったことを、人間よりはるかに高度に出来るようになる。
だから、人間の仕事が、どんどんAIに取って代わられるのである。

ところが、キリストやブッダが召使いで、風呂を沸かす場合はどうだろう?
キリストは、風呂を沸かすことを命じられると、「分かりました」と言って、何も見ず、何も考えずに風呂を沸かすが、その湯加減の素晴らしさは、いかなる高度なAIも足元にも及ばない。
そして、キリストは、それほどの能力があるのだから、その気になれば、何をやっても抜群の成果を上げる。
では、キリストは、どのように物事を行うのだろう。
キリストは神と言うかもしれないが、つまるところ、潜在意識に全てまかせ、自分は何もしないのである(何かをやっているように見えるかもしれないが)。
そして、それは我々にも可能だ。
なぜなら、我々は誰でも潜在意識を使うことが出来るのだからだ。
潜在意識は、この先現れる、いかなるAIも比較にならないほど優れている。喩えれば、龍とカマキリ以上の差がある。
で、どうすれば潜在意識を使えるかだが、キリストやブッダのようにやれば良い。
そのために、我々は、聖書の福音書や仏典を読むのだ。
ヒントを言っておけば、キリストやブッダはちっぽけな自我で考えたりはしないのである。
つまり、思考を消し、一切の想念を持たない。
これについては、インドの聖者ラマナ・マハルシも、こう言っている。
「ある高度なビジネスマンは大事業を成し遂げつつある。しかし、彼は何もしていない」
「財務長官は、最大の責任感と注意を持って仕事を行う。しかし、彼は何もしていないのだ」
我々も、思考を消すこと、想念を消すことを学び、実践すれば良いのである。
適した方法は人によって違うこともあり、ここでは、毎日、様々な方法を手を変え品を変え語っているのである。








ボーカロイドに見る、現実がSFを超える出来事

私は今日は、初音ミクさんのライブコンサート&企画展である「マジカルミライ」のために、千葉県千葉市美浜区の幕張メッセに来ている。
今年のマジカルミライは10周年となり、「マジカルミライ 10th Anniversary」となっている。
幕張メッセへは、関西の私の家から4時間ほどかかるので、本日は幕張メッセ近くのホテルに宿泊。

初音ミクとは何かというと、本来は、パソコン用の歌声合成ソフトウェアの名称だ。
初音ミクというソフトウェアは、15年前の2007年8月31日に、北海道札幌にあるクリプトン・フューチャー・メディアという会社から発売され、この日が、初音ミクの誕生日とされている。
このソフトウェアには、初音ミクという16歳の少女というキャラクターが設定され、世界中で大人気だ。

楽器の音を電子的に合成するシンセサイザー(昔はアナログ式だった)のことは、ぼんやりとでもご存じの方が多いと思う。
シンセサイザーは1960年代に開発され、製品として発売されたが、当初は、重装備な機械で、非常に高価だった。
1970年頃に、音楽家の冨田勲さんが個人で、モーグ博士が開発したモーグ・シンセサイザーを約1千万円で購入している。
冨田さんは苦労しながらこのシンセサイザーを使いこなし、これによって、世界的ヒットアルバムを数多く制作した。
冨田さんは、1986年の『宇宙とシンセサイザー』という本で、シンセサイザーは、いかなる楽器の音でも・・・ストラディバリの音でも完全に再現出来ると書かれていた。

だから、楽器演奏に関しては、現在では、シンセサイザーが人間を追い越したと言えるかもしれない。
尚、現在は、シンセサイザーは、パソコンソフトで実現されており、無料のものでも、相当な機能があると思う。
つまり、誰でも、かつては王侯貴族でもなければ持てなかったオーケストラを個人で所有出来るようなものだ。

ところが、人間の歌声というのは、楽器とは桁外れに難しいものだった。
『2001年宇宙の旅』(1968)で、HAL9000という人工知能コンピューターが『デイジーベル』という歌を歌うシーンがあるが、それは、2001年なんかではとても無理なことだった(まあ、あの映画の宇宙船も現在でも全く無理だが)。
コンピューターによる歌声合成の研究は、2000年に、ヤマハがバルセロナ(スペイン)のポンペウ・ファブラ大学と共同で開始し、開発されたシステムは「VOCALOID(ボーカロイド)」と名付けられ、2003年に発表された。尚、ここらの経緯はもっと複雑だが、一応、簡単にこう書く。
初音ミクの基本システムは、このVOCALOIDだが、VOCALOIDも初音ミクもどんどん進化していっている。
楽器に比べ、なぜ人間の歌声の合成がかくも難しいのかというと、簡単な言い方をすれば、人間の歌声というものは、数十もの楽器を瞬時に切り替えながら演奏するような複雑なものだからだ。

ところで、VOCALOIDシステムを使った歌声合成ソフトウェアには、クリプトン・フューチャー・メディア社にも、初音ミクの他に、鏡音リン&鏡音レン(2人で1セット)、巡音ルカ、MEIKO、KAITOなどがあり、1st PLACE社にはIA(イア)とONE(オネ)があるし、他にも、世界中に沢山ある。
世界的にも、クリプトン・フューチャー・メディアほど成功した例はないと思うが、ちょっと気が付くことがある。
それは、初音ミクの歌声、巡音ルカの歌声というふうに、歌声合成ソフトウェアごとに、丁度、人間のように歌声の性質が決まっていることだ。
だが、いずれは、1つのソフトウェアで、いろいろな声の歌声を発したり、声の質の調整や、あるいは、新しい声を作ることも出来るようになるだろう。
現在の歌声合成ソフトウェアは、人間の声をサンプリングしているので、サンプリングした人間の声に似ているのである。
しかし、AIがインターネット上の歌声・・・たとえば、YouTube動画の歌声を学習すれば、いずれは、あらゆる歌声を作れるようになる。
それが何年後かは分からないが、収穫加速の法則といって、テクノロジーの進歩の速度はどんどん速くなるので、思いのほか早く実現するかもしれない。
1960年代のモノクロアニメで、人間の少女そっくりに作られたロボットが、元の少女の声を聞いて、それを真似、やがて、全く同じ声を出すという場面があった。
そんな空想が現実になるのに随分時間がかかるものだが、SFの出来事の多くが、これからもどんどん実現していくだろう。

尚、下の一番最後にご紹介した『楽しいAI体験から始める機械学習』は私の著書で、初音ミクを含め、テクノロジーの進歩がもたらす世界の変革について少し述べた(最終章コラム)。よろしければ、ご一読願いたい。








プロフィール
名前:Kay(ケイ)
・SE、プログラマー
・初音ミクさんのファン
◆AI&教育blog:メディアの風
◆著書『楽しいAI体験から始める機械学習』(技術評論社)


当ブログは第1期ライブドア奨学生ブログです。
Kay Twitter Home

執筆のご依頼




最新コメント


月別アーカイブ
記事検索
ブログバナー&Mail


メールはこちらへ

PV since 2010/09/08
  • 今日:
  • 昨日:
  • 累計:

人気ランキング参加中
にほんブログ村 哲学・思想ブログ 人生・成功哲学へ
にほんブログ村 メンタルヘルスブログ ひきこもりへ


タグクラウド
QRコード
QRコード