この記事は「AIにサポートされつつ自力で絵を描く」記事です。「AIに機械学習させて自分の絵柄を描いてもらう」ではないのでご注意ください。
AIイラストをいまから初めてみるまでの導入記録でもあります。
やってみようと思ったわけ
2022年中ごろから、本格的にコミックイラスト分野にもAI技術の話が及んできたのを見て、一素人の絵描きとしても「面白そうだな。何かに使えないかな~」と思ってました。
が、ネットで見かける出力された絵は「引きで見るとかっこいいけど、よく見ると構造的にぐちゃぐちゃ」が多く、これをこのまま背景や小物の素材や参照用にするには厳しいな~という感想も持ってました。
そうこうしているうちに月日がたち、このまとめを見る。
「あ、これだわ」と思いました。
AIイラストの(現状の)強みである「ぱっと見の雰囲気の良さ」と、弱みである「細部の弱さ」も、「AIイラストを下絵として、仕上げまでは自分で作画すればどっちも生かせるんじゃない?」と。
というわけで早速、素人のAI導入から実際にやるまでの流れを記録として残しておきます。
まずはAIイラストを出力してみる
出力環境の導入まで
あれこれ調べた結果、最終的に「にじジャーニー」を使ってみました。
群雄割拠のサービスの中から、いい感じのを探すのが大変で大変で…あれこれ試して見比べて、最終的に選んだ理由は下記です。
- 標準でコミックイラストの絵柄が出力できる。
- 全方位的なAI出力サービスだと、目当てのコミックイラスト調にするだけでも大変だった…。
- 日本語で指示ができる。
- 英語指示でも簡単な単語で十分使えますが、最初のステップとしてはネイティブ助かる。
- ネットサービスなので、ローカル環境の構築は不要。
- なんとなく「AIをガチにやるならローカル環境の構築必須なのでは?」と思ってましたが、調べてみたら高度なAIイラストを作成してる方々も非ローカルの人は結構多かった。
- 無料プランがある(出力数に制限あり)
- ネットサービスの場合、最初から有料プランのみというところも多く、初心者にはまずは無料助かる。
とりあえず、2023年3月に試した導入までの流れを簡単に描いときます。
(仕様がすごい速さで変わっている界隈なので、詳しいことは各自検索してください)
- Discordをインストールする。必要ならアカウント作成してログインしておく。
- 自分は別用途ですでに導入していましたが、使ったことない方はDiscord自身のアカウントを作成しておきましょう。簡単にいうとチャットツールです。
- にじジャーニーの「はじめに」から「ディスコードに参加しましょう!」をクリックする。
- Discordのアプリ画面に移動する。
- Midjourneyに入会する。
- 最初に「なんで?」ってなったところ。
- にじジャーニーはAI出力サービス「Midjourney」の一部という位置づけで、まずはMidjourneyの利用もできるようにする必要があるようらしい? この辺、がちゃがちゃいじっていて順序があいまいですが、とりあえず入っておきました。
- Midjourneyを使うつもりがないなら放置でいいみたい。
- にじジャーニーに入会する。
これで導入完了です。
イラストを出力してみる
以降の手順はDiscord内でも丁寧な誘導があったり、「はじめに」にも記載があるので詳細は割愛します。
簡単に説明すると「こういう絵を出してくれ」と、絵の構成要素をチャットの入力フォームから送信して数分待つと、まず4パターンのイラストが出力されます。
例えば「男の子、花、花が舞っている」と入力するとこんな感じ。
どうも「(花が)舞っている」が「(男の子が)踊っている」と解釈されたようです。まあいいか。
この中から「これをベースにもっと違う絵がほしいな」と思えば、さらにバリエーション違いを出力できます。
正直違いが判らん。顔の角度や手の向きがちょっと違うかな…?
あまりこだわりもなかったので、このうちの一つを拡大出力することに。確か選んだのは右下の絵だったはず。
ここで出力した絵が以下。
選んだ絵と違うのだが?? よく見ると顔の向きがどれとも違う。
調べたところ拡大出力とは、傾向は同じままに再出力するようで、つまりAIくんとしては絵を描きなおしている状態らしい。それで絵が変わっちゃうのか。
こういう感じで「テキストを入力し、画像を生成する」形式を「TtoI(Test to Image。t2iともいう)」というそうです。
とりあえず目当ての絵は出せたので、画像を保存して準備は完了です。
AI利用時の諸問題や法律について調べてみる
ここで閑話休題。
今回の目的である「趣味の一環で、AIイラストを下絵として、仕上げまでは自分で作画したい」について、「それやっていいの?」という点について調べてみました。
AIサービス規約の観点から
今回利用したにじジャーニーの規約にどのような規定や制限があるか調べてみました。
まず、にじジャーニーの規約はMidjourneyに準拠するようです。親サービスですからね。今のところにじジャーニー独自の制限や規約はないようなので、Midjourney規約を調べます。
日本語公式の利用規約はなかったので、英語規約を翻訳ツールで確認しました。
- 作成された画像の利用・改変・公開に関する権利はすべて生成した人のものになる(例外あり)
- Midjourney(にじジャーニー)は、複製品やサムネイル画像などを生成者に断りなく利用できる権利を有する。
- 例外として、無料プランしか利用したことない人には、クリエイティブコモンズ「表示-非営利 4.0 国際」が適用される(=商用利用不可)
- 有償プランに入会すると、クリエイティブコモンズが外れて商用利用可能になる。
- 有償プランを脱会しても、その間に精製したものであれば以降も同じ権利で利用可能。
ざっくり上記の理解です。
生成者による改変は認められていることと、今回は金銭を絡める予定はないので無料プランでも問題ないと判断しました。
※これらは個人的な理解のための文章であり、規約内容を保証するものではありません。
国内法の観点から
国や論者によっても判断がわかれるようで、ここでは日本国内のコミックやアニメの著作権問題にも詳しい福井弁護士の論を主な参考にしています。
「AIが描いた絵」は誰のもの?~テクノロジーと著作権の新たな関係を考える(福井健策)
まず、「AIに出力させたものが著作物かどうか(著作権で保護されるのかどうか)」は、日本国内でも国際的にも「著作権はない」というのが2023年主流の考え方のようです。ただし、生成物に人間が手を加えた場合はその限りではないとのこと。
AI生成物を著作物として認めることによって社会が被る影響は、そのようにまだ読み切れないところがあります。しかし、では著作物として認めない場合、誰がどのくらい困るのか、実のところ誰もそれほど困らないのではないか。そういうとらえ方もあって、現時点の日本ではAI生成物には著作権が「ない」という整理が主流です。また、これは世界の多くの国での共通認識でもあります。
「AIが描いた絵」は誰のもの?~テクノロジーと著作権の新たな関係を考える(福井健策)2ページ目
ただし現実には、AIが生成した情報は、すでに著作物として扱われはじめています。
(中略)
その理由のひとつには、AIと人間が協働して生成物をつくりだすケースも多い、ということがあります。自分の下絵をもとに画像を生成して仕上げもした、または曲調や楽器などを指定して生成したメロディにアレンジを施した、といった形は、人間が「創作に寄与」した「共創モデル」として、現行の著作権法の解釈でもその人の著作物だと認められます。
「AIが描いた絵」は誰のもの?~テクノロジーと著作権の新たな関係を考える(福井健策)2ページ目
生成物の利用範囲については、前述のサービス規約もあるので、「AI絵はパブリックドメイン扱いだ! 第三者の俺がいくらでも使ってやるぜー!」は難しいのではと個人的にも思います。
また、今回のようにAIを下絵にして自作絵を描くケースは、私の著作物として認められる可能性は高そうと判断しました。
その一方で「AIイラストを使うことで他者の著作権を侵害しないか?」も気になるところでしょう。
こちらも記事内の「画像生成AIを使ううえで注意するべきこと」で整理されていたので、引用します(太字はこちらで追加しました)
ほかの誰かの著作権を侵害してしまう可能性があることを知っておくべきでしょう。
「AIが描いた絵」は誰のもの?~テクノロジーと著作権の新たな関係を考える(福井健策)3ページ目
著作権を侵害したかどうかは、「依拠」(よりどころがあること、何かに基づいていること)の有無で判断されます。おおまかに言うと、「もとの著作物を知っていて似せた」はNGです。「知らなかったがたまたま似た」ときは、著作権法上は許容されます。世の中には無数の作品があるから、「意図しない偶然の一致」は許容されるのですが、しばしば本当に偶然なのかをめぐって争いになります。
「依拠」をベースにケースバイケースで判断される、ということですね。
特に問題になりそうなパターンも網羅されています。ちょっと長いのですが、大事な内容なのでそのまま引用します(太字はこちらで追加しました)
これをもとに考えると、ItoI(画像をもとに画像を生成させる方法)タイプの画像生成AIを使うときにはだいぶ注意が必要です。
誰かが描いた「A」という画像をAIに読み込ませた結果、「Aに似た絵」が生成されてきて、それを自分の作品として発表したとします。この場合、現行法のもとでも、「A」に依拠している=「A」に対する著作権侵害であるとみなされる可能性が高いでしょう。いわゆる「トレパク」(トレースによるパクリ行為)と同様です。生成された絵に自分なりにアレンジを加えたとしても、裁判になれば、どのくらい似ているのかが検証されることになるでしょう。判断が難しいのは、AIにテキストで「〇〇さん風の絵」という指示を出したら、AIが機械学習したその作家の絵のどれかに、かなり似たものが出力されてしまった、というような場合です。
「AIが描いた絵」は誰のもの?~テクノロジーと著作権の新たな関係を考える(福井健策)3ページ目
ここでポイントになるのは、AIが機械学習したデータは「依拠」となるのかどうか、です。仮に、あるAIにレンブラントの全作品を学習させたとします。このとき、学習後のAIは、1枚1枚の画像を保存して個別に記憶しているわけではありません。絵に共通する筆致、色使い、コントラストなどの作風を示すパラメータ、つまり「レンブラント風とみなされる傾向」をデータとして持つのでしょう。
レンブラントだけを学習させたこのAIに、新しく絵を描いてみろと指示した場合、「レンブラント風」の傾向を強く有する絵が生成されるのは間違いありません。仮にそれがレンブラントのどれかの絵と実際にソックリだった場合、個別の絵との類似は偶然の一致と見るのか、それとも依拠があるとみなすべきなのか。今後の争点となるでしょう。
総じて「入力段階で明確に他者の著作物を指定して出力する」はアウトになる確率が高く、「全くの偶然で、たまたま似た絵になった」は低くなっていく、という理解です。このあたりは人間と人間の間でも同じ話になるでしょうね。
さらに、AIイラストの場合は生成時以外にも、AIが絵を学ぶ段階、「機械学習」でも人の手が入ります。ここからはAIについての専門的な知識が必要になるので、まずは下記記事を参照してみてください。
【暫定版】テキストから絵を生成するAIが何をやっているのかのポンチ絵
ここからは個人の推測も含みますが、以上のAIにおける出力工程を鑑みた場合、一般的に世間で流通しているAIはあらかじめ世にある何億もの画像パターンをノイズから学習しているため、出力結果が元からあった絵に酷似したとしても、出力前に具体的な指示がなければ、依拠の問題にのっとり「全くの偶然で、たまたま似た絵になった」状況に近くなるのではないかと思います。
しかし仮に「AIが特定作者の作風パターンだけを機械学習した結果、すでにある絵に酷似した」ケースについては、「依拠がある」に該当するのかどうか、まだ国際的にもはっきりした判断はないようです。
仮に「機械学習時の行為も依拠となる」となった場合、パッと思いつく限りでも、では「特定の作風だけを学習させない」としたとしても、どのくらいなら「だけ」にならないのか? 100パターンのうち99パターンが特定作風だった場合「だけ」にならないのか? 10000分の10、100000000分の10ではどうか? という、尺度や度合いの問題も発生してくるのでしょう。
以上はあくまで専門家ではない個人の見解です。今後の判例や法整備によって大きく変わってくる可能性もあります。このあたりが怖くて利用に慎重になっている人は、もう少し時期を置いてみた方がいいかもしれません。
以上踏まえて、AI利用者は「どういった指定で出力したのか客観的ログを残す」のは、今後のもめごと回避のためにも重要なポイントになりそう。万が一、「自分の作風を指定して出力しただろう!」と言われたときに「いやこういう指定でしたよ」と示せるためです。
また、「自分の作風だけを機械学習して出力しただろう!」と言われたときのためにも、「利用したサービスをはっきりさせておく」のも大事になりそうですね。少なくとも、広く公開されているサービスで、特定の作風だけを機械学習させているということはまずないので。この辺、ローカル環境を構築している人が、確たる根拠を示すのはなかなか難しいかも…。
もちろん、特に機械学習と依拠の問題が整理されるまでは、上記が完全な自衛策になるかはわからない状況が続きます。責任の生じる場面でAI利用自体を控えるのは、まだしばらく必要な態度だろうと思います。
とはいえ、今回利用したにじジャーニーの場合、基本的にはDiscord上にすべてのログが残るんですが、私は「なんとなく恥ずかしい」という理由でログを消してしまいました。次からは残します…。
最後に、クリエイターであれば気になるだろう「自作品がAIの機械学習に使用されることには問題がないのか?」について。
これは、日本国内では2010年代から法整備を踏まえて議論がなされ、2019年からは「機械学習すること自体は合法」として改正法が施行されています(著作権法第30条の4など)
日本内だけなら入力面の法整備こそ済んでいますが、出力後の絵についてはさきほどの依拠の問題に戻るのだと思います。
長々書きましたが「今回は特定の作風出力を目的としておらず、出力過程でも指定はない。問題になる可能性は低いだろう」と判断しています。
出力したイラストを元に作画することにしました。
追記・投稿サービスのAI生成物に対する規約を調べてみた
今回の主旨とはやや違いますが、AIを用いて作った絵を公開時に利用する、主だったサービスの規約や方針も羅列しておきます。
こちらは2023年3月の情報です。閲覧時期によっては内容が変更されている可能性があります。
- pixiv
- AI生成作品の取り扱いに関するサービスの方針について(2022年10月20日)
- pixivリクエスト機能における、AI生成作品の取り扱いに関する方針について(2022年11月25日)
- Skeb
- SkebのAIに対するスタンスとAI生成データを検出するAIの導入につきまして(2023年3月1日)
- ニコニコ動画
- 【10/19追記】AIを利用した作品のクリエイター奨励プログラム・作品収入の奨励金付与について(2022年10月19日)
- Twitter・Youtube・Instagram
- 上記サービスは、ざっと検索した限りで「利用者がAI生成したメディアを投稿すること」についての規約は見当たりませんでした。
- 私見ですが、AI生成物(ないしそれを利用した作品)を投稿したときには、AI生成物である旨の記述や、利用したサービス名をハッシュタグなどで任意で記載する傾向にあるようです。
- また、AI出力サービス側の規約で、Youtubeなどの収益システムのあるサービスでの使用を「商用利用」とみなして制限を設けている場合が多いようです。
AIイラストから自作絵を描いてみる
自前のイラスト作成については、シンプルに「下絵からレイヤー分けして線画を起こして、着色して仕上げる」なので割愛。普段みんながやってるやつだよ。
気を付けた点だけ記載します。
1枚目
最初にテストした絵。難しいポーズじゃないのに画面に動きがあっていいなあと選択。
見るからに手指や花束が変だったので、それは直さなきゃなと思ってましたが、改めてじっくり見ると他も怪しかったです。
胸元の青いひも状の何か、別パターン画像を見るとたぶんリボンタイなんですが、もはやよくわからん物体に。そもそもタイだったとしても襟と連動してない。
右腕と胴体も怪しい。脇の線が上着の下でつながってないのと、上着の重なりが矛盾している。
これは好みかな~と思いましたが、胴体がやや長い気がするので少し縮めてます。
あと、ここでも脇下の線がつながってない。面白いことに、線画でこの脇下の線をどこに引くかで体格が違って見えたこと。AIくん、いい感じに手を抜く術をすでに身に着けている…。
上着のシルエットがよくわからんことに。めちゃくちゃ長い。
でも勢いがあってよいので、修正するのも善し悪しだな~。
これも半分好みですが、裾の厚着がすごかったので線画ではオミットします。
などなどを整理してできたのが以下の線画。
結果的に「学ランをきた生徒が花束を持っている」という絵に着地させました。
胸元をひらひらしていたリボンは、ネクタイにするには学ランと矛盾を起こすので、花束をまとめるリボンということに。
着色した絵はこちら。
塗りを似せるのはあきらめて、自前の絵柄で仕上げ。
「卒業式で花束もらった生徒が、別れを惜しんで手を振ってる」という絵にしました。
2枚目
続けて2枚目。今回は「女の子、花」という指定で出力。
なんとなーく1枚目とモチーフが近かった下記を元に作成しました。
今回は過程動画を取っていたので張り付けときます。
できた絵はこちら。
今回は1枚目ほど怪しい細部は少なかったんですが、元絵の首が長すぎて、その調整で地味に体格や構図が変わっています。
あと、1枚目のテーマと近づけるため、卒業式のあの筒を持たせて表情も変えました。
3枚目
ここまでで結構慣れてきたので、3枚目は積極的に改変していくことにしました。
それぞれに気に入ってる2枚をベース、左の絵の構図で、右の配色を使った絵にできないかなと~とチャレンジしてみました。人力合成です。
これも過程動画をどうぞ。
できた絵はこちら。
仕上がってみると、どっちの絵とも似てない気がする。
あと自分が描くと男の子の年齢がちょっと上がる。意識してなかった点なのでなかなか不思議。
振り返り
- 予想通り作画時間の短縮効果がすごかったです。
- 「完成図を元にここからこうしよう、こう変えよう」という検討ができるので、普段のように「白紙の上で完成図を想像しながら試行錯誤する」より迷いが減って、必要な時間も減る感じある。
- 細部の修正に手間がかかるという問題もありますが、トータルだと時間短縮になるんじゃないかな。
- TtoIで「狙った構図やポーズ」を出すのは難しい。
- 今回は必要なかったですが、特定のポーズや構図を想定しているとテキスト指定では厳しい。
- だからItoI(Image to Image)があるんやね。
- AIくん、フィーリング重視で細かい仕事が雑。
- よく「手指が苦手」と言われますが、そもそも構造把握について人間とは全く認識が異なるので、複雑な立体物は総じて人間から見て変な形になってる。
- きちんとした絵に仕上げるには、人間側に正しい知識と技術が必要なんやね。
- このあたり今後の技術発展で補われていきそうな気がする。
- AIイラスト、サービスがいっぱいありすぎてよくわからん。
- たぶん今の一番の参入障壁はこの「手段がいっぱいある」ことだと思う。
- AIイラスト、がっつりやるとお金かかる。
- たいていのサービスが有料プラン前提。無料プランもすぐに上限くるし、お金払うまでは上限復活もないです。
- ローカル環境の構築には一定のマシンスペックが必要なので、うちの場合はスペック増設=金銭的投資が必要だと判明。いつかチャレンジしたいね。
以上でーす。