画像生成AI

こんにちは、冨田です。
近頃、各所でAIという言葉を耳にすることが増えました。
ChatGPTや画像生成AIなど我々の職業にもいずれ身近なものになっていくのでしょう。興味が湧く一方、難しそうだな、、となかなか手を出せずにいましたが、世界に置いていかれないよう少しずつ触れていきたいなと思っています。

そこで!、せっかくの機会なので「画像生成AI」について勉強しつつ、触った感じなどをブログでご紹介していこうと思います。
※パソコンには疎い者なので一個人の体験として参考程度にお楽しみください。

さて、まずはどのソフトを使用するかですが、ネットで調べる度に、新しいソフトやアプリが増え、迷ってしまいます。
今回はアドビが開発中の『Firefly』というソフトを利用していきたいと思います。

こちらを選んだ理由は、4点。

①商用利用が可能である
ネットで検索してみて人気のソフトがいくつか出てきたのですが、商用利用ができないものが結構多い印象でした。
これは画像生成AIが、世界中の画像を自由に学習していたためです。それらから生成される画像は、誰かの著作権を侵害している可能性があり、いくつもの問題があると考えられると言われています。
『Firefly』は学習先を 著作権者がAIの学習データに使用することを許諾した画像とオープンライセンスの作品、著作権期限切れになっているコンテンツのみなどに制限することによってこの問題をクリアしているということです。

②日本語対応
シンプルに身近な感覚のものを使いたいという思考です。ただ、生成の精度はやはり英語入力より少々劣るみたいです。
画像生成AIが出始めの頃は専ら、英語入力のみばかりの印象でしたが、最近は ソフトによって日本語でも感度が高いものが出てきているようですね。

③デザイン系のソフトを網羅しているアドビが開発している
先述の通り、あんまりパソコン関係に詳しくないので完全に主観ですが、アドビのソフトを利用することが多いので、今後欲しい技術を適切に供給してくれるのではないかと、期待しています。

④アドビのアカウントさえあれば、現在無料で利用できる
現在、『Firefly』はオンライン上でログインをすれば、無料で操作を行うことができます。

『Firefly』のβ版(無料)として現在、提供されている機能は下記の4つです。
・Text to image:テキストからの画像生成
・Generative fill:テキスト指示による画像加工
・Text effects:テキストのエフェクト(ロゴ)生成
・Generative recolor:テキスト指示による色調の修正(SVG形式に限る)

ブログでは、こちらのβ版にて各機能を使用しご紹介していこうと思います。
ちなみに『Firefly』は現在も開発途中で、今後さらに『3Dからの画像生成』や『テキストからベクターの生成』などの機能が随時追加更新されていくようです。

それでは早速始めていきましょう。
今回ご紹介する機能は『テキストからの画像生成』。
画像生成は呪文、プロンプトと呼ばれるコマンドを元に生成します。
画面下部の入力画面にイメージを入力すると何パターンか画像が作成されます。
右側には効果などを変更・調整できるパネルがあります。
更新ボタンを押すと再生成をしてくれます。

「深海を泳ぐたぬき」、こちらの画像を作成してみたいと思います。上記の通り『Firefly』は日本語に対応しているので、そのままプロンプトを打ち込みます。

文書や単語、形態を変えて入力しましたがだめでした

生成されたのはこちら、どう見てもたぬきではない何かができあがりました。
何度か再生成しましたがかわいさの欠片もない魚寄りの奇獣に見えます。
悩んだ挙句、空も飛ばしてみましたが、また別のタヌキではない何かになってしまいました。

なぜ上手く生成できないのか理由を考えてみます、、。
・本来生息しえない設定、ファンタジーな発想についてこれない
・賢すぎるが故に倫理観が生成を阻み環境に適応したものをつくってしまう
(深海ではタヌキは肺呼吸なので生きられない→適応させた??)
・翻訳が上手くいかず、英語で正しく入力しなくてはいけない
・海外でタヌキがマイナーな動物

考察後、解決の糸口を探して、参考にトップに上がっている画像たちを見てみました。
先人たちの作品を確認すると、なんとも空想的な絵が並んでいます。そしてプロプントを確認すると、なるほど、私が記していたものと明確な違いがあります。「どのように」「どう」なのかという修飾語で細かく指示を記載した文章が並んでいました。生成失敗の理由はどうやら指示内容が不足していたことのようです。 

試しに、トップに掲載されていたプロンプトを引用して、生成してみると、、

引用
コアラをタヌキに変えてみた

出来ました!
やはり情報量が足りていなかったのですね。AIは考える余地があるとわからなくなってしまうのかな、と理解しました。
それでは、情報をつけ足して最初に描きたかった絵を作成してみようと思います。

かわいい。満足しました。よくできたと思います。
かわいくなったので許容しましたが、これはタヌキではなくアライグマですね。
タヌキはやはりいないのかしら、、。

もう少し勉強してAIと仲良くなろうと思います。
また少しずつご紹介していきます。お楽しみに。

おまけ(何故か足の本数が多い人がいます、、)

【追記】先日、アドビのソフトで各機能の正式な提供がはじまりました。

Adobe HPより
アドビは、画像、テキスト効果、ベクター、Adobe Photoshop での生成塗りつぶし、生成拡張、Adobe Firefly でのテキストで画像作成、Adobe Illustrator での生成再配色、Adobe Express でのテキスト効果などから開始しています。今後、Firefly の技術を利用している生成 AI を 3D、アニメーション、および動画でご利用いただけるようになる予定です。

HPでのアナウンスの通り、それぞれのソフトで各機能が利用できます。『Firefly』の機能についてはプランによって月の使用回数の制約があるようです。詳しくは一度検索をしてみてください。