最近は生成AIを使った企業広告が良くも悪くも話題となっている。
各企業がどの生成AIを使っているのか分からないが、AI自体は各社が作っており大量に存在する。
以前は「Midjourney」とか「Stable Diffusion」が流行。最近はトレンドが変わってきた。
再度、傾向を見直してみたい。
画像生成AI
ざっとまとめてみた。
ツール・サービス名 | 概要 |
---|---|
Midjourney | デビット・ホルツ氏が設立した研究チームが開発した画像生成AI |
Stable Diffusion | Stability AI社が開発・運営する画像生成AI |
Pony Diffusion | Stable Diffusionベースでアニメイラストの出力に長けているSDXLモデルの一つ |
Dream Machine | 2024年6月12日にLuma AI社が公開した動画生成AI |
Runway | Runway社の動画やテキストから動画を生成できるサービス |
Adobe Firefly | 2024年3月21日に、Adobe社が公開した画像生成機能を中心とした画像生成AI |
NovelAI Diffusion | Anthropic社が開発したAI生成サービス。画像生成サービスが日本の利用で人気 |
DALL-E 3 | 2023年9月21日にOpenAI社が公開した画像生成AI |
ImageFX | Googleが開発した最新の画像生成AIモデル「Imagen3」搭載の画像生成AIツール |
この中から幾つか紹介。
なお「Midjourney」は2023年の3月28日に利用停止が公式から発表された。
プロンプトは
Please createt image about “anime girl in Studio Ghibli style,blonde hair,blue eye”
スタジオジブリ風のアニメの女の子、金髪、青い目
とする。
「ジブリ風」を入れている理由は、
- 著作権侵害をどこまで排除して安全な生成AIシステムに変わったのか?
- その上でジブリの事を理解した上でイラストを生成しているのか?
を把握するためだ。
Stable Diffusion
2022年にジブリ風の絵を書かせてみたが、どれだけ進化したのか楽しみ。
【2022年】
【2024年】
ジブリっぽさが減ったけど女性イラストのクオリティが激上がり。
ただジブリ風では無い。
クオリティ的には普通にアニメキャラとして登場してそうな違和感のないレベル。
Adobe Firefly
Adobe Stockという写真や映像のライブラリでトレーニングされていることが特徴で、インターネット上の画像をスクレイピングして学習した他の画像生成AIと異なり、商業的にも安全なAIだとAdobeは主張。
つまり「ジブリ風」なんて全く知らない。
確かに全くジブリ風ではない……けど多少面影があるようにも見える。
イラストのレベルは自分で書く気力を完全に失うクオリティ。
DALL-E 3 (dalle3)
OpenAI社が2023年9月21日に公開した画像生成AI。
言語処理に特化したチャット型AIと連携しているため、入力されたテキストの説明からニュアンスを読み取り画像を生成することができる。
DALL-E 3の使い方には次の2種類がある。
- Bing Image Creator(Copilot)(無料)
- ChatGPT(有料)
Bing Image Creatorで本格的にDALL-E 3を使用して画像生成をする場合は、こちらの画像生成に特化したページから利用するのが便利。
それぞれ描かれたイラストは次のとおり。
イラストを見る限りジブリのことは全く知らないと思われる。
イラストのクオリティはアニメファンが喜びそうなレベルだ。
ImageFX
ImageFXとはGoogleが提供する画像生成AIサービスです。
Imagen3はその基盤となるAIモデルの名称。
日本語でも使用可能だけど、英語での入力がより精確な画像生成につながる。
で結果。
うーん、ジブリ風ではない……とも言えるけど、今までの生成AIと比べると若干ジブリが入ってる気がする。
イラスト自体は萌ではない正当アニメ的な画風を感じる。
おわりに
同じプロンプトと入れてもデザインの仕方が全く違う。
とはいえ、どれも実用に耐えうる素晴らしいクオリティで、あとは好みの問題だろう。
著作権を考慮した安全な世界にも進みつつある。
今後も上手に生成AIを利用してブログやサイト生成、仕事、生活に活かしていきたい。