Nano Bananaは、Googleによる最新のAI画像生成・編集モデルです。このモデルが画期的なのは、人物に一貫性を持たせられるところです。
多くのAI画像生成モデルは、同一人物を作成することは得意ではありません。例えば、Googleが開発したAIシステム、Geminiでいくつか画像を作ってみます。

上記の指示で画像を3枚分作ってもらいます。以下のような結果になりました。



外見については「23歳の美しい日本人女性」とだけ指定しています。後はAIが顔、服装、ポーズなどを考えて生成してくれます。1枚目と2枚目は、同一人物に見えます。3枚目は別人ですね。また、この画像を生成した日が10月なので、3枚とも秋の装いになっています。みなさん黄色い線を超えて電車寄りに位置してますね。ちょっと危険です。
画像生成に利用したGeminiは、Nano Bananaのモデルが使われています。見てわかるように、画像を生成する際は、人物の一貫性を維持することはできません。では3枚目の画像を修正してみます。画像の女性はスマホを注視していますが、正面を向いて笑顔になるよう修正の指示を出します。このような画像になりました。

顔の向きと表情が異なる同じ人物の画像ができました。女性の服装や、背景は維持されているのもポイントです。さらに、この女性の服装をスーツに変えてみます。

見事に服装だけ変わりました。
では、画像の修正ではなく、イチから指示してこの画像を再現できるでしょうか。「美しい日本人女性が、スーツを着て電車を待っている。手にはスマートフォンを持っていて、正面を見て微笑んでいる」という指示で画像を生成してみます。

修正で作った画像の女性とは別人に見えますね。
ということで、Nano Bananaの「人物に一貫性を持たせた画像修正ができる」という機能がすごいというお話でした。