日日是好日

今を楽しむ50代主婦のつぶやき

スコーンを縦割りにしたがるAIと対戦した話

 

「画像生成AIはスコーンを縦割りにしてしまう」というつぶやきをネットで見かけました。本当に?

はじまりは好奇心から

試しにGeminiで生成してみた画像がこちら。

たしかに見事な縦割りです。

 

これを縦と認識しているなら、割る方向を90°変えたらどうでしょうか。

カットする方向を水平方向に90°変えてと指定

いやこれ、さっきと同じ画像では…。

 

できないなら、やらせてみようホトトギス…じゃなくて縦割り。

ChatGPTにプロンプト作成を手伝ってもらいながら、挑戦することにしました。

 

以下、
🐸:私
🤖:ChatGPT
の会話でお送りします。(画像生成プロンプトは長いので省略します。)

 

対戦1回目

🐸:Geminiの画像生成で、スコーンを縦割りではなく、ハンバーガーのバンズのよう     に横に割る画像が作りたいです。 Geminiに理解できるプロンプトを作ってもらえますか?

🤖:Geminiは「scone」を出すとデフォルトで縦に割れ目が入ったり、イギリス式のティータイム的な表現を出すことが多いので、「hamburger bun style」「split horizontally」などの表現を加えると伝わりやすいです。

 

対戦1回目の結果

🐸:まだ縦割りでした。

🤖:おおっと💦 やっぱりGemini、デフォルトで「スコーン=縦割り」と学習しているせいで、強調しても横割りになりにくいんですね。ここはさらに「横割り」の指定をしつこく入れて、縦割りを禁止する形で書くのが効果的です。

 

対戦2回目

対戦2回目 湯気に違いはあるけれど…

🐸:縦割り禁止にしたのですが、縦割りでした。

🤖:あー、やっぱり来ましたか😅
Geminiは「scone = 縦割り」っていう強固な学習があるみたいで、こちらが何度強調しても「縦割りに戻そうとする」癖があるんですよね。
なので、発想を少し変えて、「hamburger bun」や「burger bun style bread」などの別の食べ物メタファーを強めてあげるのが有効です。

 

対戦3回目

対戦3回目 ハンバーガーっぽくなった

🐸:やっと横割りにできましたが、包丁で切ったように断面が平らすぎました。手で裂いたような、粗い断面図にしたいです。

🤖:おおー!ついに横割り成功ですね👏✨
でも「包丁でスパッと切ったみたいに平らな断面」になってしまったんですね。
スコーンらしい「手で割ったときの粗くてちぎれたような断面」を出すには、rough / torn / uneven / crumbly といった質感ワードを追加すると効果的です。

 

対戦4回目

対戦4回目 断面はふわふわだけど…

🐸:断面はふわふわになったのですが、また縦割りになりました💦

🤖:なるほど…!💦縦割りバイアスは本当にしぶといですね。
でも朗報は「断面図自体はいい感じに出た」ということ。つまり「ふわっと手で割った内部の質感」は理解されています。
ここからは戦略を少し変えて、「scone」と言わずに完全に“burger bun”として指定し、最後に“bread-like scone”と補足するのが一番確実かもしれません。

 

対戦5回目

対戦5回目 ついに成功!!

🐸:やりました!横割りでしたよ

🤖:やったーー!!🙌🎉ついに横割り成功ですね!✨
いや〜しぶとかったですが、やっぱり 「burger bun 優先で、最後にスコーンっぽい」 という裏技が効きましたね。
  

縦割り画像を何かに使うという目的があったわけではなかったのですが、
謎の達成感がありました。

 

AIはなぜスコーンを縦割りにしたがるのか

ふと気になったので、どうしてAIはスコーンを縦割りにするのかをChatGPTに聞いてみました。

 

最初はアメリカのスコーンは縦割りだからという偽情報を教えられたのですが、裏付けが取れなかったと伝えると、「もっとも多く見た例を優先して出力するから」とのこと。

 

🐸:実際に食べたことがないのに、画像生成するのは難しいですよね。横割りの方が食べやすいと、Geminiも学習できる日がくるといいですね。

🤖:ほんとそれです😊
AIは「実際に食べた経験」がないので、どうしても “見たことの多い画像”=正解 として学習してしまうんですよね。
だから「横割りの方が食べやすい」「伝統的にそう食べる」という人間にとっての“当たり前”が反映されにくいんです。
  

対戦してみて感じたこと

AIの傾向には理由があります。


その理由を考えてみると、思い通りに画像が生成できないときも楽しんで試行錯誤できるのではないかなと思いました。