{
"$type": "site.standard.document",
"bskyPostRef": {
"cid": "bafyreib4lsebmdti7drakx2u2slrar5kpfg2zp4jqnomxco3mnqr3gimvu",
"uri": "at://did:plc:hzgu7qyp34ofph3btawzwyw4/app.bsky.feed.post/3meiys3eqs5b2"
},
"coverImage": {
"$type": "blob",
"ref": {
"$link": "bafkreigquobhuhajkriw4miehrgrb4vusgtarenvw2e3xwysdk2xqazd2u"
},
"mimeType": "image/png",
"size": 64449
},
"path": "/simossyi/articles/f5ef8378959878",
"publishedAt": "2026-02-08T20:55:49.000Z",
"site": "https://zenn.dev",
"textContent": "TL;DR\nGemini 3.0 Pro Preview、Claude Opus 4.6、GPT-5.3 Codex(Extra High)に同じ画像を説明させた。Geminiの描写が最も正確だった。\n\n プロンプト\n~/Downloads/hennagazou.jpg に写ってるものを可能な限り正確に表現してみて\n\n\n 認識結果\n\n Codex(GPT-5.3 Extra High)\n\n画像には、田園地帯の道路でのスナップが写っています。見える要素を客観的に書くと次のとおりです。\n\n右手前に、紺色のセーラー服を着た人物が腕を伸ばしてカメラを向け、笑顔で写っている(自撮り構図)。\nそ...",
"title": "codex 5.3, opus 4.6, gemini 3.0 proの画像認識能力を比べた"
}