Raw Record Source

{
  "$type": "site.standard.document",
  "bskyPostRef": {
    "cid": "bafyreib4lsebmdti7drakx2u2slrar5kpfg2zp4jqnomxco3mnqr3gimvu",
    "uri": "at://did:plc:hzgu7qyp34ofph3btawzwyw4/app.bsky.feed.post/3meiys3eqs5b2"
  },
  "coverImage": {
    "$type": "blob",
    "ref": {
      "$link": "bafkreigquobhuhajkriw4miehrgrb4vusgtarenvw2e3xwysdk2xqazd2u"
    },
    "mimeType": "image/png",
    "size": 64449
  },
  "path": "/simossyi/articles/f5ef8378959878",
  "publishedAt": "2026-02-08T20:55:49.000Z",
  "site": "https://zenn.dev",
  "textContent": "TL;DR\nGemini 3.0 Pro Preview、Claude Opus 4.6、GPT-5.3 Codex（Extra High）に同じ画像を説明させた。Geminiの描写が最も正確だった。\n\n プロンプト\n~/Downloads/hennagazou.jpg に写ってるものを可能な限り正確に表現してみて\n\n\n 認識結果\n\n Codex（GPT-5.3 Extra High）\n\n画像には、田園地帯の道路でのスナップが写っています。見える要素を客観的に書くと次のとおりです。\n\n右手前に、紺色のセーラー服を着た人物が腕を伸ばしてカメラを向け、笑顔で写っている（自撮り構図）。\nそ...",
  "title": "codex 5.3, opus 4.6, gemini 3.0 proの画像認識能力を比べた"
}