{
"$type": "site.standard.document",
"bskyPostRef": {
"cid": "bafyreibre3os2bksp5qn4b5bkwseefi4ubk3h5fsnvky6dwy7zzkmdp5gq",
"uri": "at://did:plc:hzgu7qyp34ofph3btawzwyw4/app.bsky.feed.post/3me6cn7iifwn2"
},
"coverImage": {
"$type": "blob",
"ref": {
"$link": "bafkreiab6pyweixu4r2raitesjtpi25ybl7vcbdurgx22pdaxlzub64k3q"
},
"mimeType": "image/png",
"size": 52084
},
"path": "/google_cloud_jp/articles/0e7a7bd1573dfb",
"publishedAt": "2026-02-05T09:15:01.000Z",
"site": "https://zenn.dev",
"textContent": "本記事では、Gemini を API で利用する際のコストを節約するための手法をまとめています。主には Vertex AI からの利用を想定していますが、多くは Google AI Studio などでも使える手法です。\n\n 背景\nGemini をはじめ多くの LLM は、入出力の Token 数に応じた従量課金モデルとなっているため、特に大規模に利用している場合はコストが気になることが多いと思います。\nGemini にはコンテキストキャッシュ保存 という機能など、コストを削減する手法は幾つかありますが、あまり体系的 / 網羅的に整理されているコンテンツがなかったので、今日時点の機能をベ...",
"title": "Gemini API のコストを最適化する方法"
}