{
"$type": "site.standard.document",
"bskyPostRef": {
"cid": "bafyreie2bq6vwkmbeqhkgzntqkwoxefj42u3xcrjbynndbllsbymuoroai",
"uri": "at://did:plc:jpm3rtvn5m32wrn5ljktnfmq/app.bsky.feed.post/3mih6atd6wkh2"
},
"coverImage": {
"$type": "blob",
"ref": {
"$link": "bafkreiepzxkwgzkwujelmwxrsmwxmxpm3375bdu4tm33f6ol2x7inbdgsa"
},
"mimeType": "image/png",
"size": 79885
},
"path": "/blog/26/20301llm90.html",
"publishedAt": "2026-04-01T15:46:39.000Z",
"site": "https://www.publickey1.jp",
"textContent": "米調査会社のガートナーは、2025年と比較した場合の大規模言語モデルにおける推論実行のコストが、1兆個のパラーメータを持つ大規模言語モデルでは2030年までに90%以上削減されるとの予想を発表しました。 この大きなコスト削減効果は、半導体およびインフラにおける処理効率の向上、モデル設計の革新、チップ利用率の向上、推論特化シリコンの利用増加、特定のユースケースに向けたエッジデバイスの応用などの複数の技術改善を組み合わせたことで実現されると、同社シニアディレクター兼アナリスト、ウ……",
"title": "2030年までに、1兆個のパラメータを持つLLMの推論コストが90%以上削減される、ガートナーが予想",
"updatedAt": "2026-04-01T14:55:33.000Z"
}