Raw Record Source

{
  "$type": "site.standard.document",
  "bskyPostRef": {
    "cid": "bafyreich7iegsbbb6ewgdtaczi5wncfibr7mc3glnrusg732x4k4wtzz5i",
    "uri": "at://did:plc:hzgu7qyp34ofph3btawzwyw4/app.bsky.feed.post/3mhnctbi3mnk2"
  },
  "coverImage": {
    "$type": "blob",
    "ref": {
      "$link": "bafkreihcrtlg2yl5ipkekhdssjvdryakyvkyabfqujlkhakyoz54zle63e"
    },
    "mimeType": "image/png",
    "size": 52198
  },
  "path": "/karaage0703/articles/fcca40c614dffd",
  "publishedAt": "2026-03-21T16:18:04.000Z",
  "site": "https://zenn.dev",
  "textContent": "NVIDIA DGX Spark（GB10、ARM64、128GB統合メモリ）でローカルLLMを動かす方法を、推論エンジン別（Ollama / vLLM / SGLang）に解説します。\n「どのモデル × どのエンジンを選べばいいの？」という疑問に答えるため、手軽さ・賢さ（ツールコール精度）・速度・メモリ使用量の4軸で整理しました。\nこの記事は実際にDGX Sparkで動作確認した手順をまとめたものです。動作確認できなかった方法も参考として記載しています。\n!\nこの記事は、あくまで自分の環境での少数試行での結果です。条件など完全に揃えられてない点もありますので、正確なベンチマークというよ...",
  "title": "DGX Sparkで色々なローカルLLMを動かした比較結果"
}