{
  "$type": "site.standard.document",
  "bskyPostRef": {
    "cid": "bafyreiepvryudxqvu2yjdginu5oo4lhxf5psrih5rz2khdp5runvv4wg34",
    "uri": "at://did:plc:46dtqwuc6bckm3ewbfuqlnxt/app.bsky.feed.post/3mfkvuubqrls2"
  },
  "path": "/node/149833",
  "publishedAt": "2026-02-23T04:26:33.000Z",
  "site": "https://www.blognone.com",
  "tags": [
    "TAALAS",
    "lew"
  ],
  "textContent": "TAALAS ฝังโมเดล Llama 3.1 8B ลงชิปโดยตรง อัตราการตอบสูงถึง 16,960 token/s\n\nBody\n\nTAALAS บริษัทออกแบบชิปจากแคนาดา สาธิตชิป Taalas HC1 ที่ฝังโมเดลปัญญาประดิษฐ์ Llama 3.1 8B ลงไปในชิปตรงๆ ไม่สามารถแก้ไขได้อีก แต่ให้ความเร็วในการรันสูงถึง 16,960 token/s อยู่ในระดับที่เห็นผลลัพธ์ทันที\n\nโมเดลที่รันไม่ใช่โมเดลเต็ม แต่เป็นรุ่นย่อ 3-bit ทำให้คุณภาพไม่เท่ากับ Llama 3.1 8B ที่ใช้งานกัน แต่ตัวชิปรองรับการรัน LoRA adapter ด้วย ทำให้สามารถปรับแต่งงานเฉพาะทางได้บางส่วนในอนาคต แม้จะแก้ไขโมเดลหลักไม่ได้ก็ตามที โดยรวมชิปมีทรานซิสเตอร์ทั้งหมด 53,000 ล้านตัว กินไฟ 2.5kW\n\nตัวบริษัท TAALAS เป็นสตาร์ตอัพอายุเพียง 2.5 ปี แต่ได้รับเงินทุนมาแล้วกว่า 200 ล้านดอลลาร์ ทาง TAALAS คาดว่าจะอัพเดต HC1 ให้รันโมเดลขนาดใหญ่ขึ้นและเป็นโมเดลคิดก่อนตอบเพื่อนำมาให้บริการต่อไป และมีแผนจะเปิดตัว HC2 ภายในปีนี้\n\nที่มา - TAALAS\n\nlew Mon, 23/02/2026 - 11:26",
  "title": "TAALAS ฝังโมเดล Llama 3.1 8B ลงชิปโดยตรง อัตราการตอบสูงถึง 16,960 token/s"
}