·
2026年Taalas 发布首款产品HC1
Taalas 是一家加拿大AI专用推理芯片初创公司,2023年成立于多伦多,以“模型即芯片(The Model is the Computer)”为核心理念。
走极致专用化路线:把特定大模型直接固化到硬件电路,而非通用GPU动态加载。
主打推理速度、成本、功耗的量级突破,挑战英伟达通用GPU主导格局。
- 创始人/CEO:Ljubiša Bajić,前AMD首席架构师、Tenstorrent创始人,团队仅约24人,多来自AMD、英伟达。 - 累计融资:2.19亿美元(2026年2月最新一轮1.69亿美元)。
- 专为 Llama 3.1 8B 深度定制,台积电6nm工艺。 - 性能:17,000 tokens/s,比英伟达H200快约73倍。 - 成本:推理成本约0.75美分/百万token,为传统GPU云的1/266。 - 功耗:约250W,仅为通用方案的1/10。 技术与局限 技术:模型权重硬连线+存算一体,消除内存墙,无需HBM。 局限:模型不可更改,灵活性差;激进量化可能影响精度。
软件固化到硬件中,当然不可升级。但也杜绝了黑客的风险。这思路完全符合专业化分工的大逻辑,大趋势。
这是专用芯片,不是通用芯片。现在AI有两个分裂趋势:
1️⃣ 云端大模型 —— 需要GPU(英伟达统治)
2️⃣ 边缘端AI —— 需要低功耗专用芯片
转发此帖子?
与您的关注者分享。
回复