当前位置:首页 > Deepseek最新资讯 > 正文内容

每秒 12000 tokens 吞吐:Taalas 集群跑 DeepSeek R

4个月前 (02-21)Deepseek最新资讯64

  IT之家 2 月 21 日消息,科技媒体 Wccftech 昨日(2 月 20 日)发布博文,报道称 AI 芯片初创公司 Taalas 为解决大模型的延迟与成本难题,

  在 AI 算力竞争日益激烈的当下,延迟已成为制约智能体(Agentic)应用的核心瓶颈。不同于 Cerebras 或 Groq 试图通过集成 SRAM 来加速的路径,成立仅 2.5 年的初创公司 Taalas 选择了更为激进的 ASIC(专用集成电路)路线。

  IT之家援引博文介绍,该公司研发出一种能将任意 AI 模型转化为定制硅片的平台,其核心逻辑在于“融合计算与存储”,直接将特定 LLM 的神经网络映射到硅片电路中,在 DRAM 级密度下完成所有计算。

  这种设计彻底摒弃了 HBM(高带宽内存)、复杂封装及昂贵的散热系统,从物理层面消除了数据传输的“内存墙”障碍。

  然而,巨大的芯片面积仅容纳了 80 亿参数的模型,这与当前万亿参数的前沿模型相比显得“容量有限”deepseek。这表明,为了实现极致的硬连线速度,Taalas 在单位面积的参数密度上做出了巨大妥协,这也是该技术路线面临的主要物理限制之一。

  尽管参数密度不高,但 HC1 的性能表现极具颠覆性。官方数据显示,相比现有的高端算力基础设施,Taalas 方案的每秒 Token 生成数(TPS)提升了 10 倍,同时生产成本降低至 20 分之一。

  为了解决单芯片容量不足的问题,Taalas 采用了集群化扩展策略。在针对 DeepSeek R1 模型的测试中,通过 30 芯片的集群配置,实现了高达 12000 TPS / User 的吞吐速度(据公司称,GPU 目前的技术约为每人每秒 200 个 tokens)。这一数据意味着在实时交互和复杂推理任务中,用户将获得近乎零延迟的体验。

  TPS 是衡量大语言模型生成速度的关键指标,代表模型每秒能输出多少个文本单位(Token)。相当于打字员的打字速度,TPS 越高,AI 回复得越快,用户等待时间越短。

  该媒体指出 Taalas 的技术路线虽然诱人,但商业模式面临独特挑战。由于模型权重被“硬连线”在硅片中,芯片一旦制造完成便无法更改模型参数。

  这意味着客户必须为特定的模型版本(如 Llama 3.1 或 DeepSeek R1)购买专用硬件,一旦算法迭代,硬件可能面临淘汰风险。原文出处:每秒 12000 tokens 吞吐:Taalas 集群跑 DeepSeek R1 创速度纪录,感谢原作者,侵权必删!

标签: deepseek

“每秒 12000 tokens 吞吐:Taalas 集群跑 DeepSeek R” 的相关文章

12月6日DeepSeek预测:76人vs雄鹿,字母哥缺阵马克西能否率队双杀?

12月6日DeepSeek预测:76人vs雄鹿,字母哥缺阵马克西能否率队双杀?

  北京时间12月6日09:00,雄鹿将坐镇主场迎战76人,这是双方本赛季第二次交手。目前76人以12胜9负暂列东部第7,雄鹿10胜13负排名第10,此役胜负将直接影响两队季后赛席位争夺形...

DeepSeek面临数据质量难题,大模型发展遇瓶颈

DeepSeek面临数据质量难题,大模型发展遇瓶颈

  #互联网公司# 算力被视为推动人工智能发展的强大发动机,而数据则是不可或缺的燃料。然而,数据的质量却成为了制约大模型发展的关键因素之一,DeepSeek 正面临着这样的数据难题。中文互...

DeepSeek-R2 发布传闻牵动股市,历史表现让市场充满期待

DeepSeek-R2 发布传闻牵动股市,历史表现让市场充满期待

  2025年1月20日 DeepSeek-R1 的发布,港恒生科技指大涨了一波deepseek,最高涨幅约47%原文出处:DeepSeek-R2 发布传闻牵动股市,历史表现让市场充满期待...

招生简章丨关于举办“Deepseek驱动下的行政事业单位政府采购与资产管理实践”

招生简章丨关于举办“Deepseek驱动下的行政事业单位政府采购与资产管理实践”

  为帮助各单位人员深入学习政府采购及其在国有资产管理的应用,提升资产管理人员的业务水平和管理能力,规范采购流程,有针对性地解决政府采购及招投标业务存在的突出问题,以及人工智能大模型Dee...

刚刚,DeepSeek发了“终极版”!

刚刚,DeepSeek发了“终极版”!

  智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣...

DeepSeek破解数学AI的自我欺骗难题:让机器真正学会数学推理

DeepSeek破解数学AI的自我欺骗难题:让机器真正学会数学推理

  这项由DeepSeek-AI团队的邵志宏、罗宇翔、卢承达等研究人员完成的重要研究,发表于2025年1月的arXiv预印本服务器(论文编号:arXiv:2511.22570v1),为数学...