DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配DeepSeek v3.2悄悄开源TileLang算子引发热议,讨论热度超越稀疏注意力机制DSA,转发量可见一斑。这一未在论文提及的重要改动仅官方公告露脸,却成为焦点。# Deepseek2天前7570
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪DeepSeek-V3.2-Exp全新发布,搭载创新DeepSeek Sparse Attention注意力机制,性能更优效率更高。3.1"最终版"后快速迭代,带来开源推理加速方案和更强模型表现。"最...# Deepseek2天前4850
DeepSeek-V3.2-Exp第一时间上线华为云CloudMatrix384超节点率先搭载DeepSeek-V3.2-Exp模型,于2025年9月29日在华为云上线。该开源模型创新采用稀疏Attention技术,提供高效AI计算能力。# Deepseek# 华为云2天前4290