QQ:355128452


导航菜单


新闻资讯

祝贺美容院开业贺词

机器之心报道编辑:杜伟、泽南没等来 DeepSeek 官方的 R2,却迎来了一个速度更快、性能不弱于 R1 的「野生」变体!这两天,一个名为「DeepSeek R1T2」的模型火了!这个模型的速度比 R1-0528 快 200%,比 R1 快 20%。除了速度上的显著优势,它在 GPQA Diamond(专家级推理能力问答基准)和 AIME 24(数学推理基准)上的表现均优于 R1,但未达到 R1-0528 的水平。在技术层面,采用了专家组合(Assembly of Experts,AoE)技术开发,并融合了 DeepSeek 官方的 V3、R1 和 R1-0528 三大模型。当然,这个模型也是开源的,遵循 MIT 协议,并在 Hugging Face 上开放了权重。Hugging Face 地址:https://huggingface.co/tngtech/DeepSeek-TNG-R1T2-Chimera经过进一步了解,我们发现:DeepSeek R1T2 是德国一家 AI 咨询公司「TNG」推出的,模型全称为「DeepSeek-TNG R1T2 Chimera」(以下简称 R1T2)。该模型除了前文提到的在智力水平和输出效率之间实现完美平衡之外,相较于这家公司的初代模型「R1T Chimera」,智力大幅跃升,并实现了突破性的 think-token 一致性。不仅如此,即使在没有任何系统提示的情况下,该模型也能表现稳定,提供自然的对话交互体验。在评论区,有人误以为这个模型出自 DeepSeek 官方,并且认为他们是不是也在走相同的路线:给模型起各种名称,就是不用主系列下一代版本号?更多的人认可该模型「找到了智能与输出 token 长度之间的最佳平衡点,并且提升了速度」,并对该模型在现实世界的表现充满了期待。模型细节概览从 Hugging Face 主页来看,R1T2 是一个基于 DeepSeek R1-0528、R1 以及 V3-0324 模型构建的 AoE Chimera 模型。该模型是一个采用 DeepSeek-MoE Transformer 架构的大语言模型,参数规模为 671B。R1T2 是该公司 4 月 26 日发布的初代模型「R1T Chimera」的首个迭代版本。相较于利用双基模型(V3-0324 + R1)的初代架构,本次升级到了三心智(Tri-Mind)融合架构,新增基模型 R1-0528。该模型采用 AoE 技术构建,过程中利用较高精度的直接脑区编辑(direct brain edits)实现。这种精密融合不仅带来全方位提升,更彻底解决了初代 R1T 的token 一致性缺陷。团队表示,R1T2 对比其他模型具备如下优劣:与 DeepSeek R1 对比:R1T2 有望成为 R1 的理想替代品,两者几乎可以通用,并且 R1T2 性能更佳,可直接替换。与 R1-0528 对比:如果不需要达到 0528 级别的最高智能,R1T2 相比之下更加经济。与 R1T 对比:通常更建议使用 R1T2,除非 R1T 的特定人格是最佳选择、思考 token 问题不重要,或者极度需求速度。与 DeepSeek V3-0324 对比:V3 速度更快,如果不太关注智能可以选择 V3;但是,如果需要推理能力,R1T2 是首选。此外,R1T2 的几点局限性表现在:R1-0528 虽推理耗时更长,但在高难度基准测试中仍优于 R1T2;经 SpeechMap.ai(由 xlr8harder 提供)测评,R1T2 应答克制度(reserved)显著高于 R1T,但低于 R1-0528;暂不支持函数调用:受 R1 基模型影响,现阶段不推荐函数调用密集型场景(后续版本可能修复);基准测试变更说明:开发版由 AIME24+MT-Bench 变更为 AIME24/25+GPQA-Diamond 测评体系,新体系下 R1 与初代 R1T 的分差较早期公布数据更大。最后,关于 R1T2 中重要的 AoE 技术,可以参考以下论文。论文标题:Assembly of Experts: Linear-time construction of the Chimera LLM variants with emergent and adaptable behaviors论文地址:https://arxiv.org/pdf/2506.14794参考链接:https://x.com/tngtech/status/1940531045432283412
  • 🌵附近人200快餐电话🌵植树节活动作文【热门】

    在我们平凡的日常里,大家总免不了要接触或使用作文吧,作文是一种言语活动,具有高度的综合性和创造性。你知道作文怎样写才规范吗?以下是小编精心整理的植树节活动作文,供大家参考借鉴,希望可以帮助到有需要的朋

    2025-07-05
  • 🌵发牌是什么意思🌵我的大学读书笔记8篇

    《我的大学》是高尔基自传体三部曲中的最后一部。这本书通过描写饱尝人间辛酸的阿辽什卡,抱着进大学读书的梦想来到喀山。下面是小编收集整理的我的大学读书笔记8篇,希望对您有所帮助! 篇一:我的大学读书笔记 这个暑假,我读了高尔基的三部曲第三部——《

    2025-07-05
  • 🌈口袋里放什么打牌会赢🌈我家的鹦鹉四年级状物作文

    四年级状物作文400字篇一:我家的鹦鹉 我家养了两只鹦鹉,一只是虎皮鹦鹉,另一只是牡丹鹦鹉。 它们都十分可爱。我最喜欢牡丹鹦鹉,因为它身上长有各种各样的颜色。色彩斑斓有黄的、红的、橘的,深绿色的,美丽极了。而虎皮鹦鹉身上有像老虎一样的斑纹,它的

    2025-07-05
  • 🌵庄闲图片🌵瘦西湖导游词范文

    各位游客,非常欢迎到瘦西湖参观游览。瘦西湖原名保障河,又名长春河。有文献可翔实稽考为《宋书》记载:广陵旧有高楼,湛之更加修整起风亭、吹台、琴室、月观,果竹繁茂,花药成行。这是瘦西湖最早见于史书的记载。其规模最盛时期为清乾隆年间。由于康熙、

    2025-07-05
  • 🌵庄闲稳赢的十种方法🌵描写父亲节的现代诗歌(精选32首)

    在学习、工作乃至生活中,许多人对一些广为流传的诗歌都不陌生吧,诗歌饱含丰富的感情和想象。什么样的诗歌才经典呢?下面是小编为大家整理的描写父亲节的现代诗歌,仅供参考,欢迎大家阅读。  描写父亲节的现代诗歌 1  《父亲》  父亲  您是我前进的动力  给我战胜困难的勇气  您虽如此的平凡  但您却是我心中最伟大的人  父亲是条河,流转着岁月,诉说人世的沧桑  父亲是片海,擎起了太阳,放飞天空的`翅膀  父亲是座山,坚韧起脊梁,挺拔大地的芬

    2025-07-05
  • 🌈成为一个老千要练多久🌈名家经典抒情散文(集合)

    无论在学习、工作或是生活中,大家都经常接触散文吧?散文是抒发作文真情实感,写作方式灵活的记叙类文学体裁。为了帮助大家更好的了解散文,以下是小编为大家整理的名家经典抒情散文,欢迎大家借鉴与参考,希望对大

    2025-07-05
  • 🍉荷官口头禅100句🍉井底之蛙寓言故事

    在平平淡淡的学习、工作、生活中,大家都看过寓言故事吧,寓言多用借喻手法,使富有教训意义的主题或深刻的道理在简单的故事中体现,你还在找寻优秀经典的寓言故事吗?下面是小编收集整理的井底之蛙寓言故事,希望对

    2025-07-05
  • 🌵十八岁 韩剧🌵中国中学生必读名著读后感

    当看完一本著作后,想必你有不少可以分享的东西,此时需要认真地做好记录,写写读后感了。可是读后感怎么写才合适呢?以下是小编收集整理的中国中学生必读名著读后感,欢迎大家分享。中国中学生必读名著读后感1四大

    2025-07-05
  • 🍉赌场发牌🍉小学生春节的日记(通用30篇)

    忙碌而又充实的一天又过去了,这一天里,大家身边一定有一些有趣的见闻吧,此时此刻我们需要写一篇日记了。怎样写日记才更能吸引眼球呢?以下是小编为大家收集的小学生春节的日记,欢迎大家借鉴与参考,希望对大家有所帮助。  小学生春节的日记 1  春节是我们中华民族最重大最传统的节日。家家户户忙着贴春联、买年货、包汤圆,我家也不例外。  爸爸在店里很忙,因此今年贴春联我成了妈妈的小帮手。妈妈打扫干净大门后,我们就准备贴春联了。首先把双面胶和春联准备

    2025-07-05
  • 🍉老千扑克牌怎么识别🍉迟子建经典散文

    俗话说文如其人。迟子建的文字如同她的人一样好看,不是那种江南小女子粉妆玉琢的美,而是东北女子特有的大气疏朗的那么好看。她的文风中也少有小女子哀哀切切的忧愁。在有人提出文学之死以及文学是垃圾的命题时,她却不以为然。 在她的笔下,文字是良药,在

    2025-07-05