什么是DeepSeek,Distill,Qwen? DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型 。DeepSeek-R1的强项之一是具有很强的推理能力。 数据搜索能力 Qwen,阿里巴巴的大模型,强项是具有较为丰富的参数。 丰富的数据 Distill,蒸馏这个过程,就是结合两者的优势,组合成一个新的大模型。 强大的数据集 + 强大的推理计算能力 ...

BowmanJin 2025-02-05 62 0
没有账号? 注册  忘记密码?