部署本地DeepSeek大模型时,怎么选择合适的模型文件?
问题是什么? 大家都知道deepseek开源了大模型,可能想本地部署试试效果如何,去各个大模型平台看了一遍,这时候部分人可能会很奇怪,为什么这些平台官方推荐的deepseek大模型都是“DeepSeek-R1-Distill-Qwen” 这种?deepseek和Qwen有什么关系?什么是Distill? 什么是DeepSeek,Distill,Qwen? DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型 。DeepSe...
GPT语言大模型个人使用体验排名。
2024年更新(忘了几月份) 排名 GPT-4o: by OpenAI/Microsoft,ChatGPT开创者 Claude: by Anthropic,在编程领域非常突出,特别是在Cursor内使用时。 Qwen: by 阿里巴巴 Llama: by Meta Gemini: by Google Other 上述五种之外的国内外大模型,使用体验都非常一般,包括马斯克的Grok,抖音的豆包,Kimi,文心一言等等,计算能力和理解能力都较为普通。 总结 ...