最新的qwen Llama Gemma小参数模型比较,移动端
qwen2-1.5-instruct 好于Gemma2-2b-instruct\Llama3.2-1B-instruct
从 Qwen2–1.5B-instruct 到 Gemma2–2B-instruct,再到 Llama3.2–1B-instruct,最后是新的 Qwen2.5–1.5B-instruct。虽然我对 Llama3.2–1B-instruct 感到相当失望,但对新的 Qwen2.5–1.5B-instruct 的出色表现感到惊讶。
涵盖了聊天机器人中使用的许多主要语言任务,例如总结、简短总结、随意聊天、RAG、真实RAG等等。
涵盖了聊天机器人中使用的许多主要语言任务,例如总结、简短总结、随意聊天、RAG、真实RAG等等。
从这几个维度进行人工打分比较
他们的声明伴随着关于新模型家族的事实:密集型、易于使用的仅解码器语言模型,提供 0.5B、1.5B、3B、7B、14B、32B 和 72B 尺寸,以及基础和指令变体。在我们最新的大规模数据集上进行预训练,涵盖多达 18T 的标记。指令跟随方面的显著改进对系统提示的多样性更具弹性,增强角色扮演实施和聊天机器人的条件设置。支持高达 128K 的上下文长度,并可以生成最多 8K 的标记。支持超过 29 种语言的多语言功能