Qwen3-30B-A3B 模型迎来了新版本:Qwen3-30B-A3B-Instruct-2507。
这是一个非思考模式(non-thinking mode)的新模型,仅激活3B参数,就能取得可媲美 Gemini 2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型的超强性能。
Qwen3-30B-A3B-Instruct-2507 在诸多方面实现了关键提升:
🌟通用能力大幅提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多方面;
🌟在多语言的长尾知识覆盖方面,模型进步显著;
🌟在主观和开放任务中,新模型与进一步紧密对齐了用户偏好,可以生成更高质量的文本,为用户提供更有帮助的回答;
🌟长文本理解能力提升至256K。
通义团队已在魔搭社区和HuggingFace等平台开源这一新模型,可前往QwenChat(chat.qwen.ai)直接体验。
还没有评论,来说两句吧...