Windows 11
微软最新的操作系统

阿里开源通义Qwen2模型

阿里开源通义Qwen2模型

阿里上周开源了通义Qwen2模型,可以说是现阶段这个规模最强的开源模型。发布后直接在 Huggingface LLM 开源模型榜单获得第一名,超过了刚发布的 Llama3 和一众开源模型。

Qwen2在代表推理能力的代码和数学以及长文本表现尤其突出。推理相关测试及大海捞针测试都取得了很好的成绩。

模型概览:

Qwen 2 模型组成包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。其中Qwen2-57B-A14B为 MoE 模型。

模型在中文、英文语料基础上,训练数据中增加了27种语言相关的高质量数据;

增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。

LLM 竞技场成绩:

LLM 竞技场成绩也相当不错,成为目前中文中表现最好的开源模型(排名第7)。

  • 相较于 v1.5-110B 有显著提升
  • 整体表现上能与 GPT-4-0314 媲美
  • 在处理“难题”上,几乎赶上了表现最好的开源模型 Llama-3-70B。

模型下载:https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f

2n90urdoo

赞(0) 打赏
未经允许不得转载:Win 11系统之家 » 阿里开源通义Qwen2模型

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏