当前位置:首页 >探索 >全面赶超GPT 正文

全面赶超GPT

来源:凤凰网   作者:时尚   时间:2024-05-10 11:47:24


  5月9日 ,全面阿里云正式发布通义千问2.5 。赶超阿里云方面表示 ,全面该模型性能全面赶超GPT-4Turbo。赶超

  阿里云表示,全面与通义千问2.1版本相比,赶超通义千问2.5的全面理解能力 、逻辑推理 、赶超指令遵循、全面代码能力分别提升9% 、赶超16% 、全面19%  、赶超10%;与GPT-4相比  ,全面中文语境下,赶超通义千问2.5文本理解 、全面文本生成 、知识问答及生活建议 、闲聊及对话、安全风险等多项能力赶超GPT-4 。随着通义千问2.5的发布,阿里云表示,在权威基准OpenCompass上 ,通义千问2.5得分追平GPT-4Turbo ,是国产大模型首次在该基准取得该项成绩。

  “对标”GPT-4正在成为国产大模型的潮流 。今年4月  ,商汤科技宣布发布全新升级的日日新SenseNova5.0大模型——采用MOE混合专家架构,基于超过10TB tokens训练 ,推理上下文窗口200K ,商汤科技董事长兼首席执行官徐立表示日日新5.0大模型体系综合能力全面对标GPT-4,知识  、数学 、推理和代码能力方面大幅提升 。

  加速技术追赶的同时 ,国产大模型也在不断推进行业落地。阿里云公布的数据显示  ,目前 ,通义大模型已通过阿里云服务企业超9万、通过钉钉服务企业超过220万,通义开源模型累计下载量突破700万。通义落地应用进程加速,现已进入PC、手机、汽车、航空 、天文 、矿业、教育 、医疗、餐饮 、游戏 、文旅等领域 。

  此外 ,阿里云还在今日发布了最新款开源模型1100亿参数的Qwen1.5-110B ,阿里云表示 ,该模型在MMLU、TheoremQA 、GPQA等基准测评中超越了Meta的Llama-3-70B模型;HuggingFace推出的开源大模型排行榜OpenLLMLeaderboard上,Qwen1.5-110B位列榜首。阿里云表示 ,海内外大量中小企业和开发者以下载开源模型的方式使用通义 ,在HuggingFace、魔搭ModelScope等开源社区,通义开源大模型的累计下载量超过了700万 。

  同时,阿里云通义灵码也正式宣布推出企业版 。通义灵码是阿里云推出的一款智能编码助手  ,基于SOTA水准的通义千问代码模型CodeQwen1.5研发,阿里云表示 ,2023年10月发布至今,通义灵码的插件下载量已超350万 ,每日推荐代码超3000万次 ,被开发者采纳的代码超亿行 。随着企业版的推出,通义灵码将满足企业用户的定制化需求。

  5月9日上午,通义千问2.5发布后 ,阿里巴巴港股盘中略有上涨,截至发稿 ,阿里巴巴港股报价76.65港元,今日开盘价为75.75港元 。

(文章来源:第一财经)

标签:

责任编辑:娱乐