行业新闻

太牛了!阿里云百炼上线百万长文本模型Qwen25 -Turbo百万tokens仅需03元

发布时间:2025-02-03 04:34:04 作者: 刀锋平台

  11月20日消息,最新的Qwen2.5-Turbo已在阿里云百炼上线万个汉字,在多个长文本评测集上的性能表现超越GPT-4。即日起,全用户可在阿里云百炼调用Qwen2.5-Turbo API,百万tokens仅需0.3元。

  此前阿里集团发布财报后的电话会议上,谈到阿里云的支出问题时,阿里巴巴集团CEO吴泳铭明确说,大家还会看到“通义千问”模型的API token上的持续降价,也会看见我们将在平台的推理服务、算力服务上做更多让利。AI业务,或者说行业对AI的需求还是处在非常早期的阶段。因此,在这样的领域,阿里云还是会持续地从拓展用户的角度去确定产品价格。

  关于API token降价,吴泳铭表示,很多新用户会因为这一些降价来使用阿里云的模型,用户在使用这个模型时,他们会非常自然地将应用部署在平台上面,这也会促使用户用到阿里云的其他云产品,比如计算、存储或者数据库等产品。

  “相对来说,你们可以把我们‘通义千问’模型的API token降价理解为促进用户增长,或者说获取更多用户的手段。”

  在推理速度方面,通义千问团队利用稀疏注意力机制将注意力部分的计算量压缩了约12.5倍,将处理1M tokens上下文时的首字返回时间从4.9分钟降低到68秒,实现了4.3倍的速度提升。

  Qwen2.5-Turbo可应用于长篇小说深入理解、仓库级别代码助手、多篇论文阅读等场景,可一次性处理10本长篇小说,150小时的演讲稿,3万行代码。针对该模型,阿里云百炼免费为用户赠送1000万tokens额度。

  该团队表示,长文本任务处理依然存在诸多挑战,未来将进一步探索长序列人类偏好对齐,优化推理效率以减少运算时间,并继续研发更大、更强的长文本模型。

  据介绍,阿里云百炼已上线Qwen、Llama、Flux等超200款国内外主流开源和闭源大模型,用户可选择直接调用、训练微调或打造RAG应用。目前,一汽、金山、哈啰集团、国家天文台等超30万企业和机构在使用阿里云百炼。

  阿里巴巴集团CEO吴泳铭在最新的财报电话会议上说,从目前客户的短期需求上来看,无论是AI的算力,还是AI的API服务,客户的真实需求还是在持续爆发的,客户的需求也处于“并不能非常容易满足”的阶段。“因此,我们在AI的投入上相对来说确实比较激进。”

  “另外,我们要考虑到这一波生成式AI技术的发展确实是难得一见的。这对于技术行业来说可能是一个历史性机遇,甚至能够说是二十年一遇的技术革新。从这个方面来看,无论是当前模型能力所需的推理服务,还是这些模型在各行各业的应用,我们正真看到各行各业的应用都在逐步展开,用户的需求依旧很确定的。同时,我们也看到像OpenAI最新的Orion模型在所谓的思维链技术上的应用,可以说行业未来对推理需求的算力还是有相当大数量级的需求提升。基于这样的技术预判,我们会在AI的算力基础设施建设上做提前的投入。”吴泳铭说。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  双色球第25012期研究预测:精选6+2,蓝10 15,财富作伴展宏图

  萌娃回老家双手插兜,双眼无神,站在门口发呆,网友:小小的人儿在想什么呢

  《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律

  《兽人必须死!死亡陷阱》评测:再入窠臼/

  主站 商城 论坛 自运营 登录 注册 《兽人必须死!死亡陷阱》评测:再入窠臼 D.哈卡 2025-01-3...

  铭凡海外推出迷你主机 UN100P:N100 + 16G + 256G 售 179 美元


上一篇: 14848(GX40CrNiSi25-20)耐热合金空腹炉底辊破碎机对辊压榨辊

下一篇: 阿里云百炼上线-Turbo模型:支撑100万超长上下文