有关"怎么添加观察钱包tp"消息 hd 12.70-凯发旗舰厅
5月21日,阿里云抛出重磅炸弹:通义千问gpt-4级主模qwen-long,api输入价格从0.02元/千tokens降至0.005元/千tokens,直接降至97%。
5月21日,阿里云抛出重磅炸弹:通义千问gpt-4级主模qwen-long,从0.02元/千tokens到0.0005元/千tokens,api输入价格直接下降97%。这意味着1元可以买到200万tokens,相当于5本新华字典的文字量。该模型最多支持1000万tokens长文本输入,降价后约为gpt-4价格的1/400,突破全球底价。

qwen-long是通义千问的长文本增强版模型,gpt-4性能标杆,上下文长度最高达1000万。除输入价格降至0.005元/千tokens外,qwen-long的输出价格也直接下降了90%到0.002元/千tokens。相比之下,gpt-4是国内外制造商、gemini1.5 pro、claude 3 sonnet及ernie-4.0每千tokens的输入价格分别为0.22元、0.025元、0.022元和0.12元,远高于qwen-long。

本次降价涵盖了9个商业化和开源系列模型。不久前发布的通义千问旗舰大模型qwen-max,api输入价格降至0.04元/千tokens,降至67元%。qwen-max是目前业内表现最好的中文大模型,在权威基准opencompass上的表现与gpt-4相当-turbo,chatbot在大型竞技场 arena跻身世界前15名。

不久前,openaisam chatbot转发了altman arena榜单证实了gpt-4o的能力,其中世界前20名模型中只有三款是通义千问制作的。

业内普遍认为,随着大模型性能的逐步提高,人工智能应用创新正进入密集探索期,但高推理成本仍然是制约大模型应用的关键因素。
阿里云智能集团高级副总裁、公共云事业部总裁刘伟光在武汉人工智能领袖峰会上表示:“作为中国最大的云计算公司,阿里云大幅降低了大型模型推理价格,希望加快人工智能应用的爆发。我们预计未来大型api的调用量将增加数千倍。”。
刘伟光认为,无论是开源模式还是商业模式,公共云 api将成为企业使用大型模型的主流方式,主要有三个原因:
一是公共云的技术红利和规模效应,带来巨大的成本和性能优势。阿里云可以不断优化模型本身和人工智能基础设施,追求最终的推理成本和性能。基于自主研发的异构芯片互联和高性能网络hpn7.0,阿里云、cpfs的高性能存储、人工智能平台pai等核心技术和产品构建了极具弹性的人工智能计算能力调度系统,大大降低了模型推理成本,加快了模型推理速度。
即使是相同的开源模型,公共云上的调用价格也远低于私有化部署。以qwen-72b开源模型和每月1亿tokens用量为例,api每月只需600元,私有化部署平均成本每月超过1万元。
二是云上多模型调用更方便,为企业级数据安全提供保障。阿里云可为各企业提供独家vpc环境,实现计算隔离、存储隔离、网络隔离、数据加密,充分保证数据安全。目前,阿里巴巴云已主导或深入参与制定与大模型安全相关的10多项国际国内技术标准。
第三,云制造商的自然开放性可以为开发者提供最丰富的模型和工具链。阿里云百炼平台汇聚通义,百川,chatglm、llama系列等数百款国内外高质量模型,内置大型模型定制和应用开发工具链,开发人员可以轻松测试不同的模型,开发独家大型模型,轻松构建rag等应用。从模型选择、模型调整、应用到外部服务,一站式完成。