当前位置:首页 > Deepseek最新资讯 > 正文内容

亚马逊云科技为何上架Qwen和DeepSeek的最新模型

9个月前 (09-20)Deepseek最新资讯306

  2025年二季度云业务营收增速17.5%,相比两年前的2023年三季度同比提升5.2个百分点。

  亚马逊总裁安迪·贾西(Andy Jassy)在2025年二季度财报后的投资者电话会披露,亚马逊的生成式AI业务目前年营收增速达到三位数,价值数十亿美元,目前需求量已经超过了供应能力。

  在全球地缘政治环境面临不确定因素的大背景下,引入更多领先的中国模型,对于亚马逊来说,可以尽量降低客户的供应链风险。

  事实上,中国模型厂商在全球开源社区正在拥有越来越大的影响力。无论是Qwen3还是DeepSeek-V3.1,这两款模型的性能在全球均处于领先位置。它们是企业和开发者正在广泛使用的模型。

  更重要的是,Qwen3和DeepSeek-V3.1在和OpenAI、Anthropic等全球领先模型性能接近的同时,还拥有一定的价格优势。

  大模型调用价格通常是按照每百万Token(词元,AI推理算力的计量单位,一个Token可以是单词、标点、数字、符号等)的输入/输出价格计算。

  也就是说,Qwen3和DeepSeek-V3.1的价格,在全球所有领先的模型中几乎是最低的。对于需要处理大量文本的应用场景,例如内容创作、智能客服等,选用这两款中国模型,能大幅降低运营成本。

  一位中国创业公司的开发者今年8月曾表示,在他的实际测试中,Qwen3、DeepSeek-V3.1实际性能可以达到OpenAI、Anthropic旗舰模型的80%-90%,但价格只要30%-60%。

  只有开发者用起来的模型,才是好模型。被消耗了多少Token,可以侧面证明一款模型是否真正被使用。

  性能有优势,价格不算贵,客户也有需求,这也解释了为什么Amazon Bedrock会上架Qwen3还是DeepSeek-V3.1这两款来自中国的开源模型。

  “模型大战”已经持续三年多,至今依然没有诞生能够“一统天下”的模型。现在,越来越多人预判,这场竞赛最终也不会有“一统天下”玩家。

  2025年,全球科技公司的大模型迭代速度都越来越快,更新速度以“天”计算。据我们的综合调研统计,2025年1月1日-7月25日的206天内,中国、美国参与模型竞争的11家科技公司(包括阿里巴巴、字节跳动、腾讯、百度、华为、DeepSeek、月之暗面、谷歌、OpenAI、Anthropic、xAI)发布或迭代了至少29版大模型,平均每7.1天就会有一版新的大模型被发布。

  现在的最强模型,3个-6个月后就可能被超越。企业如果将自己的AI战略完全押注在某一个封闭、独家的模型上,将会面临巨大的技术和商业风险。

  在大模型的竞赛中,大语言模型、图像模型、语音模型、视频模型、3D/4D模型层出不穷。几乎每一个细分领域、每一个赛道,都有单项性能领先的选手。

  选定了模型的专业领域,还要面对“不可能三角”——在成本、速度、性能三者之间权衡,最终找到适合自身业务的模型。

  在真实的商业场景中,仅凭借单一模型很难满足所有需求。在这种复杂情况下,要像搭积木一样,把不同的模型组合起来,这种“多模型协作”的方法才能达到最佳的效果。

  一位中国营销出海软件公司的软件负责人曾对我们表示,一个多语言客服应用,英文、小语种处理部分可能用Claude4效果更好,但中文处理部分用Qwen3的效果更高。当企业希望获得性价比,而且对幻觉率要求不高的时候,DeepSeek可能更合适。

  一位国际ERP(企业资源管理)厂商人士曾提到,他们的业务之中使用了10余款模型,可以随时调用切换。他认为,选择丰富之后,才能根据模型的性能、成本、表现选型。这可以尽量降低试错成本,也可以动态切换成本更低的模型,避免被一家模型公司绑定。

  一位中国科技公司大模型平台业务负责人今年6月的看法是,Muti-Agent应用即将在2025年底成熟。未来,企业内部的真实模型使用场景可能是,一个模型驱动一款Agent,不同模型驱动的不同Agent在一起协同工作。

  安迪·贾西曾在re:Invent2023对此解释,要给开发者自主选择的权利。使用模型时,拥有多种选择至关重要,因为“永远不会出现一种工具在某个领域一统天下的情况”。

  在亚马逊云科技的“Choice Matters”的大模型战略拼图中,至少为开发者提供了300多款模型。开发者既可以利用SageMaker平台精调、训练属于自己的模型,也可以用Amazon Bedrock直接使用全球主流模型。

  Amazon Bedrock上架了全球14家模型厂商的200多款精选模型。它的使用门槛更低,可以通过API调用全球主流大模型。如果企业目标是快速将强大的生成式AI能力集成到自己的应用中deepseek,可以选择Amazon Bedrock。

  在Amazon Bedrock上,客户可以在同一个平台,用同一个API,对来自中国、美国的主流模型进行性能、成本的A/B测试,进而选择适合自己的模型。

  对亚马逊云科技来说,让自己的大模型平台保持中立、做大生态,才是最重要的。它不执着于在基础模型研发上与OpenAI、谷歌等公司一较高下,而是希望提供一个全面、开放、易于使用的模型平台,尽量囊括全球优秀模型,让客户根据自身需求自由选择。原文出处:亚马逊云科技为何上架Qwen和DeepSeek的最新模型,感谢原作者,侵权必删!

标签: deepseek

“亚马逊云科技为何上架Qwen和DeepSeek的最新模型” 的相关文章

DeepSeek又上新!模型硬刚谷歌

DeepSeek又上新!模型硬刚谷歌

  两款模型有着不同的定位。DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用智能体任务场景。9月底DeepSeek发布了实验版V3.2-Exp,此...

早盘消息0820 T 链 Gen3 技术路线重塑供应链、DeepSeek 模型升

早盘消息0820 T 链 Gen3 技术路线重塑供应链、DeepSeek 模型升

  ·政策细节:工信部部长亲自出席,首次把发电企业与地方工信纳入协调,打通制造端到电站端价格传导;强调“市场化法治化”退出落后产能,收储方案7月底已达成初步共识。   价...

DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍

DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍

  2月27日消息,依旧没等到DeepSeek V4,今天DeepSeek与北京大学、清华大学在ArXiv联合发布了一篇关于全新智能体推理框架DualPath的论文。据了解,该框架旨在解决...

智能驾驶板块何时迎来自己的“DeepSeek”时刻?

智能驾驶板块何时迎来自己的“DeepSeek”时刻?

  【智能驾驶】作为高端制造与AI融合的核心赛道,相关产业链在最近一段时间迎来密集变化:国内 L3 级自动驾驶正式迈入商业化试点,海外监管放松打开行业发展空间,端到端技术快速迭代提升智驾体...

“共创、共享、共赢”数智未来 华为云生态领航者·总裁思享会(厦门)圆满落幕

“共创、共享、共赢”数智未来 华为云生态领航者·总裁思享会(厦门)圆满落幕

  在数字经济的浪潮席卷各行各业、智能化转型成为企业核心竞争力的今天,云计算作为关键技术底座,正持续推动产业生态的协同进化与价值重塑。在此背景下,2025年11月24日,华为云在厦门工学院...

11月18日DeepSeek预测:步行者vs活塞,东部榜首大战,活塞主场能否延续

11月18日DeepSeek预测:步行者vs活塞,东部榜首大战,活塞主场能否延续

  11月18日早8点,NBA常规赛将迎来一场东部榜首与榜尾的焦点战——底特律活塞坐镇小凯撒球馆迎战印第安纳步行者。目前活塞以11胜2负高居东部第一,而步行者仅1胜12负排名东部倒数第二,...