当前位置:首页 > Deepseek最新资讯 > 正文内容

亚马逊云科技为何上架Qwen和DeepSeek的最新模型

9个月前 (09-20)Deepseek最新资讯307

  2025年二季度云业务营收增速17.5%,相比两年前的2023年三季度同比提升5.2个百分点。

  亚马逊总裁安迪·贾西(Andy Jassy)在2025年二季度财报后的投资者电话会披露,亚马逊的生成式AI业务目前年营收增速达到三位数,价值数十亿美元,目前需求量已经超过了供应能力。

  在全球地缘政治环境面临不确定因素的大背景下,引入更多领先的中国模型,对于亚马逊来说,可以尽量降低客户的供应链风险。

  事实上,中国模型厂商在全球开源社区正在拥有越来越大的影响力。无论是Qwen3还是DeepSeek-V3.1,这两款模型的性能在全球均处于领先位置。它们是企业和开发者正在广泛使用的模型。

  更重要的是,Qwen3和DeepSeek-V3.1在和OpenAI、Anthropic等全球领先模型性能接近的同时,还拥有一定的价格优势。

  大模型调用价格通常是按照每百万Token(词元,AI推理算力的计量单位,一个Token可以是单词、标点、数字、符号等)的输入/输出价格计算。

  也就是说,Qwen3和DeepSeek-V3.1的价格,在全球所有领先的模型中几乎是最低的。对于需要处理大量文本的应用场景,例如内容创作、智能客服等,选用这两款中国模型,能大幅降低运营成本。

  一位中国创业公司的开发者今年8月曾表示,在他的实际测试中,Qwen3、DeepSeek-V3.1实际性能可以达到OpenAI、Anthropic旗舰模型的80%-90%,但价格只要30%-60%。

  只有开发者用起来的模型,才是好模型。被消耗了多少Token,可以侧面证明一款模型是否真正被使用。

  性能有优势,价格不算贵,客户也有需求,这也解释了为什么Amazon Bedrock会上架Qwen3还是DeepSeek-V3.1这两款来自中国的开源模型。

  “模型大战”已经持续三年多,至今依然没有诞生能够“一统天下”的模型。现在,越来越多人预判,这场竞赛最终也不会有“一统天下”玩家。

  2025年,全球科技公司的大模型迭代速度都越来越快,更新速度以“天”计算。据我们的综合调研统计,2025年1月1日-7月25日的206天内,中国、美国参与模型竞争的11家科技公司(包括阿里巴巴、字节跳动、腾讯、百度、华为、DeepSeek、月之暗面、谷歌、OpenAI、Anthropic、xAI)发布或迭代了至少29版大模型,平均每7.1天就会有一版新的大模型被发布。

  现在的最强模型,3个-6个月后就可能被超越。企业如果将自己的AI战略完全押注在某一个封闭、独家的模型上,将会面临巨大的技术和商业风险。

  在大模型的竞赛中,大语言模型、图像模型、语音模型、视频模型、3D/4D模型层出不穷。几乎每一个细分领域、每一个赛道,都有单项性能领先的选手。

  选定了模型的专业领域,还要面对“不可能三角”——在成本、速度、性能三者之间权衡,最终找到适合自身业务的模型。

  在真实的商业场景中,仅凭借单一模型很难满足所有需求。在这种复杂情况下,要像搭积木一样,把不同的模型组合起来,这种“多模型协作”的方法才能达到最佳的效果。

  一位中国营销出海软件公司的软件负责人曾对我们表示,一个多语言客服应用,英文、小语种处理部分可能用Claude4效果更好,但中文处理部分用Qwen3的效果更高。当企业希望获得性价比,而且对幻觉率要求不高的时候,DeepSeek可能更合适。

  一位国际ERP(企业资源管理)厂商人士曾提到,他们的业务之中使用了10余款模型,可以随时调用切换。他认为,选择丰富之后,才能根据模型的性能、成本、表现选型。这可以尽量降低试错成本,也可以动态切换成本更低的模型,避免被一家模型公司绑定。

  一位中国科技公司大模型平台业务负责人今年6月的看法是,Muti-Agent应用即将在2025年底成熟。未来,企业内部的真实模型使用场景可能是,一个模型驱动一款Agent,不同模型驱动的不同Agent在一起协同工作。

  安迪·贾西曾在re:Invent2023对此解释,要给开发者自主选择的权利。使用模型时,拥有多种选择至关重要,因为“永远不会出现一种工具在某个领域一统天下的情况”。

  在亚马逊云科技的“Choice Matters”的大模型战略拼图中,至少为开发者提供了300多款模型。开发者既可以利用SageMaker平台精调、训练属于自己的模型,也可以用Amazon Bedrock直接使用全球主流模型。

  Amazon Bedrock上架了全球14家模型厂商的200多款精选模型。它的使用门槛更低,可以通过API调用全球主流大模型。如果企业目标是快速将强大的生成式AI能力集成到自己的应用中deepseek,可以选择Amazon Bedrock。

  在Amazon Bedrock上,客户可以在同一个平台,用同一个API,对来自中国、美国的主流模型进行性能、成本的A/B测试,进而选择适合自己的模型。

  对亚马逊云科技来说,让自己的大模型平台保持中立、做大生态,才是最重要的。它不执着于在基础模型研发上与OpenAI、谷歌等公司一较高下,而是希望提供一个全面、开放、易于使用的模型平台,尽量囊括全球优秀模型,让客户根据自身需求自由选择。原文出处:亚马逊云科技为何上架Qwen和DeepSeek的最新模型,感谢原作者,侵权必删!

标签: deepseek

“亚马逊云科技为何上架Qwen和DeepSeek的最新模型” 的相关文章

仅用38分钟!深圳一初创企业跑通DeepSeek新模型国产芯片适配

仅用38分钟!深圳一初创企业跑通DeepSeek新模型国产芯片适配

  1月27日,DeepSeek团队发布了DeepSeek-OCR-2模型。来自深圳的智子芯元公司运用自主研发的KernelCAT工具,仅用38分钟就完成了这款模型在华为昇腾平台的自动化部...

11月5日DeepSeek预测:黄蜂vs鹈鹕,鲍尔率队客场擒鹈鹕

11月5日DeepSeek预测:黄蜂vs鹈鹕,鲍尔率队客场擒鹈鹕

  西部垫底的鹈鹕将迎来东部第11的黄蜂挑战。鹈鹕本赛季0胜6负未尝胜绩,场均净负18.1分联盟最差;黄蜂3胜4负虽胜率不足五成,但进攻效率高居联盟第8。此役胜负将直接影响双方在分区排名的...

为什么DeepSeek从年初“国运级”到现在热度减退,问题出在哪里?

为什么DeepSeek从年初“国运级”到现在热度减退,问题出在哪里?

  DeepSeek从年初的“国运级”到现在的热度减退,到底哪里出问题了?有网友表示,Deepseek 并没有无人问津,依然每天有大量的活跃用户。但提问者依然觉得Deepseek的热度和年...

赋能数字化转型 引领产业新变革 —— 公司举办“DeepSeek 赋能产业数字化

赋能数字化转型 引领产业新变革 —— 公司举办“DeepSeek 赋能产业数字化

  为加快推进公司数字化转型,全面提升员工AI实战能力,9月5日,公司组织开展了“DeepSeek赋能产业数字化转型”专题培训,80多名公司中层管理人员、业务骨干等齐聚一堂,共同探索AI大...

700万参数击败DeepSeek R1等,三星一人独作爆火,用递归颠覆大模型推理

700万参数击败DeepSeek R1等,三星一人独作爆火,用递归颠覆大模型推理

  今年 6 月,来自 Sapient Intelligence 的研究者提出了分层推理模型(HRM),用循环架构打破了传统思维链(CoT)的架构限制,对大模型推理结构产生了重大的影响。H...

沐曦股份即将上市 其下一代国产高端GPU芯片或再现“DeepSeek神话”

沐曦股份即将上市 其下一代国产高端GPU芯片或再现“DeepSeek神话”

  近日,上海证券交易所公告显示,上市审核委员会定于10月24日审议沐曦集成电路(上海)股份有限公司(以下简称“沐曦股份”)的首发申请。   作为国内高性能GPU产品的领...