当前位置:首页 > Deepseek最新资讯 > 正文内容

AWS新增全托管AI模型:Qwen3和DeepSeek-V3.1

2个月前 (09-19)Deepseek最新资讯166

  亚马逊网络服务(AWS)今日宣布,在其AI模型组合中新增两款全托管开放权重模型——Qwen3和DeepSeek-V3.1。

  这些新模型为依赖Amazon Bedrock生成式AI服务的客户提供了更大的灵活性,以满足其不断发展的业务需求。

  开放权重模型为开发者提供了关于模型权重的更高透明度,这使得为特定用例定制模型变得更加容易。Amazon Bedrock中的这些新开放权重模型与来自Meta Platforms、Mistral AI和OpenAI等领先开发商的其他模型共同组成了丰富的模型生态系统。

  不同模型在各个领域都有其独特优势。来自阿里巴巴的Qwen3为复杂编程和通用推理提供了模型选项,而DeepSeek-V3.1模型在数学、编程和智能体任务方面表现出色。Qwen3是Amazon Bedrock产品组合中首个全托管的Qwen模型系列。

  虽然这些模型可以免费获得,但通过在Bedrock中使用这些模型,客户可以利用亚马逊的企业级安全性,包括数据加密和严格的访问控制,这有助于维护数据隐私和法规合规性。客户保持对其数据的完全控制,AWS不会与模型提供商共享模型输入和输出数据,也不会用于改进基础模型。

  AWS技术总监Shaown Nandi表示,AWS将在亚洲deepseek、拉丁美洲、欧洲和北美等关键全球市场推出这些新模型。他指出,大型通用AI模型对于许多企业中常见的窄用例来说可能过于庞大。你想要一个更小的模型,或者更便宜的模型,这是可以的,因为用例的多样性,Nandi说。我们在开放权重模型中看到的是成本优势和选择优势。

  Qwen3系列提供四个新的开放权重模型,这些多语言模型可以规划多步骤工作流程,与工具和API集成,并在任务中处理长上下文窗口。两个通用模型提供思考和非思考推理模式。

  DeepSeek-V3.1模型的优势在于混合推理能力,能够平衡快速响应与深度、透明的思考,使客户能够根据要解决的问题类型在模式之间切换。该模型能耗效率很高,很少将基本查询转化为冗长的讨论,同时在制定战略决策方面保持高水平的专业性。

  AWS通过客户反馈、使用情况分析和对部署及更新计划的educated guess来决定在哪些市场推出什么模型。目前,AWS提供数百种模型,并正在扩大添加新模型的区域范围。

  A:Qwen3是来自阿里巴巴的多语言模型,擅长复杂编程和通用推理,可以规划多步骤工作流程,提供思考和非思考推理模式。DeepSeek-V3.1则在数学、编程和智能体任务方面表现出色,具有混合推理能力,能够平衡快速响应与深度思考。

  A:开放权重模型提供更高的透明度,使开发者更容易为特定用例定制模型。它们具有成本优势和选择优势,通过模型蒸馏技术,客户可以将模型训练到更小尺寸,保持准确性的同时运行成本可降低多达30倍。

  A:AWS将在亚洲、拉丁美洲、欧洲和北美等关键全球市场推出这些新模型。特别是拉丁美洲和亚洲部分地区的客户对能够为本地需求调优模型表现出特别的兴趣,而开放权重模型更容易实现这一点。原文出处:AWS新增全托管AI模型:Qwen3和DeepSeek-V3.1,感谢原作者,侵权必删!

标签: deepseek

“AWS新增全托管AI模型:Qwen3和DeepSeek-V3.1” 的相关文章

深度|生物药资产爆发后,中国创新医疗器械何时迎来DeepSeek一刻

深度|生物药资产爆发后,中国创新医疗器械何时迎来DeepSeek一刻

  今年中国创新生物药对外授权引发全球关注。相关数据显示,上半年创新药对外授权金额近660亿美元,让全世界见证了中国生物医药的DeepSeek一刻。   不过在医疗器械领...

计算机行业点评报告:DEEPSEEK助力国产AI软硬协同 政策+产业共振将至

计算机行业点评报告:DEEPSEEK助力国产AI软硬协同 政策+产业共振将至

  战略定调:“人工智能+”行动引领,AI 规模化落地进行时。2025 年7 月31 日,国务院总理主持召开国务院常务会议,审议通过《关于深入实施“人工智能+”行动的意见》,推进人工智能规...

川网传媒:川网云接入DeepSeek-R1、腾讯混元等大模型

川网传媒:川网云接入DeepSeek-R1、腾讯混元等大模型

  投资者,您好!“川网云”作为公司打造的开放式云网融合基础技术平台,始终致力于融合人工智能等前沿技术以赋能业务发展。目前,平台已接入DeepSeek-R1、腾讯混元等大模型deepsee...

智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

  在这背后,并非其技术力量不足,而是当前的应用形态仍停留在“工具赋能”的初级阶段,大模型的潜力被束缚在碎片化场景中,未能转化为重构生产逻辑的核心动能。   正如360集...

刚刚,DeepSeek-V3.1「终极版」重磅发布!最大提升超36%,V4R2还

刚刚,DeepSeek-V3.1「终极版」重磅发布!最大提升超36%,V4R2还

  值得一提的是,新模型在Humanitys Last Exam(人类最后的考试)中,成绩提升幅度高达36.48%!   这一Bug已经导致DeepSeek V3.1无法...

当我问deepseek,中国女排如何在洛杉矶奥运会夺冠,回答太犀利!

当我问deepseek,中国女排如何在洛杉矶奥运会夺冠,回答太犀利!

  中国女排若要在2025年洛杉矶奥运会中实现突破,需直面当前结构性困境,摒弃“粉饰太平”的惯性思维,以系统性改革应对以下核心挑战:   蔡斌的局限性:蔡斌执教能力虽可保...