当前位置:首页 > Deepseek最新资讯 > 正文内容

OpenAI发布低成本模型 与

3个月前 (08-06)Deepseek最新资讯316

  OpenAI周二发布了自2019年推出GPT-2以来首批开放权重语言模型。这两款纯文本模型分别命名为gpt-oss-120b和gpt-oss-20b,旨在为开发者、研究人员和企业提供更易运行和定制的低成本选项。

  当人工智能模型的参数(即训练过程中优化输出和预测能力的要素)公开可用时,该模型即被视为开放权重。此类模型虽能提供透明度和控制权,但不同于开源模型——后者允许用户完全获取并修改源代码。

  近年来,Meta、微软支持的Mistral AI以及中国初创企业DeepSeek等公司也相继发布了开放权重模型。

  OpenAI总裁格雷格·布罗克曼在简报会上表示,见证这个生态系统的成长令人振奋,我们很荣幸能参与其中并推动技术边界,进而观察其发展轨迹。该公司与英伟达、超威半导体、Cerebras及Groq合作deepseek,确保模型能在多种芯片上稳定运行。

  OpenAI向世界展示了基于英伟达AI技术的可能性,如今他们正在开源软件领域推动创新,英伟达CEO黄仁勋在声明中评价道。

  此次发布备受期待,部分原因是公司曾多次推迟上线。OpenAI CEO萨姆·奥尔特曼七月在X平台发文称需要更多时间进行额外安全测试并审查高风险领域,此前六月他也明确表示模型不会当月发布。

  OpenAI周二声明已对开放权重模型实施全面安全训练与测试。在预训练阶段清除了有害的化学、生物、放射性与核武器相关数据,并模拟了恶意行为者可能进行的模型微调。

  测试表明,经恶意调优的模型无法达到其准备框架设定的高能力阈值——这是该公司衡量和防范危害的评估体系。OpenAI还透露已邀请三个独立专家团队对恶意微调评估提供反馈。

  用户可通过Hugging Face和GitHub等平台依据Apache 2.0许可证下载模型权重,并借助LM Studio、Ollama等程序在个人电脑运行。亚马逊云、Baseten和微软云也将提供模型服务。

  这两款模型均具备高级推理、工具调用和思维链处理能力,适配从消费级硬件到云端乃至终端设备的各种环境。例如gpt-oss-20b可在笔记本电脑运行,作为能检索文件和辅助写作的个人助手。

  我们很荣幸将这项耗资数十亿美元的研究成果开放给全世界,让尽可能多的人掌握AI技术,奥尔特曼在周二的声明中表示。原文出处:OpenAI发布低成本模型 与,感谢原作者,侵权必删!

标签: deepseek

“OpenAI发布低成本模型 与” 的相关文章

DeepSeek预测:尤文图斯VS亚特兰大!斑马军团主场复仇or真蓝黑再演屠杀?

DeepSeek预测:尤文图斯VS亚特兰大!斑马军团主场复仇or真蓝黑再演屠杀?

  北京时间9月28日凌晨,意甲第5轮将上演强强对话——尤文图斯坐镇安联球场迎战亚特兰大。目前斑马军团以3胜1平积10分排名第二,而真蓝黑则以2胜2平积8分位列第五。这场价值6分的欧战区卡...

【中国那些事儿】二十届四中全会擘画“十五五”蓝图 全球媒体聚焦中国发展新方向

【中国那些事儿】二十届四中全会擘画“十五五”蓝图 全球媒体聚焦中国发展新方向

  中国日报网10月22日电 10月20日至23日,中国共产党第二十届中央委员会第四次全体会议在北京召开。会议将审议《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》。在全球不确...

DeepSeek预测:诺丁汉森林vs切尔西!蓝军客场碾压?凯塞多+佩德罗双星闪耀

DeepSeek预测:诺丁汉森林vs切尔西!蓝军客场碾压?凯塞多+佩德罗双星闪耀

  作为英格兰足坛的老牌劲旅,诺丁汉森林本赛季的表现堪称灾难。7轮过后仅积5分排名第17,距离降级区仅有1分优势。球队进攻端仅打入5球(联赛第19),防守端丢12球(第16),场均得失球0...

DeepSeek崩了引热议 官方深夜回应:网页API已恢复

DeepSeek崩了引热议 官方深夜回应:网页API已恢复

  据了解,2025年伊始,来自中国的AI大模型DeepSeek凭借其突破性进展迅速走红,各行各业都在积极拥抱DeepSeek。   1月27日,Deepseek应用登顶...

中储股份:控股子公司中储智运暂未选择接入DeepSeek

中储股份:控股子公司中储智运暂未选择接入DeepSeek

  中储股份9月10日在互动平台表示,控股子公司中储智运科技股份有限公司(简称“中储智运”)综合考量成本控制、安全合规及系统集成适配性等多维度因素,经审慎研究,暂未选择接入DeepSeek...

DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本,还是多模态

DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本,还是多模态

  当前,业界顶尖的大模型正竞相挑战“过度思考”的难题,即无论问题简单与否,它们都采用 “always-on thinking” 的详细推理模式。无论是像 DeepSeek-V3.1 这种...