当前位置:首页 > DeepSeek技术交流 > 正文内容

从“浅尝”到“深爱”,华为云Stack打通政企应用DeepSeek最后一公里

4个月前 (03-26)DeepSeek技术交流299

DeepSeek横空出世火爆全网,在个人用户端,DeepSeek App频登各大应用市场下载量榜首;企业用户端,不完全统计已有几百家企业机构用户宣布部署DeepSeek。“全民AI”的浪潮从DeepSeek尝鲜来到了产业新命题:拥有DeepSeek不是真的好,用好DeepSeek才是真的好。

大模型增量预训练,从通用到行业,提供“大而全”的行业大模型

以煤矿行业为例,高度专业化的行业流程、设备术语,叠加煤矿企业自身特有的生产标准、操作规程、安全要求等行业规范,都对通用大模型的领域知识储备带来极大挑战。如“最强大脑”般包罗万象的DeepSeek,也可能因缺乏对企业既往地质勘探报告的数据积累,而无法给出针对该企业矿产分布情况的分析意见。

因此,在部署DeepSeek后,煤企还需要通过增量预训练开发,将行业领域知识、煤矿专业词典、自身经营信息等数据注入基础大模型,来解决基础模型知识库与行业知识的适配、以及企业自身私有数据集成的难题。开发过程中,需要对问答数量不足的领域使用专业词典生成新文本以增强源数据,对图片类行业文档进行格式转换,进行数据处理去除无用信息,审核数据内容安全性,对新增数据添加特定标签后拼装新的标注数据集,并进行相应的参数优化和强化学习。

经过行业领域知识增强后的行业大模型,将能够通过分析企业历史事故报告、安全规程文本等信息,给出针对性的生产预警建议;通过解析企业技术图纸、设备、合同等文档构建企业自有知识库从而提升设备故障诊断效率和文档检索效率;以及帮助矿区巡检人员将语音记录自动转化为巡检报告从而大幅提升巡检效率,真正成为企业“最有用”的AI小帮手。

大模型场景开发微调,聚焦任务性能提升,提供“精而深”的场景大模型

以制造行业为例,有研发设计、生产制造、供应物流、质量管理、市场营销、售后支持、设备维护等众多细分场景,各场景业务智能化任务所需要的模型能力不一而同。因而,往往需要企业在完成行业领域大模型专业知识构建和增强之后,针对特定任务执行的性能表现,基于已形成的行业预训练数据进行进一步的专家数据标注、通过行业Prompt工程进行问答润色、以及使用行业指令数据和通用指令数据进行数据处理以完善指令数据配比,并在此基础上进行持续的场景模型参数调整优化和强化学习,从而提升对于具体业

务场景下对模型“精而深”的性能要求。

例如,在产品生产质量管控这一细分场景,通过将企业独有的产品生产批次数据、质检记录和客户质量反馈投诉等信息用于质检场景模型分析优化,将能够帮助企业持续积累客户反馈问题与产品缺陷规律的质量分析经验,并在不断优化模型表现的基础上,持续提升产品缺陷的响应速度,从而帮助企业及时进行原材料优化、工艺改进等质量措施以不断提升产品质量,让大模型真正助力企业的核心生产力提升。

蒸馏模型开发,从“大模型”淬炼“小模型”,轻量部署助力模型能力边端落地

对于很多拥有大量分支机构的行业来说,分支机构多且分散的实际情况往往会成为企业规模化部署智能化应用的一大挑战。尤其是针对有众多偏远区域分支的客户,例如能源基础设施企业,公共服务企业,由于环境特殊性、网络限制及实时性需求,企业通常会通过部署边缘计算和智能设备实现本地化数据处理与决策。

然而,在大模型应用的过程中,基础大模型往往参数量巨大,无法在边缘低算力设备中部署。此外,一些实时性要求较高的作业,例如事故报警,需要毫秒级响应,大模型的推理速度往往无法满足要求。

在这种场景下,通过知识蒸馏,可以将行业大模型的知识迁移到更轻量级的小模型中,在既保持模型性能的同时降低对边缘设备的计算需求,提升边端模型应用性能,实现快速响应。例如在采矿业,通过将小模型应用到边缘站点终端的安全巡检助手应用,可实现矿井下语音指令识别和安全警告。这将大大助推矿企真正实现少人化、无人化作业,让AI成为提高生产效率和安全性的利器。

大模型应用上线备案支持, 为企业大模型应用顺利上线保驾护航

根据 《生成式人工智能服务管理暂行办法》,企业上线大模型业务应用,需要满足相应的备案、安全评估、内容合规等要求。在这个过程中,企业需要应对包括生成内容合规、数据合法授权、用户数据隐私与保护,用户实名认证管理、版权法律保护等诸多层面的工作挑战。

大模型专业服务提供商可基于自身对模型开发原理、内容生成机制、系统安全保障等领域的丰富经验和专业能力,可帮助企业设计安全评估与渗透测试完善风险预案,组建包括法务、技术和风控角色的内部合规团队,助力企业在完成模型开发后,实现模型应用快速上线,及持续性安全合规监测,真正完成“从布得起”,到“用得好”的全流程业务闭环。

端到端专业服务,为DeepSeek大模型深度应用提供“最后一公里”保障

可以看出,大模型在政企的应用之路并不仅仅是一次安装即可完成的,仍然存在大量的工程化调优和开发等工作,才能真正匹配企业的业务场景。在这个过程中,选择有丰富实施经验和服务工具的厂商合作,可以更有效和快速地解决安装到应用过程中的一系列问题。结合30多个政企细分行业场景和1000+场景模型经验沉淀,华为云Stack提供全链路DeepSeek专业服务体系,涵盖咨询、部署实施、场景开发微调、蒸馏模型开发、大模型开发增量预训练及培训6大类服务场景和30多个服务能力,并将服务能力沉淀到数据、模型、工程三大工程工具里,打通DeepSeek在政企行业应用的最后一公里。


“从“浅尝”到“深爱”,华为云Stack打通政企应用DeepSeek最后一公里” 的相关文章

DeepSeek开放平台使用指南:开启智能服务新纪元

DeepSeek开放平台使用指南:开启智能服务新纪元

DeepSeek开放平台使用指南:开启智能服务新纪元一、引言在数字化转型的大潮中,企业对于高效、智能的解决方案需求日益增长。DeepSeek开放平台作为一款功能强大的人工智能工具,凭借其灵活的API接...

边城一场“孟”,世间山海“连”!与DeepSeek共游云南宝藏小城

边城一场“孟”,世间山海“连”!与DeepSeek共游云南宝藏小城

边陲风情,民族特色……当小编询问当下热门的大语言模型DeepSeek:“云南省普洱市的宝藏小城是哪一座?”DeepSeek推荐了被誉为“边地绿宝石”的孟连。今天,让我们和DeepSeek一同踏入孟连这...

DeepSeek、Manus相继火了,产业政策怎样“抢时间”?

DeepSeek、Manus相继火了,产业政策怎样“抢时间”?

“经济主题记者会,快变成科技主题记者会了。”今年全国两会期间,证监会主席吴清开玩笑说,这两天,谁要是不说说DeepSeek,好像就不太时髦似的。话音未落,又一款国产AI产品Manus横空出世,迅速走红...

郑州大学部署“满血版”DeepSeek!

郑州大学部署“满血版”DeepSeek!

DeepSeek R1作为我国自有团队研制的开源人工智能大模型之一,其能力震惊业界,其应用在全球如火如荼。2月19日,郑州大学国家超级计算中心、计算机与人工智能学院、信息化办公室携手攻坚,成功在超算中...

群邑Choreograph接入DeepSeek,让品牌更快找到对的消费者

群邑Choreograph接入DeepSeek,让品牌更快找到对的消费者

Choreograph已将DeepSeek R1 全面整合到其自主研发的媒体平台标签翻译产品Audience Translator中,以帮助品牌在中国市场更好地找到对的消费者。Audience Tra...

DeepSeek-R1“思维学”;苹果:原生多模态模型的Scaling Laws|今日热门论文

DeepSeek-R1“思维学”;苹果:原生多模态模型的Scaling Laws|今日热门论文

速览热门论文1.DeepSeek-R1“思维学”2.苹果:原生多模态模型的 Scaling Laws3.7B 模型超越 o1!视觉推理新突破:所需样本少,还能自提升4.MIT 团队提出“自我引导”LM...