当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗

1年前 (2025-04-02)Deepseek最新资讯720

国家知识产权局官网显示,4月1日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利公布。

摘要显示,本发明涉及数据采集领域,尤其涉及一种广度数据采集的方法及其系统,包括:建立网页元信息库;确定每日调度单元下载配额及当日下载总额度;从网页元信息库中选取相应数量的链接,分配下载额度;下载过程控制;下载文本进行后处理及数据清洗后进入回灌队列,通过信息回灌实现网页元信息库更新。本发明的有益效果在于:发现尽可能多的网页链接,并减少对网站的流量冲击;对已经下载的内容进行分析,对未下载的连接进行质量推断,通过择优下载分配额度的方式,减少低质量网页下载和重复下载,提高数据质量及下载效率,减少在数据采集过程中网络资源的消耗;采用单独的信息回灌队列,保证网页元信息库修改操作的原子性和稳定性。


“DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗” 的相关文章

DeepSeek大模型赋能“有诉必应马上办”

DeepSeek大模型赋能“有诉必应马上办”

本报讯(记者 张弘靓)记者从西宁市数据局(市政务服务监管局)获悉,为进一步贯彻习近平总书记考察青海时提出的“切实保障和改善民生,尽力而为、量力而行,多办顺民意、惠民生、暖民心的实事,扎实解决群众急难愁...

快手旗下快影接入DeepSeek-R1满血版

快手旗下快影接入DeepSeek-R1满血版

快手旗下剪辑软件快影正式接入DeepSeek-R1满血版,成为行业首批接入DeepSeek能力的剪辑工具。快影将融合DeepSeek-R1模型技术,并加持可灵AI视频生成能力,集成文案成片、小说漫、A...

DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?

DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?

DeepSeek低调升级,引发科技圈热议。5月28日,DeepSeek 在官方微信群发布消息称,DeepSeek R1模型已完成“小版本试升级”,欢迎前往官方网页、APP、小程序测试(打开深度思考),...

大厂接入DeepSeek,自己的大模型怎么办?

大厂接入DeepSeek,自己的大模型怎么办?

现在还要没有接入DeepSeek的科技大厂吗?盘点下来,好像还真没有了。从国外的英伟达、亚马逊、微软等头部大厂,到国内的BAT、华为和字节跳动,DeepSeek出圈后不就,但凡叫得上名的科技大厂都做出...

安徽率先完成DeepSeek满血版本地化部署全省试用推广

安徽率先完成DeepSeek满血版本地化部署全省试用推广

人民财讯3月11日电,据安徽日报,记者3月10日从安徽省数据资源管理局获悉,安徽省率先在全国省级层面完成DeepSeek满血版(671B)本地化部署,推出无差别综窗、公文写作、语音转文字等16个典型应...

九识无人车领衔DeepSeek推荐榜,天猫养车战略合作再升级

九识无人车领衔DeepSeek推荐榜,天猫养车战略合作再升级

在数据驱动决策成为主流的当下,智能评估系统正日益成为企业和消费者获取客观参考的重要依据。以智能城配行业为例,当用户试图了解行业格局时,算法驱动的数据洞察正取代传统的主观经验判断。据悉,用户在DeepS...