欢迎来到中细软旗下技术转移平台

我的成果我的需求在线客服

服务热线:400-700-0065

一种基于逆扩散引导策略的离线强化学习方法

  • 发明专利

    专利类型
  • 未知

    专利状态
  • 2024102028289

    专利号
免费询价 在线咨询
收藏

专利信息

数据仅供参考,具体信息可联系在线顾问

专利号 2024102028289 专利名称 一种基于逆扩散引导策略的离线强化学习方法
专利类型 发明专利 国际分类 G06N 3/092 (2023.01)
申请人 中国矿业大学 申请地址 江苏省徐州市铜山区大学路1号
发明人 申请日期 2024-02-23
下证状态 未知 更新时间 2025-01-10 07:53:41
专利摘要 本发明公开了一种基于逆扩散引导策略的离线强化学习方法,首先,鉴于现有的策略约束方法不能准确地表达行为策略,并且倾向于选择行为策略支持集内概率密度更大的动作,引入扩散模型用于准确表达行为策略;然后,训练逆扩散引导策略引导预训练的扩散模型准确生成行为策略支持集内的动作;最后,给生成动作添加可训练扰动,使学习策略可以逃离行为策略的性能限制。本发明可以灵活地在行为策略支持内选择最优动作,同时避免行为策略密度分布的影响。

交易流程

转让材料

买卖双方需提供 平台提供 转让后买方可获得
企业 个人 专利代理委托书
专利权转让协议
办理文件副本请求书
发明人变更声明
专利证书
手续合格通知书
专利登记簿副本
买方 企业营业执照
企业组织机构代码证
身份证
卖方 企业营业执照
专利证书原件
身份证
专利证书原件

服务保障

优质专利推荐

一种纸质垃圾收集及压缩打包装置

专利状态:已下证

专利类型:发明专利

询价

一种可根据包裹重量进行自动分类的装置

专利状态:已下证

专利类型:发明专利

询价

一种防逃票方法以及装置

专利状态:已下证

专利类型:发明专利

询价

一种波峰焊的自动上板下板装置

专利状态:已下证

专利类型:发明专利

询价
品类齐全,快速响应
专业顾问一对一服务
服务流程追踪更安全

登录成功

您的咨询我们已收到,稍后会有专业顾问与您联系。