发明专利
专利类型未知
专利状态2024102028289
专利号专利号 | 2024102028289 | 专利名称 | 一种基于逆扩散引导策略的离线强化学习方法 |
---|---|---|---|
专利类型 | 发明专利 | 国际分类 | G06N 3/092 (2023.01) |
申请人 | 中国矿业大学 | 申请地址 | 江苏省徐州市铜山区大学路1号 |
发明人 | 申请日期 | 2024-02-23 | |
下证状态 | 未知 | 更新时间 | 2025-01-10 07:53:41 |
专利摘要 | 本发明公开了一种基于逆扩散引导策略的离线强化学习方法,首先,鉴于现有的策略约束方法不能准确地表达行为策略,并且倾向于选择行为策略支持集内概率密度更大的动作,引入扩散模型用于准确表达行为策略;然后,训练逆扩散引导策略引导预训练的扩散模型准确生成行为策略支持集内的动作;最后,给生成动作添加可训练扰动,使学习策略可以逃离行为策略的性能限制。本发明可以灵活地在行为策略支持内选择最优动作,同时避免行为策略密度分布的影响。 |
买卖双方需提供 | 平台提供 | 转让后买方可获得 | ||
---|---|---|---|---|
企业 | 个人 | 专利代理委托书 专利权转让协议 办理文件副本请求书 发明人变更声明 | 专利证书 手续合格通知书 专利登记簿副本 | |
买方 | 企业营业执照 企业组织机构代码证 | 身份证 | ||
卖方 | 企业营业执照 专利证书原件 | 身份证 专利证书原件 |
专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价您的咨询我们已收到,稍后会有专业顾问与您联系。