发明专利
专利类型未知
专利状态2024101068236
专利号专利号 | 2024101068236 | 专利名称 | 一种基于安全互模拟度量的视觉强化学习方法 |
---|---|---|---|
专利类型 | 发明专利 | 国际分类 | G06N 3/092 (2023.01) |
申请人 | 中国矿业大学 | 申请地址 | 江苏省徐州市铜山区大学路1号中国矿业大学 |
发明人 | 申请日期 | 2024-01-25 | |
下证状态 | 未知 | 更新时间 | 2025-01-10 07:53:36 |
专利摘要 | 本发明公开了一种基于安全互模拟度量的视觉强化学习方法,首先,建立序列条件变分推断模型、安全互模拟度量模型与安全强化学习模型,并初始化模型参数;对于每个环境步,收集经验样本,构建拉格朗日损失函数,并更新拉格朗日乘子;对于每个梯度步,从经验回放池中采样数据序列,构建序列条件变分推断模型损失函数与安全互模拟度量模型损失函数并更新模型参数,构建安全强化学习模型并更新模型参数;最后,重复上述步骤直到获得最优模型参数。本发明能够学习到紧凑且富含信息的视觉状态表征,同时满足预设的安全约束要求。 |
买卖双方需提供 | 平台提供 | 转让后买方可获得 | ||
---|---|---|---|---|
企业 | 个人 | 专利代理委托书 专利权转让协议 办理文件副本请求书 发明人变更声明 | 专利证书 手续合格通知书 专利登记簿副本 | |
买方 | 企业营业执照 企业组织机构代码证 | 身份证 | ||
卖方 | 企业营业执照 专利证书原件 | 身份证 专利证书原件 |
专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价专利状态:已下证
专利类型:发明专利
询价您的咨询我们已收到,稍后会有专业顾问与您联系。