京東城市(北京)數字科技有限公司張玥獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉京東城市(北京)數字科技有限公司申請的專利基于超參優化的深度強化學習模型的訓練方法、裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN113723615B 。
龍圖騰網通過國家知識產權局官網在2025-06-17發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202011621981.3,技術領域涉及:G06N20/00;該發明授權基于超參優化的深度強化學習模型的訓練方法、裝置是由張玥;尹澤夏;霍雨森;王小波;鄭宇設計研發完成,并于2020-12-31向國家知識產權局提交的專利申請。
本基于超參優化的深度強化學習模型的訓練方法、裝置在說明書摘要公布了:本申請公開了一種基于超參優化的深度強化學習模型的訓練方法、裝置,其中,方法包括:獲取多個初始超參數組合,和多個第一深度強化學習模型;采用初始超參數組合中的多個超參數訓練多個第一深度強化學習模型,以得到與多個第一深度強化學習模型分別對應的訓練評價指標;根據訓練評價指標從多個第一深度強化學習模型之中篩選出第二深度強化學習模型;采用與第二深度強化學習模型對應的多個目標超參數對初始超參數組合進行優化處理,以形成目標超參數組合;得到目標深度強化學習模型。由此,將超參數優化與模型訓練結合起來實現深度強化學習模型的訓練,不僅可訓練出性能更高的深度強化學習模型,而且可使訓練出的模型適應更廣泛的應用場景。
本發明授權基于超參優化的深度強化學習模型的訓練方法、裝置在權利要求書中公布了:1.一種基于超參優化的深度強化學習模型的訓練方法,所述方法用于工業領域的燃燒優化控制,其特征在于,所述方法包括: 獲取多個初始超參數組合,和多個第一深度強化學習模型; 采用所述初始超參數組合中的多個超參數訓練所述多個第一深度強化學習模型,以得到與所述多個第一深度強化學習模型分別對應的訓練評價指標,其中所述多個第一深度強化學習模型的輸入為狀態特征,輸出為動作,所述狀態特征包括鍋爐燃燒過程中傳感器采集的數據,所述動作包括燃燒過程中可以調節的控制變量; 根據所述訓練評價指標從多個第一深度強化學習模型之中篩選出第二深度強化學習模型; 采用與所述第二深度強化學習模型對應的多個目標超參數對所述初始超參數組合進行優化處理,以形成目標超參數組合;以及 采用所述目標超參數組合之中的多個超參數訓練所述第二深度強化學習模型,以得到目標深度強化學習模型; 其中,所述訓練所述多個第一深度強化學習模型,包括: 基于所述初始超參數組合中的每一組超參數分別對第一強化學習模型進行訓練,引入多GPU進行并行訓練以生成模型組合。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人京東城市(北京)數字科技有限公司,其通訊地址為:100086 北京市海淀區知春路76號(寫字樓)1號樓9層1-7-5號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。