內蒙古工業大學郭洪飛獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉內蒙古工業大學申請的專利基于PPO算法的選擇性拆卸優化方法、設備和介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119005499B 。
龍圖騰網通過國家知識產權局官網在2025-09-05發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411021248.6,技術領域涉及:G06Q10/063;該發明授權基于PPO算法的選擇性拆卸優化方法、設備和介質是由郭洪飛;傅文杰;任亞平;何智慧;張銳;朝寶設計研發完成,并于2024-07-28向國家知識產權局提交的專利申請。
本基于PPO算法的選擇性拆卸優化方法、設備和介質在說明書摘要公布了:本發明提出了基于PPO算法的選擇性拆卸優化方法,方法包括:根據需要拆卸的報廢EOL產品構建拆卸廢舊產品的DPN模型;根據DPN模型構建基于強化學習的選擇性拆卸模型,并使用PPO算法對選擇性拆卸模型進行訓練;將實時需要拆卸的EOL產品輸入訓練后的選擇性拆卸模型,得到最優的拆卸動作合集。本發明基于PPO算法的選擇性拆卸優化方法不僅提高了拆卸過程的效率和效果,而且在面對復雜動態的拆卸任務時展現了更強的適應性和穩定性。此外,結合其他先進的強化學習算法并探索更優的建模方案,有望進一步提升選擇性拆卸規劃方法的性能和實用性,為可持續制造和資源回收提供有力的技術支持。
本發明授權基于PPO算法的選擇性拆卸優化方法、設備和介質在權利要求書中公布了:1.基于PPO算法的選擇性拆卸優化方法,其特征在于,所述方法包括: 步驟1:根據需要拆卸的EOL產品構建拆卸廢舊產品的DPN模型; 步驟2:根據DPN模型構建基于強化學習的選擇性拆卸模型,并使用PPO算法對選擇性拆卸模型進行訓練; 步驟3:將實時需要拆卸的EOL產品輸入訓練后的選擇性拆卸模型,得到最優的拆卸動作合集; 所述基于強化學習的選擇性拆卸模型的獎勵函數包括:拆卸過程的環境污染指標、拆卸過程的回收再利用價值指標和拆卸過程的回收再利用價值指標; 所述步驟2具體包括: 設DPN模型中有個庫所和個變遷,狀態s用元向量表示,其元素的取值為0或1,分別表示對應庫所有或沒有令牌的狀態; 活動用整數a表示,a的取值范圍是1≤a≤,表示對應變遷的序號; 在狀態s下所有可選擇的活動的集合用As表示,As是根據DPN模型判斷的;其中,用維向量表示在狀態s下變遷能否被激活,其元素的取值取值為1或0,分別表示對應的變遷能否被激活,其中,x和As的計算公式如下: ; ; 構建選擇性拆卸模型的獎勵函數,表示如下: ; 其中,、和表示各指標的權重,表示拆卸操作拆除的被選擇零件的環境污染指數之和,表示拆卸操作拆除的被選擇零件的可回收再利用質量之和,表示指拆卸操作拆除的被選擇零件的可回收再利用價值之和; 所述拆卸過程的環境污染指數: 以最少的拆卸操作拆卸出被選擇的零件,并使得拆卸過程的環境污染指標最大,表示如下: ; 其中,表示拆卸操作拆除的被選擇零件的環境污染指數之和,計算公式如下: ; 其中,表示被選擇性拆卸出的零件集合,表示在拆卸過程中除選擇性拆卸之外拆卸出的零件的集合,表示零件c的環境污染指數級別,N表示零部件的個數; 所述拆卸過程的可回收再利用質量指標: 以最少的拆卸操作拆卸出被選擇的零件,并使得拆卸過程的可回收再利用質量指標最大,表示如下: ; 其中,表示拆卸操作拆除的被選擇零件的可回收再利用質量之和,計算公式如下: ; 其中,valc表示零件c的可回收再利用的質量; 所述拆卸過程的可回收再利用價值指標: 以最少的拆卸操作拆卸出被選擇的零件,并使得拆卸過程的可回收再利用價值指標最大,表示如下: ; 其中,表示拆卸操作拆除的被選擇零件的可回收再利用價值之和,計算公式如下: ; 其中,weic表示零件c的可回收再利用價值。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人內蒙古工業大學,其通訊地址為:010000 內蒙古自治區呼和浩特市新城區愛民路(北)49號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。