浙江大學李瑩獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浙江大學申請的專利一種基于深度哈希的代碼遷移方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116541072B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202310527262.2,技術領域涉及:G06F8/76;該發明授權一種基于深度哈希的代碼遷移方法是由李瑩;張心怡;鄧水光;尹建偉設計研發完成,并于2023-05-11向國家知識產權局提交的專利申請。
本一種基于深度哈希的代碼遷移方法在說明書摘要公布了:本發明公開了一種基于深度哈希的代碼遷移方法,包括以下步驟:1選擇開源數據集,提取所有代碼特征,向量化表示代碼特征;2利用k?means算法,將代碼特征進行聚類;3構建基于深度哈希的代碼遷移網絡模型;4利用聚類分組后代碼對的代碼特征向量對代碼遷移網絡模型進行訓練,使深度哈希模塊學習到的哈希編碼相似矩陣與聯合代碼相似矩陣對齊;通過訓練好的模型對開源的代碼數據集的代碼進行哈希表示,構建代碼哈希數據庫;5對于待遷移的代碼,提取代碼特征向量輸入訓練好的模型,通過深度哈希模塊得到對應的二進制哈希編碼,并從代碼哈希數據庫檢索到相匹配的遷移后的代碼。利用本發明,可以極大提高代碼遷移的精度和速度。
本發明授權一種基于深度哈希的代碼遷移方法在權利要求書中公布了:1.一種基于深度哈希的代碼遷移方法,其特征在于,包括以下步驟: 1選擇開源數據集,提取數據集中所有代碼特征,包含文本特征和結構特征;進一步向量化表示代碼特征,得到代碼特征向量; 2利用k-means算法,將代碼特征進行聚類,得到多個聚類分組; 3構建基于深度哈希的代碼遷移網絡模型,所述的代碼遷移網絡模型包含向量表示代碼特征分布模塊和深度哈希模塊; 其中,向量表示代碼特征分布模塊用于將代碼特征向量歸一化,計算代碼對之間的代碼相似矩陣,通過代碼相似矩陣中的向量表示代碼對的特征分布;并進一步通過聯合代碼相似矩陣來整合代碼相似矩陣的信息,全面表示在整個代碼空間中的分布; 通過相加整合代碼相似矩陣構造聯合代碼相似矩陣S,公式為: 其中,β為權重參數,SCo和SCn是將代碼對的代碼特征向量VCo、VCn歸一化的結果,然后計算得到代碼相似矩陣其中SCo=VCo TVCo、SCn=VCn TVCn,最后得到聯合代碼相似矩陣S; 深度哈希模塊用于將代碼特征向量轉化為二進制哈希編碼向量,并在歸一化后計算得到代碼對之間的哈希編碼相似矩陣;深度哈希模塊中,采用改進的詞袋模型NBOW,采用三個具體tanh·激活函數的全連通FC層來代替原始詞袋模型BOW中的輸出層,讓輸出控制在-1,1區間內,從而將原始的代碼特征向量轉化為二進制哈希編碼; 4利用聚類分組后代碼對的代碼特征向量對代碼遷移網絡模型進行訓練,使深度哈希模塊學習到的哈希編碼相似矩陣與聯合代碼相似矩陣對齊,從而保留代碼對之間在哈希空間和原來的代碼空間的相似信息;然后通過訓練好的模型對開源的數據集的代碼進行哈希表示,構建代碼哈希數據庫; 具體的,采用了雙編碼器架構,利用獨立的編碼器,分別將代碼對編碼到表示向量和對應的二進制哈希編碼中;引入新的三元組度量損失,保證學習到的二進制哈希編碼保留代碼對之間在哈希空間和原來的代碼空間的相似信息;三元組度量損失函數為: 式中,θ是超參數,λ1、λ2是權重參數,BCo、BCn是代碼對的代碼特征向量VCo、VCn經過二進制編碼得到的二進制哈希編碼向量;利用余弦相似度,計算BCo、BCn之間的差距,從而縮小哈希編碼對和聯合代碼對之間的距離; 5對于待遷移的代碼,提取代碼特征向量,輸入訓練好的模型,通過深度哈希模塊得到對應的二進制哈希編碼,并從代碼哈希數據庫檢索到相匹配的遷移后的代碼。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江大學,其通訊地址為:310058 浙江省杭州市西湖區余杭塘路866號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。