浙江大學醫學院附屬邵逸夫醫院;浙江大學劉華鋒獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浙江大學醫學院附屬邵逸夫醫院;浙江大學申請的專利基于千問大模型指導主干網絡進行圖像分割的方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120318522B 。
龍圖騰網通過國家知識產權局官網在2025-09-26發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510795227.8,技術領域涉及:G06V10/26;該發明授權基于千問大模型指導主干網絡進行圖像分割的方法是由劉華鋒;林佳駿;胡紅杰設計研發完成,并于2025-06-15向國家知識產權局提交的專利申請。
本基于千問大模型指導主干網絡進行圖像分割的方法在說明書摘要公布了:本發明公開了基于千問大模型指導主干網絡進行圖像分割的方法,包括:將訓練集中的文檔圖片輸入到UNet主干分割網絡中,得到特征圖;將文檔圖片和人工設計的提示輸入千問2多模態大模型中,獲得其隱藏層的特征信息;將特征信息放入可變形代理注意力機制中進行融合,得到語義與視覺特征互相融合的更加完整的信息;將可學習的查詢向量和融合信息放入解碼器層中等步驟,本發明加快模型的收斂速度,使模型訓練更加穩定。不僅可以減少計算開銷,降低顯存使用,同時還能加強代理量獲取的靈活性,讓模型更加自適應地學習到合理、有用的知識,得到更加靈活的注意力,有效地通過千問的指導,提高了主干分割網絡的性能,對文檔圖片進行了較為清晰地分割。
本發明授權基于千問大模型指導主干網絡進行圖像分割的方法在權利要求書中公布了:1.一種基于千問大模型指導主干網絡進行圖像分割的方法,其特征在于,包括: 1)構建整體模型,所述的整體模型包括千問2多模態大模型、UNet主干分割網絡、融合模塊、解碼模塊; 所述的千問2多模態大模型用于獲取文檔圖片和提示,輸出視覺特征信息和語義特征信息發送給融合模塊; 所述的UNet主干分割網絡用于獲取文檔圖片,產生粗粒度特征圖,用于最后的預測; 所述的融合模塊用于接收千問2多模態大模型輸出的視覺特征信息和語義特征信息,輸出高級融合特征發送給解碼模塊; 所述的解碼模塊用于接收可學習查詢向量和高級融合特征,輸出學習后的查詢向量,再將學習后的查詢向量與粗粒度特征圖產生預測掩膜; 2)獲取訓練集中的文檔圖片,通過UNet主干分割網絡得到特征圖,同時獲取文檔圖片和提示,通過千問2多模態大模型獲得其隱藏層的特征信息,所述的特征信息包括視覺特征信息和語義特征信息; 3)所述的隱藏層的特征信息通過可變形代理注意力機制進行融合,得到語義特征信息與視覺特征信息互相融合的更加完整的高級融合特征; 4)所述的可學習的查詢向量和步驟3)得到的更加完整的高級融合特征通過整體模型的解碼模塊,可學習的查詢向量學習高級融合特征中的知識,得到學習后的查詢向量; 5)將學習后的查詢向量與步驟2)中UNet主干分割網絡輸出的特征圖相乘,得到最終的預測掩膜; 所述的步驟3)中的高級融合特征,是以視覺特征信息為查詢向量,語義特征信息作為鍵值向量,輸入到可變形代理注意力機制中進行交互得到的值,且融合過程中有多層可變形代理注意力機制,即融合部分使用了多層堆疊的結構,視覺特征信息被語義特征信息多次交互,最終得到高級融合特征,所述的高級融合特征的尺寸與視覺特征信息的尺寸相同。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江大學醫學院附屬邵逸夫醫院;浙江大學,其通訊地址為:310016 浙江省杭州市上城區慶春東路3號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。