廈門大學紀榮嶸獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廈門大學申請的專利一種詳細三維指向性目標分割方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120388032B 。
龍圖騰網通過國家知識產權局官網在2025-08-29發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510880991.5,技術領域涉及:G06T7/11;該發明授權一種詳細三維指向性目標分割方法是由紀榮嶸;紀家沂;陳琦;吳昌鱺;馬祎煒;孫曉帥設計研發完成,并于2025-06-27向國家知識產權局提交的專利申請。
本一種詳細三維指向性目標分割方法在說明書摘要公布了:本發明公開了一種詳細三維指向性目標分割方法,包括以下步驟:S1、定義任務形式以及定義任務的評價指標;S2、結合人工和大模型對ScanRefer數據集進行修改和增強,以生成DetailRefer數據集;S3、構建DetailBase基線模型,通過DetailBase基線模型對句子級別或短語級別的語言進行分割;該方法通過定義任務形式、生成DetailRefer數據集以及構建DetailBase基線模型,可增強在3D視覺和語言任務中理解和定位文本上下文的能力。
本發明授權一種詳細三維指向性目標分割方法在權利要求書中公布了:1.一種詳細三維指向性目標分割方法,其特征在于,包括以下步驟: S1、定義任務形式以及定義任務的評價指標; 步驟S1中,定義任務形式用于從點云場景中分割出與句子中給定的每個目標短語相對應的掩碼,具體過程為: S11、給定點云場景,其中,為點的數量,為特征長度;所述特征長度包括坐標XYZ、顏色RGB和法向量; S12、給定一個文本描述,其中,是文本中的單詞數量; S13、給定一組索引,其中,為文本中個待分割目標短語的索引位置;索引對應于文本中需要進行分割的個名詞的位置,模型為所有名詞輸出點云場景掩碼,用于理解自然語言描述并在三維空間中標記出對應的物體或區域; S2、結合人工和大模型對ScanRefer數據集進行修改和增強,以生成DetailRefer數據集; S3、構建DetailBase基線模型,通過DetailBase基線模型對句子級別或短語級別的語言進行分割; 步驟S3中,DetailBase基線模型的具體處理過程為: S31、輸入點云場景、文本描述以及需要分割的名詞的索引,通過將點云輸入到3DU-Net網絡中,以獲得點級別的特征;其中,點云僅使用坐標XYZ和顏色RGB作為每個點的初始特征; S32、采用超點池化對點級別的特征進行簡化,對點云場景進行無監督的過分割,生成個超點,其中,; S33、對屬于同一超點的所有點的特征進行平均處理,再通過兩次獨立的線性變換,將池化的特征轉換為用于多模態信息融合的視覺特征和用于預測掩碼的超點特征,其中,表示特征維度; S34、對于給定的文本描述,在開頭和結尾分別添加特殊單詞后將其輸入到MPNet網絡以獲取單詞特征,使用單詞特征經過多層感知機生成初始查詢; S35、將初始查詢輸入到解碼器中,在解碼器中使用交叉注意力整合來自視覺模態的信息,再使用自注意力聚焦句子內部的信息,并通過前饋神經網絡進行非線性變換; S36、計算最后一層輸出的查詢與超點特征之間的親和度,并將親和度二值化以獲得與查詢對應的超點掩碼,再將超點掩碼廣播以獲得點級別的掩碼;對于句子級別的分割,使用與[CLS]標記對應的掩碼作為分割結果;對于短語級別的分割,使用索引中提供的位置對應的查詢生成的掩碼作為分割結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廈門大學,其通訊地址為:361000 福建省廈門市思明南路422號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。