廈門理工學院吳志銘獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉廈門理工學院申請的專利一種融合圖像、文本與BIM模態的施工場景預測方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120411789B 。
龍圖騰網通過國家知識產權局官網在2025-09-23發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510846123.5,技術領域涉及:G06V20/10;該發明授權一種融合圖像、文本與BIM模態的施工場景預測方法及裝置是由吳志銘;肖稱;項建新;方靜雯;林昊;李欣偉;方天客;楊榮華;李秀芳;連宇新;康潤池設計研發完成,并于2025-06-24向國家知識產權局提交的專利申請。
本一種融合圖像、文本與BIM模態的施工場景預測方法及裝置在說明書摘要公布了:本發明提供的一種融合圖像、文本與BIM模態的施工場景預測方法及裝置,涉及智慧施工預測管理技術領域。本發明通過提取BIM模型的BIM語義信息構建BIM語義圖,結合YOLO模型進行施工現場視頻的目標檢測識別,得到目標檢測結果;并與CLIP跨模態對齊實現圖像、文本與BIM的多模態數據深度融合,得到多模態異構圖;將多模態異構圖輸入時空序列模型進行預測,輸出未來若干時刻施工場景的預測結果,并動態映射至數字孿生平臺,實現風險預警與可視化展示。本申請能夠實時捕捉施工動態變化,精準預測施工進度與風險,提升施工管理智能化水平。
本發明授權一種融合圖像、文本與BIM模態的施工場景預測方法及裝置在權利要求書中公布了:1.一種融合圖像、文本與BIM模態的施工場景預測方法,其特征在于,包括: S1,基于BIM平臺構建施工場景項目的三維建筑模型,并提取三維建筑模型中每個構件的構件信息,建立以每個構件為節點、構件間的邏輯關系為邊的BIM語義圖; S2,實時采集施工現場視頻與施工相關文本資料,利用YOLO模型對所述施工現場視頻進行目標檢測識別,得到目標檢測結果; S3,將所述目標檢測結果與施工相關文本資料分別輸入CLIP模型提取出圖像語義向量與文本語義向量,并通過圖神經網絡對所述BIM語義圖進行編碼,得到BIM嵌入; S4,將所述BIM嵌入映射至與CLIP模型的語義空間一致的表示空間,進行所述BIM嵌入、所述圖像語義向量與所述文本語義向量的對齊與融合,得到多模態異構圖;其中,所述圖像語義向量為高維嵌入形式表達的圖像中各目標對象的語義特征;將所述BIM嵌入投影映射至CLIP模型的d維語義空間,表達式為: ; 其中,為圖神經網絡GNN編碼后的構件節點,即所述BIM嵌入的構件節點表示;表示投影后的表示;為線性映射矩陣;表示維實數; 計算圖像目標與所述BIM嵌入之間的語義相似度,其表達式為: 其中,為所述圖像語義向量;‖·‖為向量的歐氏范數; 計算所述文本語義向量與所述BIM嵌入之間的語義相似度,其表達式為: ; 其中,為所述文本語義向量;為節點的鄰居節點; 計算所述圖像語義向量與所述文本語義向量之間的語義相似度,其表達式為: ; 其中,為L2范數; 根據、、以及所述文本語義向量、所述圖像語義向量以及所述BIM嵌入,構建得到動態的多模態異構圖; S5,將所述多模態異構圖輸入時空序列模型進行預測,輸出未來若干時刻施工場景的預測結果; S6,根據所述預測結果,生成預測時刻的施工場景信息,并通過數字孿生映射進行可視化更新。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人廈門理工學院,其通訊地址為:361024 福建省廈門市集美區理工路600號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。