藍卓數字科技有限公司褚健獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉藍卓數字科技有限公司申請的專利基于多模態大模型的UI效果圖識別方法、系統及介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119206376B 。
龍圖騰網通過國家知識產權局官網在2025-09-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411687205.1,技術領域涉及:G06V10/764;該發明授權基于多模態大模型的UI效果圖識別方法、系統及介質是由褚健;陳英杰;劉賢康;李佳鶴設計研發完成,并于2024-11-25向國家知識產權局提交的專利申請。
本基于多模態大模型的UI效果圖識別方法、系統及介質在說明書摘要公布了:本申請公開了基于多模態大模型的UI效果圖識別方法、系統及介質,方法包括如下步驟:基于圖像編碼、多模態投影以及文本編碼構建多模態預訓練模型;根據歷史圖像數據以及多模態預訓練模型執行微調訓練,獲取多模態大模型;基于內置組件數據結構構建向量數據庫;獲取待識別UI效果圖,基于多模態大模型以及待識別UI效果圖輸出第一識別數據;利用檢索算法針對第一識別數據搜尋向量數據庫,輸出對應待識別UI效果圖的生成信息。本申請的有益效果:確保UI效果圖生成一致性以及高效性。
本發明授權基于多模態大模型的UI效果圖識別方法、系統及介質在權利要求書中公布了:1.基于多模態大模型的UI效果圖識別方法,其特征在于:包括如下步驟: 基于圖像編碼、多模態投影以及文本編碼構建多模態預訓練模型; 根據歷史圖像數據以及多模態預訓練模型執行微調訓練,獲取多模態大模型; 基于內置組件數據結構構建向量數據庫; 獲取待識別UI效果圖,基于多模態大模型以及待識別UI效果圖輸出第一識別數據; 利用檢索算法針對第一識別數據搜尋向量數據庫,輸出對應待識別UI效果圖的生成信息; 所述根據歷史圖像數據以及多模態預訓練模型執行微調訓練還包括: 獲取歷史圖像數據,識別歷史圖像數據的關鍵特征; 若關鍵特征為基本視覺特征,則以圖像編碼的初始卷積層作為微調層次; 若關鍵特征為復雜結構特征,則以圖像編碼的中間卷積層作為微調層次; 若關鍵特征為全局語義特征,則以圖像編碼的頂層卷積層或全連接層作為微調層次; 當以圖像編碼的中間卷積層作為微調層次時: 利用LoRA根據微調層次調整多模態預訓練模型的權重矩陣; 對歷史圖像數據進行圖像編碼和文本編碼,獲取視覺特征與語言特征; 基于交叉注意力模塊映射視覺特征與語言特征,計算注意力權重; 基于注意力權重以及門控融合機制獲得融合視覺特征; 基于損失函數以及融合視覺特征更新微調參數,執行微調訓練; 當以圖像編碼的頂層卷積層或全連接層作為微調層次時: 利用前綴調優技術更新文本編碼的前綴向量參數,執行微調訓練。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人藍卓數字科技有限公司,其通訊地址為:315012 浙江省寧波市海曙區甬水橋科創中心1號A區6-3,D區6-2;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。