數據堂(北京)科技股份有限公司齊紅威獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉數據堂(北京)科技股份有限公司申請的專利多模態大模型數據清洗治理方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120336725B 。
龍圖騰網通過國家知識產權局官網在2025-09-02發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510820032.4,技術領域涉及:G06F18/10;該發明授權多模態大模型數據清洗治理方法及系統是由齊紅威;何鴻凌;豐強澤;王大亮;高禹;鄭繼龍設計研發完成,并于2025-06-19向國家知識產權局提交的專利申請。
本多模態大模型數據清洗治理方法及系統在說明書摘要公布了:本申請涉及數據清洗技術領域,其具體地公開了一種多模態大模型數據清洗治理方法及系統,其對原始多模態數據集進行基礎的格式過濾后,通過單模態質量評估機制量化評估多模態數據集中的圖像清晰度和文本流暢性,以篩選出質量合格的圖像和文本數據樣本。接著,進一步引入語義級對齊評估機制,對數據集中每一組對應的圖像樣本和圖像文本描述進行語義級交互響應分析,以量化評估圖像樣本與文本描述之間的語義對齊程度,篩選出高度語義對齊的圖像?文本數據對。該方法通過對多模態數據集進行多層次的清洗治理,能夠確保多模態訓練樣本質量達標,并且在跨模態語義層面實現高度對齊,從而提升多模態大模型在跨模態理解與生成任務中的準確性和魯棒性。
本發明授權多模態大模型數據清洗治理方法及系統在權利要求書中公布了:1.一種多模態大模型數據清洗治理方法,其特征在于,包括: 獲取原始多模態數據集; 對所述原始多模態數據集進行初始數據清洗后從中提取待精選多模態數據樣本,所述待精選多模態數據樣本包括待精選圖像數據和與所述待精選圖像數據對應的待精選文本描述; 對所述待精選圖像數據進行視覺特征提取以得到待精選圖像視覺特征編碼向量; 對所述待精選文本描述進行語義特征提取以得到待精選文本描述語義特征編碼向量; 對所述待精選圖像視覺特征編碼向量和所述待精選文本描述語義特征編碼向量進行語義級細粒度對齊編碼以得到待精選圖像-文本語義級細粒度交互響應編碼向量; 基于所述待精選圖像-文本語義級細粒度交互響應編碼向量,確定是否過濾所述待精選多模態數據樣本; 對所述待精選圖像視覺特征編碼向量和所述待精選文本描述語義特征編碼向量進行語義級細粒度對齊編碼以得到待精選圖像-文本語義級細粒度交互響應編碼向量,包括: 對所述待精選圖像視覺特征編碼向量和所述待精選文本描述語義特征編碼向量進行基于特征值大小的有序化排列以得到待精選圖像視覺特征有序化排列編碼向量和待精選文本描述語義特征有序化排列編碼向量; 對所述待精選圖像視覺特征有序化排列編碼向量和所述待精選文本描述語義特征有序化排列編碼向量進行等粒度特征切分以得到待精選圖像局部視覺特征有序編碼向量的序列和待精選文本描述局部語義特征有序編碼向量的序列; 將所述待精選圖像局部視覺特征有序編碼向量的序列和所述待精選文本描述局部語義特征有序編碼向量的序列中每組對應的待精選圖像局部視覺特征有序編碼向量和待精選文本描述局部語義特征有序編碼向量輸入語義級轉移交互響應推理單元以得到待精選圖像-文本描述局部語義交互響應編碼矩陣的序列; 對所述待精選圖像-文本描述局部語義交互響應編碼矩陣的序列進行語義傳遞編碼以得到所述待精選圖像-文本語義級細粒度交互響應編碼向量。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人數據堂(北京)科技股份有限公司,其通訊地址為:100080 北京市海淀區寶盛南路1號院11號樓1層101-01;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。