阿里巴巴集團控股有限公司郭立帆獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉阿里巴巴集團控股有限公司申請的專利一種字段注釋生成、字符串理解方法、設備及存儲介質獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN113688613B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202010425675.6,技術領域涉及:G06F40/169;該發明授權一種字段注釋生成、字符串理解方法、設備及存儲介質是由郭立帆;徐閬平設計研發完成,并于2020-05-19向國家知識產權局提交的專利申請。
本一種字段注釋生成、字符串理解方法、設備及存儲介質在說明書摘要公布了:本申請實施例提供一種字段注釋生成、字符串理解方法、設備及存儲介質。在本申請實施例中,對于缺失字段注釋的字段名,可對字段名進行拼音分詞,以獲得字段名對應的拼音序列;通過對拼音序列的理解,可生成拼音序列對應的中文序列,進而根據中文序列生成字段名對應的字段注釋。據此,本申請實施例中,字段注釋的補充工作不再依賴于人工方式,這可有效提高字段注釋的生成效率,而且,通過對字段名的合理分詞及準確理解,可保證字段注釋的準確性。
本發明授權一種字段注釋生成、字符串理解方法、設備及存儲介質在權利要求書中公布了:1.一種字段注釋生成方法,其特征在于,包括: 獲取待處理的字段名; 將所述字段名輸入拼音分詞模型; 在所述拼音分詞模型中,識別所述字段名中符合拼音全拼特征的至少一串連續字符以及不符合所述拼音全拼特征的至少一個單字符,分別作為字符組,以生成所述字段名對應的拼音序列,所述拼音序列中包含至少一個字符組,所述字符組中包含拼音全拼或拼音簡寫;所述識別所述字段名中符合拼音全拼特征的至少一串連續字符以及不符合所述拼音全拼特征的至少一個單字符,包括:針對所述字段名中的每個字符,根據所述字符的上下文及所述字符本身,確定所述字符符合拼音全拼下各拼寫位置的狀態特征的概率;若所述字符符合拼音全拼下任意拼寫位置的狀態特征的概率滿足預設條件,確定所述字符符合所述拼音全拼特征;若所述字符符合拼音全拼下各拼寫位置的狀態特征的概率均不滿足所述預設條件,確定所述字符為不符合所述拼音全拼特征的單字符;所述拼音全拼特征包括用于對所述拼音分詞模型進行訓練的拼音全拼下各拼寫位置的狀態特征; 基于拼音全拼和或拼音簡寫與中文之間的映射關系,確定所述拼音序列對應的中文序列; 根據所述中文序列,生成所述字段名對應的字段注釋。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人阿里巴巴集團控股有限公司,其通訊地址為:英屬開曼群島大開曼資本大廈一座四層847號郵箱;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。