語聯網(武漢)信息技術有限公司張文博獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉語聯網(武漢)信息技術有限公司申請的專利一種面向html標簽翻譯的機器翻譯后處理方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115455995B 。
龍圖騰網通過國家知識產權局官網在2025-09-12發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211197757.5,技術領域涉及:G06F40/58;該發明授權一種面向html標簽翻譯的機器翻譯后處理方法是由張文博設計研發完成,并于2022-09-29向國家知識產權局提交的專利申請。
本一種面向html標簽翻譯的機器翻譯后處理方法在說明書摘要公布了:本發明公開了一種面向html標簽翻譯的機器翻譯后處理方法,包括有標簽源語言句子、無標簽源語言句子、機器翻譯模型、html后處理模型、有標簽譯文。本發明的有益效果是:該方法分成機器翻譯階段和標簽翻譯階段,實現了文本內容翻譯和html標簽翻譯之間的解耦,因此幾乎不會影響機器翻譯的質量。因為機器翻譯模型和后處理模型是無關的,所以該后處理模型可以搭配任何其他的商業機器翻譯引擎使用,提高了靈活性。除此之外,后處理模型還能起到標記原文本和目標文本的內容,從而還可以用于術語替換等其他用途。
本發明授權一種面向html標簽翻譯的機器翻譯后處理方法在權利要求書中公布了:1.一種面向html標簽翻譯的機器翻譯后處理方法,其特征在于,所述機器翻譯后處理方法包括以下步驟: 1)提取帶標簽的源語言句子中的文本內容,對于輸入的帶標簽的源語言句子,記為Stag;并使用正則表達式識別Stag中所有的標簽,同時刪除所有的標簽得到無標簽的源語言句子Sno_tag; 2)使用機器翻譯模型翻譯所述源語言句子的文本內容得到機器翻譯譯文; 3)將帶標簽的所述源語言句子以及所述機器翻譯譯文作為html后處理模型的輸入,得到帶有標簽的機器翻譯譯文; 所述步驟3)中包括: a)訓練html后處理模型; b)將有標簽源語言句子Stag和無標簽譯文Tno_tag拼接作為輸入; c)利用訓練好的后處理模型PE得到有標簽譯文Ttag。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人語聯網(武漢)信息技術有限公司,其通訊地址為:430000 湖北省武漢市武漢東湖新技術開發區高新大道999號未來科技城B2棟;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。