上海大學武星獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉上海大學申請的專利一種基于自適應編碼的蛋白存儲文件管理系統及方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN116841956B 。
龍圖騰網通過國家知識產權局官網在2025-09-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211499963.1,技術領域涉及:G06F16/11;該發明授權一種基于自適應編碼的蛋白存儲文件管理系統及方法是由武星;胡宏崗;董昕;蘇笠;胡明濤設計研發完成,并于2022-11-28向國家知識產權局提交的專利申請。
本一種基于自適應編碼的蛋白存儲文件管理系統及方法在說明書摘要公布了:本發明揭示了一種基于自適應編碼的蛋白存儲文件管理系統及方法,包括編碼記錄數據庫、解碼記錄數據庫,信息編碼模塊、信息檢索模塊、信息解碼模塊和結果輸出模塊;信息編碼模塊用于將文件編碼為氨基酸序列;信息檢索模塊用于查詢編碼記錄和解碼記錄,根據編碼記錄得到編碼文件地址用于后續的解碼操作;信息解碼模塊用于將氨基酸序列解碼為源文件;結果輸出模塊用于對編碼和解碼產生的結果進行輸出。本發明提供的基于自適應編碼的蛋白存儲文件管理系統及方法,實現了具有存儲密度高、測序覆蓋率低、存儲時間長、耦合度高、可塑性強的蛋白存儲系統,保證數據存儲的安全性、可靠性和持久性。
本發明授權一種基于自適應編碼的蛋白存儲文件管理系統及方法在權利要求書中公布了:1.一種自適應編碼的蛋白存儲文件管理方法,其特征在于,包括如下步驟: S100、預處理:將原始文件轉換為二進制碼; S200、加入冗余:在步驟S100中生成的二進制碼中使用Reed-Solomon糾錯碼添加冗余信息; S300、分段:將添加完冗余信息的二進制碼分割成等長的n個分段,在每個分段兩端添加編號信息序列和可實現隨機數據訪問的信息序列,并基于RobustSoliton分布產生一個隨機整數d; S400、自適應編碼: 根據編碼位置的特點,對上一步所獲得編碼中的有效載荷和非有效載荷兩種不同情況采用不同的編碼方式,其中,有效載荷指的是上一步所獲得編碼中未添加冗余之前的部分,非有效載荷是指分段時添加在每段兩端的編號信息序列和可實現隨機的數據訪問的信息序列,其中,對于有效載荷部分進行編碼包括以下步驟: S401、Luby變換:根據步驟S300中獲得的d值,在n個分段中選出d個進行XOR異或運算生成編碼符號,為了保障存儲質量,引入兩個字節的RS糾錯碼,然后將編碼符號和糾錯碼組合成一個液滴,作為Luby變換的輸出; S402、篩選:首先將液滴的二進制序列轉換為氨基酸序列,然后運用算法對液滴的均聚物及GC含量進行篩選;若通過篩選,則認為液滴是有效的并將它添加至文件中進行存儲,若未通過篩選,則認為是無效液滴,將其刪除; S403、計算約束閾值:通過有效載荷編碼的GC內容根據公式來自適應地計算非有效載荷編碼時的GC含量閾值,使得在蛋白合成和測序中,GC的含量保持在50%,以獲得更好的效果; 對于非有效載荷部分進行編碼具體包括以下步驟: S404、計算有效載荷編碼集的GC內容和連續性等特征值; S405、計算生成非有效載荷編碼集GC內容的閾值、連續性閾值,針對不同的存儲條件、存儲內容、不同的實驗環境和不同的存儲開銷,選擇算法和約束; S406、輸入對非有效載荷編碼集合進行編碼所需的地址位數,判斷當前非有效載荷編碼集GC內容的閾值條件是否超過非有效載荷編碼集合的下界; S407、如果超過,則返回步驟S406,否則,執行步驟S408; S408、使用當前的非有效載荷編碼閾值繼續下一個編碼過程 S500、蛋白合成:將步驟S400中生成的氨基酸序列合成為多肽鏈并制成蛋白信息存儲材料; S600、信息解碼:將氨基酸序列重新還原為原始文件; S700、結果展示:利用結果輸出模塊將步驟S600中生成的原始文件通過顯示屏顯示結果,并將結果保存至編碼記錄數據庫中。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人上海大學,其通訊地址為:200436 上海市寶山區上大路99號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。