本發(fā)明涉及區(qū)塊鏈數(shù)據(jù)管理,具體為一種基于區(qū)塊鏈的數(shù)據(jù)管理系統(tǒng)。
背景技術:
1、在當前的數(shù)據(jù)管理場景中,傳統(tǒng)的中心化管理模式面臨著諸多難以克服的問題。數(shù)據(jù)存儲分散,不同系統(tǒng)之間的數(shù)據(jù)格式不統(tǒng)一,導致數(shù)據(jù)交互時需要進行大量的格式轉換工作,不僅耗費時間和資源,還容易在轉換過程中出現(xiàn)數(shù)據(jù)丟失或錯誤。
2、數(shù)據(jù)的安全性和可靠性難以得到有效保障。中心化的存儲架構使得數(shù)據(jù)一旦遭遇黑客攻擊或系統(tǒng)故障,就可能面臨大規(guī)模泄露或損壞的風險。而且,數(shù)據(jù)的更新和維護缺乏有效的追蹤機制,當數(shù)據(jù)發(fā)生變動時,難以快速定位變動的源頭和影響范圍,這給數(shù)據(jù)的追溯和校驗帶來了極大的困難。
3、在數(shù)據(jù)共享方面,由于缺乏可信的交互機制,不同主體之間的數(shù)據(jù)共享往往存在較高的信任成本。各方對于數(shù)據(jù)的使用權和管理權界定模糊,導致數(shù)據(jù)資源無法得到充分的利用,限制了數(shù)據(jù)價值的發(fā)揮。此外,現(xiàn)有的數(shù)據(jù)管理系統(tǒng)在處理數(shù)據(jù)與存儲介質的映射關系時,缺乏靈活性和適應性,當數(shù)據(jù)需求發(fā)生變化時,難以快速調整映射關系以滿足新的需求,使得數(shù)據(jù)管理的效率低下。
4、區(qū)塊鏈技術的出現(xiàn)為數(shù)據(jù)管理提供了新的思路,其去中心化、不可篡改等特性具有潛在的優(yōu)勢。然而,現(xiàn)有的基于區(qū)塊鏈的數(shù)據(jù)管理方案在實際應用中仍存在明顯缺陷。這些方案大多未能對數(shù)據(jù)進行有效的分域處理,使得不同類型、不同用途的數(shù)據(jù)混雜在一起,增加了數(shù)據(jù)查詢和處理的難度。在區(qū)塊組合方面,缺乏科學合理的匹配機制,難以根據(jù)數(shù)據(jù)的實際需求形成最優(yōu)的區(qū)塊組合,影響了數(shù)據(jù)存儲和讀取的效率。
5、數(shù)據(jù)分域與區(qū)塊鏈分域之間的映射關系固定,無法隨著數(shù)據(jù)的更新而動態(tài)調整,導致當數(shù)據(jù)發(fā)生變化時,區(qū)塊鏈中的存證信息與實際數(shù)據(jù)出現(xiàn)偏差,影響了數(shù)據(jù)的一致性。這些問題共同制約了區(qū)塊鏈技術在數(shù)據(jù)管理領域的進一步應用和發(fā)展,使得數(shù)據(jù)管理的質量和效率無法滿足當前數(shù)字時代的需求。
技術實現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于區(qū)塊鏈的數(shù)據(jù)管理系統(tǒng),以解決上述背景技術中提出的問題。
2、為實現(xiàn)上述目的,本發(fā)明提供一種基于區(qū)塊鏈的數(shù)據(jù)管理系統(tǒng),所述系統(tǒng)包括:
3、數(shù)據(jù)分域模塊,用于獲取用戶操作時的交互數(shù)據(jù),按照用戶操作時的需求,判斷交互數(shù)據(jù)相對于區(qū)塊鏈服務的數(shù)據(jù)分域;
4、域鏈映射模塊,用于獲取交互數(shù)據(jù)的區(qū)塊鏈分域,并構建數(shù)據(jù)分域與區(qū)塊鏈分域的映射關系;
5、區(qū)塊組合模塊,用于從數(shù)據(jù)分域與區(qū)塊鏈分域中提取關鍵分域,并按照關鍵分域判斷區(qū)塊鏈分域中多個區(qū)塊之間的組合匹配度,得到區(qū)塊偏向組合;
6、存證更新模塊,用于以區(qū)塊偏向組合為基礎,對區(qū)塊鏈分域進行信息核查,識別區(qū)塊鏈分域中存證的更新情況,并按照存證的更新情況,更新數(shù)據(jù)分域與區(qū)塊鏈分域之間的映射關系;
7、數(shù)據(jù)管理模塊,用于根據(jù)更新后的數(shù)據(jù)分域與區(qū)塊鏈分域之間的映射關系,識別交互數(shù)據(jù)的數(shù)據(jù)目標和數(shù)據(jù)順序,并生成數(shù)據(jù)管理庫。
8、優(yōu)選的,數(shù)據(jù)分域模塊的實現(xiàn)方式包括:
9、針對用戶操作時的任一交互數(shù)據(jù),獲取交互數(shù)據(jù)對應的需求分類模型;
10、使用需求分類模型對交互數(shù)據(jù)進行分類,至少獲取一個需求類別;
11、識別對應需求類別下,交互數(shù)據(jù)中存在的同義詞、多義詞和關聯(lián)詞,以形成數(shù)據(jù)樣本集;
12、分別對數(shù)據(jù)樣本集中的同義詞、多義詞和關聯(lián)詞進行分析,依次獲取數(shù)據(jù)樣本集對應的同義詞區(qū)、多義詞解析區(qū)和關聯(lián)詞關聯(lián)區(qū),并作為交互數(shù)據(jù)相對于區(qū)塊鏈服務的數(shù)據(jù)分域。
13、優(yōu)選的,獲取數(shù)據(jù)樣本集對應的同義詞區(qū)、多義詞解析區(qū)和關聯(lián)詞關聯(lián)區(qū)的實現(xiàn)方式還包括:
14、將數(shù)據(jù)樣本集中的同義詞、多義詞和關聯(lián)詞按照需求類別進行合并,得到多個需求合并結果;
15、提取需求合并結果中的同義詞對,將同義詞對與同義詞詞典比較,得到同義詞區(qū);
16、提取需求合并結果中多義詞的語義變化率和關聯(lián)詞的關聯(lián)強度,按照多義詞的語義變化率和關聯(lián)詞的關聯(lián)強度對需求合并結果進行劃分,得到多義詞解析區(qū)和關聯(lián)詞關聯(lián)區(qū)。
17、優(yōu)選的,判斷交互數(shù)據(jù)相對于區(qū)塊鏈服務的數(shù)據(jù)分域實現(xiàn)方式還包括:
18、對數(shù)據(jù)分域進行判斷,分析數(shù)據(jù)分域中用戶的操作次數(shù)和操作時間,將數(shù)據(jù)分域按照操作次數(shù)和操作時間進行擬合,構建數(shù)據(jù)分域到用戶的實際需求的映射關系。
19、優(yōu)選的,域鏈映射模塊的實現(xiàn)方式包括:
20、調用交互數(shù)據(jù)對應的區(qū)塊和存證,生成多個無標簽的區(qū)塊識別結果,無標簽的區(qū)塊識別結果表示未與數(shù)據(jù)分域中詞匯進行關聯(lián)的區(qū)塊和存證;
21、判斷多個無標簽的區(qū)塊識別結果是否為目標區(qū)塊識別結果,若為目標區(qū)塊識別結果,則將目標區(qū)塊識別結果視為交互數(shù)據(jù)的區(qū)塊鏈分域。
22、優(yōu)選的,構建數(shù)據(jù)分域與區(qū)塊鏈分域的映射關系的實現(xiàn)方式包括:以數(shù)據(jù)分域中存在的同義詞區(qū)、多義詞解析區(qū)和關聯(lián)詞關聯(lián)區(qū)的信息表示,區(qū)塊鏈分域的描述信息和區(qū)塊鏈分域的類別,將數(shù)據(jù)分域與區(qū)塊鏈分域構建映射關系。
23、優(yōu)選的,區(qū)塊組合模塊的實現(xiàn)方式包括:
24、將數(shù)據(jù)分域和區(qū)塊鏈分域按照服務類型、鏈類型、鏈功能進行聚類分析,將聚類分析后的最大聚類中心,設置為關鍵分域;
25、提取關鍵分域的關鍵字,并計算各關鍵字之間的余弦相似度,設置與各關鍵字之間的余弦相似度相關的公共序列;
26、利用各關鍵字之間的余弦相似度相關的公共序列,提取公共序列中存在的區(qū)塊,并設置各區(qū)塊之間的最長公共子序列,并將最長公共子序列的長度值設為各區(qū)塊之間的組合匹配度;
27、將各區(qū)塊之間的組合匹配度,按照各區(qū)塊的時間分布概率,設置區(qū)塊偏向組合。
28、優(yōu)選的,存證更新模塊的實現(xiàn)方式包括:
29、從區(qū)塊偏向組合中提取各區(qū)塊的時間分布概率;將區(qū)塊偏向組合按照各區(qū)塊的時間分布概率所對應的時間段,設置區(qū)塊偏向組合的目標路徑;
30、將區(qū)塊偏向組合中各區(qū)塊的目標路徑進行擬合,得到擬合后的目標路徑,將擬合后的目標路徑在每個時間段上的概率值設為區(qū)塊偏向組合的組合出現(xiàn)概率;
31、將區(qū)塊偏向組合的組合出現(xiàn)概率與區(qū)塊鏈分域中存證的引用情況進行比對,標識出現(xiàn)的差異值,并按照出現(xiàn)的差異值對區(qū)塊鏈分域中存證進行分類,完成對區(qū)塊鏈分域中存證的更新。
32、優(yōu)選的,數(shù)據(jù)管理模塊的實現(xiàn)方式為:
33、根據(jù)更新后的數(shù)據(jù)分域與區(qū)塊鏈分域之間的映射關系,提取交互數(shù)據(jù)中的數(shù)據(jù)目標,按照數(shù)據(jù)目標的出現(xiàn)概率,對數(shù)據(jù)目標進行排序,得到交互數(shù)據(jù)中的數(shù)據(jù)順序;按照結構化形式對數(shù)據(jù)目標和數(shù)據(jù)順序進行組合,得到數(shù)據(jù)管理庫。
34、優(yōu)選的,判斷多個無標簽的區(qū)塊識別結果是否為目標區(qū)塊識別結果的實現(xiàn)方式包括:
35、計算無標簽的區(qū)塊識別結果與數(shù)據(jù)分域中詞匯的語義匹配度;若語義匹配度超過預設閾值,則將該無標簽的區(qū)塊識別結果標記為目標區(qū)塊識別結果。
36、與現(xiàn)有技術相比,本發(fā)明的有益效果是:
37、通過數(shù)據(jù)分域模塊,能夠根據(jù)用戶操作時的需求對交互數(shù)據(jù)進行分域判斷,讓數(shù)據(jù)管理更貼合實際應用場景。不同類型的交互數(shù)據(jù)被劃分到對應的分域中,避免了數(shù)據(jù)的雜亂堆砌,使得數(shù)據(jù)的歸類更加清晰,便于后續(xù)的處理和操作。
38、域鏈映射模塊構建的數(shù)據(jù)分域與區(qū)塊鏈分域的映射關系,實現(xiàn)了數(shù)據(jù)與區(qū)塊鏈存儲結構之間的精準對應。這種對應關系讓數(shù)據(jù)在區(qū)塊鏈中的存儲位置更加明確,當需要調用數(shù)據(jù)時,能夠快速找到對應的區(qū)塊鏈分域,減少了數(shù)據(jù)查找的時間,提升了數(shù)據(jù)調用的便捷性。
39、區(qū)塊組合模塊通過提取關鍵分域并判斷區(qū)塊之間的組合匹配度,形成區(qū)塊偏向組合,使得區(qū)塊鏈中的多個區(qū)塊能夠按照更合理的方式進行組合。這種組合方式能夠充分利用區(qū)塊的存儲空間,減少區(qū)塊資源的浪費,同時讓數(shù)據(jù)在區(qū)塊鏈中的存儲結構更加優(yōu)化,便于數(shù)據(jù)的整體管理。
40、存證更新模塊對區(qū)塊鏈分域進行信息核查并更新映射關系,能夠及時發(fā)現(xiàn)區(qū)塊鏈中存證信息的變化。當存證信息發(fā)生更新時,數(shù)據(jù)分域與區(qū)塊鏈分域之間的映射關系也隨之調整,保證了兩者之間的同步性,避免了因映射關系滯后而導致的數(shù)據(jù)管理混亂。
41、數(shù)據(jù)管理模塊根據(jù)更新后的映射關系生成數(shù)據(jù)管理庫,使得交互數(shù)據(jù)的數(shù)據(jù)目標和數(shù)據(jù)順序得到明確。數(shù)據(jù)管理庫的形成讓數(shù)據(jù)的整體脈絡更加清晰,用戶能夠更直觀地了解數(shù)據(jù)的分布和流轉情況,從而更高效地進行數(shù)據(jù)的使用和維護,讓整個數(shù)據(jù)管理過程更加順暢有序。