國網電力空間技術有限公司;國家電網有限公司楊璇獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉國網電力空間技術有限公司;國家電網有限公司申請的專利一種基于機器學習的敏感數據探查方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119884897B 。
龍圖騰網通過國家知識產權局官網在2025-06-20發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510387379.4,技術領域涉及:G06F18/241;該發明授權一種基于機器學習的敏感數據探查方法及系統是由楊璇;王佳穎;孟小前;鄭思嘉;葉子;宮雅文;白皓東;黎澤承;吳建雄;白雪;李冽庚;方平凱設計研發完成,并于2025-03-31向國家知識產權局提交的專利申請。
本一種基于機器學習的敏感數據探查方法及系統在說明書摘要公布了:本發明涉及一種基于機器學習的敏感數據探查方法及系統,通過從電力相關數據源中采集包括桿塔位置數據、機場位置數據及重要場站位置數據的原始數據,并對其進行異常值清洗、數據格式統一等預處理操作,生成結構化數據;基于預處理后的數據,提取包括位置分布、空間關聯性及數據頻次在內的多維特征向量,并結合敏感性標注規則生成模型訓練數據,利用機器學習算法構建并優化敏感數據探查模型;目標數據集通過訓練完成的模型進行敏感性分析,生成敏感性分類標簽,并對探查出的敏感數據按照分類標簽實施分級保護,其中對高敏感數據采用加密存儲與訪問控制策略;本發明能夠高效、準確地識別和保護敏感數據,適用于電力相關領域的數據安全需求。
本發明授權一種基于機器學習的敏感數據探查方法及系統在權利要求書中公布了:1.一種基于機器學習的敏感數據探查方法,其特征在于,包括:從電力相關數據源中采集包括桿塔位置數據、機場位置數據、重要場站位置數據在內的原始數據;對所述原始數據進行預處理,其中,所述預處理包括清洗異常值、統一數據格式及標準化地理坐標,生成預處理后的結構化數據;基于預處理后的結構化數據,生成多維特征向量;根據預先規定的敏感性標注規則,將所述多維特征向量與其對應的敏感性標注標簽組合,生成模型訓練數據;其中,所述多維特征向量包括位置分布、空間關聯性、數據頻次;基于所述模型訓練數據,利用機器學習算法構建敏感數據探查模型;通過迭代優化訓練所述敏感數據探查模型,獲得用于識別目標數據敏感程度的模型參數;根據所述模型參數,獲得訓練完成的敏感數據探查模型;將目標數據集輸入所述敏感數據探查模型,獲得模型輸出結果;根據所述模型輸出結果,標注目標數據集中包括的敏感數據,生成敏感性分類標簽;其中,所述目標數據集采用預處理后的目標結構化數據;根據敏感性分類標簽,對探查到的敏感數據進行分級保護,包括對高敏感數據的加密存儲與訪問控制策略;其中,所述基于預處理后的結構化數據,生成多維特征向量,包括:將輸入的地理數據按照預設的規則劃分為等距網格單元,其中,每個網格單元對應指定的地理范圍;計算每個網格單元內地理數據點的數量,表示為網格密度;對所述網格密度值進行歸一化處理,生成反映地理數據局部分布特征的位置分布特征;對每個地理數據點,計算其與一組預定義重要設施的距離;根據設施類型分配權重,將各距離值與對應權重進行加權平均,得到空間關聯值;對所有地理數據點的空間關聯值進行歸一化處理,生成空間關聯性特征;其中,所述重要設施包括桿塔、機場和變電站;對每個地理數據點的時間屬性進行分析,將其在固定時間周期內的出現次數統計為頻次值;通過設定時間衰減權重,對頻次值進行加權處理后歸一化,生成描述時空活躍程度的時空頻次特征;將每個地理數據點的歸一化位置分布特征、空間關聯性特征和時空頻次特征組合,生成多維特征向量,并輸出用于模型訓練的特征向量數據集。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人國網電力空間技術有限公司;國家電網有限公司,其通訊地址為:102200 北京市昌平區未來科技城濱河大道18號C座7層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。