欧美日韩激情电影,久久亚洲精品毛片,日日夜夜天天综合入口,亚洲激情六月丁香

您的位置: 首頁 >互聯網 >

改變的數據集仍然可以提供統計完整性并保護隱私

2019-07-09 16:19:46 編輯: 來源:
導讀 據統計學家稱,合成網絡可能會增加某些數據的可用性,同時仍能保護個人或機構的隱私。賓夕法尼亞州立大學統計學家表示,綜合網絡可能會增加

據統計學家稱,合成網絡可能會增加某些數據的可用性,同時仍能保護個人或機構的隱私。賓夕法尼亞州立大學統計學家表示,綜合網絡可能會增加某些數據的可用性,同時仍能保護個人或機構的隱私。“我的主要興趣在于開發方法,以便能夠以有助于科學發現的方式更廣泛地共享機密數據,”賓夕法尼亞州Eberly科學學院統計學副教授和研究生教育副院長Aleksandra Slavkovic說。“能夠以最小的可量化風險共享機密數據,以發現敏感信息并確保統計準確性和完整性,這是我們的目標。”

Slavkovic通過跨學科合作找到了解決這一數據隱私問題的方法,特別是與計算機和社會科學家合作。她的研究重點是各種數據,包括捕獲個人或機構等實體之間關系信息的網絡數據。她在華盛頓特區舉行的2019年美國科學促進會年會上報告了她今天(2月16日)提供滿足隱私差異概念的合成網絡的方法。

差異隱私為個人的隱私損失提供了數學上可證明的保證。

科學家希望獲得他人收集的數據用于他們的研究,但這種訪問也可能損害個人隱私,即使在刪除所謂的個人身份數據之后也是如此。

“大量的輔助數據是罪魁禍首,”斯拉夫科維奇說。“隨著數據收集和記錄聯動的方法和技術進步,更容易訪問可能與手頭數據集相關的各種數據源,以及資助機構分享數據的要求,數據隱私的風險正在增加。但是,找到好處管理隱私損失的解決方案對于實現可靠的科學發現至關重要。“

例如,關于HIV藥物的藥物試驗的公開信息將表明誰在治療組中以及誰在對照組中。治療組僅包含被診斷患有HIV的人,即使數據所有者從該數據集中隱瞞了個人詳細信息,也會保留一些識別信息。由于如今在社交媒體和其他數據集中可以獲得如此多的信息,因此可以連接點并識別人,從而可能揭示他們的HIV狀態。

“連接兩個數據集的技術,比如選民記錄和健康保險數據,已大大改善,”斯拉夫科維奇說。“在最早的調查結果之一中,Latanya Sweeny(現在在哈佛大學)表明,通過鏈接這些類型的數據,您可以根據他們的出生日期,性別和5位數確定1990年美國人口普查中87%的人。最近,研究人員使用推文和相關的Twitter元數據來證明他們能夠以96.7%的準確率識別用戶。“

斯拉夫科維奇指出,不僅數據包含在數據庫中的人或機構,而且數據庫外的人也可能直接或通過關聯侵犯隱私。數據集中的信息與社交媒體上的信息之間的聯系可能導致嚴重的隱私后悔 - 如果被披露,諸如艾滋病病毒感染狀況或性取向等可能會產生嚴重后果。

雖然隱私很重要,但收集的數據集構成了研究人員必不可少的信息來源。目前,在某些情況下,當數據特別敏感時,研究人員必須親自前往數據存儲庫進行研究,使研究更加困難和昂貴。

Slavkovic對網絡數據感興趣。顯示人員或機構 - 節點 - 以及節點之間連接的互連性的信息。她的方法是創建略微改變的鏡像網絡數據集,其中一些節點移動,連接移位或邊緣改變。

“目的是創建滿足嚴格的差異隱私要求的新網絡,同時從原始網絡中捕獲大部分統計特征,”Slavkovic說。

這些合成數據集可能足以讓一些研究人員滿足他們的研究需求。對于其他人來說,在必須轉到數據存儲站點之前測試他們的方法和假設就足夠了。研究人員可以在等待使用其存儲庫站點中的原始數據的許可時測試代碼,進行探索性研究以及可能的基本分析。

“我們不能滿足所有統計分析對相同類型的改變數據的要求,”斯拉夫科維奇說。“有些人需要原始數據,但其他人可能會使用合成網絡這樣的合成數據。”


免責聲明:本文由用戶上傳,如有侵權請聯系刪除!

最新文章

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ   備案號:

本站除標明“本站原創”外所有信息均轉載自互聯網 版權歸原作者所有。

郵箱:toplearningteam#gmail.com (請將#換成@)

主站蜘蛛池模板: 崇州市| 定州市| 资阳市| 衡山县| 都匀市| 玉环县| 丘北县| 九寨沟县| 曲阜市| 丰镇市| 康乐县| 武鸣县| 老河口市| 梁平县| 六安市| 五原县| 金堂县| 佛学| 海原县| 博野县| 漳平市| 青铜峡市| 凤台县| 龙泉市| 新巴尔虎右旗| 连平县| 定远县| 长白| 榆林市| 陇川县| 鸡东县| 宕昌县| 上杭县| 大方县| 北安市| 舒城县| 海林市| 凉城县| 灌云县| 江源县| 闻喜县|