2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ 備案號:
本站除標明“本站原創”外所有信息均轉載自互聯網 版權歸原作者所有。
郵箱:toplearningteam#gmail.com (請將#換成@)
在2023年12月5日,谷歌公司旗下的研究人員表示,現在已經找到了獲取OpenAI公司旗下人工智能聊天機器人ChatGPT的訓練數據方法。在剛剛發布的論文中,谷歌公司的研究人員表示,有一些關鍵詞能夠讓ChatGPT泄露在訓練時所接受的訓練及內容。

研究人員舉例模型在重復詩歌這個詞語以后給出的答案是一個真實存在的電子郵件地址和電話號碼。研究人員表示,個人信息泄露經常會發生在他們向平臺發動攻擊的時候。此外,當研究人員要求模型重復公司這個詞語的時候,也出現了類似的情況。研究人員表示,雖然這種攻擊的方式看起來比較的簡單,但是這種攻擊卻十分有效。

研究人員在論文中指出,僅僅只用價值200美元的查詢,就能夠提取出超過1萬個逐字記憶的訓練示例。根據研究人員的推斷,如果有更多的預算,那么就可以獲得更多競爭對手的訓練數據。目前OpenAI公司正在面臨著幾個有關于ChatGPT秘密訓練數據的訴訟。因為為 ChatGPT人工智能模型提供數據的是來自于互聯網的文本數據庫,據了解,目前ChatGPT已經接受了3,000億個單詞的訓練。

有一項集體訴訟中指出OpenAI公司私自竊取了大量的個人數據,其中包括私人的醫療記錄和兒童信息,這些信息全部都用來訓練 ChatGPT人工智能模型,還有一些作家也在起訴OpenAI公司指控公司利用他們的作品來訓練聊天機器人。對于谷歌公司研究人員的發現OpenAI公司已經做出了正面回應,表示重復使用一些指令,可能違反了公司的服務條款。目前還并不清楚這種行為違反了OpenAI公司內容政策的哪一部分,不過在OpenAI公司的使用條款中,確實規定用戶不能夠使用任何自動或者編程的方法提取數據。
2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ 備案號:
本站除標明“本站原創”外所有信息均轉載自互聯網 版權歸原作者所有。
郵箱:toplearningteam#gmail.com (請將#換成@)