機器會學習，但它會遺忘嗎？ - 澳門國際科技產業發展協會 AIDIT.ORG 澳門國際科協

機器會學習，但它會遺忘嗎？

有朋友說，“拔了電源不保存不就忘了！”

問題沒那麼簡單。

學會遺忘，AI面臨的一大挑戰

機器學習的宗旨是使用電腦作為工具並致力於真實、實时的類比人類學習方式，其可以將現有內容進行知識結構劃分，再廣泛應用於解决工程應用和科學領域的複雜問題。現在，機器學習被視作最具智能特徵的研究領域，但科學家提出了新的問題：機器會學習，但它會遺忘嗎？

《連線》網站文章截圖

《連線》雜誌網站近日刊文稱，作為計算機科學中的新興領域，機器學習研究者們已經開始探索在AI中誘發“選擇性失憶”的方法，其目標是在不影響模型效能的前提下，從機器學習中删除特定人員或點的敏感數據。如果未來能够實現，那麼這一概念將幫助人們更好地控制數據。

視頻截圖。研究人員測試他們能否在無需“從零開始”重新訓練系統的情况下删除敏感數據。

學習容易，想要忘記有點難

實際上，機器的學習方式雖然在效仿人類，但“遺忘”方式卻與我們大不一樣。

機器學習的“遺忘”，對於有需求的用戶——比如那些對他們在網上分享的內容感到後悔的人來說，其實很直觀。但從科技層面來講，消除特定數據點影響的傳統方法，就是“從零開始”重建系統，這是一項代價可能相當高昂的工作，令企業幾乎難以承受。

具體來說，某些地區的用戶如果對他們披露的內容改變了主意，其實是有權要求公司删除他們所有數據的。但“徹底抹除”這件事很難實現，因為一旦經過訓練，機器學習系統就不會輕易改變，甚至就連訓練者們自己也不清楚系統是如何掌握這些能力的——他們並不能完全理解自己調試或訓練出的算法。

圖片來源：視覺中國

2019年，有科學家提出可以將機器學習項目的源數據分成多個部分，以實現對單個數據點的“遺忘”，但這一思路最近已被證明存在缺陷——如果提交的删除請求以特定的順序出現，無論是偶然的還是惡意的，機器學習系統都會崩潰。

選擇性失憶，需要全新探索

人們對人工智能系統侵犯個人隱私的擔憂日益嚴重。如何讓AI學會“選擇性失憶”，從而可以在無需“從零開始”對系統進行再培訓的情况下删除敏感數據，成為時下研究的熱點問題。它關乎能否可以更好地控制數據和由此獲得的價值。而要實現“選擇性失憶”這個概念，科學家可能需要在計算機科學方面做出全新探索。

“當他們（用戶）要求删除數據時，我們能否消除他們數據的所有影響，同時避免從頭開始重新訓練的全部成本？”賓夕法尼亞大學機器學習教授亞倫·羅斯表示，他們現時進行的研究就是希望能找到一些“中間地帶”。或許在不久的將來，有望找出一條既可以控制數據也可以保護由數據產生的價值的發展道路。

（來源：科技日報）