AI觀察站

智慧音箱所衍生的資安危機(上)

  近幾年,由於人工智慧及語音辨識技術的快速發展,使得智慧音箱(Smart Speakers)能更精準地與人們互動,而備受許多家庭歡迎。然而,智慧音箱卻也潛藏許多法律與倫理道德之議題,是我們應該要去關注的。英國政府所創設的資料倫理與創新中心(Centre for Data Ethics and Innovation; CDEI)於今年九月發布了一篇報告,即針對智慧音箱來做探討,故本文分為上下篇,乃摘譯該報告之內容,以利我們能迅速掌握與之相關的問題。


何謂智慧音箱?其如何運作?
智慧音箱是一款具有人工智慧語音助理的音箱,藉由連接網路後,智慧音箱可以根據人們的指令,提供相應的內容與服務,並與人們互動。在英國有四個主要的語音助理,分別為Amazon的 Alexa、Microsoft的 Cortana、Google的 Assistant與Apple的 Siri。儘管各家的語音助理具有差異性,但智慧音箱的運作方式大抵相同。在任何時刻,智慧音箱都會將環境中所記錄的聲音放入緩衝區(buffer),並進行掃描以尋找喚醒詞(wake-word)。只有在偵測到喚醒詞後,智慧音箱才會開始將所記錄的聲音傳輸到雲端,以進行分析與儲存。

在雲端,該記錄的聲音會藉由語音辨識技術進行轉換,並通過自然語言處理(Natural Language Processing; NLP)的形式運作,將其轉換為機器可理解的含義結構。然後,將此所產生的結果傳遞給「對話管理器」(dialogue manager),而該管理器可以決定最佳的回應為何,例如撥放音樂或是啟用搜索查詢。當這樣做時,它將考量到使用者的想法,並且還將決定是否給予回應,例如藉由特定的app撥放音樂。一旦確認了適當的回應,就會產生使用者所聽到的語音回覆。

如何使用智慧音箱?有何益處?
人們在日常生活中可以隨時呼叫智慧音箱,以協助完成基本任務,例如提供娛樂或是搜索訊息。根據路透新聞研究所(Reuters Institute for the Study of Journalism)的一份報告發現,播放音樂是英國絕大多數用戶(84%)使用最多的功能。其次則是回答一般性問題,像是提供天氣資訊和設置鬧鐘。

使用智慧音箱可以更便利於人們的生活,因為只需要聲控即可完成許多事情,而沒有像一般機器設備擁有繁瑣的按鈕或是複雜的螢幕說明。只要設定完成後,人們即可從事搜索訊息、聯繫朋友以及預訂餐廳等。同時,智慧音箱還能使人們降低滑手機的時間,由於其回答問題與播放特定音樂,人們都毋須接觸到智慧型手機。

智慧音箱對於資料之蒐集、使用與隱私問題
儘管智慧音箱帶來許多便利,惟對於資安的問題,仍為人們所擔憂。這些擔憂包括智慧音箱如何記錄資料,以及一旦其蒐集資料後,應當如何處理的問題。於下分述之:

一、智慧音箱一直在聆聽
人們認為智慧音箱無時無刻都在聆聽家中的各種言論,並進而將語音資料發送至雲端。然而於實際上,智慧音箱對於語音資料的記錄、儲存與分析會直到偵測到喚醒詞才開始行動。當然,這也不排除智慧音箱可能誤聽喚醒詞,導致其將錯誤的資料傳輸到雲端,這種情況稱為錯誤接受(false accepts)。隨著技術的快速發展,錯誤接受的發生率可能會減少,並且錯誤記錄的資料會更少。

二、訓練語音助理與共享個人資料
科技公司為了改善智慧音箱的語音辨識能力與自然語言處理系統,會對於智慧音箱所儲存的語音資料進行人工審查。人們擔憂雖然該語音資料是匿名且為片段式,但若該訊息具有可辨識資料與敏感訊息,則有可能藉由該資料回推連接至使用者。因此,使用者可以自主決定是否要共享自己的語音資料。不過若使用者決定刪除語音紀錄或關閉儲存資料的功能,則智慧音箱可能會不再智慧,因為其無法學習使用者的說話方式。

儘管一般資料保護規範(General Data Protection Regulation; GDPR)所要求的隱私聲明必須是簡潔與透明,然而科技公司為了取得使用者許可其可審查語音資料,即有誘因向使用者清楚說明此一運作流程。

三、蒐集資料會發生什麼事
儘管語音助理目前不使用於廣告,但是藉由語音助理進行的網路活動資料,例如網路搜尋或是音樂選擇等,則可以推測使用者的喜好,從而在其他機器設備上宣傳廣告以回推給使用者。此外,智慧音箱的使用者可能不只一人,這使得那些蒐集資料的人,可以更深入瞭解使用者的家庭。

四、智慧音箱具有分析情緒、健康和個性的潛力
智慧音箱可以蒐集語音資料並進行分析,該分析可能會揭露出使用者的健康狀況、疲勞程度或其他人格方面。例如Amazon為其Alexa的新版本申請專利,Alexa可以藉由分析使用者的言語,偵測出使用者是否生病,並向他們出售藥品。這種技術雖然有好處,但是這種看透內心的行為,對於使用者而言可能具有侵擾性,甚至令人不寒而慄。因此這種技術的實施,需要謹慎思考以及人們要能夠理解。

五、隱私擺在第一位的可能性
科技公司研發保護隱私權的方法,可能會鞏固其在市場上的地位。開發人員可以採用隱私優先架構,將使用者的隱私置於資料蒐集之上,即意味著資料將留在智慧音箱中進行處理,而不用上傳至雲端。倫敦帝國理工學院的Hamed Haddadi教授正在研究此方法,同時開發隔音罩,以消除語音內容中的情緒,從而減少共享資料,而只蒐集對於智慧音箱的指令。

六、第三方使用資料的可能
語音助理通常會建議安裝第三方的App以擴展其功能,例如提供新聞、建議或操控智慧生活。大多數科技公司不直接向App開發人員提供語音紀錄,而是傳輸與App進行相關互動所需的資料。儘管科技公司表示只有在使用者同意的情況下,他們才能傳遞包括可辨識個人的資料。但在某些情況下,科技公司還是會與App開發人員共享語音紀錄,以協助他們瞭解使用者與App進行互動的狀態。

智慧型手機App的系統已經有與商業夥伴共享資料的例子。類似的行為發生在智慧音箱上,可能會有風險。在開發人員建立App時,他們應考量要如何更好地與使用者溝通,以及哪些資料可以被共享與使用。
(編譯者:陳中安)

從本文中我們可以看到智慧音箱或語音助理的運作機制與其可能涉及的法律問題,下篇文章我們將會討論智慧音箱的破壞性影響,以及在更細微的社會、道德面可能強化的外部效果。