網(wǎng)易科技訊12月12日消息,據(jù)國(guó)外媒體報(bào)道,自2014年亞馬遜發(fā)布智能音箱Echo以來(lái),亞馬遜Echo、谷歌Home和Apple HomePod等“智能音箱”設(shè)備已經(jīng)銷售了數(shù)以百萬(wàn)臺(tái),大科技公司正在將亞馬遜Alexa、蘋果Siri、谷歌Assistant、微軟Cortana,以及Facebook的類似服務(wù)整合到人們生活中。咨詢公司Juniper Research估計(jì),到2023年,全球智能音箱年市場(chǎng)規(guī)模將達(dá)到110億美元,全球約有74億部語(yǔ)音控制設(shè)備。
科技公司表示智能音箱只有在用戶激活時(shí)才會(huì)錄音,但事實(shí)上正在把永遠(yuǎn)開著的麥克風(fēng)引入私密空間。亞馬遜及其競(jìng)爭(zhēng)對(duì)手表示,絕大多數(shù)語(yǔ)音請(qǐng)求都是由電腦自動(dòng)執(zhí)行的,無(wú)需人工審核。然而,這些智能設(shè)備都在依賴成千上萬(wàn)的低薪員工進(jìn)行人工轉(zhuǎn)錄,用戶私密對(duì)話已經(jīng)成為他們最有價(jià)值的數(shù)據(jù)集之一。所有科技公司都認(rèn)為,這是改善他們產(chǎn)品的一種合理方式。
蘋果
2011年,蘋果公司推出了帶有Siri功能的iPhone 4S,不再需要通過實(shí)驗(yàn)室收集錄音。幾天之內(nèi),蘋果賣出了400多萬(wàn)部4S手機(jī),開始免費(fèi)積累不可估量的自然語(yǔ)音數(shù)據(jù)。在最初的幾年里,直到2014年之前,蘋果都在依賴外部語(yǔ)音軟件專家使用這些數(shù)據(jù)來(lái)提高Siri的分析能力。過去幾年,蘋果在收集和分析自然語(yǔ)音方面非常積極,期望外包商能解釋語(yǔ)音片段中不同的語(yǔ)言、方言和文化特質(zhì)。在GlobeTech辦公室里,合同工們戴著耳機(jī)坐在電腦前,每天要抄錄1300個(gè)片段。當(dāng)合同工點(diǎn)擊播放語(yǔ)音錄音時(shí),電腦會(huì)在一個(gè)文本框中填入它認(rèn)為Siri“聽到”的單詞,然后提示通過或更正內(nèi)容。當(dāng)合同工詢問負(fù)責(zé)人是否可以跳過過于私密的語(yǔ)音片段時(shí),卻被告知沒有任何片段是過于私密的。合同工通常只工作幾個(gè)月,關(guān)于隱私問題的培訓(xùn)也很少。一名對(duì)這項(xiàng)工作毫無(wú)疑慮的前合同工表示,偷聽真實(shí)世界的用戶的聲音“絕對(duì)令人捧腹”。
2015年,蘋果Siri每周處理的請(qǐng)求超過10億次。這時(shí)的用戶可以開啟一項(xiàng)功能,不必再按iPhone上的按鈕來(lái)激活語(yǔ)音助手,但這種情況下Siri總是處于傾聽狀態(tài)。蘋果表示,語(yǔ)音數(shù)據(jù)可能會(huì)被記錄和分析以改進(jìn)Siri,但它沒有提到人們可能會(huì)被監(jiān)聽?!巴德爠e人說話讓我覺得非常不舒服,”一位前合同工說。
蘋果Siri部門的十名前高管表示,他們從不認(rèn)為Siri系統(tǒng)侵犯了隱私。這些前高管表示,錄音與蘋果用戶標(biāo)識(shí)無(wú)關(guān),他們認(rèn)為用戶會(huì)理解蘋果在處理他們的音頻剪輯,那么有人幫忙處理又有什么關(guān)系呢?“我們?cè)谇楦猩细械桨踩?,認(rèn)為這樣做是正確的,”Siri高級(jí)開發(fā)小組前員工約翰·伯基(John Burkey)說?!斑@與應(yīng)用程序崩潰并詢問你是否要將報(bào)告發(fā)送給蘋果是一樣的。這只是個(gè)語(yǔ)音錯(cuò)誤。”
蘋果公司表示,只有不到0.2%的Siri請(qǐng)求經(jīng)過了人工分析。到2019年,蘋果將Siri引入無(wú)線耳機(jī)和HomePod音箱等產(chǎn)品后,Siri每月處理150億條語(yǔ)音指令,0.2%仍意味著每月有3000萬(wàn)次請(qǐng)求經(jīng)過語(yǔ)音分析,一年就是3.6億次。
亞馬遜
在智能音箱領(lǐng)域,蘋果的HomePod估計(jì)只占美國(guó)市場(chǎng)的5%。亞馬遜估計(jì)有70%。亞馬遜Echo的七個(gè)麥克風(fēng)一直在監(jiān)聽“喚醒詞”,這將觸發(fā)新的錄音。與蘋果一樣,每一段用戶音頻都會(huì)被發(fā)送到公司的服務(wù)器,其中的一部分會(huì)被分流到數(shù)百個(gè)數(shù)據(jù)關(guān)聯(lián)公司中進(jìn)行人工審查。
默認(rèn)情況下,亞馬遜會(huì)無(wú)限期保留錄音。亞馬遜沒有透露這些數(shù)據(jù)的具體用途,只是表示在將Alexa翻譯成世界各地新語(yǔ)言和擴(kuò)展其響應(yīng)能力方面,人工轉(zhuǎn)錄已被證明具有巨大的優(yōu)勢(shì)。
從羅馬尼亞首都布加勒斯特到印度南部城市欽奈,亞馬遜已經(jīng)在世界各地的城市建立了數(shù)量眾多的人工轉(zhuǎn)錄機(jī)構(gòu),今年它已經(jīng)舉辦了好幾次為海外人工轉(zhuǎn)錄員舉行的招聘會(huì)。一位花了數(shù)十年時(shí)間為科技公司開發(fā)識(shí)別系統(tǒng)的技術(shù)專家表示,亞馬遜最近一次招聘活動(dòng)中概述的音頻數(shù)據(jù)分析規(guī)模之大令人震驚。亞馬遜表示,它非常重視“客戶及其語(yǔ)音記錄的安全”,而且它需要完全理解地方口音和各種口語(yǔ),才能讓Alexa全球化。
微軟
今年8月,微軟承認(rèn),會(huì)使用人工審查包括Cortana和即時(shí)通訊應(yīng)用程序Skype在內(nèi)的語(yǔ)音識(shí)別技術(shù)產(chǎn)品生成的語(yǔ)音數(shù)據(jù)。寶馬、惠普和Humana等公司正在將相關(guān)技術(shù)整合到自己的產(chǎn)品和服務(wù)中。行業(yè)分析師說,谷歌和Facebook同樣認(rèn)為音頻數(shù)據(jù)將極大推動(dòng)它們龐大的廣告業(yè)務(wù)。密歇根大學(xué)教授Schaub表示,網(wǎng)頁(yè)瀏覽行為向這些公司提供了大量個(gè)人信息,但錄音可以讓人工智能更容易估算出用戶年齡、性別、情緒,甚至所處地點(diǎn)和興趣。
谷歌
谷歌Assistant為谷歌搜索引擎提供來(lái)自10億臺(tái)設(shè)備的查詢,包括Android智能手機(jī)和平板電腦、Nest恒溫器和索尼電視。谷歌也聘請(qǐng)海外臨時(shí)工來(lái)轉(zhuǎn)錄音頻片段,以提高系統(tǒng)的準(zhǔn)確性。谷歌承諾,經(jīng)過審查的語(yǔ)音記錄不會(huì)與任何個(gè)人信息相關(guān)聯(lián)。但今年夏天,谷歌一家承包商向比利時(shí)廣播公司VRT NWS共享了1000多份用戶錄音。媒體根據(jù)錄音內(nèi)容確立了一些用戶,讓人大為震驚。其中大約有10%的錄音片段是在未經(jīng)這些用戶同意的情況下錄制的,因?yàn)樵O(shè)備錯(cuò)誤地檢測(cè)到了喚醒詞“OK,谷歌”。
谷歌的一名女發(fā)言人說:“自從聽到這些擔(dān)憂后,我們一直致力于暫停助理音頻的人工轉(zhuǎn)錄,同時(shí)加強(qiáng)我們的隱私控制。該公司拒絕評(píng)論人類是否轉(zhuǎn)錄了從其他谷歌服務(wù)收集到的語(yǔ)音數(shù)據(jù)。谷歌助理的一名高級(jí)工程師最近離開了公司,他說,如果語(yǔ)音助理(包括谷歌的)更有用的話,人們可能會(huì)忽視窺探的擔(dān)憂。
Facebook在2018年11月推出了集智能音箱和可視電話于一體的Portal時(shí),就已經(jīng)受到數(shù)據(jù)隱私丑聞的困擾。但其也一直依賴人工轉(zhuǎn)錄音頻來(lái)訓(xùn)練人工智能,來(lái)源不止是用戶音頻。Facebook通過埃森哲雇傭的一名承包商被要求使用Facebook個(gè)人賬戶給朋友和家人打電話,創(chuàng)建新的音頻,但沒有告訴他們?yōu)槭裁?。Facebook內(nèi)部的一名消息人士證實(shí),這些同化會(huì)被記錄下來(lái)。但Facebook表示,從未明確要捕捉實(shí)際的通話內(nèi)容。
Facebook聊天應(yīng)用Messenger支持用戶傳輸音頻信息,其也依賴人工轉(zhuǎn)錄。公司會(huì)提示用戶選擇讓其人工智能自動(dòng)轉(zhuǎn)錄這些語(yǔ)音信息,但沒有告訴他們這些剪輯也被交給了承包商TaskUs進(jìn)行人工審查。Facebook也沒有告訴TaskUs這些音頻是從哪里來(lái)的。
負(fù)責(zé)監(jiān)督Facebook硬件部門的副總裁安德魯·博斯沃思(Andrew Bosworth)說,除了像蘋果那樣將語(yǔ)音文件與用戶ID分開之外,F(xiàn)acebook軟件還會(huì)在將文件轉(zhuǎn)發(fā)給承包商之前,略微改變每個(gè)人的音調(diào)。他承認(rèn)使用語(yǔ)音指令工具需要“對(duì)工具背后的技術(shù)承包商抱有很大信息”,但很他相信谷歌、亞馬遜以及Facebook使用語(yǔ)音數(shù)據(jù)實(shí)在改善他們的服務(wù)而非利用敏感信息。博斯沃思表示自己家中也有多個(gè)語(yǔ)音設(shè)備。
今年,幾家大型科技公司調(diào)整了它們的策略。谷歌暫停人工轉(zhuǎn)錄Assistant音頻,蘋果已經(jīng)開始允許用戶刪除Siri的歷史記錄,并選擇不再分享更多內(nèi)容;把共享錄音設(shè)為可選項(xiàng),并直接聘用許多前承包商來(lái)加強(qiáng)對(duì)人工轉(zhuǎn)錄的控制。Facebook和微軟在其隱私政策中增加了更明確的免責(zé)聲明。亞馬遜也披露了類似的信息,并開始允許Alexa用戶選擇對(duì)錄音不進(jìn)行人工審核?!斑@是業(yè)內(nèi)眾所周知的事情,”亞馬遜最近談到人工轉(zhuǎn)錄時(shí)說?!安还苁敲襟w還是用戶都知道,很明顯我們?cè)谶@方面做得不夠好。”
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。