本文發(fā)布于機(jī)器之能(微信公眾號:almosthuman2017)岔歼,編譯:王宇欣秋贤、白悅、Rik R 帘既、邱陸陸爬喝,來源: The Intercept,轉(zhuǎn)載請聯(lián)系 jqzn@jiqizhixin.com顷敞。
在美蘇冷戰(zhàn)最嚴(yán)峻的時期程鸵,那是 1980 年的冬天,美國聯(lián)邦調(diào)查局(FBI)的特工人員記錄到了一次通話——一名男子被安排與在華盛頓特區(qū)的蘇聯(lián)大使進(jìn)行秘密會晤寡瘩。然而缔道,在約定的那天,調(diào)查局的特工們沒能看到究竟是誰進(jìn)入了大使館管书。當(dāng)時享甸,特工們沒有辦法僅根據(jù)他的通話聲音就查出他的名字,所以這個間諜得以繼續(xù)藏匿自己的身份梳侨,并在隨后的五年中蛉威,將一些美國機(jī)密項(xiàng)目的細(xì)節(jié)賣給了蘇聯(lián)。
直到 1985 年走哺,根據(jù)一名俄羅斯叛逃者提供的情報蚯嫌,F(xiàn)BI 才最終確定了當(dāng)時那名通話者為前美國國家安全局(NSA)分析員 Ronald Pelton。次年丙躏,Ronald Pelton 被判處間諜罪择示。
而今,F(xiàn)BI 和 NSA 的特工能夠在 Pelton 給蘇聯(lián)撥出第一個電話的幾秒內(nèi)識別出他的真實(shí)身份。NSA 2006 年 1 月的機(jī)密備忘錄顯示栅盲,NSA 的分析員使用了一種「用聲音識別人的技術(shù)」成功將 Pelton 以往的音頻文件與電話監(jiān)控相匹配汪诉。備忘錄中描述道:「如果這種技術(shù)早出現(xiàn) 20 年,那么將能夠提前發(fā)現(xiàn) Pelton 的間諜行為并實(shí)施抓捕谈秫,這將會大大減少 Pelton 對國家安全造成的重大損失扒寄。」
由前 NSA 雇員斯諾登提供的機(jī)密文件顯示私免,NSA 開發(fā)的技術(shù)不僅能夠?qū)⑺矫軐υ掁D(zhuǎn)為文本木冈,還能自動識別對話中的人。
美國人在喚醒亞馬遜的 Alexa 或者打電話給銀行的時候檀抡,經(jīng)常會使用到這種被稱為聲紋識別的技術(shù)演易。但是早在「Hello Siri」和「OK Google」這樣的語言指令走入尋常百姓家之前十年,NSA 就用這種聲紋識別技術(shù)來監(jiān)控恐怖分子层漠、政治家爱茫、毒梟、間諜甚至是一些普通政府機(jī)構(gòu)的雇員涨旨。
這種技術(shù)的原理在于分析個人聲音中獨(dú)特的物理和行為特征來區(qū)分不同人的聲音,例如發(fā)聲的音高拷拗、嘴型槽叮、咽部長度等。算法隨后會創(chuàng)建個人聲音特征的動態(tài)計(jì)算機(jī)模型涩霞,也就是通常所說的「聲紋」模型津贩。整個過程——捕捉所說的單詞、將單詞轉(zhuǎn)化為聲紋睦绍、并將這種表示與數(shù)據(jù)庫中其他的「聲紋」進(jìn)行對比——都可以在瞬間完成尝江。盡管我們已經(jīng)知道 NSA 依靠指紋和面部圖像來識別目標(biāo),但是根據(jù) 2008 年的一份機(jī)構(gòu)文件英上,聲紋才是「NSA 的統(tǒng)治地位所在」炭序。
我們不難看出原因。NSA苍日,無論獲得許可與否惭聂,截取了數(shù)以百萬計(jì)的美國公民的電話,甚至包括越洋電話相恃、視頻電話和互聯(lián)網(wǎng)電話辜纲,從而建立了一個無可比擬的聲紋庫。來自斯諾登提供的文件顯示拦耐,分析人員將部分人的錄音提供給聲紋識別算法之后耕腾,即使這些人在其他通話中使用未知的號碼、秘密代碼亦或是不同語言,算法都可以將其與已有的音頻相匹配扫俺。
早在伊拉克自由行動時苍苞,分析人員就使用聲紋識別技術(shù),證實(shí)了那些「疑似被廢黜的領(lǐng)導(dǎo)人薩達(dá)姆的錄音」確實(shí)是薩達(dá)姆本人核必,而不像公眾以為的那樣是偽造的茸汇。NSA 的備忘錄進(jìn)一步表明,NSA 分析員為本·拉登也構(gòu)建了聲紋荒鳖,「在幾次放送中居饵,他的聲音都十分明顯且一致」;與基地組織的現(xiàn)任領(lǐng)導(dǎo)人 Ayman al-Zawahri 以及基地組織的三把手 Abu Musab al-Zarqawi 有顯著不同末昂。他們也使用 Zarqawi 的聲紋從幾份網(wǎng)上發(fā)布的音頻中找到了他减严。
據(jù) 2004 年至 2012 年間的機(jī)密文件顯示,NSA 對其聲紋識別技術(shù)進(jìn)行了愈發(fā)復(fù)雜的迭代二蚓。文件證實(shí)了聲紋識別在反恐行動和緝毒行動中均獲使用肮碗。文件還建議更多國家機(jī)構(gòu)部署這項(xiàng)技術(shù),不僅僅是為了追溯像 Pelton 這樣的間諜停就,還為了防止像斯諾登這樣的舉報人出現(xiàn)始踪。
永遠(yuǎn)在聽的算法
(2015 年 3 月 4 日,一位男子倚在紐約的一個公共電話亭旁用智能手機(jī)打電話)
一些民權(quán)專家擔(dān)心聲紋識別技術(shù)和該技術(shù)的擴(kuò)展應(yīng)用將會侵害公民隱私颈癌。白宮前國家情報局局長顧問 Timothy Edgar 解釋說洁糟,「聲紋識別技術(shù)即創(chuàng)建了一種新的情報能力,一種容易被濫用的能力猖败∷倮拢」「我們的聲音代替我們本人穿越各種渠道完成溝通。在大眾監(jiān)控的時代恩闻,這種能力對我們所有人的隱私都有深遠(yuǎn)的影響艺糜。」
Edgar 和其他專家指出幢尚,相比于姓名破停、地址、密碼侠草、電話號碼和個人識別碼辱挥,人聲的相對穩(wěn)定性使得其難以被改變或偽裝。電子前線基金會(Electronic Frontier Foundation)的律師 Jamie Williams 表示边涕,這讓追蹤變得「容易的多」晤碘。「只要你能識別出某個人的聲音功蜓,」她表示园爷,「你就能在監(jiān)聽記錄或錄音中找到他們。」
聲音是一種獨(dú)特且易于獲取的生物特征:與 DNA 不同卷芜,它可以被動地被收集夷朽,且不受距離的限制,不需要目標(biāo)知悉或者征得他們的同意元粹。雖然識別的準(zhǔn)確度受到收音條件的相似性熄朴,但是在受控的環(huán)境中——低底噪、熟悉的聲學(xué)環(huán)境和良好的通信質(zhì)量——這種技術(shù)可以用寥寥幾句話就精確地匹配到個人勺激。計(jì)算機(jī)模型擁有的同一個人的不同聲音樣本越多雾鸠,模型就愈發(fā)強(qiáng)大,愈發(fā)「成熟」捎滴。
在商業(yè)環(huán)境中纪娄,聲紋識別技術(shù)與呼叫中心欺詐審查、與 Siri 等語音助理交談以及個人銀行業(yè)務(wù)密碼驗(yàn)證等任務(wù)關(guān)聯(lián)密切悉契。并且這種技術(shù)的用途正在逐漸增長启毁,根據(jù)市場研究公司 Tractica 的報告,到 2024 年憔辞,語音生物識別技術(shù)產(chǎn)業(yè)的收入預(yù)計(jì)將達(dá)到每年 50 億美元页衙,其用途將擴(kuò)展至邊境檢查站、醫(yī)療阴绢、信用卡支付和可穿戴設(shè)備中拷姿。
公民自由主義者的一個主要擔(dān)心在于,聲紋識別技術(shù)有可能使談話「冷卻」旱函。新聞自由基金會執(zhí)行董事 Trevor Timm 指出,可以假設(shè) NSA 的聲紋識別技術(shù)將會被用來追蹤記者描滔、揭露消息來源棒妨,攔截匿名消息等。雖然如今人們已經(jīng)知道在處理敏感材料時應(yīng)該加密自己的電話含长,但是 Timm 指出券腔,從電視機(jī)到耳機(jī)再到互聯(lián)網(wǎng)設(shè)備,能夠偷偷記錄聲音的渠道實(shí)在是不勝枚舉拘泞。Timm 說纷纫,我們 24 小時都會隨身攜帶一個麥克風(fēng),那就是我們的手機(jī)陪腌。我們知道政府有辦法侵入手機(jī)和計(jì)算機(jī)來打開這些麥克風(fēng)辱魁。
他繼續(xù)說道,「盡管斯諾登泄密事件之后叼稍,立法方面發(fā)生了很大變化轨赦,但美國人民對這種政府用來監(jiān)視全球數(shù)百萬人的工具仍然只有一個片面的理解。這是一個值得在公眾領(lǐng)域辯論的事情√阜遥」但是他指出徙祥,如果公眾對技術(shù)的使用缺乏有意義的認(rèn)識,這種爭論將會非常困難——甚至是否能存在都值得商榷式蠢。
一位前國防情報官員廉贤,因政策所限無法對機(jī)密文件進(jìn)行討論,匿名對 The Intercept 表示遥妒,他相信這種技術(shù)一直隱而不漏絕非偶然卧蒂。「政府避免討論這種技術(shù)圣界,正是因?yàn)樗岢隽艘恍﹪?yán)峻的問題更假,而這些問題政府不愿意回答,」這位官員如是說道贷币』魇ぃ「這是自 911 事件發(fā)生以來,對于我們個人及我們的權(quán)利的一項(xiàng)重要轉(zhuǎn)變役纹∨妓ぃ」而想要進(jìn)入技術(shù)監(jiān)控范圍,官員指出促脉,「你什么都不用做辰斋,張嘴說話就行了∪澄叮」
民權(quán)主義者擔(dān)心宫仗,如果沒有針對政府秘密收集我們的語音模式這一事項(xiàng)的公開討論以及監(jiān)督,我們可能會進(jìn)入一個越來越沉默的世界旁仿。
新型聲音工具
(2012 年 10 月 9 日藕夫,科羅拉多州博爾德,美國國家標(biāo)準(zhǔn)與技術(shù)研究院語音研究所(NIST)大樓)
2013 年開始枯冈,美國人就已經(jīng)知道 NSA 在大量收集國內(nèi)外的電話數(shù)據(jù)毅贮,但如何將原始數(shù)據(jù)轉(zhuǎn)化為有用情報這一技術(shù)仍然鮮為人知。2015 年尘奏,據(jù) The Intercept 報道炊捻,NSA 為處理政府收集的大量音頻建立了一系列「人類語言技術(shù)」。通過開發(fā)程序自動將語音翻譯成文本——分析員稱之為「語音版 Google」——政府部門可以使用關(guān)鍵詞和「選擇器」來搜索瓣挂、閱讀和索引錄音而不是派人親自去聽眨捶,從而節(jié)省了大量的人力。
從語音轉(zhuǎn)寫文字項(xiàng)目衍生的聲紋識別技術(shù)為分析員提供了一種額外的工具枪笆,使其可以將不計(jì)其數(shù)的戰(zhàn)區(qū)音頻進(jìn)行攔截與分類辜尝。NSA 和國防部斥巨資發(fā)展此技術(shù)并增加其可靠性毫蚁。數(shù)字時代之前,聲紋識別隸屬于法庭科學(xué)雳址。二戰(zhàn)期間析深,人類分析員對來自無線電的聲音頻率的可視化輸出進(jìn)行比較。根據(jù)《法庭聲紋識別》的作者 Harry Hollien 的說法敌痘,這些可以「閱讀語音」的機(jī)器——即語譜圖技術(shù)——甚至用來駁斥阿道夫•希特勒被暗殺并被人取代的謠言咨锐。
作為法庭聲紋識別標(biāo)準(zhǔn)化事宜的聯(lián)邦領(lǐng)導(dǎo)者,首席聲紋識別專家 James Wayman 解釋道:「聲紋可以被看到钢婆,」他指出系馁,雖然「聲紋」這個詞已經(jīng)被商業(yè)公司用爛了,但其實(shí)有一定的誤導(dǎo)性窟扑。因?yàn)椤讣y」意味著所捕獲的信息是物理的喇颁,而不是行為的。他說:「其實(shí)你所擁有的是軟件程序里的一個方程嚎货,能夠輸出不同的數(shù)字橘霎。」
這些方程已經(jīng)從簡單的求均值演變?yōu)閯討B(tài)算法模型殖属。自 1996 年依賴姐叁,NSA 資助了美國國家標(biāo)準(zhǔn)與技術(shù)研究院語音研究所(NIST),培養(yǎng)和測試「解決聲紋識別問題的最具主導(dǎo)性和前途的算法」洗显。與 NIST 一起測試系統(tǒng)的還有外潜,領(lǐng)先的生物識別公司和研究人員,其中有一些人獲得了 NSA 和國防部高級研究計(jì)劃局(DARPA)的資助挠唆。
NSA 一直對其聲紋識別項(xiàng)目三緘其口处窥,因此公眾很難知道它目前可以發(fā)揮多大的作用。但是考慮到 NSA 資助的學(xué)術(shù)研究所和私企間緊密的聯(lián)系玄组,從其他國家正在做的事情和供應(yīng)商正在銷售的東西可以大概估計(jì)出 NSA 的進(jìn)展碧库。
例如,行業(yè)領(lǐng)導(dǎo)者 Nuance 向政府功跑、軍事部門和情報部門推銷「一個全國范圍內(nèi)的生物聲紋識別系統(tǒng),能夠從包含數(shù)百萬聲紋的系統(tǒng)中快速準(zhǔn)確地識別并區(qū)分一個人的聲音」谤变。2014 年荞谬,美聯(lián)社報道說,土耳其最大的移動電話公司已經(jīng)使用 Nuance 的技術(shù)适系,用來收集 1000 萬左右用戶的語音數(shù)據(jù)字拗。
10 月份,人權(quán)觀察社(HRW)報道說高骑,中國政府正在建立一個國家級聲紋數(shù)據(jù)庫蝠盘,從而能夠自動識別電話中的人脾仁。政府旨在將成千上萬的人的語音生物信息與他們的身份證號碼、民族和家庭地址聯(lián)系起來苔免。據(jù) HRW 報道秕栓,制造中國語音軟件的公司甚至已經(jīng)給一個可以精確定位音頻文件用于「輿論監(jiān)督」的系統(tǒng)申請了專利,更启。
11 月邢入,根據(jù)國際刑警組織發(fā)布的新聞,由歐盟資助的一個國際聲紋識別的項(xiàng)目通過了最后的測試趴荸。來自 50 多個國家的 100 多名情報分析員儒溉、研究人員和執(zhí)法人員(其中包括國際刑警組織的探員,英國大都會警察局和葡萄牙司法系統(tǒng)的警察們)都來到了展示現(xiàn)場发钝,研究人員證明他們的方案可以識別「社交媒體上或合法截獲的音頻中說不同語言的未知發(fā)言者」顿涣。
The Intercept 查閱的 NSA 文件中描繪了一個類似地正在發(fā)展的系統(tǒng)的輪廓——在 9/11 事件之后的幾年里,這個系統(tǒng)的發(fā)展使得「語音分析員能夠在幾秒鐘內(nèi)對數(shù)百小時的語音剪輯進(jìn)行篩選酝豪,基于關(guān)鍵詞或說話者聲紋識別篩選出有用的信息涛碑。」
「戲劇性」結(jié)果
(2008 年 11 月 22 日寓调,一名 Sahwa 成員在巴格達(dá)市中心檢查站附近用手機(jī)通話)
NSA 聲紋識別技術(shù)的部分歷史可以通過閱讀信號情報局(SID)近十年的內(nèi)部通訊中重新構(gòu)建锌唾。刨除那些自吹自擂和刻意略過的部分,SIDtoday 的備忘錄詳細(xì)記錄了聲紋識別的轉(zhuǎn)變歷程——從一門需要人類審查員進(jìn)行的不太可靠的法庭科學(xué)到一個依賴大量的語音數(shù)據(jù)進(jìn)行的自動算法程序夺英。特別是晌涕,這些備忘錄著重說明了美國分析員與英國政府通訊總部(GCHQ)的同行們?nèi)绾蚊芮泻献魈幚韥碜砸晾撕桶⒏缓沟呐c反恐工作相關(guān)的大量錄音。GCHQ 雖然拒絕回答本文中涉及的具體細(xì)節(jié)痛悯,但在內(nèi)部通訊中自夸稱其系統(tǒng)「在與 NSA 的合作中發(fā)揮了重要作用」余黎。
雖然有時候很難區(qū)分 SIDtoday 總是在展望未來的信息發(fā)布和技術(shù)的實(shí)際進(jìn)展,但顯然凄在,至少自 2003 年以來才擒,NSA 一直在利用自動聲紋識別技術(shù)來定位和標(biāo)注「那些重點(diǎn)關(guān)注對象的語音消息」。一份 SIDtoday 的備忘錄解釋說舞懦,每當(dāng)一個聲音信號被攔截善瞧,聲紋識別技術(shù)就會為其建模,并將其與其他已知音源比較來回答這個問題:「這是我們一直在跟蹤的恐怖分子嗎毕蕉?是奧薩馬·本·拉登嗎蓬肢?」
但 NSA 的系統(tǒng)的功能遠(yuǎn)遠(yuǎn)不止回答「是」或者「不是」。在 2006 年的一系列通訊中乙笛,報道了一個名為「實(shí)時語音」(Voice RT)的項(xiàng)目魂中,這個系統(tǒng)不僅能在語音攔截中自動識別說話者身份,還能識別他們的語言刽室、性別和口音香题。分析員可以對攔截按上述類別進(jìn)行分類饶辆,通過關(guān)鍵字進(jìn)行實(shí)時搜索,并設(shè)置自動警報雌隅,在傳入的攔截符合某些標(biāo)簽的條件時通知他們翻默。一份 NSA 的 PPT 進(jìn)一步證實(shí),Voice RT 程序?qū)⑵洹笖z入」的伊拉克語音數(shù)據(jù)轉(zhuǎn)換為了聲紋澄步。
斯諾登提供的 NSA 備忘錄并沒有說明 Voice RT 的部署范圍冰蘑,而 GCHQ 的語音/傳真用戶組的會議記錄中提到了這一點(diǎn)。英國機(jī)構(gòu)的備忘錄中的詳細(xì)說明了 NSA 的聲紋識別計(jì)劃是如何針對外國目標(biāo)進(jìn)行部署的村缸。2007 年秋季祠肥,當(dāng)其語音/傳真用戶組在與 NSA 代表會面時,NSA 成員們介紹了一個高效的 Voice RT 系統(tǒng)梯皿,可以為語言學(xué)家和分析員提供說話者識別和語言類別識別能力仇箱,可以將語音轉(zhuǎn)換為文本和并搜索語音《「實(shí)質(zhì)上剂桥,」會議記錄將 Voice RT 描述為,「一個一站式商店……他們?yōu)榱颂岣呦到y(tǒng)的可部署性付出了大量的努力属提∪ǘ海」到 2010 年,NSA 的 Voice RT 程序可以處理超過 25 種外語的音頻冤议。在阿富汗僵馒,NSA 將語音分析和地圖軟件配合使用,定位那些講阿拉伯語的信號塔集群——用來發(fā)現(xiàn)新的基地組織訓(xùn)練營粪畔。
GCHQ 則使用了一個名為 Broad Oak 的項(xiàng)目绸秸,根據(jù)聲音來識別目標(biāo)者。英國政府在中東地區(qū)建立了聲紋識別系統(tǒng)支际,識別對象不乏沙特匠似、巴基斯坦、格魯吉亞和伊拉克的領(lǐng)導(dǎo)人蟹嫁。GCHQ 的會議記錄稱:「如果您認(rèn)為我們可以幫助您在海量信息流中找到您感興趣的目標(biāo)暗沉,請隨時與我們聯(lián)系,我們很樂意與您討論您的需求讹玉,并希望能夠提供一個迅速準(zhǔn)確的解決方案每贮。」
這不是一張空頭支票乡鼻。2009 年,在識別伊拉克副總統(tǒng)之一 Adil Abdul Mahdi 時栽斑,GCHQ 吹噓說他們比對手 NSA 做得要好艇挨〔信冢「由于我們一直以比他們更快的速度報告他(副總統(tǒng))的相關(guān)消息,NSA 已經(jīng)放棄參與其中 …… 此項(xiàng)良好的表現(xiàn)也提高了我們在 NSA 的聲譽(yù)缩滨∈凭停「2010 年,GCHQ 的研究概述顯示脉漏,兩個機(jī)構(gòu)就聲紋分析項(xiàng)目的聯(lián)合實(shí)驗(yàn)進(jìn)行了廣泛的合作苞冯。
但聲紋識別工具的發(fā)展并非一帆風(fēng)順。在其早期階段侧巨,這項(xiàng)技術(shù)遠(yuǎn)不如今天那么強(qiáng)大有效舅锄。前國防情報官員回憶說,雖然分析員能夠在他們的工作站播放語音樣本司忱,但由于音頻沒有編入索引皇忿,搜索重要的樣本是一個很大的挑戰(zhàn)。在 SIDtoday 發(fā)表的一封 2006 年的寫給編輯者的信中坦仍,一位分析員抱怨說語音工具的引入使其非常崩潰鳍烁,并將其初始速度比作「流淌在一月的糖漿」。
然而到了 2007 年堆嘿,聲紋識別技術(shù)已經(jīng)明顯成熟羞条。NSA 專門為伊朗總統(tǒng) Mahmoud Ahmadinejad 的紐約市聯(lián)合國大會之行建立的備忘錄中詳細(xì)列舉了該技術(shù)的實(shí)際功用。在獲得合法授權(quán)后氏走,分析員配置了一個專門的系統(tǒng)资妇,盡可能多的跟蹤 143 名伊朗代表的電話。在所有的這些傳入流量上技碍,他們運(yùn)行了語音活動檢測算法皇苫,以避免目標(biāo)在沒有說話的時候分析員浪費(fèi)時間跟蹤; 通過關(guān)鍵字來搜索「電子郵件地址的傳遞和重要人物的討論」云许;以及根據(jù)說話者聲紋識別來成功定位「包括伊朗外交大臣在內(nèi)的重要人士」的對話烈拉。
同年,NSA 在當(dāng)年格魯吉亞開設(shè)的一家新的音頻取證實(shí)驗(yàn)室在一份聲明中指出辣候,NSA 計(jì)劃將這些語音技術(shù)提供給整個機(jī)構(gòu)的更多分析員牛拭。2008 年 SIDtoday 的備忘錄報告稱系統(tǒng)的升級將允許分析員「找到目標(biāo)者與過去音頻匹配的新的音頻剪輯」。
當(dāng)目標(biāo)找出規(guī)避聲紋識別技術(shù)的策略時大熟,這些工具也會隨之進(jìn)化割扬。2007 年,分析員注意到偿荷,他們識別為基地組織的兩個目標(biāo)的攔截頻率超出了正常人的談話范圍窘游。在接下來的幾年中,分析員在也門跳纳,阿富汗忍饰,伊拉克和其他地方也發(fā)現(xiàn)了這種聲音經(jīng)過調(diào)制的目標(biāo)贪嫂。「這很有可能是為了避免被情報機(jī)構(gòu)識別」艾蓝。他們觀察到的一些音頻剪輯扭曲了說話者的音調(diào)力崇,所以聽起來像是「艾文和花栗鼠」在說話。分析員據(jù)此推測赢织,參與 2009 年 12 月企圖在底特律轟炸的 AQAP 成員通過使用全新的電話號碼和掩蓋自己聲音的方式逃脫了政府的識別亮靴。
2010 年,機(jī)構(gòu)的技術(shù)人員制定出了一個應(yīng)對這些調(diào)制聲音的解決方案——應(yīng)用 HLT Lite——一個用來搜索修改過或異常的聲音的軟件于置。SIDtoday 稱茧吊,該方案在掃描了 100 多萬條音頻后,在也門發(fā)現(xiàn)至少 80 個經(jīng)過修改的語音的例子俱两。據(jù)報道饱狂,這使機(jī)構(gòu)發(fā)現(xiàn)了同時使用幾個新電話號碼的目標(biāo)人物。
隨著系統(tǒng)能力的提升舶酒,他們的監(jiān)控范圍也在擴(kuò)大装魁。2010 年 9 月的一則通訊詳細(xì)介紹了墨西哥城升級的聲紋識別系統(tǒng)的「戲劇性」發(fā)展——網(wǎng)站的負(fù)責(zé)人稱,堪比相當(dāng)于一臺額外的掃描儀缰橘。通過在音頻攔截中搜索「bomba」這個詞逐程,分析員可以分離和檢測有關(guān)炸彈威脅的對話。
聲紋識別系統(tǒng)也可以很容易地通過重新配置赞拼,用在別的地方飒自。GCHQ 2008 年 10 月的會議記錄描述了一個「涉及阿富汗毒品交易的高層人員網(wǎng)絡(luò)」的建立過程,這個網(wǎng)絡(luò)后來被「投入到意想不到的應(yīng)用之中」璃锻。分析員甚至「在毒品流量較大的區(qū)域進(jìn)行了一次地毯式搜索」來識別更多的目標(biāo)秘驻。
從戰(zhàn)場上到機(jī)構(gòu)中
(服務(wù)器機(jī)房里的網(wǎng)絡(luò)設(shè)備)
NSA 很快意識到,他們的錄音處理能力可以用來識別 NSA 內(nèi)部的員工玫葡。正如 2006 年 1 月那篇討論 Ronald Pelton 的音頻的備忘錄所解釋的那樣戳明,「聲音匹配技術(shù)正被應(yīng)用到新提出的內(nèi)部威脅(Insider Threat)計(jì)劃中,企圖捉住『我們中的間諜』碴穴「郴溃」
在美國軍方告密者 Chelsea Manning 泄密之后,該計(jì)劃由奧巴馬政府公開宣布仰楚,其內(nèi)容是密切監(jiān)視政府雇員的生活隆判。但這份文件似乎表明,該舉措在 2011 年奧巴馬頒發(fā)行政命令之前就已經(jīng)開始實(shí)行了僧界。
據(jù)新聞自由基金會的 Trevor Timm 的分析侨嘀,NSA 將用于檢測外部威脅人員的生物技術(shù)運(yùn)用到檢測內(nèi)部成員中的異見人士身上這一手段并不新鮮。「在過去 15 年中咬腕,我們已經(jīng)看到了一連串這樣的例子:執(zhí)法機(jī)構(gòu)把那些侵犯式的埋哟、本來作用于恐怖分子身上的工具——無論是定位跟蹤還是人臉識別,或者是像這種聲紋識別技術(shù)——用于其它各種犯罪調(diào)查中郎汪。」
Timm 指出闯狱,在過去幾年中煞赢,告密者,情報人員以及記者都采取了更嚴(yán)密的安全措施來避免暴露身份哄孤。但是照筑,「如果記者使用的電話號碼并未與其身份關(guān)聯(lián),那么政府就會通過許可證等方式來掃描他們通話旅霍,這項(xiàng)技術(shù)也將潛在被用于抑制新聞業(yè)的發(fā)展诽矩。」
對于情報圈的民權(quán)律師第一人 Timothy Edgar 來說铣翁,這些「風(fēng)險」可以歸為這樣一個問題:「他們是在尋找正當(dāng)目標(biāo)租触,還是在濫用權(quán)力?比如試圖監(jiān)控記者或告密者這樣的做法供馍?」
Edgar 說蔽宜,在某些方面,聲紋識別或有助于保護(hù)個人隱私刽软。這項(xiàng)技術(shù)允許分析員來篩選電話苫颤,這樣他們就可以專注于目標(biāo)人物的聲音,從而剔除掉其他人的聲音奏散。一份 2010 年度的 SIDtoday 備忘錄強(qiáng)調(diào)俯坐,通過確保「該名說話人是某國領(lǐng)導(dǎo)人而非甜甜圈店的某個服務(wù)員剩喧,」該技術(shù)可以降低情報人員所需監(jiān)聽的通話量寺晌。
「事實(shí)上,」這一級別的精確度码邻,成為了「NSA 解釋當(dāng)初大量收集元數(shù)據(jù)的做法的擋箭牌」折剃,Edgar 解釋說∠裎荩「他們?yōu)轫?xiàng)目進(jìn)行辯護(hù)的手段之一怕犁,就是自稱沒有收集所有的數(shù)據(jù),而是通過篩選器來收集信息己莺∽喔Γ」
同時,從大量數(shù)據(jù)中識別特定個體的目標(biāo),常常證明了繼續(xù)收集更多數(shù)據(jù)的必要性阵子。識別可以幫助分析人員縮小電話接聽的范圍思杯,但這項(xiàng)技術(shù)似乎會鼓勵他們在更大范圍內(nèi)進(jìn)行搜索,因?yàn)楸举|(zhì)上這項(xiàng)任務(wù)的目標(biāo)是監(jiān)聽目標(biāo)聲音出現(xiàn)的對話挠进,無論他用什么號碼撥出色乾。或如 Pelton 備忘錄所指出的那樣皇驼,這項(xiàng)技術(shù)使得分析員能夠「在任何地方辨別出那個聲音圾框。」
雖然這些文件表明畦怒,該機(jī)構(gòu)確實(shí)試圖在其員工身上運(yùn)用這項(xiàng)技術(shù)残团,但 The Intercept 所查閱的文件并沒有明確表明,該機(jī)構(gòu)是否已經(jīng)在美國普通公民的對話數(shù)據(jù)中進(jìn)行聲紋創(chuàng)建桶邑。
外國人情報監(jiān)視法案(Foreign Intelligence Surveillance Act画眯,F(xiàn)ISA)規(guī)定,機(jī)構(gòu)可以自由收集在國外服務(wù)器和基礎(chǔ)設(shè)施上傳輸?shù)囊纛l數(shù)據(jù)务囤,以及美國人與外國人的語音交流數(shù)據(jù)灌当。因?yàn)轫?xiàng)規(guī)定,Edgar 稱快挡,越洋電話「基本上」是被系統(tǒng)錄過聲紋了临辨。「如果他們沒對越洋電話使用這些技術(shù)手段现蹂,我才會感到驚訝筏拢。在某種程度上,這就是他們的工作內(nèi)容凑懂∶汉郏」
然而專家們對「NSA 是否有權(quán)利在沒有許可的情況下掃描美國公民在美國領(lǐng)土上進(jìn)行的通話并制作聲紋」這一議題表現(xiàn)出了分歧的態(tài)度。這種分歧部分源自監(jiān)督相關(guān)法律的不完備接谨,這方面的法律未能跟上聲紋與語音識別等數(shù)字技術(shù)的發(fā)展摆碉。
雖然美國已經(jīng)制定了嚴(yán)格的法律,禁止在沒有許可證的情況下對美國領(lǐng)土上進(jìn)行的電話內(nèi)容進(jìn)行記錄脓豪,但也沒有任何聯(lián)邦機(jī)構(gòu)負(fù)責(zé)監(jiān)管聲音數(shù)據(jù)的采集和處理事宜巷帝。
監(jiān)管缺失的部分原因是,雖然政府需要許可才能獲得「內(nèi)容」扫夜,但聲紋應(yīng)該被歸類為「內(nèi)容」嗎楞泼?或者像 NSA 聲稱的那樣,聲紋不過是「元數(shù)據(jù)」——這部分信息所受的法律保護(hù)就少多了笤闯。在這個問題上堕阔,法律基本上沒有做對這部分信息做任何具體的規(guī)定棍厂,這導(dǎo)致一些專家推測,NSA 正在利用這一法律灰色地帶實(shí)行聲紋建立超陆。
針對一系列詳細(xì)的問題牺弹,NSA 給出了如下的回應(yīng):「根據(jù)長期政策,NSA 將不確認(rèn)也不否認(rèn)該文所指的涉及的美國政府信息的準(zhǔn)確性战架≡倚拢」
無所不用其極
星期四,參議院投票通過擴(kuò)大外國人情報監(jiān)視法案(FISA)的 702 條咸壮,這使得 NSA 有權(quán)對那些與外國人溝通的美國人進(jìn)行暗中監(jiān)視叛榆,且不需要許可證。這種再授權(quán)行為鄙骏,與上周在眾議院的行動類似,證實(shí)了那些評論家的觀點(diǎn)服半,他們認(rèn)為 NSA 對其法律權(quán)力的解釋整日益強(qiáng)硬——同時日益模糊碗冈。
計(jì)算機(jī)科學(xué)家和監(jiān)控研究專家 Andrew Clement 在斯諾登披露相關(guān)信息之前就已經(jīng)在調(diào)查 NSA 的無許可竊聽活動。他堅(jiān)信滤灸,該機(jī)構(gòu)對美國公民的聲紋識別的利用并未收到任何限制怪褐。他解釋說,該機(jī)構(gòu)經(jīng)常選擇將收集到的所有信息進(jìn)行分類翁旁,直到達(dá)到人類分析員能夠?qū)⑵渥鳛樵獢?shù)據(jù)來進(jìn)行聽或讀為止蝠欲。「那只是一個巨大的漏洞倦微,」他解釋說妻味,「看來,他們會把通過算法方式從內(nèi)容中獲取到的任何信息欣福,都簡單地歸類為元數(shù)據(jù)责球。」
Clement 類比了 NSA 對待電話號碼和電子郵件地址的方式拓劝,來類比 NSA 會如何將建立聲紋的行為合法化雏逾。斯諾登在 2013 年披露的 XKeyscore 項(xiàng)目,就允許工作人員從截獲的電郵中提取出電郵地址(它們被歸類為元數(shù)據(jù))郑临。這些工作人員還可以對關(guān)鍵字進(jìn)行全文搜索栖博,它們同樣被歸類為上下文信息而不是內(nèi)容。
然而 Edgar 認(rèn)為厢洞,如果政府把我們的聲音也算作元數(shù)據(jù)仇让,那么他會大吃一驚∠洌「你可以試著辯解說妹孙,聲音特點(diǎn)不等于說話內(nèi)容,」Edgar 說,「但是為了做聲紋識別肢姜,你還是得收集一通國內(nèi)電話的內(nèi)容主渤,并對其進(jìn)行分析以便提取出聲音〕酃耄」
目前還不知道 NSA 收集瘪叉、取樣或保留了多少國內(nèi)的通話內(nèi)容。但 EFF 的 Jamie Williams 指出呕豪,NSA 不一定非得通過收集美國人的電話錄音來制作美國人的聲紋庫药扒,因?yàn)槊駹I企業(yè)就一直在記錄我們的聲音。他們正擁有越來越多的音頻資源糯档。汽車隙殴、恒溫器、冰箱蜡幼、電燈泡掷栋,甚至是垃圾桶,都已變成了「智能的」(即互聯(lián)網(wǎng)化的)語音設(shè)備嗓万。Gartner 預(yù)測邦鲫,今年有三分之一的人機(jī)交互將通過與語音系統(tǒng)的對話來進(jìn)行。最近神汹,Google 和亞馬遜的「智能音箱」都推出了聲紋識別系統(tǒng)庆捺,用以區(qū)分家庭成員的聲音∑ㄎ海「一旦公司擁有這些聲音數(shù)據(jù)滔以,」Williams 說,「在理論上氓拼,執(zhí)法機(jī)構(gòu)就能拿到它醉者,只要他們有一個有效的法律程序∨」
這位前政府官員指出撬即,原始語音數(shù)據(jù)可以存儲在民營企業(yè)那里,并供 NSA 通過秘密協(xié)議進(jìn)行訪問呈队。比如在 Fairview 計(jì)劃中剥槐,該機(jī)構(gòu)與 AT&T 是合作伙伴關(guān)系。盡管美國國會試圖控制 NSA 對國內(nèi)電話記錄的收集行為宪摧,但該機(jī)構(gòu)一直在尋求獲得我們提供給企業(yè)數(shù)據(jù)庫的原始數(shù)據(jù)助潭。(例如與 Verizon 和 AT&T 的合作伙伴關(guān)系,對 Xbox 游戲系統(tǒng)的滲透连欲,以及對萬千網(wǎng)友的在線元數(shù)據(jù)的暗中收集打且,這些只是幾個最近的例子宠录。)「電信公司持有數(shù)據(jù),而沒有什么可以阻止他們運(yùn)行一個算法帘战,」這位前官員說祸麸。
Clement 想知道的是,對于 NSA 而言斑永,可能聲紋識別能力比其內(nèi)容識別能力更為重要椭斜。「這可以讓他們把你和你自己的其他身份聯(lián)系起來蛀埂,并確定你和其他人的關(guān)系揣煤,」他說。
這似乎才是 NSA 的最終目標(biāo)盾轮。在 2010 年的一次關(guān)于「一次前所未有的機(jī)會凉适,了解 NSA 如何將其創(chuàng)造性的能量用于個人跟蹤」的會議上,NSA 的高層領(lǐng)導(dǎo)談到如何將「全生活(whole life)」戰(zhàn)略納入他們的目標(biāo)糙箍。他們描述了將生物特征數(shù)據(jù)(比如聲紋)與傳記資料(如社交網(wǎng)絡(luò)和個人歷史)進(jìn)行整合的需求恨锚。用該機(jī)構(gòu)自己的話說,「一切都是關(guān)于在空間和時間上進(jìn)行個人定位倍靡、跟蹤和維護(hù)的連續(xù)性。我們不局限于傳統(tǒng)的通訊方式——我們無所不用其極课舍∷鳎」