深度解密蘋果人工智能:不止有Siri,還有iBrain
matthew 2016.08.26 08:55 人工智能概念股
說到蘋果公司的人工智能技術(shù)你能想到什么?可能是Siri,但并不會覺得它多么的有科技感。實際上,蘋果在人工智能的發(fā)展一直不被外界所知,Backchannel主編Steven Levy近日走訪了蘋果,帶你了解蘋果在人工智能上的一切。
眼下最受關(guān)注的技術(shù)非人工智能莫屬,但全球市值最高的公司蘋果似乎對此無動于衷,被認為在人工智能領(lǐng)域嚴重落后,除了語音助手Siri,似乎沒有更多作為。但真實情況或許與外界猜測的完全不同,閱讀本文你可以迅速了解蘋果哪些產(chǎn)品已被機器學(xué)習(xí)入侵,為何它能秘密研發(fā)新技術(shù)多年,機器學(xué)習(xí)給其文化和原則帶來了怎樣的挑戰(zhàn),它又是如何與主流業(yè)界“對著干”……
眼下最受關(guān)注的技術(shù)非人工智能莫屬,但全球市值最高的公司蘋果似乎對此無動于衷,被認為在人工智能領(lǐng)域嚴重落后,除了語音助手Siri,似乎沒有更多作為。但真實情況或許與外界猜測的完全不同,Backchannel主編Steven Levy近日走訪了蘋果,發(fā)現(xiàn)這家公司其實先于業(yè)界使用了時髦的深度學(xué)習(xí)技術(shù),并將其用在了除Siri外的方方面面。閱讀本文你可以迅速了解蘋果哪些產(chǎn)品已被機器學(xué)習(xí)入侵,為何它能秘密研發(fā)新技術(shù)多年,機器學(xué)習(xí)給其文化和原則帶來了怎樣的挑戰(zhàn),它又是如何與主流業(yè)界“對著干”……
一
2014年6月30日,Siri迎來了一次腦部移植。
再三年前,蘋果是第一家將智能助理整合進其操作系統(tǒng)的主流公司。而Siri則是蘋果對一個收購而來的獨立應(yīng)用的改進,它還在2010年吞下了開發(fā)團隊。對于Siri,最初的評價令人欣喜,但后來的幾個月到幾年中,用戶對它的缺點越來越不耐煩。它常常錯誤理解指令,怎么調(diào)整也沒沅改進。
所以在上面提到的那個日期,蘋果將Siri的語音識別移植到了基于神經(jīng)網(wǎng)絡(luò)的系統(tǒng)上。這一服務(wù)首先面向美國用戶,并在8月15日推向全球。一些早期技術(shù)仍有用,包括隱馬爾可夫模型,但現(xiàn)在系統(tǒng)使用的是機器學(xué)習(xí)技術(shù),包括DNN(深度神經(jīng)網(wǎng)絡(luò)),卷積神經(jīng)網(wǎng)絡(luò),長短期記憶單位,封閉復(fù)發(fā)性單位(gated recurrent units),以及n-grams等。用戶升級后,Siri雖然看起來還是一樣,但經(jīng)過了深度學(xué)習(xí)的加強。
與其它底層改進一樣,由于不愿向競爭者暴露自己,蘋果沒有公布Siri的進展。如果用戶注意到了什么,也只是它犯的錯變少了。蘋果也表示,準(zhǔn)確度的改善令人震驚。
Eddy Cue
蘋果互聯(lián)網(wǎng)軟件及服務(wù)部高級副總裁Eddy Cue表示,“這次改進的效果如此明顯,以至于進行了重新測試,確保沒人算錯小數(shù)點?!?/p>
Siri轉(zhuǎn)變的故事會讓人工智能領(lǐng)域的人皺起眉頭,不是因為神經(jīng)網(wǎng)絡(luò)對系統(tǒng)的提升,而是因為蘋果對技術(shù)如此熟練又如此低調(diào)。直到最近,雖然蘋果在AI領(lǐng)域加大了招聘力度,也做出了一些高調(diào)的收購,但外界還是認為它在最為激烈的AI競爭中稍顯落后。由于蘋果一直守口如瓶,連AI行家也不知道它在機器學(xué)習(xí)上有何作為。在斯坦福教授人工智能歷史一課的Jerry Kaplan表示,“蘋果不屬于社區(qū)的一分子,就像是AI領(lǐng)域的NSA(美國國家安全局)”。一般認為,如果蘋果的努力與Google和Facebook一樣認真,應(yīng)該會被外界所知。
艾倫AI研究所的Oren Etzioni表示,“Google、Facebook和微軟有著頂尖的機器學(xué)習(xí)人才。蘋果確實聘用了一些人,但機器學(xué)習(xí)的五大領(lǐng)袖中有誰為蘋果工作?蘋果有語音識別技術(shù),但除此之外機器學(xué)習(xí)還能幫什么忙呢。”
二
然而,就在本月初,蘋果秘密地展示了機器學(xué)習(xí)在自家產(chǎn)品上的應(yīng)用。但沒有展示給Oren Etzioni看,而是展示給了我。當(dāng)天,我的大部分時間都待在了蘋果庫比提諾飛船總部大樓里,在蘋果高管的陪同下,感受了蘋果產(chǎn)品在人工智能與機器學(xué)習(xí)上的緊密結(jié)合。(高管包括Eddy Cue,副總裁兼市場營銷主管Phil Schiller,以及軟件主管兼高級副總裁Craig Federighi)同時在場的還有負責(zé)開發(fā)Siri的專家。當(dāng)我們都就坐以后,他們給我看了寫滿了兩頁紙的機器學(xué)習(xí)應(yīng)用,一些是已經(jīng)投入使用的產(chǎn)品或服務(wù),一些是還在討論中的項目。
如果你是一名iPhone用戶,大概已經(jīng)受益于機器學(xué)習(xí)所帶來的用戶體驗的提升。但與直覺相反,機器學(xué)習(xí)并不僅僅應(yīng)用于Siri上。識別陌生來電,在解鎖后列出你最常使用的應(yīng)用,或者在提醒事項中標(biāo)記了一個約會(但你并沒有將之放入日程表中),以及自動顯示附近標(biāo)記的酒店,這些在蘋果全面擁抱機器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)后,都能做得更加盡善盡美。
對,這就是傳說中的“Apple Brain”,已經(jīng)內(nèi)置于你的iPhone中。
用到了神經(jīng)網(wǎng)絡(luò)的面部識別
“機器學(xué)習(xí)”,一名專家說,“現(xiàn)在在蘋果的產(chǎn)品及服務(wù)里無處不在”。Apple store使用深度學(xué)習(xí)辨別騙保行為,公測版操作系統(tǒng)收到的反饋也會使用人工智能篩選一遍,找出有用的反饋報告。還有蘋果的News應(yīng)用,采用機器學(xué)習(xí)挑選出你可能感興趣的新聞源。
Apple Watch也利用到了機器學(xué)習(xí),檢測用戶在鍛煉狀態(tài)還是僅僅在閑逛。還有就是眾所周知的相機人臉識別,iPhone早已搭載這項技術(shù)。在Wi-Fi信號較弱的情況下,出于電量考慮,iOS還會建議你使用蜂窩網(wǎng)絡(luò)。它甚至能分辨出拍攝視頻的好壞,并在點擊一個按鈕之后,快速把一組相關(guān)的視頻剪輯到一起。當(dāng)然,這些蘋果的競爭對手們做的也不賴,但高管們強調(diào),蘋果是唯一一家在用戶隱私及用戶體驗上取得平衡的公司。當(dāng)然,要在 iOS 設(shè)備上達到這一標(biāo)準(zhǔn),也只有蘋果能做到。
對蘋果來說,人工智能并非新玩意兒。早在上世紀90年代,蘋果推出牛頓(Newton)平板時,配套的觸控筆就采用了一定程度的人工智能,用以識別用戶輸入的字符。這一研究成果目前還在為蘋果帝國發(fā)光發(fā)熱,即Apple Watch上面的中文字符識別系統(tǒng)。這一系統(tǒng)允許用戶輸入極為潦草的筆劃仍能精準(zhǔn)識別。(這些功能數(shù)十年以來都是由統(tǒng)一的機器學(xué)習(xí)團隊在研發(fā))當(dāng)然,早期的機器學(xué)習(xí)極為原始,現(xiàn)在大行其道的深度學(xué)習(xí)在當(dāng)時仍處于襁褓之中。
現(xiàn)在人工智能與機器學(xué)習(xí)成為人必言之的顯學(xué),蘋果在這方面一直飽受批評。近幾周,Tim Cook終于發(fā)話,表示蘋果并非在人工智能方面沒有著力,僅僅是宣傳較少?,F(xiàn)在,高管們終于已改悶聲做事的做法,將蘋果在人工智能方面的成果公之于眾。
機器學(xué)習(xí)用于Apple Watch的健康應(yīng)用
“蘋果在過去的五年里增長迅猛”,Phil Schiller說,“我們的產(chǎn)品的改進速度也非??欤珹系列的處理芯片每年都有不小的性能突破,這使得我們擁有更加充裕的性能,將越來越多的機器學(xué)習(xí)技術(shù)應(yīng)用到終端產(chǎn)品上。機器學(xué)習(xí)有不少好東西,而我們也有能力用好它”。
即使蘋果擁抱機器學(xué)習(xí)的熱情絲毫不亞于任何硅谷科技公司,但他們對于機器學(xué)習(xí)的使用仍是克制的。這幫庫比提諾的天才們并不認為機器學(xué)習(xí)是解決一切問題的靈丹妙藥。人工智能是未來的交互方式,但觸摸屏幕,平板電腦,面向?qū)ο缶幊淘谔囟〞r期一樣發(fā)揮了相同的作用。在蘋果看來,機器學(xué)習(xí)并非其他公司所說,是人機交互的終極答案。
“人工智能與以往改變?nèi)藱C交互的各種媒介并無本質(zhì)區(qū)別”,Eddy Cue 說。蘋果對于機器是否將取代人類這樣老生常談的討論也并無興趣。與預(yù)期相同,蘋果并沒有承認造車計劃,也沒有談及自制電視劇的傳言,但蘋果的工程師們明確指出,他們不會造出類似“天網(wǎng)”的東西。
“我們使用技術(shù)來解決以前做不了的事情,已經(jīng)改進舊有范式”,Schiller說,“我們確保每項技術(shù)都能以最蘋果的方式應(yīng)用到產(chǎn)品上”。
之后,他們對于上述觀點展開了進一步的闡釋。如,人工智能在多大程度上重塑了蘋果的生態(tài)系統(tǒng)。蘋果研發(fā)人工智能的初衷是,彌補缺乏搜索引擎帶來的用戶體驗缺失。(搜索引擎能夠訓(xùn)練神經(jīng)網(wǎng)絡(luò),使其快速成熟)此間,高管們再次強調(diào)了蘋果對于保證用戶隱私的決心。(即使這樣將限制用戶數(shù)據(jù)的使用,從而阻礙機器學(xué)習(xí)的效果)高管們強調(diào),這些障礙并非不可逾越。
這個“大腦”有多大?iPhone上有多少用戶數(shù)據(jù)緩存可供機器學(xué)習(xí)調(diào)用?工程師們的回答讓我驚訝:“平均200Mb,具體多少取決于用戶信息的多寡?!保楣?jié)約存儲空間,緩存會時不時被清理出去)。這些信息包括了應(yīng)用的使用習(xí)慣,與他人的交互,神經(jīng)網(wǎng)絡(luò)處理,還有“自然語言模型”。還有對象識別,人臉識別,場景識別等供神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)。
對于蘋果來說,這些數(shù)據(jù)都是你的私人信息,并不會被上傳到網(wǎng)絡(luò)及云端。
三
盡管蘋果并沒有對其在人工智能方面的努力做出任何解釋,但我還是成功獲取了有關(guān)公司內(nèi)部如何分配機器學(xué)習(xí)技術(shù)的決議。其機器學(xué)習(xí)智能可以在全公司得到共享,并且公司鼓勵生產(chǎn)團隊利用這一技術(shù)來解決問題,并發(fā)明一些更具特色的個性化產(chǎn)品?!霸谔O果,我們并沒有一個單獨集中負責(zé)機器學(xué)習(xí)技術(shù)的組織”,Craig Federighi說:“我們盡力保持各個團隊之間的緊密合作,力圖應(yīng)用這一技術(shù)創(chuàng)造出良好的用戶體驗。”
那么在蘋果有多少人在從事機器學(xué)習(xí)這一塊的工作呢?“有很多”,F(xiàn)ederighi在受到一些刺激之后說道。(如果你認為他會告訴我具體數(shù)字,那說明你還不了解蘋果)有趣的是,負責(zé)蘋果機器學(xué)習(xí)的許多人,在進入蘋果公司之前,并沒有受到過這方面的必要訓(xùn)練?!拔覀児陀玫娜瞬哦际窃谝恍┗绢I(lǐng)域方面十分厲害的人,比如像數(shù)學(xué),統(tǒng)計學(xué),程序設(shè)計語言,密碼學(xué)等?!?Federighi說:“結(jié)果表明,這些核心的智能能夠完美地轉(zhuǎn)換為機器學(xué)習(xí)智能。盡管現(xiàn)在我們的確雇用了許多機器學(xué)習(xí)人才,但我們還是希望能找到具有良好核心資質(zhì)和才能的人才?!?/p>
Craig Federighi(左)與Alex Acero
盡管Federighi并沒有說,但這一途徑似乎不可避免:蘋果喜歡保密,而競爭對手們則鼓勵計算機科學(xué)家將他們的研究在全球范圍內(nèi)共享,這樣一來,蘋果便會處于不利地位?!拔覀兊膶嵺`更傾向于強化自然選擇——其實就是兩種不同類型人之間的對抗,一種喜歡通過團隊合作,進而創(chuàng)造出偉大的產(chǎn)品,而另一種則是將公布產(chǎn)品和技術(shù)作為他們的首要動力”,F(xiàn)ederighi說。如果科學(xué)家們在提升某一蘋果產(chǎn)品性能的同時,又恰巧在這一領(lǐng)域取得了重大突破,那真是再好不過了?!暗菍ψ罱K結(jié)果的幻想為我們提供了巨大動力。”Cue說。
蘋果在這方面的一些才能也來自于不斷的收購?!白罱荒陼r間,我們已經(jīng)購買了20到30家公司。這些都是相對較小而又真正需要人力的公司?!盋ue 說。“當(dāng)蘋果買下一個人工智能公司時,這里肯定會有大量的機器學(xué)習(xí)研究員,但我們不會是穩(wěn)定住這些人” ,F(xiàn)ederighi說:“我們關(guān)注的是那些自身十分有才能,但又能真正注重實現(xiàn)絕佳體驗的人?!?/p>
最近的一次收購是位于西雅圖的Turi公司,蘋果最終以2億美元的價格收購。該公司建立了一個機器學(xué)習(xí)工具包,一直以來都被比作是Google的TensorFlow。此次收購給蘋果提供了一種不同的思索,即可以將它用作類似的用途,既用于公司內(nèi)部,也可以提供給開發(fā)商?!翱梢钥隙ǖ氖牵麄兊挠行┦虑楹吞O果十分匹配,無論是從技術(shù)的角度還是從個人的角度來看,都是如此。”Cue說。在一年或兩年的時間里,或許我們就能弄清楚發(fā)生了什么。蘋果在2013年收購了一家小的初創(chuàng)企業(yè)Cue,后來Siri開始顯示出一些預(yù)測能力。
無論這些才能來自哪里,蘋果的人工智能基礎(chǔ)建設(shè)有助于其開發(fā)出全新的產(chǎn)品和功能,而這通過以前的手段都是不可能做到的。這正在改變著公司的產(chǎn)品線路圖?!艾F(xiàn)在在蘋果,炫酷的想法簡直層出不窮,永無止境?!?Schiller說:“機器學(xué)習(xí)正在使我們對一些事情給予肯定的看法,而這些事情放在過去幾年,我們是絕對會說不的。它正在不斷深入到我們的決策當(dāng)中,決定著我們下一批產(chǎn)品的走向?!?/p>
iPad Pro的Apple Pencil就是一個例子。為了發(fā)明出一支高科技的觸控筆,蘋果不得不面臨這樣一個問題,即當(dāng)人們在設(shè)備上寫字的時候,他們的手掌底部難免會擦到屏幕,造成各種觸控失靈。這時,使用“防手掌誤觸”這樣一個機器學(xué)習(xí)模式,就能很好的解決這一問題。因為該模式能夠使屏幕傳感器感受到刮擦,觸摸和筆觸之間的區(qū)別,大大提升了觸控筆操控的精確度?!叭绻|控筆無法在iPad上進行完美操作,那么iPad就不能被看作是一張很好的可供我繼續(xù)寫字的紙,Pencil也就不會是一個好的產(chǎn)品?!?Federighi說。所以如果你愛Apple Pencil的話,那就請感謝機器學(xué)習(xí)吧。
四
對蘋果機器學(xué)習(xí)方面進展的最佳測量方式,或許來自它在AI上最重要的收購:Siri。Siri最初誕生自DARPA在智能助理上的一項計劃,后來部分科學(xué)家成立了一家公司,用同樣的技術(shù)開發(fā)了一款應(yīng)用。2010年,喬布斯親自說服公司創(chuàng)始成員將公司出售給蘋果,并指示將Siri整合進操作系統(tǒng)。在2011年10月iPhone 4S的發(fā)布會上,Siri是一大點亮。現(xiàn)在它早已不是用戶長按Home鍵,或發(fā)出“Hey, Siri”指令進行喚醒(這一功能本身也使用了機器學(xué)習(xí),允許iPhone在不耗電的情況下了解周圍情況)這么簡單了。Siri的智能整合進了Apple Brain,即便不發(fā)場時也在工作。
作為核心產(chǎn)品而言,Cue提到了四個組成:語音識別(理解你何時與它對話),自然語言理解(理解說話內(nèi)容),執(zhí)行(滿足查詢或請求)以及響應(yīng)(產(chǎn)生回話)?!皺C器學(xué)習(xí)對所有這些都有重要影響。”
Tom Gruber(上)與Alex Acero
Siri高級研發(fā)部主管Tom Gruber是在最初的收購后加入了蘋果的,他表示,在蘋果把神經(jīng)網(wǎng)絡(luò)用于Siri之前,其用戶量已經(jīng)在產(chǎn)生大量數(shù)據(jù),而這對訓(xùn)練神經(jīng)網(wǎng)絡(luò)十分重要。“喬布斯說,一夜之間就會擁有數(shù)百萬用戶,還不用公測。突然之間就會有用戶,他們會告訴你,人們?nèi)绾闻c應(yīng)用對話。這是第一次革命,那之后神經(jīng)網(wǎng)絡(luò)時代到來了。”
隨著Siri轉(zhuǎn)移到用神經(jīng)網(wǎng)絡(luò)處理語音識別而來的,還有幾位AI專家,其中包括現(xiàn)在語音組的主管Alex Acero。Acero的語音識別經(jīng)歷始于90年代的蘋果,后來他在微軟研究院工作了多年。“我喜歡這類工作,也發(fā)表了很多論文。當(dāng)Siri出現(xiàn)時,我意識到這是讓深度神經(jīng)網(wǎng)絡(luò)應(yīng)用得以實現(xiàn)的機會,不是讓幾百人用,而是讓數(shù)百萬人用。”換句話說,他就是蘋果想找的那類科學(xué)家——優(yōu)先考慮產(chǎn)品而非發(fā)表論文。
當(dāng)Acero在三年前加入時,Siri用的語音技術(shù)仍基本來自第三方的授權(quán),而這種情況必須改變。Federighi意識到,這是蘋果不斷在重復(fù)的一種模式?!半S著一項技術(shù)對開發(fā)核心產(chǎn)品變得越來越重要,我們會讓內(nèi)部逐漸接手開發(fā)。要開發(fā)偉大的產(chǎn)品,我們希望內(nèi)部擁有技術(shù),并在內(nèi)部創(chuàng)新,語音識別就是一個很好的例子?!?/p>
團隊開始訓(xùn)練神經(jīng)網(wǎng)絡(luò),以替代Siri早前的技術(shù)。蘋果的GPU集群不停運轉(zhuǎn),調(diào)用了大量數(shù)量。2014年7月的發(fā)布證明,所有努力都沒有白費。
Acero表示,“當(dāng)時在所有語言上,錯誤率降低了兩倍,在很多場景下還不止如此。這都要歸功于深度學(xué)習(xí)及對它的優(yōu)化,不僅是算法方面,更是在產(chǎn)品開發(fā)的整個過程上?!?/p>
蘋果不是第一家在語音識別中使用DNN的公司,但它證明,控制整個運轉(zhuǎn)系統(tǒng)會產(chǎn)生優(yōu)勢。Acero表示,正是因為蘋果自己設(shè)計芯片,他能直接與編寫固件的芯片設(shè)計組工程師合作,最大化提升神經(jīng)網(wǎng)絡(luò)的性能。Siri團隊的需求甚至影響了iPhone設(shè)計的方方面面。
Fdferighi表示,“不僅僅是芯片,還涉及設(shè)備上的麥克風(fēng),以及麥克風(fēng)安裝的位置,還有如何調(diào)整硬件,以及處理音頻的軟件棧。這需要所有組件的協(xié)調(diào),比起只是開發(fā)軟件的公司,有著驚人的優(yōu)勢?!?/p>
另一個優(yōu)勢是,當(dāng)蘋果的神經(jīng)網(wǎng)絡(luò)在一個產(chǎn)品上成功時,還能成為其它產(chǎn)品的核心技術(shù)。機器學(xué)習(xí)讓Siri理解了用戶,也讓輸入方式由手動變成了聽寫。也正是因為Siri的技術(shù),用戶語音輸入的信息也變得更流暢和完整。
Cue提到的Siri第二個部分是自然語言理解。Siri在2014年11月開始用機器學(xué)習(xí)理解用戶的意圖,并在一年后推出了深度學(xué)習(xí)版。如在語音識別上一樣,機器學(xué)習(xí)提升了體驗,特別是在理解指令上。
蘋果認為,沒有Siri上的技術(shù),它不太可能開發(fā)出最新版的Apple TV,因為后者也有語音控制功能。盡管早期的Siri版本要求你用清晰的方式說話,但深度學(xué)習(xí)加強版不僅能從大量電影和音樂中找到特定的選擇,更能處理“播放一部湯姆·漢克斯主演的優(yōu)秀驚悚片”這樣的概念。這在以前是完全不可能的。
在即將正式發(fā)布的iOS 10中,Siri的聲音是最后一個被機器學(xué)習(xí)改造的部分。同樣,深度神經(jīng)網(wǎng)絡(luò)替代了原先授權(quán)的技術(shù)。Siri的聲音來自一家語音中心收集的錄音數(shù)據(jù)庫,每句話都是語音段拼貼的結(jié)果。機器學(xué)習(xí)讓語音變得平滑,聽起來更像一個真人。
這看起來只是很小的細節(jié),但更自然的聲音能為Siri帶來很大的改變。Gruber認為,“如果聲音質(zhì)量更高,人們會感到更加可信。更好的語音能吸引用戶,讓他們更常使用?!?/p>
使用Siri的意愿,以及機器學(xué)習(xí)在技術(shù)上的提升,都在蘋果向開發(fā)者開放Siri的過程中十分重要。許多人注意到,蘋果在Siri上的合伙量只有兩位數(shù),遠遠落后于亞馬遜的Alexa,后者稱外部開發(fā)者幫助開發(fā)了1000多項技能。蘋果認為這種比較沒有意義,因為亞馬遜用戶要使用特定的指令方式,才可用到那些技能。蘋果表示,Siri在與Uber和SquareCash等服務(wù)的整合上會更自然。
與此同時,蘋果對Siri的改善也得到了回報,用戶發(fā)現(xiàn)了一些新功能,也感到常用的查詢變得更準(zhǔn)確,而相應(yīng)的,查詢數(shù)量也不斷增長。
五
或許,蘋果使用機器學(xué)習(xí)技術(shù)中遇到的最大問題,是如何堅持保護用戶隱私的原則。蘋果會加密用戶信息,包括公司律師在內(nèi)的任何人都無法讀取。FBI也不能,即便獲得了批準(zhǔn)。它還表示,不會收集用戶信息用于廣告目的。
從用戶的角度上看,這種行為值得尊敬,但這對吸引頂尖AI人才并無幫助。一位蘋果前員工表示,“機器學(xué)習(xí)專家想要的就是數(shù)據(jù)。但出于保護隱私的立場,蘋果總會有所干預(yù)。這種做法是否正確暫不討論,但外界會認為蘋果不是鐵桿AI粉?!?/p>
蘋果高管并不認同這種觀點。他們認為無需將用戶信息放在云端,或存儲訓(xùn)練神經(jīng)網(wǎng)絡(luò)所用的數(shù)據(jù),也能得到提升機器學(xué)習(xí)表現(xiàn)的數(shù)據(jù)。Federighi認為,“外界一直存在錯誤的觀點,做出了錯誤的妥協(xié),我們想讓他們走上正軌。”
這里有兩個問題。第一個涉及到在機器學(xué)習(xí)系統(tǒng)中處理個人信息,當(dāng)個人詳細信息是由神經(jīng)網(wǎng)絡(luò)收集到的時,這些信息會怎么樣?第二個涉及到收集訓(xùn)練神經(jīng)網(wǎng)絡(luò)識別行為所需的數(shù)據(jù),不收集個人信息,又將如何做到訓(xùn)練呢?
蘋果對兩者都有答案。Cue表示,“有人認為,我們用AI做不了這些事,因為沒有數(shù)據(jù)。但我們找到了獲取所需的數(shù)據(jù),同時保護隱私的方式。這是我們的底線?!?/p>
對于第一個問題,蘋果的解決方式是利用其獨特的對軟硬件的控制。簡單來說,多數(shù)個人信息仍保留在Apple Brain中。Federighi表示,“我們會將部分最敏感的信息保留在設(shè)備上,這時機器學(xué)習(xí)完全在本地運行?!彼o出的例子是應(yīng)用推薦,即在主屏上右滑時會出現(xiàn)的圖標(biāo)。在理解狀態(tài)下,這些應(yīng)用就是你意圖想用的。這種預(yù)測基于許多因素,基本都與用戶的行為有關(guān)。這一功能確實有用,F(xiàn)ederighi表示,預(yù)測用戶想用圖標(biāo)的概率有90%。
蘋果存在設(shè)備上的其它信息可能包括了最個人的信息:用戶使用iPhone鍵盤輸入的文字。使用經(jīng)過神經(jīng)網(wǎng)絡(luò)訓(xùn)練的系統(tǒng),蘋果能識別出關(guān)鍵事件和項目,如航班信息,聯(lián)系人及約會。不過這些信息都存在手機上。即使是備份在蘋果云上的信息,也會經(jīng)過處理后不能僅由備份信息進行還原。“我們不想把信息存在蘋果服務(wù)器上,公司沒必要知道你的愛好或你在哪。”
蘋果也在盡量減少整體上保存的信息。一個例子是,在交談中有人可能提到一個詞,這或許需要搜索。其它公司很可能在云端分析整段對話,從而識別出那些詞語,但蘋果設(shè)備無需這些數(shù)據(jù)遠離用戶就能識別出來。這是因為系統(tǒng)會不斷與手機中的知識庫進行搜索匹配。
Federight表示,“知識庫很精練,但也相當(dāng)完善,儲存了成千上萬的地點和實體?!碧O果所有的應(yīng)用都能用知識庫,包括Spotlight搜索應(yīng)用,地圖和瀏覽器。它也能幫助自動糾錯,一直在后臺運行。
機器學(xué)習(xí)圈的一個疑問是,蘋果的隱私限制是否會阻礙神經(jīng)網(wǎng)絡(luò)算法,這也是上文中提到的第二個問題。經(jīng)過大量數(shù)據(jù)訓(xùn)練,神經(jīng)網(wǎng)絡(luò)才能準(zhǔn)確。如果蘋果不采集用戶行為數(shù)據(jù),又從哪里得到數(shù)據(jù)呢?與其它公司一樣,蘋果用公開數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò),但總有需要更新更準(zhǔn)確的數(shù)據(jù)的時候,而這又只能從用戶中來。蘋果的做法是在不知道用戶是誰的情況下收集信息。它會對數(shù)據(jù)匿名處理,隨機打上識別信息。
從iOS 10開始,蘋果會開始使用一種名為差分隱私(Differential Privacy)的新技術(shù),它會對信息進行眾包處理,讓個人身份無法識別。這種技術(shù)可能用在出現(xiàn)新流行詞,而它又不在蘋果知識庫中時;也會用在某個鏈接突然變得與相關(guān)查詢的答案相關(guān)時,或某個表情被大量使用時。“傳統(tǒng)的方式會將用戶每次輸入都傳到服務(wù)器上,然后遍歷數(shù)據(jù)來找到感興趣的東西。但我們有端到端加密,不會這樣行事?!彪m然差分隱私是一個較為學(xué)術(shù)的詞,但蘋果想讓它變得更加普及。
Federighi表示,“我們數(shù)年前就開發(fā)研究,做出了能大范圍使用的有趣的成果。它的隱私程度令人驚嘆?!焙唵蝸碚f,差分隱私就是對數(shù)據(jù)的若干片段加入數(shù)學(xué)噪音,這樣蘋果能識別用使用模式,又不會辨別出個人身份。蘋果還授權(quán)研究相關(guān)技術(shù)的科技家發(fā)表論文,公布他們的工作。
六
顯然,機器學(xué)習(xí)改變了蘋果產(chǎn)品的方方面面,但對于蘋果本身,機器學(xué)習(xí)改變了什么,還有待觀察。從感覺上說,機器學(xué)習(xí)似乎與蘋果公司的氣質(zhì)格格不入。蘋果喜歡對用戶體驗進行全方位的控制,所有事情都事先幫你設(shè)計好,代碼極致優(yōu)化。但使用機器學(xué)習(xí),就意味著要將一部分決定權(quán)交由軟件處置。將用戶體驗逐漸交給機器控制,蘋果能接受這樣的設(shè)定嗎?
“這件事情引起了內(nèi)部無窮無盡的爭論”,F(xiàn)aderighi 說,“我們對此曾有過非常深入的思考。以往我們根據(jù)經(jīng)驗,從多個維度控制人機交互的種種細節(jié),以達到最佳的用戶體驗。但如果你開始訓(xùn)練機器通過大量數(shù)據(jù)模擬人的行為,結(jié)果就不再是蘋果設(shè)計師所擅長的。所有的一切都來自數(shù)據(jù)?!?/p>
但蘋果并沒有回頭,Schiller 說,“盡管這樣的技術(shù)將改變我們的工作方式,但為了做出更高質(zhì)量的產(chǎn)品,我們終將在這條路上越走越遠”。
也許這就是問題的答案:蘋果并不會大張旗鼓地宣揚自己采用了多么先進的機器學(xué)習(xí)技術(shù),但他們?nèi)詴M可能地將之運用到產(chǎn)品中,以期獲得更好的用戶體驗。藏在你iPhone中的Apple Brain就是最好的證明。
“典型的蘋果用戶,將在不知不覺中得到機器學(xué)習(xí)帶來的用戶體驗的提升,并因此更加愛上蘋果產(chǎn)品”。Schiller 說。“最讓人興奮的是,你甚至都感覺不到它的存在,直到有一天你突然意識到,并發(fā)出由衷的感嘆:“這一切是怎么發(fā)生的?”
天網(wǎng)不會到來。
人工智能概念股:埃斯頓、科大智能、漢王科技、江南化工、華東數(shù)控、和而泰、中科曙光、永創(chuàng)智能、北京君正、通富微電、永創(chuàng)智能、勁拓股份。
人工智能概念股
那么問題來了:最值得配置的人工智能概念股是哪只?即刻申請進入國內(nèi)首個免費的非公開主題投資交流社區(qū)概念股論壇參與討論!
申明:本文為作者投稿或轉(zhuǎn)載,在概念股網(wǎng) http://m.chiang1015.com/ 上發(fā)表,為其獨立觀點。不代表本網(wǎng)立場,不代表本網(wǎng)贊同其觀點,亦不對其真實性負責(zé),投資決策請建立在獨立思考之上。