Google 是如何讓自己成為一家機器學習優先的公司?

Google 目前的挑戰是要將他們的工程師隊伍過度到機器學習的隊伍,不要求每個人都熟悉掌握機器學習,但起碼需要熟悉機器學習。不僅 Google 在這麼做,很多其他的公司(比如 Facebook)都在積極邁進機器學習的時代。Google 正在各個名校的機器學習領域搶奪人才。Google 也即將在蘇黎世開設一個機器學習研究中心,搶奪機器學習人才的戰爭,延伸到了歐洲。
評論
評論

原文刊登於 合作媒體 ifanr,Inside 獲授權轉載。

前不久,Google 的 CEO Sundar Pichai 在接受 Forbes 專訪時,非常明確地指出了:Google 將在一切服務和設備中,或早或晚地採用人工智慧技術。

BackChannel 的一篇 來自 Steven Levy 的文章 描述了 Google 從培訓、雇佣、管理、技術等各個方面的措施和轉變,並且介紹了機器學習在 Google 崛起的歷史、克服的阻力、以及勢不可擋的未來。

Google 正在打造機器學習的「忍者團隊」

Carson Holgate 正在訓練自己成為一名「忍者」。

她今年 26 歲,之前已經在跆拳道裡拿過一個二級的黑帶。 這次,她要做的是在演算法上成為一名「忍者」。 她在 Google 的 Android 部門擔任工程師,現在則被收編到 Google 內部的一個機器學習「忍者專案」。這個專案只招收了 18 個人,這 18 個人卻都是 Google 各個產品部門的精英。他們將要把學習到的人工智慧技巧,用於打造他們各自負責的產品。

在 Google 負責內部機器學習、管理此「忍者專案」的產品經理 Christine Robson 說:「這個專案邀請 Google 全公司對機器學習感興趣的工程師, 與機器學習團隊一起學習 6 個月,跟導師取取經,做一些專案,然後開展和實施專案,從中學習經驗和教訓。」

很多年來,機器學習被認為是一個只有技術精英才懂的技術專項。 但是現在,機器學習成為了將人類智慧與電腦智慧結合在一起的不二途徑。 Google 致力於在公司內部製作多一點機器學習的「精英」,甚至想要讓機器學習成為工程師的常規技巧。

Google 是一個龐大的公司,六萬個雇員裡面,有將近一半都是工程師。對比之下,這個目前只有 18 個人的機器學習忍者專案,實在很小。但是這個專案表明了 Google 一個認知上的轉變——機器學習已經成為最受重視的新方向之一。

雖然 Google 一直都有採用機器學習的技術,也一直致力於雇用這個領域的人才,但是直到 2016 年,Google 才開始執迷於機器學習這項科技。 去年年末, Google 的總裁 Sundar Pichai 就說出了 Google 的新態度:

機器學習是一個核心的、轉變式的改變,它將改變我們做每一件事的方式和想法。我們有目的地在我們的各項產品中運用機器學習,無論是搜尋、廣告、YouTube,還是 Play。我們目前所處的階段還早,但是你會看到我們一個系統性、規模性的進展——我們將在眾多的領域使用機器學習。

因而這個邏輯很清晰:如果 Google 真的想要在全線的產品中運用機器學習,它的工程師也必須掌握機器學習的技巧,這個技巧將和傳統的寫程式很不同。正如知名的機器學習宣言《高超演算法》一書的作者 Pedro Domingos 所言:

機器學習確實是太陽底下的新鮮事:它將自己建造(和實現)自己。

機器學習是如何在 Google 崛起的?

做好機器學習,意味著辨識正確的數據,選擇正確的演算法,並且確保所有的其他條件都正確,才能成功。

Jeff Dean,Google 軟體部的神級人物,如今帶領著機器學習團隊,建造各種工具,幫助 Google 工程師加深機器學習的技能。根據他的預測:今天 Google 25000 個工程師中,只有幾千個工程師精通於機器學習。 而 Jeff Dean 的願景是:所有的 Google 工程師都要懂得機器學習的一些知識。「我們將要嘗試實現這個目標。」

John Giannandrea 一直以來都在 Google 內部提倡機器學習的重要性,而時代造英雄,在 Google 的機器學習時代,Giannandrea 成為了搜尋業務的負責人。但是當他 2010 年剛到公司的時候,他並沒與多少機器學習的經驗。 2011 年的時候,他在一個會議上得知「神經訊息處理系統」(Neural Information Processing Systems,NIPS), 從此欲罷不能。

從此,每一年,NIPS 都使用機器學習創造著科技界的神話,解決著如翻譯、聲音辨識、或者視覺辨識等諸多領域的難題。Giannandrea 回憶道當時參加這個 NIPS 會議的時候,這個會議非常不知名,「但是這個領域在學術和科技界都在過去三年高速成長。去年參會者達到了 6000 人。」

不只是 Giannandrea 認為機器學習將會成為科技的核心。 Google 內部的機器學習擁護者越來越多。比如,Google Brain 的共同創辦人 Dean,他曾在 Google X 負責一個神經網絡的研究計劃。這些在 Google 進行的機器學習運動,說明了 Google 對電腦的決心和信心。

如今在機器學習領域最領先的為「深度學習」演算法,這個演算法的模型由人腦啟發,建立在複雜的神經網絡之上。Google Brain 以及 Google 在 2014 年 1 月以 5 億美元收購的 DeepMind,都在深度學習這一塊集中力量開發。 DeepMind 開發了 AphaGo,並在圍棋比賽中將人類的冠軍打敗了,這件事激發了人類對人工智慧深深的恐懼。 Giannandrea 覺得人工智慧絕對不會把人類趕盡殺絕或者取代人類,但是,它將要深刻地變革我們生活的每一個方面。

機器學習的概念在 Google 絕不是新鮮事。 Google 的創辦人一直以來相信人工智慧的力量。十年前,Google 已經開始在公司內部給工程師教授機器學習的課程。 2005 年的時候,研究科學家 Peter Norvig 開始在每周三在 43 號樓給感興趣的 Google 工程師講授機器學習。課程如此受歡迎,以至於在 Bangladesh 的工程師熬夜到凌晨,只為了遠程打個電話過來一起聽課。而 2013 年,整個 Google 都意識到了機器學習的重要性。

隨著機器學習的重要性在 Google 內部崛起,Jeff Dean 也開始認真思考:

在過往,我們可能會使用機器學習,去改善系統的某幾個方面。但現在我們真的是要用機器學習去取代整個舊的系統。

機器學習正在讓產品有著以往不可想像的新功能。比如去年 11 月發表的 Gmail 上的智慧回覆功能,就是緣起於 Google Brain 與 Gmail 團隊的一次對話。Google 一直鼓勵著這種合作,讓這兩個團隊保持密切的聯繫。

傳統的對人工智慧語言的理解是:人們需要將語言的規則嵌入到系統,但是在 Gmail 的智慧回覆中,這個系統擁有足夠多的數據,它自己就可以學習和完善自己。

不過當這個團隊在開始測試智慧回覆的時候,這個軟體有一個很詭異的問題:它總是在建議一些不太符合場合的浪漫性的回覆。當它感到困惑的時候,它就會開始說:我愛你。這不是什麼軟體上的故障。這個錯誤可能就是它從人類行為中學習而來的:如果你處於不知所措或者困窘的狀態,說「我愛你」是個很好的防範策略。

克服重重阻力,機器學習滲透到了搜尋演算法中

自從去年 11 月發表智慧回覆之後,Gmail Inbox 應用的用戶就可以選擇三個自動生成的回覆,而且這些自動生成的回覆準確性一般很高。現在,從手機行動端的 Gmail 用戶發出的回覆中,十分之一都是由機器學習系統創造的。Gmail 的成功只是 Google 成功運用機器學習的一個極小的例子。

但是當機器學習被運用到搜尋功能,這就是極大的轉折點了。一直以來,搜尋都有運用到機器學習,但是很多年以來,這個公司最重要的搜尋演算法,都被認為太過於神聖,而不能被機器學習演算法所玷汙。機器學習對於搜尋的作用,一直都受到懷疑。

這種懷疑,部分源自於一種文化上的抵抗:一直以來,高超的駭客們都想要對程式有完全的掌控,而機器學習難免有點太禪意般的「放任自流」。Amit Singhal 是一個經驗豐富的搜尋工程師,是傳奇式的電腦科學家 Gerald Salton 的學徒,Singhal 當年修改了 Google 創辦人 Sergey Brin 和 Larry Page 的寫程式作業,讓他們的程式變為可以量化擴大的工具。Singhai 對於把機器學習併入搜尋演算法,曾經抱著懷疑的態度。Google 的工程師 David Pablo Cohn 證實當時他們用機器學習提高搜尋的沮喪的嘗試:

Amit Singhai 的演算法當時是世界上最棒的,我們只能透過複製他的想法來做好。當時我們找不到任何比他的方法要好的東西。

到 2014 年早期的時候,Google 的機器學習專家們繼續挑戰這種局面。結果,機器學習團隊的實驗成為了搜尋的一個核心部分:透過看用戶是否點擊了搜尋詞條,來判斷搜尋呈現的結果是否更好地匹配搜尋的詞條。

如今,機器學習所建立的搜尋匹配的成果 RankBrain,已經是搜尋演算法的一部分。RankBrain 於 2015 年 4 月的時候上線。 Google 一直以來對於搜尋功能如何運作都是閃乎其辭,但是 Jeff Dean 很明確得說:

RankBrain 這個機器學習的產物在每一次檢索中都發揮作用,並且在大部分的檢索中影響著排名。

並且,這個機器學習的演算法證明是非常有效的。每一次的 Google 搜尋都要用上幾百個訊息點(比如,用戶所處的地理位置,以及頁面的標題是否與搜尋詞條匹配),而 RankBrain 提供的訊息點,是所有訊息點中的重要性排在了第三。

打敗了傳統寫程式後,機器學習該如何在 Google 普及

機器學習在搜尋中獲得成功,對於 Google 而言非常重要,這讓很多人開始真的注意起機器學習來。而華盛頓大學的教授 Pedro Domingos 用更直白的語言說:

一直以來,在傳統工程師與機器學習者之間都存在著一場戰爭。結果機器學習者在戰鬥中獲勝了。

Google 目前的挑戰是要將他們的工程師隊伍過度到機器學習的隊伍,不要求每個人都熟悉掌握機器學習,但起碼需要熟悉機器學習。不僅 Google 在這麼做,很多其他的公司(比如 Facebook)都在積極邁進機器學習的時代。Google 正在各個名校的機器學習領域搶奪人才。Google 也即將在蘇黎世開設一個機器學習研究中心,搶奪機器學習人才的戰爭,延伸到了歐洲。

基於目前學術界並沒有造出很多的機器學習人才,保持這方面的人才就顯得至關重要。在 Google,這並不是易事。因為大部分的頂級工程師一輩子都透過傳統的寫程式取得成就。但是機器學習所要求的,是全新的思維。工程師一般透過對寫程式的控制來進行創造,但是機器學習要求掌控的是某些具體類型的數學和統計學,但是這些領域的知識,甚至對於一些頂級的、可以解決複雜問題的工程師而言,都是陌生的,他們之前也根本不願意學。

Christine Robson 正在致力於給 Google 的工作人員創造更好的機器學習的環境:

機器學習與靜止不變的寫程式不同:你要經常給它提供新數據,我們要一直更新模型,一直學習,要一直添加更多的數據,一直轉變我們預測的方式。機器學習就像是一個活生生的、會呼吸的傢伙,它和傳統的電腦寫程式完全不同。

但是,Google 對訓練工程師學會機器學習的前景是樂觀的:如今在機器學習中使用的數學不算太複雜,大部分 Google 的工程師都可以學會。Google 並且建造了類似 TensorFlow 的工具,幫助工程師學習機器學習。TensorFlow 也為 Google 在雇用人才方面增加了吸引力。當 Google 開設 TensorFlow 公開課時,有 75000 人報名參加。

目前 Google 最大的任務,就打造更多可以完善這些機器學習工具的人才。他們也在內部建立了大量的機器學習的課程,「下一次的課程,已經有好幾千的工程師報名參加。」Jeff Dean 說。

毫無疑問,機器學習,將會是 Google 一個重大的發展方向。 我們的未來,將會是一個機器學習和人工智慧的未來。



精選熱門好工作

產品經理 (PM, PO)

VeryBuy非常勸敗
臺北市.台灣

獎勵 NT$15,000

數位行銷資深人員

王道商業銀行
臺北市.台灣

獎勵 NT$15,000

Web Application QA Engineer

Omlet Arcade 美商歐姆雷特
臺北市.台灣

獎勵 NT$15,000