網易有道周楓:曾夢想執筆去教書,卻轉崗當上CEO

InfoQ2018-06-14 11:23:53

記錄與時代並行的技術人,暌違已久的二叉樹短視頻回來了!叩問過技術大牛的「初心」,描繪過技術人的「眾生相」,這次我們帶您去見識那些橫跨「兩界之間」的技術人們。這是 10 位行走在中國人工智能之路上的技術人,他們正見證著中國的人工智能技術落地。點擊公眾號菜單「戳」一欄“二叉樹視頻”或掃描文末二維碼可觀看往期高清視頻。

他曾經的理想是在高校教書。但是在伯克利讀博期間,他的論文被丁磊看上了。他曾經作為兼職學生被 Chinaren 和 Sohu 委以重任,他說那是因為在 20 年前,懂系統的人實在太少。

今天的他,儘管官方職位是一名“CEO”,但是言談之中仍然掩蓋不住濃濃的技術氣息。當 InfoQ 二叉樹團隊前去採訪他的時候,他的桌上正擺著一份由機器翻譯成中文的最新的一份年度亞馬遜 CEO 致股東的信——坦白說,如果是一位完全不懂英文的人去看機器翻譯的這個版本也可以看懂裡面的意思。

人工智能技術對翻譯領域都造成了哪些影響?對教育領域又會造成哪些影響?且看今天的二叉樹——


《兩界之間》技術專題紀錄片 | 第九集

由 InfoQ 二叉樹 出品

嘉賓簡介

周楓,現任網易高級副總裁,網易有道 CEO,在網易有道期間先後主導了有道詞典、有道搜索、有道雲筆記、有道精品課、有道翻譯官的產品研發工作。

Q:首先請您介紹一下有道翻譯這塊的發展?


有道是國內最早做在線翻譯引擎的公司,我們從 2008 年開始就有自己的自主研發的翻譯引擎。2008 年一直做到現在(2018 年),基本上做了有兩代的翻譯引擎。整個有道詞典目前累計了有 7 億用戶,每天全平臺活躍用戶超過 1700 萬。

Q:上述整個過程中有哪些重要的變化?

2008 年我們去考慮做翻譯的時候,其實考慮了很久,因為當時翻譯在商業應用的領域是非常新的狀態,我記得 Google 的翻譯應該是大概 2006 年、2007 年商業應用的,互聯網公司中間基本上是沒有什麼公司有翻譯的技術的。所以我們因為當時是剛剛出了有道詞典,用戶都需要用翻譯,但是其實用戶也不知道可以做自動的翻譯,那麼我們團隊覺得:要不我們試一下?


試完之後發現,的確可以把它做出來,當時用的是的技術。機器翻譯大概從 1940 年、1950 年左右就有人在討論,最初的翻譯技術叫規則機器翻譯。統計機器翻譯是更好的、第二代的技術。

我們 2008 年左右把它做出來,對我們的產品發展發揮了非常大的作用,每年它通過數據的積累,通過算法的改進,質量都有提升,但其實到 2012、2013 年之後,它的質量就達到一個瓶頸,因為總體上,統計機器翻譯是有自己的侷限性的。之後幾年,其實翻譯的產品和業務都是比較難受的,因為它質量不理想,也有很多關於翻譯的笑話。

基本上是到 2015、2016 年的時候,整個學術界提出來基於深度學習的神經網絡翻譯的一些論文和想法。當時其實還沒有公司把它產品化,我們也是認為值得去嘗試,所以花了大概有兩年時間把神經網絡的機器翻譯最終產品化。在 2017 年我們推出了神經網絡的機器翻譯的引擎,比之前的翻譯的效果提高了非常多,而且現在總體上這個領域非常活躍,每個季度我們的翻譯質量,包括一些同行的翻譯質量都會有比較大的提升。


去年的一年時間,包括我們在內的翻譯質量的提升,比過去五年加起來都要多。每個季度我們都會有新的模型上線,剛剛上個星期我們的中文和英文的翻譯引擎就上線了一個全新的版本,它的整體的網絡架構、整體的訓練方法和之前的 2017 年我們上線這個版本是完全不一樣的。

機器翻譯基本上我覺得有三部分工作,第一部分工作是數據,對於翻譯來說的話就是平行語料,就是一句英文一句中文或者一句日文一句中文。第二部分是模型架構,或者說網絡架構,因為它是深度學習,它是個網絡,有很多不同的做法,這個是大家會有差異化的地方。第三部分,實際落地的時候會有很多問題,包括大小、尺寸,包括性能,包括你是在服務器端還是在在手機端,還是說各分一半等等很多選擇。

Q:像您說的落地,在有道來說就是翻譯蛋。為什麼會想到做這樣的一個形態?

對我們來說也是個挺巧合的事情,因為我們很多用戶用我們翻譯裡邊的離線翻譯的功能,用了之後都很喜歡,用戶就會提更多的需求。2017 年年初我們推出了語音對話翻譯的功能,功能一上線之後,用戶非常喜歡,使用量比我們想象的要大很多。

我們剛好那個時候也碰上一個我們的合作方,他們願意做硬件。他們說既然你有語音翻譯的功能,我又會做硬件,我們一起合作來做一個翻譯的硬件。其實我們開始的時候還是討論挺多,覺得有很多挑戰,因為單獨賣用戶一個硬件也挺不容易。實際做下來之後發現還是不錯的,用戶需求比我們想象的要大,而且產品體驗總體上也還不錯。

Q:您在翻譯蛋的產品研發中扮演一個什麼角色?

主要工作是團隊做的,我還是在產品的技術和體驗,很多事情上還是會跟團隊一起參與和討論。像我們希望支持更多的語言,像我們希望說二代我們一定要把離線的翻譯做得更好,這方面是我比較關心的。


可能有個例子是我自己參與事情比較多的,是關於這個產品的尺寸的設計。我們是想了很久這個問題,最後我們自己的定位是說,我們認為這個產品應該要比手機小,把它做成 70 克這樣的一個重量,用戶覺得這個是比較符合他需要的。第一代我們是 70 克,第二代還是 70 克。

Q:翻譯的研究領域,您現在關注哪些新的進展?

翻譯本身在模型方面還是有挺多新的架構,包括我們自己用的比較多的,像注意力這樣的機制,像 transformer 這樣的機制,我們在不斷的看,不斷的自己也在嘗試。

然後實際從工程角度上,我自己體會是說,真的要把產品做到說用戶認為非常好用和指標高還是不是一回事。

Q:目前我們在教育領域都有哪些投入?

我們認為工具產品也是教育產品,當然最直接的就是我們的課程產品,它的品牌是有道精品課。主要的形式是直播的大課,就是一個老師既有可能給幾百人同時上課,也有可能是同時上萬人一起上課。

目前來看的話,其實直播課程是比較關鍵性的一步,直播課程使得在線教育開始能夠得到大批量的用戶的接受,也有了一個比較健康的商業模式。我覺得至少在可能從一年多前開始,到未來可能兩三年或者更長,直播應該是互聯網教育的一個主要的形態。我是這麼看這個問題。

我覺得互聯網的這樣的遠程的純在線的教育方式裡邊,兩個問題最關鍵:第一個是學習的效率,第二個是學習的動力。這兩個問題必須都解決,才是一個比較好的產品形態。我們發現直播形態其實能夠比較好的保持學生的注意力,因為它有一個大家一起學習的感覺,跟老師也有各種各樣的互動。我覺得是娛樂直播產品給教育產品做了一個非常好的示範。

所以相當於我們摸索了幾種形式之後,到 2016、2017 年開始做直播之後,發現用戶的反饋是完全不一樣,以前可能能學完課的比例是百分之十甚至更低,現在很大比例的學生都能堅持下來。

Q:錄播變成直播就有這樣的效果嗎?

直播是其中挺關鍵的一步。我覺得直播只是開始,後面的話我們覺得非常重要的一環是 AI 技術的各種的應用。

在當下的話,這裡邊我們認為一個關鍵的點,就是怎麼把這樣的一個基於直播的教學從單向變成雙向。因為如果是簡單的直播的話,總體上它的方式是老師講學生聽,這是一個單向的過程,總體上你還是沒有辦法知道學生到底學的怎麼樣?他是不是有聽懂?課後他有沒有去跟進去學習?他的困擾有沒有得到解決?我覺得這是目前階段我們在著力解決的問題和未來的產品機會所在。

我們做了一些嘗試,包括我們的有道智能答題板,包括我們做的用戶習題的系統,包括我們做的一些做作業的自動批改,這些都是一定程度上把教學過程從單向變成雙向。


Q:您是相當於從小學的時候就接觸計算機?

對,我初中小學花了很多時間在計算機上,高考的時候我就選了清華的計算機系,基本上到清華之後也一直在跟計算機打交道。

我在清華的時候,剛好 1998、1999 年的時候,中國互聯網的第一批公司大發展,所以當時我去了 Chinaren 和 Sohu 兩家公司兼職。那個時候,其實兼職學生往往被公司賦予重任——因為會做系統的人很少,所以當時還是積累了一些經驗。之後我去了美國伯克利讀 PHD,畢業之後回到網易。

Q:當時沒有想過要留在美國?

我本來是想在美國教書的,我去美國讀 PHD 的時候是覺得說,其實我是個挺喜歡教書的人。現在我們做教育相當於也是教書,所以還好,繞了一大圈。

Q:其實像您一直以來做底層也做了很長時間,其實也還是很關注技術。您覺得一直推動您去做這個領域的動力在哪裡?

我覺得還是興趣。我覺得每個人做工作,其實最開心的就是能找到自己喜歡的東西,對吧?我覺得我還是比較幸運的,不管是說做互聯網產品也好,還是說做教育也好,這本身都是我喜歡的。

我會覺得跟同事們一起去做團隊的工作,把整個 team 能夠找到一些好的工作方向,這是一件我覺得挺好的事。

另外一方面,關注一些技術的細節,去了解一些新的技術的方向,包括實際動手去參與一些,也是另外一種很開心的、能夠去做的事情。

我覺得對於擅長技術、熟悉產品的、工程和設計方面的團隊帶頭人,其實是有很多優勢的,使得團隊溝通中間很多事情變得更加高效和直接。就像我們很多時候討論問題的時候,比方說有一個新的領域,可能大家如果和非技術工程背景的一些同事聊的時候,也能聊明白,但是可能要聊很久;而在網易,我們去把可能領域最初的技術的介紹,把最初的那幾篇論文我們找出來,可能花個兩小時讀一下整個領域是怎麼來的,為什麼有這件事情,以及說它未來一段時間可能的技術走向,就比較清楚了。我覺得這個是一個挺好的優勢。

就像我之前讀 Elon Musk 的自傳,我覺得還是挺有共鳴的。其他人就說他們發現說 Musk 這個人有一個習慣,就是喜歡打破砂鍋問到底,會問到非常技術細節的東西。然後後來大家發現,不是說 Musk 懷疑這個人不懂,而是說這是他學習的一種方式。打破砂鍋問到底,問完之後,一方面瞭解了團隊的工作狀態,另外一方面 Musk 自己學會了很多事情。我覺得在網易很多時候也是這樣的文化,我們還是非常技術的一個文化。

Q:現在如果請您分享一件印象最深刻的跟團隊一起的事情,您會想到什麼事情?

我覺得可能是我們大家一起去構思出來當時有道詞典的一個最主要的功能,叫“網絡釋義”。那是在一次會上我們討論出來的,就是說白了我們把搜索的技術應用到讓機器編詞典這件事情上來,這個是有道辭典最主要的一個打動用戶的功能。

這個事情印象很深刻,因為相當於是有道第一個做出來一個原創的產品,而且很快的時間就有了大量的用戶。我覺得這次影響後來我們做很多事情,就像後來我們發現說直播這件事情對於教育非常的有用。

當你每次遇到這樣的這樣的 moment 的時候,你會有這樣的感覺,說有可能我找到了一個很不錯的東西。這樣的感覺,可能三次中間只有一次是對的,但是你會發現每次碰到這樣事情的時候,一些很聰明的人在一起,同時都會說是不是有點道理?可能第二天就有人去把原型已經做好了,這個感覺是非常棒。

Q:最後,您對於整個團隊在未來有怎樣的期許?


我們希望能夠在教育這個事情上跑得更快一些,因為確實是非常好的一個機會,整個一個非常大的市場,而且能夠和 AI 非常好的結合起來。所以我們希望說這邊能夠真的做出一些好的產品,幫助到學生們,幫助到家長們,同時也讓我們自己能夠為這個事情而感到驕傲。


圖書上新,三天限時特惠

InfoQ 推出的極客新書《裂變:秒懂人工智能的基礎課》開售!本書特點:

  • 零基礎入門人工智能

  • 貫穿數學基礎、機器學習、人工神經網絡、深度學習、神經網絡實例、深度學習之外的人工智能和應用場景。

6 月 13-6 月 15 日,奉上以下福利:

《裂變》新書,原價 59 元,首發價 49 元!

《裂變》新書 + 《人工智能基礎課》專欄,原價¥127,套裝價¥89!

另外,即日起,每邀請一位好友購買《人工智能基礎課》專欄,你可獲得 12 元,你的好友也將獲得 6 元的現金獎勵,多邀多得,上不封頂,隨時提現!(提現流程:極客時間公眾號 - 我的 - 現金獎勵提現)

長按 識別下圖二維碼 或者戳 閱讀原文,立即擁有。


閱讀原文

TAGS: