谷歌搞事情:最先被AI淘汰的,居然是做AI的?
坊間流傳著這么一個說法:谷歌想回中國,必須靠AI;而靠AI回中國,必須搞個大事情。于是,上周四的晚上李飛飛發(fā)布了一篇博客,庫卡機器人,然后連著發(fā)了三條推特,宣布一個叫AutoML的AI產(chǎn)品啟動了。
一夜之間,中國的科技媒體就爆炸了,空氣中似乎回蕩著那一句話:搞事情了搞事情了搞事情了
AutoML到底是不是跟谷歌的中國戰(zhàn)略有關(guān),我們不做討論。這里希望幫大家搞清楚的,是這個AutoML到底要搞什么事情。
按照谷歌云AI項目首席科學(xué)家李飛飛的說法,AutoML的目標(biāo)是降低開發(fā)者、研究者和企業(yè)群體使用人工智能相關(guān)工具和框架的門檻。而通俗的理解大概就是,這個產(chǎn)品可以不用寫一行代碼,就訓(xùn)練出一個企業(yè)級的機器學(xué)習(xí)模型。AutoML也就是自動機器學(xué)習(xí)的意思。
驚不驚喜?意不意外?
傳說中學(xué)會機器學(xué)習(xí)年入50萬起呢?說好的BAT瘋搶AI工程師呢?是不是感覺剛掏出去的培訓(xùn)費被風(fēng)吹走了?
更有網(wǎng)友驚奇地評論道:不是說一起用AI去革一大堆工作的命嗎?怎么我辛辛苦苦學(xué)AI結(jié)果先被革命了?
當(dāng)然了,現(xiàn)實并沒有這么殘酷。但谷歌的動作并不是孤例,背后隱含著的,是一直被反復(fù)提及的AI民主化。并且也確實折射出我們今天學(xué)的AI也許是沒用的這種可能。
讓我們從這個谷歌大動作來一點點說起。
搞笑的吧?原來最先被AI革命的是AI工程師?
谷歌放出的這個讓代碼界風(fēng)聲鶴唳的東西,叫做AutoMLVision。是整個AutoML體系的第一款產(chǎn)品,專注自動生產(chǎn)圖像識別領(lǐng)域的模型。
我們用簡單易懂的方式描述一下這個系統(tǒng)是如何工作的吧:
假如以前我想要做一個能夠進行圖像識別的AI系統(tǒng),那么我需要在開發(fā)框架上自己搭建訓(xùn)練過程,完成各種訓(xùn)練部署,導(dǎo)入數(shù)據(jù)集,整個過程需要使用編程的方式來完成。
但在AutoMLVision上,我就一行代碼都不用寫,只需要按照說明,把我希望訓(xùn)練用的圖片都拖進系統(tǒng)里,然后耐心等待,一個訓(xùn)練好的機器學(xué)習(xí)模型就趁熱出爐了。
舉個例子,假如你想訓(xùn)練一個模型,用來識別你家的貓主子是不是生氣了(這得有多無聊),那么就只需要在AutoMLVision拖入你家貓的照片、它生氣時候的照片、高興時候的照片等等等等,然后你就會得到一個識別程序。用它連上手機拍照,就可以讓AI去理解貓大人的喜怒哀樂了。
是不是挺神的?
(AutoMLVision拖放圖片界面)
這背后,是谷歌利用了深度學(xué)習(xí)領(lǐng)域中的遷移學(xué)習(xí)(TransferLearning)技術(shù)。把此前谷歌訓(xùn)練圖像識別模型時積累下來的訓(xùn)練過程,遷移到AutoML當(dāng)中,這樣就節(jié)省下來了后續(xù)類似模型的開發(fā)過程。
簡單來說,AutoML有點像谷歌云搭建的一個解題公式。之后的考生并不需要知道公式是怎么來的,只需要把問題套進去就可以得到答案。當(dāng)然了,這只是簡單交代一下它的工作原理,實際上沒有那么容易。尤其在調(diào)試進程中,不同模型需求和系統(tǒng)的兼容度是個大問題。
總而言之,這個產(chǎn)品以及背后的思路,對于想做機器學(xué)習(xí)又缺乏專業(yè)技術(shù)和人才的企業(yè)來說確實是個福音。它取消的,是通過代碼搭建機器學(xué)習(xí)模型的過程,以及復(fù)雜的調(diào)試工作。僅保留了輸入特定數(shù)據(jù)這件事給用戶。很大程度上降低了機器學(xué)習(xí)訓(xùn)練中的工作量,尤其是編程工作。
但也別太樂觀。雖然AutoML目前還沒有正式發(fā)布,真實效果有待考量,使用價格也是未知數(shù)。但就目前信息來看,AutoML生成定制化模型需要的數(shù)據(jù)量還是很大。不是毫無基礎(chǔ)的開發(fā)者能夠搞定的。
而且它只能完成相對簡單的任務(wù),且只能套用谷歌給出的訓(xùn)練方案。如果想要制作比較復(fù)雜的機器學(xué)習(xí)系統(tǒng),使用獨特算法進行訓(xùn)練,那么編程還是不可避免的。
所以呢,目前來看真正用心且努力進入AI開發(fā)領(lǐng)域的朋友大可放心。只懂個大概想要快速轉(zhuǎn)行AI騙高薪的朋友,那就期待老板比你更不懂吧
除了圖像識別,谷歌未來還計劃將AutoML服務(wù)拓展到翻譯、視頻和自然語言處理等領(lǐng)域。這或許意味著初級的AI程序被自動生成、快速復(fù)制到各行業(yè)已經(jīng)不遠了。
雖然谷歌表示AutoML是目前唯一一個此類產(chǎn)品,但其實各家也都在部署類似的業(yè)務(wù)。比如亞馬遜的AmazonSageMaker,以及微軟還未正式發(fā)布的定制圖像識別模型服務(wù)。包括國內(nèi)的百度,也在旗下AI開放平中推出過定制化圖像開放平臺。
谷歌這次之所以被稱為搞了個大事,主要是因為目前來看AutoML的自動化程度更高,尤其是解決了自動搭建訓(xùn)練模型和調(diào)參這兩大問題。
在谷歌這么賣力的背后,似乎寫著五個大字:AI民主化
AI民主化,要取消了誰的集權(quán)?
去年3月,剛剛加盟谷歌不久的李飛飛就表示,人工智能的下一步是完成AI民主化。在這次發(fā)布AutoML之后,她又一次表示由于資源稀缺,多數(shù)企業(yè)無法開發(fā)個性化模型,所以AutoML的出現(xiàn)是為了進一步推進AI民主化。
那么問題來了:AI民主,到底是針對誰的專政?要取消誰的集權(quán)?
有人說了,AI現(xiàn)在是掌握在幾家大公司手里的。AI民主當(dāng)然是要讓人人成為AI的主人,破解巨頭專政。
我只能說,你當(dāng)人家傻啊?
難道谷歌們會費了好大力氣,為了瓦解自己的霸權(quán)?當(dāng)然不會。就像AutoML的產(chǎn)品思路中展示的那樣,省略掉了開發(fā)者的技術(shù)門檻,谷歌從中吃虧了嗎?沒有。谷歌擁有了更多的用戶,自身的算法優(yōu)勢無形中得到了擴張。并且AutoML的用戶訓(xùn)練模型是要直接部署在谷歌云上的,顯然這也是個變相捆綁,希望從刁鉆角度刺AWS幾刀。
對于最迫切希望得到民主的小公司和個人開發(fā)者而言,巨頭兜售的開發(fā)者賦能和去技術(shù)門檻式民主,絕不是仁慈的饋贈,而是換取小開發(fā)者緊密依賴關(guān)系的生態(tài)交換。真正被所謂AI民主瓦解的,其實是夾在大公司和小開發(fā)者之間的中層公司,或者叫算法公司、技術(shù)公司。
目前在世界各地的AI市場上,這類中型公司都普遍存在。當(dāng)然其存在是有意義和價值的。對于巨頭來講,將技術(shù)能力打入各行各業(yè),開發(fā)各種各樣的應(yīng)用是完全不可能的,那么就有賴于開發(fā)者去做這些事,自己做平臺服務(wù)和技術(shù)能力的輸出者就好了。
但小團隊和個人開發(fā)者能去做這些深入行業(yè),或者極具創(chuàng)意的開發(fā)嗎?答案是也不行,因為從頭開始的技術(shù)太復(fù)雜,對人才的需求太高。一般開發(fā)者和小企業(yè)根本玩不起。
于是就出現(xiàn)了大量夾層公司,他們以技術(shù)壁壘為主要產(chǎn)業(yè)支撐點。利用重技術(shù)和人才去做一些其實看起來不那么重的小應(yīng)用。或者以開發(fā)定制化AI模型的方式向第三方收費。
而谷歌、英特爾等巨頭企業(yè)都在倡導(dǎo)的AI民主化,事實上是將需要大量AI勞動力完成的工作裝入自動化模型里。向上收回底層技術(shù)開發(fā)權(quán),向下直接觸達細分開發(fā)場景。




