第158章 我們究竟在談些什麼

顧莫傑本該下班了,但是嚴磊的報告,成功引起了顧莫傑的注意,他決定加夜班。

讓葉敏茹去樓下雲咖啡拿了兩個套餐,然後他在辦公室裡請嚴磊邊吃邊談他的想法。

“說說吧,你對‘谷歌中國五年來在華蒐集的搜索數據’的用法細節,是怎麼看的。”

嚴磊依然保持着四年前認識顧莫傑時的學者氣,不怎麼講究禮貌,就大咧咧坐在顧莫傑對面,一邊用便當,一邊閒聊。

“你不都已經把‘初秘’那個項目交給我做了麼,寒假就要和iphone4的siri掰腕子了,難道就不想讓‘初秘’的水平在這個節骨眼上,再上升一個臺階?”

嚴磊口中提到的這個‘初秘’項目,是顧莫傑從去年初心1代手機上線後,就丟給初音的人工智能研究團隊研發的項目。

他對後世智能手機行業發展那一點僅存的記憶,到2012年底爲止。那段歷史上,蘋果公司的手機在iphone5這個型號上戛然而止。

蘋果公司會做出siri這個人工智能語音助手,顧莫傑是知道的。

那些買了iphone4s以上蘋果手機或者ipad3以上平板的用戶,可以通過siri,對機器發送語音聊天。機器會試圖模擬真人對話,並且給出使用者想搜索的內容、答案、軟件app應用,或者幫助用戶撥打電話、尋找聯繫人等等。

顧莫傑要弄的‘初秘’,就是一個狙擊siri的存在。

iphone4明年二季度就要上市了,初心2代手機會比iphone4更早一兩個月。

‘初秘’的開發,本來已經到了箭在弦上的衝刺階段。

初音集團在人工智能方面的步伐,並不比蘋果公司慢。哪怕沒有別的新招,顧莫傑手下的人也能按期完成初秘。

但是此刻,嚴磊讓顧莫傑看到了一股更高的期待。

他眉毛一挑,身子微微前傾。

“你是說,給你弄到谷歌中國過去五年在華蒐集的搜索數據,就可以幫助你提升初秘的人工智能程度?”

嚴磊細嚼慢嚥地吞下一片肥牛,喝了口飲料:

“當然。問題問答型的人工智能,本來就是要靠不斷訓練、不斷積累雲端大數據,纔會回答地得越來越準、越來越接近真人思維模式。搜索、點擊,本身不就是深度學習算法架構下,問答智能的最初淵藪麼?”

深度學習算法,本該是傑夫辛頓教授提出的學說。

本時空,這個機會被顧莫傑分潤了。

要說所有互聯網大佬當中,對深度學習算法和雲端架構的人工智能認識程度,恐怕顧莫傑能排世界第一。

只是在所有當老闆的人裡面,見識排世界第一。不包括和磚家們比。

也就是說,在對人工智能的遠見卓識上。哪怕拉里佩奇、扎克伯格、喬布斯,這3個大佬的見識,也比不上顧莫傑。

嚴磊的話,點撥到這種程度,已經足夠顧莫傑秒懂。

這個思路很不錯!

用百度,或者谷歌,搜索網頁。

這個搜索動作的本質,是什麼?

其實就是一次問答。

比如一個網民,在百度上搜“權寶兒”三個字,然後彈出幾百萬個搜索結果。

第一個搜的人,得到結果列表後,點擊了“權寶兒”的百度百科詞條。

第二個搜的人,點擊了一條她參加的綜藝節目視頻。

第三個搜的人,點擊了一條關於她的娛樂新聞。

第四個、第五個、第六個,又點了百度百科詞條。

假設,因爲百度的用戶容量夠大,有10萬人次搜了“權寶兒”這三個字,然後百度根據反饋統計:其中43%的人搜索後,點擊了百科詞條,22%的人,點了某娛樂新聞,17%的人……

這時候,如果把百度搜索的雲端大數據,接爲‘初秘’或者siri的服務器端,初秘就會知道:當下一次她的手機主人說出“權寶兒”這三個字的時候,優先把這個詞的百度百科詞條內容推送給主人——當然,是用語音閱讀的方式。

這是最簡單的問答型人工智能,靠統計數據,來讓機器的回答,更貼近代表所有網民中最大衆的那一羣人的意見。

這個過程中,機器並不理解“權寶兒”這三字代表了什麼,它只是在算法上統計了“所有曾經搜過這個詞的人,在搜索後點擊查看了哪條答案”,然後把看過人最多的那條答案,推送給最新問這個問題的人。

這樣的大數據,只有搜索引擎服務的提供商,才擁有。或者說,只有那類公司的數據,樣本容量才足夠巨大,足夠客觀,足夠撇掉誤差。

在中國,只有百度和谷歌有這個資本。

而且,百度和谷歌除了搜索大數據的歷史記錄足夠龐大、完爆其他搜索服務提供商之外,他們還有一個獨門之秘,在2009年只有他們兩家形成了規模。

那就是“百度知道”,以及比百度知道遜色一些的“谷歌問答”。

“知道”,是一個比搜索更加貼近人類語言習慣的問答產品。在搜索的時候,人只會打幾個關鍵詞,很少會直接長篇大論寫一句話,寫一個用人類正常語法表述的問題。

而用百度知道的時候,因爲背後是人類在回答,所以大家都遵循了人類語言的語法。

一個新買手機的用戶,和初秘或者siri聊天的時候,問到的問題,真的是絕無僅有、從來沒有前人問過的麼?

恐怕不盡然。

十幾億人心中的困惑,有相當大一部分是重合的。同一個問題,可能全國有幾百萬人想問。

有了百度知道的雲端大數據之後,初秘或者siri再聽到手機主人的語音發問時,就可以先搜一搜這個雲端數據,看看有沒有近似的或者重複的前人提問。

如果有,直接把前人提問中的“被採納答案”推送過來、語音閱讀一遍就行了。

在“知道”這個產品上,谷歌其實走得比百度慢。谷歌的強項,是“谷歌學術”那種專業標準化的問答,而缺少家長裡短的日常人工智能鍛鍊。

在人工智能領域,如果非要對比谷歌和百度的優劣勢,只能說:谷歌可以訓練出更精密的機器,但是不如百度那樣容易給機器學會‘七情六慾’。

因爲早年的谷歌,壓根就沒想到去鍛鍊其人工智能的這個方面。

當然,說句良心話,百度也沒想到。

“百度知道”日後教會了“度秘”比siri更能插科打諢,也只是百度發展時一招無心插柳的歪打正着。

……

正因爲顧莫傑懂行,因爲他自己就懂深度學習算法,所以,他比別人更能領會嚴磊開出的條件誘惑力。

初音集團,在搜索上是弱項。

但是初音集團,在人工智能的算法領域,是強項。

一個企業人工智能產品的強弱,受制於兩個因素。

一個是算法的好壞,一個是大數據的規模。

比如,谷歌的算法效率假設是10%,而谷歌的日搜索處理量是10億條,所以谷歌的人工智能每天理論消化的問答是1億條。

如果初音的算法效率更好,有20%,但初音每天的搜索處理量只有1億條,那麼初音人工智能每天理論消化的問答只有2000萬,比谷歌弱了五倍。

有好算法,有好的“數據消化效率”,卻沒有足夠的“數據飼料”去餵養這副“消化功能”極強的“胃口”。

這一直是初音人工智能研究院的缺憾,短板。

但是,如果按照嚴磊的說法,把谷歌中國過去五年,在中國市場上搜集到的服務器端歷史記錄數據統統copy過來,“填鴨式”地塞給“初秘”去學習,那麼初秘在“真正聽懂中國人講話”這個問題上,起碼可以贏得相當於額外獲得兩三年時間鍛鍊的效果。

歷史上siri公司成立於2007年,10年被蘋果收購後,在4s上放出了這個人工智能產品。

但是用過iphone4s的用戶,恐怕都有一種記憶:

剛開始,4s上的siri智能程度真的很低,幾乎聽不懂什麼話。還是隻能和舊時代的“語音撥號助手”那樣,幫主人翻翻通訊錄、撥打一下電話爲主。

至於讓siri真的近似於人一樣和主人聊天,似乎是2012~2013年的事情了,那時候的siri才漸漸說話像人話。

那就是因爲,siri花了兩三年時間來“學習”、來積累和消化雲端大數據,漸漸統計出人類語言習慣。

如果谷歌中國不倒下,谷歌在華的那多年數據記錄,肯定是作爲商業秘密不會公開的。因爲那涉及到其對中國人上網習慣的統計。如果公開了,很有可能被對手拿去,作爲優化對手引擎算法的參照物。

但是,如果谷歌中國倒下了,這些數據再遮遮掩掩藏着,似乎就沒什麼意義了。

只要顧莫傑出一筆看上去挺誠意的價碼,谷歌總部相信就會把這筆數據財富賣給初音。

顧莫傑意淫着美好前景,簡直要獸血沸騰。

恨不得現在就在老朋友拉利佩奇脊樑骨上捅一刀,然後把谷歌中國的數據資源巧取豪奪走。

“磊哥,來,好好說說你數據到手之後的詳細使用計劃。我都有點迫不及待了……”

“當然沒問題,就是如此如此,這般這般……”

嚴磊一副指點江山狀,對顧莫傑講解了一個鐘頭的技術路線梗概。

“只要做到了這些,然後,我們的初秘肯定可以在‘人話識別率’上領先siri至少兩年。”

第十五章 安卓暗戰第35章 波音級的待遇第149章 秒殺誰好呢第四十七章 劍宗乎?氣宗乎?第一百零五章 以刷止刷第七十九章 一切皆戰場第99章 此影帝非彼影帝第162章 網開零面第十七章 爽快人才好合作第七十五章 趕鴨子上架第二十八章 烈火烹油第三十四章 連橫合縱皆未果第四十七章 獸血沸騰的高考第十章 妖孽實力第61章 狗急跳牆第四十三章 好日子結束了第七十八章 補貼江湖第二十七章 2003年的第一次約第十七章 臨陣磨槍第三十七章 飛來橫禍第六十二章 機會成本第一百十一章 等等還可以搶救一下第26章 思考器官第十三章 電擊狂魔終極版第79章 天下無不亡之泡麪第七十八章 補貼江湖第七十四章 巋然不動第一百零二章 小馬哥的大手筆第57章 一百億美元眼都不眨一下第19章 無冕之王第58章 人在江湖飄哪能不挨刀第147章 初心2代-上第22章 美國人有的全得有第六十二章 啥生意都能做成共享經濟第七十一章 謀定而後炒第五十章 IPO佈局第九十一章 佈局四萬億第九十三章 天賜契機第二十八章 投名狀第13章 一個字酷兩個字裝逼第十一章 喝涼水也塞牙第八十八章 敗犬的遠吠第二十八章 精確窗口期第七章 和誰都能合作第130章 血洗第85章 自古補貼難逃死第160章 谷歌推倒計劃第四十七章 強勢上線第六十二章 場外和解?第143章 閱後即焚第八十五章 盜夢同款第四十七章 不該聽到的別聽第二十二章 哪國都有鍵盤俠第86章 像三體人一樣秒殺第55章 大XX共榮圈第八十七章 天上天下唯我吊第89章 最後一個天賜良機第七章 殭屍網絡第三章 源於生活第十章 魔高一尺第二十八章 精確窗口期第九十三章 必勝者只信自己第五十六章 燙手的金蛋第2章 聲望值MAX的效果第二章 當頭棒喝第97章 宿命第七十一章 謀定而後炒第七十四章 白送雙學位第五十二章 門口的野蠻人-下第四十三章 非典來襲第五十二章 我自巋然不動第三十九章 釜底抽薪絕戶計第三十六章 曲線陰影第四十八章 十一月的肖邦第七十三章 喊賊做賊第62章 不許動用的武器第一百十七章 大小非解禁第167章 衝破有色眼鏡第三十六章 想象力不夠用第四十三章 好日子結束了第十三章 上了公交就堵門?第三十六章 吊銷與轉型第三十一章 幕後交易第八章 遊戲界狂潮第九十九章 賭命也得賭第153章 只有永遠的利益第八十八章 人間陰間無雙逼第十章 魔高一尺第七十六章 剪不斷理還亂第五十章 能者無所不能第四十二章 自然生長第九章 這可不是狗大戶的錢第28章 抽搐的機會都沒有第51章 不擇手段第六十三章 殺人放火求招安第151章 你好污第二十九章 敵人的敵人第五十八章 潑泥碼的逆襲計劃第一百零八章 ONLYONE第三十五章 哭暈在廁所的英特爾
第十五章 安卓暗戰第35章 波音級的待遇第149章 秒殺誰好呢第四十七章 劍宗乎?氣宗乎?第一百零五章 以刷止刷第七十九章 一切皆戰場第99章 此影帝非彼影帝第162章 網開零面第十七章 爽快人才好合作第七十五章 趕鴨子上架第二十八章 烈火烹油第三十四章 連橫合縱皆未果第四十七章 獸血沸騰的高考第十章 妖孽實力第61章 狗急跳牆第四十三章 好日子結束了第七十八章 補貼江湖第二十七章 2003年的第一次約第十七章 臨陣磨槍第三十七章 飛來橫禍第六十二章 機會成本第一百十一章 等等還可以搶救一下第26章 思考器官第十三章 電擊狂魔終極版第79章 天下無不亡之泡麪第七十八章 補貼江湖第七十四章 巋然不動第一百零二章 小馬哥的大手筆第57章 一百億美元眼都不眨一下第19章 無冕之王第58章 人在江湖飄哪能不挨刀第147章 初心2代-上第22章 美國人有的全得有第六十二章 啥生意都能做成共享經濟第七十一章 謀定而後炒第五十章 IPO佈局第九十一章 佈局四萬億第九十三章 天賜契機第二十八章 投名狀第13章 一個字酷兩個字裝逼第十一章 喝涼水也塞牙第八十八章 敗犬的遠吠第二十八章 精確窗口期第七章 和誰都能合作第130章 血洗第85章 自古補貼難逃死第160章 谷歌推倒計劃第四十七章 強勢上線第六十二章 場外和解?第143章 閱後即焚第八十五章 盜夢同款第四十七章 不該聽到的別聽第二十二章 哪國都有鍵盤俠第86章 像三體人一樣秒殺第55章 大XX共榮圈第八十七章 天上天下唯我吊第89章 最後一個天賜良機第七章 殭屍網絡第三章 源於生活第十章 魔高一尺第二十八章 精確窗口期第九十三章 必勝者只信自己第五十六章 燙手的金蛋第2章 聲望值MAX的效果第二章 當頭棒喝第97章 宿命第七十一章 謀定而後炒第七十四章 白送雙學位第五十二章 門口的野蠻人-下第四十三章 非典來襲第五十二章 我自巋然不動第三十九章 釜底抽薪絕戶計第三十六章 曲線陰影第四十八章 十一月的肖邦第七十三章 喊賊做賊第62章 不許動用的武器第一百十七章 大小非解禁第167章 衝破有色眼鏡第三十六章 想象力不夠用第四十三章 好日子結束了第十三章 上了公交就堵門?第三十六章 吊銷與轉型第三十一章 幕後交易第八章 遊戲界狂潮第九十九章 賭命也得賭第153章 只有永遠的利益第八十八章 人間陰間無雙逼第十章 魔高一尺第七十六章 剪不斷理還亂第五十章 能者無所不能第四十二章 自然生長第九章 這可不是狗大戶的錢第28章 抽搐的機會都沒有第51章 不擇手段第六十三章 殺人放火求招安第151章 你好污第二十九章 敵人的敵人第五十八章 潑泥碼的逆襲計劃第一百零八章 ONLYONE第三十五章 哭暈在廁所的英特爾