“拒絕談判?”
太平洋彼岸,阿美瑞卡某處會客室,一名男子不可置信的看到。
“我就說,他們絕不會答應進口核輻射地區的糧食的,他們跟我們不一樣,他們是有底線的。”
“鮑姆,不對。我們現在還沒有開始談條件呢,這些東西,我們要談什麼,他們現在不可能知道的。”
“Jacks,那他們爲什麼拒絕的如此乾脆?連談都不願意談?究竟哪裡出了問題?
“難道是工業人工智能模型的未來不夠誘人?還是他們已經發現了什麼?”
“不不不,”傑克斯搖頭:“我們的專家評估了那麼長時間才得出的確切結論,他們那落後那麼多的水平,專家們即便是猜到了,也絕對不敢打包票作保證。”
現在的人工智能訓練,包括最強大的GPT4.0,都是一樣的原理,就是海量語料和海量算力的堆積。
語言模型,像ChatGPT,海量的語料獲取非常容易,網絡上爬取就是了,無非就是需要進行一番清洗,只要不在乎成本,可以無限堆積。
哪怕是OpenAi和GitHub合作共同訓練的代碼機器人模型,那也有GitHub代碼倉庫裡不計其數的代碼做訓練支撐。
但工業模型訓練呢?工業生產數據可不像語言和代碼那樣,全網都是,爬取就完了。
哪兒來的那麼多的工業數據來做訓練支撐呢?
且不說各家的工業數據都是核心隱私,根本不可能共享。就算能也沒用。
智庫評估,哪怕把全美甚至全世界的工業生產數據全部擼來,也不夠工業模型訓練之萬一的。
換言之,就是這玩意不可能存在。
……
“是的,不可能存在。”文國昌開完會,立刻就趕往了華州,他要見一見程旭,程旭也是直接了當:
“文老,以現有的人工智能模型訓練方式,至少十幾二十年內,成熟的大型工業人工智能模型沒有任何出現的可能。”
“你說的這些,包括,現有工業生產數據根本不可能支撐大型工業模型的訓練這種觀點,很多專家也都說了。”
文國昌問道:“但是,他們都不敢這麼保證。你爲什麼就敢說十幾二十年不可能?”
“他們是你的智囊團,要對你的決策負責。”程序笑道:“而我嘛,只是跟一個老朋友聊聊天,我有什麼不好說的?”
“小鬼頭。”文國昌笑了笑,沒有再糾結這個問題,這其中的道道,他比程旭明白。
“你說十幾二十年不會出現大型工業人工智能模型,我選擇信你。”
文國昌起身,鄭重的說道:“這個決策,是我個人做出的,有我來負責。”
“文老,您等會兒,”程旭立刻制止:“我什麼時候說過了。”
“你剛纔不是說……”文國昌心中突然一驚,滿臉疑惑的看着程旭。
“文老,我說的可是,以現有的人工智能模型訓練方式,是有這個前提條件的。”
程旭笑道:“換言之,阿美瑞卡不會有,但我可沒說我們不會有。”
“價值判定方法?”文老詢問道。
“文老也知道價值判定?”
程旭一驚,不過隨後也就明白了,就現在的世界形勢,這麼重要的東西不關注反倒不正常了。
文國昌點了點頭,也沒有瞞着:“我不想知道也得知道,從昨天到今天,價值判定這四個字兒都快把我的耳朵磨出繭子來了。
各路專家分析來分析去,沒有形成統一認知。
“認爲它好的,那叫一個誇,誇得天上有地下無的,開創人工智能訓練新的時代,這評價,高的沒邊兒了。
“也有人認爲,它是有點兒突破,但也就那麼回事兒,再怎麼強也強不過阿美瑞卡。畢竟人家起步早,沒有個三五十年怎麼趕得上呢?還是建議得妥協。
“現在,我想聽聽,你這個創造者對價值判定是怎麼樣的一個看法。”
“文老,價值判定是什麼我就不跟您講了,相信專家們肯定分析過了,講的肯定比我好。”
程旭笑道:“我就給您說說,基於價值判定核心,出現的一種新的訓練模型:我管它叫【條概模型】。”
“現在的人工智能訓練模型,不管哪一種,都是概率統計模型。”
程旭說着,看文老有些懵,瞬間改了一種說法:“這就像什麼呢,我們把人工智能當成一個牙牙學語小孩兒,我們教一個孩子學習語言。
“現在的模型是怎麼教的呢?給它一大堆的文章,成G成T的給它,它就會自己去拆解這些文章,統計字與字、詞與詞之間的組合和出現的概率。
“計算是計算機擅長的啊,尤其是GPU,專有運算能力非常強大,海量的數據和算力堆積就形成了現在看似是思考和邏輯的語言能力,其本質還是統計概率。
“而我的條件概率模型呢,開始的時候是不會給它海量文章的,它像孩子一樣,先學識字、再學組詞造句、再學詞性分解。
“訓練了完了這些,再給它灌輸中量的文章語料,去統計這些字這些詞出現的境況概率和詞性分解情況,慢慢的形成看起來具有一定思考和邏輯的語言能力。”
“看起來本質還是概率統計啊!”文國昌笑道。
“對,本質還是概率統計,”程旭也笑了:“它形成的東西,也只是看起來具有思考性和邏輯,它自己本身是沒有這個概念的。
“不過話說回來,如果它真的像孩子一樣,慢慢的形成思維,那就不是強大,而是可怕了吧?”
文國昌點了點頭,他聽懂了。
雖然本質還是概率統計,但是條件概率,提前通過某種手段剔除掉了絕大部分不可能的情況,那剔除的這部分,訓練量就完全省下來了。
從程旭的話裡邊也非常明顯的聽出來,現有模型訓練是海量數據堆積、海量算力支撐,而條概模型,是先行基礎邏輯,然後中量數據投喂,進行統計分析。
海量,那是沒量,愈多愈善。但,中量——可能也不少,但至少有數了。
這一比較——
突然想起剛剛說起的工業人工智能訓練模型,按現有的訓練方式,全世界的工業數據都不足以支撐。
那條概模型呢?
“條概模型能省多大水平的數據?”文國昌也是殷切的問道。
程旭一眼就看出了文老的心思,因爲他壓根沒有加以掩飾:
“利用條概模型,我說的是未來的成熟條概模型哈,而不是千尋臨時用的那個還不完善的模型雛形。
“利用條概模型,以我國的工業體系數據,絕對足以支撐一個大型工業人工智能模型的訓練。”
“哈哈哈哈哈哈……”
文國昌仰面大笑,內心十分舒爽:
阿美瑞卡是在吹牛、在忽悠,他們一定想不到,我們未來竟然有可能真的實現吧?