關於如何調查“匿名者”,追尋永生的同類們,想法、思路大概都一樣。
那麼,作爲永生之路上的後來者,能力又不太可能勝過所有的競爭者,找不到線索也很正常。
之所以出現這樣的情形,無非是因爲,在網絡上調查一個ID的身份和行跡,黑客的手段都差不多,人類的思維模式也多少會有相似之處;他方然能想到的辦法,先行者差不多都會早一步想到、並採取行動。
但是AI的行動策略,某種程度上,就和人的思維不太一樣。
對人工智能的研發認識有限,方然對AI應用於具體事務的原理也不甚了了,不過,既然AIASG能通過機器學習的方式逐漸模仿人的軟件開發活動,那麼原則上講,使用類似的系統來模仿自己的搜索活動,應該也是可以的。
至於說,AI能夠在這樣的任務中發揮到什麼程度,AIASG的表現可以作爲對照:
根據自己掌握的資料,在經歷過一次大規模升級後,就在不久之前,開發團隊在AIASG工作流程的一次梳理中,發現其具備了“有限意義”的創造性開發能力:在開發某服務器駐留程序時,面對某具體需求,系統自主完成了一段算法、並將其內嵌到軟件中,而且這段算法,在AIASG的數據庫中,是找不到的。
對給定的問題,提供算法,人工智能的這一進展是突破性的。
某種程度上,如果按某些研究者的觀點,這甚至可以作爲AI具有某種“意識”的證據,雖然系統實現的算法,在數據庫中有若干相近的算法作爲基礎,但對這些算法進行組合、協調,用來解決全新的問題,這在以前完全是人類算法設計師才具有的能力,也是人類智慧獨一無二的標誌。
現在,哪怕只是解決簡單的問題,AI自己也能做到。
對人工智能的這一進展,方然看在眼裡,覺得有些不可思議,但眼下他沒時間去探究這意味深長的突破,而是設法從“國際商用機器”的內部網絡裡,尋找AIASG開發過程中的項目資料,繼而得到該項目的部分早期代碼。
一邊看代碼,一邊查開發文檔,方然很快發現該項目的複雜度超乎想象,核心的人工智能模塊沒什麼新意,倒是負責分析軟件需求的部分,十分龐大而精密,這部分的代碼也是最零散而不成系統的,好在對自己的設想而言,這部分用處並不大,於是他將意圖組織、掩飾,然後發佈到黑客論壇上。
自己開發可用的系統,耗費時間太長,方然索性將其發佈爲商業項目。
在AI大行其道,哪怕外行都能看出大趨勢的今天,網絡上人工智能相關的開發項目浩如煙海,混雜在大量類似的開發計劃裡,“自動搜索分析”的項目描述並不起眼。
在人工智能的應用難度上,搜索、分析數據,是相當基礎的操作,最後還是要提交給自己來判斷,這樣的項目,規模並不太大,方然用新註冊的ID扮演承包商,向參與項目的兼職者支付報酬,大概在西曆1472年初秋,得到了第一個可用版本。
初步測試軟件,利用“自動搜索分析器”抓取信息,方然對AI的能力進行了評估。
將命名爲ASA的軟件上線到第三方服務器後,每天抽一點時間查看日誌,一週後,方然驗證了自己的預測。
人工智能自動抓取數據分析的能力,沒有想象中那麼強,排除服務器計算資源的限制後,總體上還是要比他自己來做慢得多,收集到的訊息雜亂無章,即便經過篩選,也很難彙總成有條理的報告供人閱讀。
但這只是系統第一次上線的表現。
在這之後,隨着機器學習的進行,盤踞在代碼中的神經網絡架構逐漸熟悉了操作流程,搜索的準確率和速度都在提升,不僅如此,此前在AIASG運行中觀察到的現象,也出現在了ASA的行爲模式裡。
這也正是方然所需要的。
在網絡上搜索、分析資料,做法,無非是截取數據並進行處理,這一點無論是人、還是程序來做,都只有速度和廣泛度的區別。
但問題在於,面對互聯網絡上數以億計的信息節點,數以萬億計的數據文件,乃至數以ZB(十萬億億字節)計的數據,如此龐大的數據量,沒可能不加選擇的進行分析處理,究竟要如何取捨,就十分棘手。
面對這種規模的問題,人和計算機的思路,並不一致。
面對數據量超出分析能力的情形,人的解決辦法,往往是藉助自身的經驗、和已經掌握的線索,進行通過率極低的初步篩查,把百分之九十九點九的信息來源都排除在外,接下來,在實施數據截取、系統侵入時,又會進行類似的篩選,把有限的時間精力集中到最有可能取得突破的方向。
這樣做,說好聽點是更有針對性,說實話則是面對海量數據的妥協。
譬如方然自己,之前調查“匿名者”的時候,雖然儘可能的多方面收集訊息,但,再怎樣拓寬口徑,也不會去侵入漢堡王的結賬系統,或者窺探汽車零部件供應商的庫存數據,因爲這些與“匿名者”行蹤八竿子打不着的數據,沒有任何搜查的必要。
但人工智能卻不這麼認爲:
憑藉遠超人類的處理能力,AI更傾向於採用“廣種薄收”的策略。
每天查看ASA系統的分析報告,經過幾個月的訓練,方然認爲這一系統已具備了實戰能力,考慮再三,他又花費時間將核心代碼內嵌到伯克利大學自然科學部的服務器裡,以“學術數據蒐集與分析系統”的名義來運作。
項目部署完畢,在秋天的伯克利,方然每天的日程就多了一項內容,基本上,不論在實驗室還是在寢室裡,他都會打開監視器,用旁觀者的視角去審視ASA的行爲,一來是扮演嗅探者的角色,評估這一系統、乃至隱藏於幕後的自己被發現的風險,二來也可以更客觀的觀察人工智能的數據蒐集策略。
上線不久,“自動搜索與分析”系統的表現,就出乎了方然的意料。