第20章 寫論文

二十來分鐘後,大家鍛鍊完畢,回寢室稍作整頓,盥洗一番之後,就去了食堂。

由於早起運動的關係,每個人都多吃了一個饅頭,精神頭也好了不少。

飯後溜達了一會兒,幾個人就結伴回班,上早讀。

江寒端正地坐在座位上,拿出一個嶄新的筆記本,開始寫論文的第一稿。

先寫下標題:《感知機:大腦信息存儲和組織的概率模型》。

然後是摘要:“本文探討了生物神經元的工作機制,並建立了一個簡單的數學模型,以及探索瞭如何在機器學習中運用這個模型……通過對生物神經元的模擬,來解決線性可分的二分類問題。”

寫完摘要後,又設了幾個關鍵字,接下來就進入了正文。

第一部分是背景介紹,主要討論生物神經元。

“要了解智能對知覺識別,泛化,回憶和思考的能力,首先我們要回答三個問題:生物系統如何感知或檢測物理世界的信息?以什麼形式存儲或記住信息?存儲或記憶中的信息如何影響識別和行爲?

第一個問題屬於感官生理學領域,而且人們對它已經有了可觀的認識。第二和第三個問題,目前仍然只有大量的猜測,而且神經生理學提供的一些相關事實,還沒有被整合成爲一個可以被人們接受的理論……”

開宗明義之後,接下來,就可以詳細討論生物神經元的工作機制了。

足足用了兩千來字,才寫完這些羅裡吧嗦的東西,最後下了結論。

“綜上所述,不管什麼信息被保留,都必須以某種方式,存儲爲特定響應的偏好,即信息包含在連接或關聯中!”

接下來,進入下一環節,建立數學模型。

對於很多人來說,這是論文寫作之中,最爲困難的地方。

就算拿出“感知機”這種大殺器,江寒也並不擔心,會被人懷疑是重生者。

除非屢見不鮮,否則誰會一碰到厲害的人,就懷疑是穿越、重生來的?

網上關於劉秀和王莽的段子,只是調侃和玩笑罷了。

但江寒仍然決定,將數學部分精簡一下,儘量不涉及太高深的東西。

很多高等數學的東西,大學生學起來都挺費勁,自己一個普通高中生,憑啥能熟練運用?

除非能證明自己,的確是個不世出的天才,不然很難解釋。

如果得到足夠的學術點,將七維屬性都加到10以上,那自己不想當天才都不可能。

可現在是起步階段,還是穩一點的好。

“感知機”的工作邏輯很簡單,本來也不是什麼複雜的東西,只是表述上要稍微嚴謹一點。

前世刷過的那篇同名論文,大部分內容都是枯燥的論述,數學推導並不多,關於如何在計算機上實現,則基本沒怎麼講。

這也不怪原作者,那個年代的計算機科學,本來就不怎麼發達。

而且那篇論文的精華,也就是一個模型,一個原理。

至於編程實現,有了模型之後,那還不是So easy嗎?

但現在是2012年,計算機技術已經取得了長足進步,足夠將機器學習技術,運用於生產生活實踐了。

所以,江寒將這篇論文的重點,放在了原理解析,以及如何實現上。

除了開頭第一段,江寒並沒有照抄原文,事實上,他也沒那個本事。

那麼長的論文,能記住大概思路,就相當不錯了。

一個字不差背下來?江寒做不到啊!

根據自己對該技術的理解,江寒開始自由發揮。

先從最簡單的情況,也就是單變量開始討論。

“對於只含有1個輸入信號xi的樣本集T,我們期望找到一個線性函數y=wx+b,通過輸入的數據xi和標籤yi,確定其中的權重w和偏置b,其中權重w控制輸入信號的重要性,而偏置b可調整神經元被激活的難易程度……”

江寒越寫越順,下筆如飛。

“……

我們定義損失函數如下:L(w,b)=?(1/--w--)∑y i (w?x i +b),根據預設的學習率η,不斷調整權重w和偏置b,直到損失函數到達極小點,即可得到可用的函數模型。

綜上所述,學習算法如下:

首先選定訓練數據集T=(x1,y1),(x2,y2),...,(xN,yN),yi∈{?1,+1}並指定一個學習率η(0<η<1);

1、任意選定權重w和偏置b;

2、讀入數據點(xi,yi);

3、判斷該數據點是否爲誤分類點,如果yi(w?xi+b)≤0 則更新w=w+ηyixi;b=b+ηy i;

4、重複進行2、3步,直到沒有誤分類點。

此時,我們就獲得了最佳的w和b,把它們代入y=wx+b,就得到了一個數學模型。”

感知機的學習過程,有個非常形象的比喻。

假設在一個棋盤上,有一堆黑子,和一堆白子,它們不相混合。

下面,拿一根細棍放上去。

我們希望這根棍子,能恰好將黑子和白子分開,棍子的一邊全是黑子,另一邊全是白子。

先把棍子隨機扔到棋盤上,如果恰好將黑子和白子分開了,那就皆大歡喜,否則的話,就平移和調整棍子的角度,直到所有白子和黑子恰好分開……

那根棍子就是感知機,而挪動棍子的過程,就是感知機在學習。

棍子的角度和平移量,就是要尋找的參數w和b,也就是直線(棍子)在平面直角座標系(棋盤)裡的函數解析式。

瞧,夠通俗易懂吧?

可惜寫論文就不能這麼寫了。

感知機是人工神經網絡的雛形,其中有個關鍵概念,叫激活函數,它決定了一個神經元是否有輸出。

江寒在這裡,用一個階躍函數sign(x)作爲激活函數,其定義爲: x<0時函數取值-1; x≥0時函數值爲1。

只要將sign換成sigmoid或者其他非線性函數,就是真正的單層前饋神經網絡了。

但江寒並沒有着急將sign之外的函數拋出去。

在第一篇論文裡,最重要的是提出概念,其他東西完全可以在下一篇論文中再討論。

能多水幾篇,豈不更加美滋滋?

搞定了輸入空間是1維的情況,接下來,就可以擴展到N維。

“對於一般情況,當有n個輸入信號時,假設輸入空間是x∈Rn,輸出空間是y∈{+1,-1}。輸入x∈X 表示實例的特徵向量,對應於輸入空間的點;輸出y屬於Y 表示實例的類別。

由輸入空間到輸出空間的如下函數:Ψ(x)=rsign(w1x1+w2x2+……+wnxn+b)=rsign(wTx+b),就可以稱之爲感知機,其中w∈Rn,b∈R爲感知機算法的參數……”

在討論完n個輸入信號的情況後,江寒指出:

“模型建立之後,經過訓練,就可以得到一組權重和偏置,這些參數確定了一個分離超平面(定義爲n維空間上的一個n-1維子空間),此超平面可以將訓練集中的數據,完全正確地分成兩份,一份爲正,一份爲負(或者0,可以自己定義)。”

取得了模型的參數後,就可以把測試數據放進去,根據模型函數運算的結果,就能對數據進行分類。

感知器用處很廣泛,幾乎所有二分類問題,都可以用它來試一試。

當然,必須是線性可分的問題,線性不可分的問題,是不能用單層感知器解決的。

例如年齡和有沒有生活經驗,就不存在線性關係;長得帥不帥和學習好不好,也沒有線性關係……

關於如何高效地判斷數據是否線性可分,江寒還真研究過,只是這個題目比較大,三言兩語說不清楚。

嗯……好像又能多水一篇或幾篇SCI?

第373章 肉體永生,還是機械飛昇?第63章 巧嗎?第344章 好險間接那個啥第55章 委託第275章 整整齊齊、更高更遠第303章 你以爲就這樣而已?第225章 papa別鬧!第375章 沒有操作系統怎麼辦?第226章 還能剩下幾個?第214章 小夥子,你很有勇氣啊!第420章 強化學習的威力第194章 睡不着怎麼辦?第409章 晨曦III巨型計算機第59章 上乾貨第260章 這可是B5啊!第159章 想怎麼看,就怎麼看?第176章 現學現賣第217章 超級粉絲第371章 莫非換了個女朋友?第68章 舉報了、舉報了第110章 敲竹槓第129章 兩道試題第372章 卷積神經網絡第97章 媽媽問我爲何跪着看手機?第252章 生吃海蔘,不蘸醬油第95章 再花5000也值第7章 所謂“取整”,就是……第175章 一億一個第92章 《激光雕刻機》第128章 被傳染了怎麼辦?第256章 擴展歐幾里得算法,以及增強線段樹第280章 這就成了“學者”了?第133章 過去的自己,以及自己的過去第197章 除了不能說的第115章 無線電發射器第201章 組內學習競賽第23章 震驚商城,開啓!第43章 寫字機器人第171章 蘇婉瑩的秘密第312章 阱中有坑,坑裡有釘第297章 Py大法威力無窮第56章 花錢容易賺錢難第383章 全自動刷分第2章 基本操作第208章 有埋伏第41章 要是不帥不酷呢?第195章 二八佳人體如酥第170章 只是一場遊戲嗎?第286章 破解壞蘋果第36章 家宴第140章 虛驚第113章 刷分的可能性第387章 打印機和繪圖儀第87章 夜話第6章 三個系統倒有四種資源?第98章 全能UP主第207章 複賽環境和Arbiter評測系統第180章 想謙虛都沒地方謙虛第262章 貴有貴的道理第363章 終於對《我的世界》下手了……第157章 找個清靜的地方第16章 倔強的夏雨菲第14章 別帶壞了江寒第297章 Py大法威力無窮第262章 貴有貴的道理第347章 中計了第292章 江寒的靈氣與編程之道第256章 擴展歐幾里得算法,以及增強線段樹第283章 給靈感充點值第386章 測量“虛擬空間”的曲率第410章 六度分割理論?第75章 金少樓的警告第292章 江寒的靈氣與編程之道第207章 複賽環境和Arbiter評測系統第55章 委託第407章 科幻片,恐怖片?第195章 二八佳人體如酥第85章 吊橋效應第382章 電動車和機械臂第351章 送她點什麼?第40章 好朋友來了第321章 星戰銀行,黑卡飛刀第403章 家產億萬,平平無奇今天只有一章了第415章 滿分入選國家隊第354章 迷你3D打印機第16章 倔強的夏雨菲第386章 測量“虛擬空間”的曲率第363章 終於對《我的世界》下手了……第359章 大佬,怪蜀黍?第234章 恐高症第68章 舉報了、舉報了第129章 兩道試題第164章 不會被下藥吧?第139章 野豬!?第140章 虛驚第84章 磁陣第340章 實力還是運氣?第350章 男生不準進去的地方
第373章 肉體永生,還是機械飛昇?第63章 巧嗎?第344章 好險間接那個啥第55章 委託第275章 整整齊齊、更高更遠第303章 你以爲就這樣而已?第225章 papa別鬧!第375章 沒有操作系統怎麼辦?第226章 還能剩下幾個?第214章 小夥子,你很有勇氣啊!第420章 強化學習的威力第194章 睡不着怎麼辦?第409章 晨曦III巨型計算機第59章 上乾貨第260章 這可是B5啊!第159章 想怎麼看,就怎麼看?第176章 現學現賣第217章 超級粉絲第371章 莫非換了個女朋友?第68章 舉報了、舉報了第110章 敲竹槓第129章 兩道試題第372章 卷積神經網絡第97章 媽媽問我爲何跪着看手機?第252章 生吃海蔘,不蘸醬油第95章 再花5000也值第7章 所謂“取整”,就是……第175章 一億一個第92章 《激光雕刻機》第128章 被傳染了怎麼辦?第256章 擴展歐幾里得算法,以及增強線段樹第280章 這就成了“學者”了?第133章 過去的自己,以及自己的過去第197章 除了不能說的第115章 無線電發射器第201章 組內學習競賽第23章 震驚商城,開啓!第43章 寫字機器人第171章 蘇婉瑩的秘密第312章 阱中有坑,坑裡有釘第297章 Py大法威力無窮第56章 花錢容易賺錢難第383章 全自動刷分第2章 基本操作第208章 有埋伏第41章 要是不帥不酷呢?第195章 二八佳人體如酥第170章 只是一場遊戲嗎?第286章 破解壞蘋果第36章 家宴第140章 虛驚第113章 刷分的可能性第387章 打印機和繪圖儀第87章 夜話第6章 三個系統倒有四種資源?第98章 全能UP主第207章 複賽環境和Arbiter評測系統第180章 想謙虛都沒地方謙虛第262章 貴有貴的道理第363章 終於對《我的世界》下手了……第157章 找個清靜的地方第16章 倔強的夏雨菲第14章 別帶壞了江寒第297章 Py大法威力無窮第262章 貴有貴的道理第347章 中計了第292章 江寒的靈氣與編程之道第256章 擴展歐幾里得算法,以及增強線段樹第283章 給靈感充點值第386章 測量“虛擬空間”的曲率第410章 六度分割理論?第75章 金少樓的警告第292章 江寒的靈氣與編程之道第207章 複賽環境和Arbiter評測系統第55章 委託第407章 科幻片,恐怖片?第195章 二八佳人體如酥第85章 吊橋效應第382章 電動車和機械臂第351章 送她點什麼?第40章 好朋友來了第321章 星戰銀行,黑卡飛刀第403章 家產億萬,平平無奇今天只有一章了第415章 滿分入選國家隊第354章 迷你3D打印機第16章 倔強的夏雨菲第386章 測量“虛擬空間”的曲率第363章 終於對《我的世界》下手了……第359章 大佬,怪蜀黍?第234章 恐高症第68章 舉報了、舉報了第129章 兩道試題第164章 不會被下藥吧?第139章 野豬!?第140章 虛驚第84章 磁陣第340章 實力還是運氣?第350章 男生不準進去的地方