第398章 商用級手寫識別算法

有圖科技是一家股份制公司,專業生產各種掃描儀。

該公司出品的“宏圖”系列光學掃描儀,在國內市場的佔有率,一向超過60%。

之所以賣得這麼好,跟他們自主研發的“宏圖OCR”軟件,關係不可謂不大。

軟件研發部中,一場工作會議正在進行。

“王工,咱們的新版OCR,還得多久能投入市場?”

說話的是藍戰新,他今年不過40歲左右,卻已在部長的位置上,穩坐了10餘年。

王仁見部長點到自己,連忙回答說:“最多一個星期。”

藍戰新點了點頭,看起來對這個答案比較滿意。

他想了想,又問:“和上一版相比,性能提升的幅度多大?”

“3%以上。”王仁回答。

“這麼高?”藍部長有些意外。

王仁露出自信地微笑:“對比較乾淨的中文版面,理想情況下,識別正確率可超過92.8%,達到了國際先進水準。”

藍戰新眼神一亮:“太好了!這樣一來,咱們的掃描儀產品,在國內的市場佔有率,一定能進一步擴大。”

王工“謙遜”地一笑,搖了搖頭:“不是我們厲害,是對手不夠能打。”

藍戰新笑了起來:“這話有點道理。有句話怎麼說來着,全靠同行襯托?”

其餘人也陪着他一起笑了起來。

沒錯,一直以來,市場上的其他中文OCR產品,識別正確率基本在85%到90%之間波動。

宏圖OCR已經是其中的佼佼者。

然而,他們萬萬料想不到,一個打破行業規則的強大OCR軟件,即將出世……

※※※

虛擬空間裡。

江寒花費了上百個小時,一共學完了三本書:《電動力學》、《量子力學I》、《熱力學和統計物理》。

他的身邊,也積攢了厚厚一摞空白圖紙。

當然,現在這些圖紙已經不空了,寫滿了各種算式和習題解答。

以江寒現在的學習速度,20~30小時一本書,一點壓力也沒有。

關鍵是,即使連續用腦上百小時,他仍然沒有感到一絲倦意。

換成剛得到系統的時候,高強度學習、工作4~5個小時,也就差不多到極限了。

而自從學力等級提升到“學者9星”之後,他就沒發現自己精力不夠用過……

雖然消耗的冰島紅極參更多了,可是和帶來的好處相比,那點金錢上的支出,完全是微不足道的。

江寒非常好奇,不知道自己現在,到底能連續學習多長時間?

於是接下來,他就毫不停頓地繼續啃書、做習題。

又是上百個小時過去,《粒子物理與核物理導論》、《量子物理II》、《等離子體物理》也全學完了。

而他身邊的空白圖紙,也從10CM左右的高度,增長到了18CM以上。

江寒終於有了一絲倦意,但感覺還能撐住,於是毫不停留地繼續學習。

《固體物理》、《高等光學》、《生物物理》、《流體力學》……

一個個txt文件學完,然後連同配套的小圖片集,一起挪到了“已學”文件夾中。

不知過了多久。

江寒學完了最後一個txt文件後,愕然發現,“物理學”文件夾已經空了。

這意味着,他一晚之間,學完了大學物理學專業,本科階段的大半專業課。

當然,只是理論方面,至於實驗,還一個也沒有做……

直到這時,江寒才感覺到了深深地疲倦,連忙退出了虛擬空間。

看了眼學科經驗值面板。

物理學的進度條,只差不到1/5,就能升到高級了。

江寒忍不住咧嘴一笑。

這還不到三個小時,自己就搞定了十來本物理專業本科教材。

沒啥意外的話,再有個把星期,物理、化學、生物三科,都能達到高級水準。

這種學習效率……

“嗯……搞不好,這纔是虛擬空間的正確打開方式?”

江寒在心裡嘟囔了一句,隨後就昏睡了過去。

第二天醒來,他仍感覺精神不夠飽滿,注意力有點無法集中。

於是思考了一下後,起身、穿衣、下樓。

廚房裡,夏如虹正忙着做早餐。

江寒笑着問候了一聲“早安”,隨後說:“阿姨,給我多加幾個紅極參吧。”

“沒問題!”

夏如虹笑呵呵地答應了,一副心情不錯的樣子。

吃完飯,夏如虹出門上班,夏雨菲繼續作曲。

江寒出門溜達了一圈,散心爲主,順便思考一下接下來的計劃。

半小時後,他回到了別墅中,就打開筆記本電腦,開始開發新軟件。

中文OCR都已經弄出來了,不妨稍微改進一下,再做一款性能過得去的“商用型中文手寫識別”。

這個世界上以前並沒有神經網絡,但這並不意味着,就沒有手寫識別和語音識別了。

條條大路通羅馬。

在機器學習領域,實現同樣的功能,有許多方案可以選擇。

只是這些替代方案,要麼正確率不夠高,要麼需要強大的算力支持……

目前爲止,在商業領域還沒有足夠高明的手寫識別算法。

而這,正是江寒的機會。

老實講,再過半個月,等他那兩篇關於CNN的論文傳播開來……

人工神經網絡在圖像識別領域的性能優勢,一定會被有識之士注意到。

到時候,幾乎可以肯定,會掀起一場技術更新的盛宴。

不出意外的話,各種各樣使用了CNN的應用,會如雨後春筍般出現。

其中絕對少不了各種手寫識別軟件。

這樣一來,要想在中文手寫識別項目上賺到錢,就必須抓緊時間了……

用於中文手寫識別的CNN網絡,和OCR神經網絡相比,在架構上極其相似。

江寒很快就把核心代碼弄了出來,只在一些細節上,進行了微不足道的調整。

然而,最大的問題是缺少訓練數據。

中文手寫識別的素材庫,基本上都攥在各大手機廠商,以及一些軟件公司、研究所手裡。

免費使用是根本不可能的,就算肯花錢,只怕那些廠商和行業大佬,也不會很容易鬆口。

江寒想了想,決定聯繫一下自己未來的導師。

張德昭人在科大,說不定能聯絡上訊飛公司。

手機裡常見的訊飛輸入法,就是訊飛公司研發的。

江寒手機裡就有訊飛輸入法,他重生之後,也試用過幾次。

可惜的是,這時候的訊飛輸入法,性能着實有點普通,語音輸入還算可以,手寫技術遠遠算不上成熟。

就算這樣,訊飛輸入法在國內外,已經算得上頂尖水準了。

事實上,在這個世界,大多數手寫識別輸入法,表現都很難讓人滿意。

不難猜想,很可能是缺少了人工神經網絡技術,才導致了這種情況發生……

手寫中文素材庫這種東西,別的地方不好找,訊飛公司一定有。

而且這個時候的訊飛,還不是一家股份制公司。

這樣更好,談起交易來更加方便……

江寒拿出手機,給張德昭撥打了過去。

老張接起電話:“喂?”

江寒:“張教授,我是江寒。”

張德昭笑了起來:“是不是想好了,打算提前來上預科?”

江寒微微一笑:“那倒不是,我這次找您,是有別的事情。”

張德昭脾氣很好:“只要不是你改主意不來了,那就有的商量。”

江寒呵呵一笑:“您老對我有點缺少信心了,說好的事情,哪那麼容易變卦?”

老張鬆了口氣:“那就好……什麼事?說吧。”

江寒將自己的需求描述了一遍。

“手寫漢字的素材?”

老張思考了一下,說:“據我所知,訊飛那邊的確有一個素材庫,規模好像還不小。”

頓了頓:“只是……”

江寒笑着問:“只是怎麼?”

老張嘆了口氣:“我跟他們的朱總也不是很熟,空口白話的,很難讓人家把那麼重要的東西分享出來。”

江寒微微一笑:“我可不是衝着佔便宜去的,該掏的錢還是會掏的……”

又說:“勞煩您從中撮合一下,不管是有償使用,還是合作開發,我都可以考慮。”

老張考慮了一會兒,一咬牙:“行,我就豁出這張老臉,去當一回說客!”

江寒連忙感謝,想了想,又補充說:“當然,如果他們的條件太苛刻,那就算了,我也不想白忙活……”

張德昭哈哈一笑:“這個你就儘管放心吧,我一定儘量把條件談得‘合理’一點。”

接下來,老張又詢問了一下江寒的學習情況,這纔是他最關心的事情。

江寒挑不那麼聳人聽聞的部分,簡單地彙報了一下。

比如說,“粗略”地翻完了大學本科階段,所有的信息學、數學,以及“少”部分物理學教材……

雖然江寒已經儘量輕描淡寫了,但聽在老張的耳朵裡,仍稍嫌浮誇了一點。

“多學點數學和物理也是好事,但切記貪多嚼不爛,一定要保證學多少、會多少,在學好信息學的基礎上,再兼顧其他科目……”

對於老張的殷殷叮囑,江寒連聲稱是。

不過,回頭該怎麼學,還得怎麼學。

自己的路,只能自己去走。

放下電話後,江寒繼續完善程序。

本以爲這事兒,即使老張親自出馬,一時半會兒的,只怕也談不下來。

誰料,還沒過兩個小時,老張的電話就打了過來。

第124章 招兵買馬第283章 給靈感充點值第234章 恐高症請假,存稿丟失一章,正在想辦法重寫第106章 查戶口第369章 點八個,贈十個……第336章 女孩的心思你別猜第374章 手工打造LED顯示器第19章 一切爲了押韻第422章 更有效率的刷分第185章 是不是太敏感了?第70章 水上公園第215章 儀表堂堂,器宇軒昂第411章 不可不防,防不勝防第43章 寫字機器人第360章 造了什麼孽?第232章 江寒的野望第155章 到底什麼關係?今天只有一章了第205章 江寒的心性第220章 英俊瀟灑,踏雪無痕第269章 易中海的困境第209章 校服就是最正式的裝扮第85章 吊橋效應第229章 從源頭上防仿製?第46章 月考開始第260章 這可是B5啊!第254章 數據解析和FCN的拓撲結構第48章 《如果時間能倒退》第419章 媽可能是親媽,爹……第336章 女孩的心思你別猜第223章 她不會玩真的吧?第97章 媽媽問我爲何跪着看手機?第413章 得講究點格調第368章 能幹的小秘書?第3章 一個大膽的想法第275章 整整齊齊、更高更遠第39章 這可能是個誤會第137章 聽鬆小院,好地方?第51章 任務分析第254章 數據解析和FCN的拓撲結構第304章 不忘舊情,有恩必償第193章 這也太考驗人了吧?第227章 智能安防報警系統第69章 論如何追女孩紙第409章 晨曦III巨型計算機第282章 又一顆壞蘋果?第33章 蘋果開發者賬號第395章 柳東斌和秦易第53章 大功告成第100章 談判第250章 幸虧有雙保險第325章 說好的理想男神呢?第138章 避蚊胺,登山第94章 水論文的正確姿勢第328章 脣槍舌劍,物我兩忘第189章 查房第127章 只怪準備得太充分了第251章 特效藥第397章 作曲大師,自帶乾糧第291章 驚動了各路神仙第171章 蘇婉瑩的秘密第172章 誰是誰的小糖人?第379章 似真似幻,恍如隔世第135章 巧合?考驗?第363章 終於對《我的世界》下手了……第169章 最後0.5公分第176章 現學現賣第169章 最後0.5公分第142章 哪捨得叫你疊被鋪牀?第417章 江寒的圍棋水平第108章 情趣第77章 多少次回眸第115章 無線電發射器第228章 恐怖如斯第251章 特效藥第70章 水上公園第198章 唯實話與馬屁不穿第286章 破解壞蘋果第145章 陳萱的邀請第359章 大佬,怪蜀黍?第82章 渣男反編譯第5章 三個系統準備就緒第359章 大佬,怪蜀黍?第361章 有點像“年輕”時的自己第200章 真的只是惡作劇嗎?第385章 超大規模集成神經網絡第157章 找個清靜的地方第358章 27個學術點第273章 假如氪金就能變強第53章 大功告成第195章 二八佳人體如酥第126章 八樓的直升飛機第257章 NOIP中最難的題型第89章 進入狀態這麼快?第403章 家產億萬,平平無奇第11章 像我這麼專一第167章 提醒還是邀請?第82章 渣男反編譯第415章 滿分入選國家隊
第124章 招兵買馬第283章 給靈感充點值第234章 恐高症請假,存稿丟失一章,正在想辦法重寫第106章 查戶口第369章 點八個,贈十個……第336章 女孩的心思你別猜第374章 手工打造LED顯示器第19章 一切爲了押韻第422章 更有效率的刷分第185章 是不是太敏感了?第70章 水上公園第215章 儀表堂堂,器宇軒昂第411章 不可不防,防不勝防第43章 寫字機器人第360章 造了什麼孽?第232章 江寒的野望第155章 到底什麼關係?今天只有一章了第205章 江寒的心性第220章 英俊瀟灑,踏雪無痕第269章 易中海的困境第209章 校服就是最正式的裝扮第85章 吊橋效應第229章 從源頭上防仿製?第46章 月考開始第260章 這可是B5啊!第254章 數據解析和FCN的拓撲結構第48章 《如果時間能倒退》第419章 媽可能是親媽,爹……第336章 女孩的心思你別猜第223章 她不會玩真的吧?第97章 媽媽問我爲何跪着看手機?第413章 得講究點格調第368章 能幹的小秘書?第3章 一個大膽的想法第275章 整整齊齊、更高更遠第39章 這可能是個誤會第137章 聽鬆小院,好地方?第51章 任務分析第254章 數據解析和FCN的拓撲結構第304章 不忘舊情,有恩必償第193章 這也太考驗人了吧?第227章 智能安防報警系統第69章 論如何追女孩紙第409章 晨曦III巨型計算機第282章 又一顆壞蘋果?第33章 蘋果開發者賬號第395章 柳東斌和秦易第53章 大功告成第100章 談判第250章 幸虧有雙保險第325章 說好的理想男神呢?第138章 避蚊胺,登山第94章 水論文的正確姿勢第328章 脣槍舌劍,物我兩忘第189章 查房第127章 只怪準備得太充分了第251章 特效藥第397章 作曲大師,自帶乾糧第291章 驚動了各路神仙第171章 蘇婉瑩的秘密第172章 誰是誰的小糖人?第379章 似真似幻,恍如隔世第135章 巧合?考驗?第363章 終於對《我的世界》下手了……第169章 最後0.5公分第176章 現學現賣第169章 最後0.5公分第142章 哪捨得叫你疊被鋪牀?第417章 江寒的圍棋水平第108章 情趣第77章 多少次回眸第115章 無線電發射器第228章 恐怖如斯第251章 特效藥第70章 水上公園第198章 唯實話與馬屁不穿第286章 破解壞蘋果第145章 陳萱的邀請第359章 大佬,怪蜀黍?第82章 渣男反編譯第5章 三個系統準備就緒第359章 大佬,怪蜀黍?第361章 有點像“年輕”時的自己第200章 真的只是惡作劇嗎?第385章 超大規模集成神經網絡第157章 找個清靜的地方第358章 27個學術點第273章 假如氪金就能變強第53章 大功告成第195章 二八佳人體如酥第126章 八樓的直升飛機第257章 NOIP中最難的題型第89章 進入狀態這麼快?第403章 家產億萬,平平無奇第11章 像我這麼專一第167章 提醒還是邀請?第82章 渣男反編譯第415章 滿分入選國家隊