第五十五章:維災難
關燈
小
中
大
“不必了。”周婺說話的語調突然變得有些溫柔,或許這樣的溫柔連周婺自己都沒有察覺。
“什麽不必了!周警官,您也說了,那麽多視頻,您一個人一晚上怎麽看得完!而且孟安城的長相我最清楚不過,我又是報案人,您這個時候把我甩開,未免太見外了!”莫如寄賭氣地回道。
“噗!”周婺終於笑出聲來,在她看來,現在的莫如寄倒是有了幾分可愛,從某種意義上來說,真像個長不大的柴犬。
“周警官,我可是真的想著幫您,您怎麽反倒笑了!別把我的話當玩笑,我可是卯足了力氣,就等著大幹一場!”說到此處,像是印證著什麽一番,莫如寄卷起了自己的袖子。
周婺的嘴角依舊上揚,她搖了搖頭:“冷靜點!我又不是沒有解決方案!”
只見周婺這才將自己背包裏的筆記本電腦擺在桌上,對莫如寄解釋道:“我的意思是說,這點量級的數據其實並不需要動用我們局裏的系統。因為我單機就能解決。再說了,我堂堂一個刑偵隊副隊長,查案反倒是要你這個外行人幫忙,讓某些人知道了,豈不是要被笑掉大牙!”
周婺腦海中忽然閃過一個人的身影,但也只是幾秒。
她甚至不知道自己為何要在此時想到他,明明他應該十分討厭自己,可一想到若自己順利解決事件,便總能收到那人欠扁的三條短信,她卻總覺得自己似乎擁有著無窮的力量——無論是對數據挖掘,還是探案!
如此一想,周婺打開了筆記本。
莫如寄顯然還沒跳轉過思路,他只是呆呆地看著周婺熟練地打開了一個程序,有將一個寫著滿屏代碼的文檔打開。
“這是……”莫如寄不是計算機科班出生,自然看不懂這些代碼。
“這是我自己調用深度學習公開數據並進行訓練後的人臉識別模型代碼。”周婺頓了頓,才對上莫如寄的目光,笑得自行從容:“莫大記者,你不要忘了,我參與了影城市的一代人臉識別系統的構建工作,而其中最核心的建模部分,就是我負責的。”
這個瞬間,莫如寄覺得周婺的這道笑容如同暗夜裏閃爍的明星一般,熠熠生輝。
——————————
待蔡翮將視頻整理完畢,已是半個小時之後。
蔡翮看著周婺熟練地將視頻導入她的筆記本電腦,他先撓了撓頭,才解釋道:“周警官,由於我們的視頻是按照一天24小時的容量進行存儲的,視頻的文件有點多,我這邊好像也幫不了您什麽忙,所以剩下的……”
“我看視頻的命名有長有短,但都有一定的規律。你們是怎麽命名的?”周婺及時打斷了蔡翮,看著電腦屏幕問道。
莫如寄自然湊著電腦屏幕看了過去,存放視頻的那個文件夾裏全是密密麻麻的視頻,看這數量,至少也有一萬多條記錄。想到此處,莫如寄倒吸一口涼氣,若這文件讓他自己處理,莫如寄覺得自己還不如用腦袋撞墻!
“是這樣的周警官,地鐵車廂內部的視頻命名方式是地鐵線路編碼+該趟地鐵班次+日期+首發時間+車廂內部攝像頭編碼,這些視頻的命名都比較長。而那些名字長度中等的,命名方式則是地鐵線路編碼+地鐵口編碼/地鐵進出口/地鐵內部區域通道編碼+該區攝像頭編碼。”蔡翮解釋道。
“明白了。”周婺朝蔡翮點了點頭,看周婺的神色,似乎在思考著什麽解決方案。
“周警官,現在要怎麽辦?”莫如寄問得及時。
周婺思索片刻,才道:“先做視頻的預處理工作。還好我以前有處理過這樣的數據經驗,包括對視頻的統一切割、視頻按時間間隔轉成圖片,再根據視頻名稱及時間命名圖片,並根據地鐵站位置或地鐵列車班次給圖片打上標簽。”
“之後呢?難道是要用神經網絡?”莫如寄雖不是科班畢業,但卻聽過神經網絡,畢竟幾年前人類設計的AI系統戰勝世界圍棋冠軍的新聞早已轟動了整個世界,各大報社、新聞網站都爭相報道此事,莫如寄看過這個AI系統的介紹宣傳片,其他覆雜的數學演算他雖是不懂,但他對那個AI系統對外號稱構建了兩個神經網絡模型一事倒是印象深刻。
周婺點了點頭,可她的目光仍看著屏幕,雙手依舊敲擊著鍵盤,電腦屏幕的亮光就這麽映照在了她的臉上,那光照得她面容變得更加冷若冰霜。
這是莫如寄頭一次看到周婺這副模樣,在他看來,周婺的眼神分明比上次在客西馬尼餐廳教訓自己那會兒還要認真。讓莫如寄覺得奇妙的是,即便現在的周婺雖依舊面無表情,可他還是感受到了周婺內心深處的某種熱忱。這種熱忱並不照映在人,也非對應到具體實物,因為周婺分明選擇了擁抱數據,那些枯燥、冗長、繁瑣的數據在她的手上也仿佛被賦予了靈魂。
這一刻,莫如寄似乎徹底明白了周婺對數據的執著,也徹底清楚了那日客西馬尼餐廳裏發生的一切。眼前之人擁有著精湛的數據挖掘知識,而自己的那些自以為是的分析伎倆在她眼裏簡直就是漏洞百出、不值一提!
“確切的說應該是Convolutional Neural Network,簡稱CNN,中文譯名為卷積神經網絡。”周婺的聲音打斷了莫如寄的思緒,只聽周婺繼續用飛快的語速說道:“對於傳統的數據挖掘,也就是業內稱呼的機器學習,一個簡單的全連接神經網絡就能搞定。而神經網絡的思路其實很簡單,無非就是模仿人類神經元的操作,通過輸入變量X再返回輸出變量Y的過程。但由於圖像自身的特殊性,導致若我們直接將圖像作為輸入變量構建全連接神經網絡,那麽就一定會造成維災難。因為這不僅是參數增加的問題,還因高維必然會降低模型的運算速度。假設一張圖片的像素是500x700,在現有計算框架內,每輸入一張圖片,就需要占據350000個空位,而這只是其中一張圖片,倘若輸入的不是一張圖片,而是N張圖片,隨著N的增加,模型的運算速度就可想而知了。而參數過多模型就越發覆雜,可若訓練樣本的數量級偏小,也自然會造成模型的過擬合問題,過擬合會導致預測方差增大,如此,也會導致模型預測的可範化性大打折扣。”
本站無廣告,永久域名(danmei.twking.cc)
“什麽不必了!周警官,您也說了,那麽多視頻,您一個人一晚上怎麽看得完!而且孟安城的長相我最清楚不過,我又是報案人,您這個時候把我甩開,未免太見外了!”莫如寄賭氣地回道。
“噗!”周婺終於笑出聲來,在她看來,現在的莫如寄倒是有了幾分可愛,從某種意義上來說,真像個長不大的柴犬。
“周警官,我可是真的想著幫您,您怎麽反倒笑了!別把我的話當玩笑,我可是卯足了力氣,就等著大幹一場!”說到此處,像是印證著什麽一番,莫如寄卷起了自己的袖子。
周婺的嘴角依舊上揚,她搖了搖頭:“冷靜點!我又不是沒有解決方案!”
只見周婺這才將自己背包裏的筆記本電腦擺在桌上,對莫如寄解釋道:“我的意思是說,這點量級的數據其實並不需要動用我們局裏的系統。因為我單機就能解決。再說了,我堂堂一個刑偵隊副隊長,查案反倒是要你這個外行人幫忙,讓某些人知道了,豈不是要被笑掉大牙!”
周婺腦海中忽然閃過一個人的身影,但也只是幾秒。
她甚至不知道自己為何要在此時想到他,明明他應該十分討厭自己,可一想到若自己順利解決事件,便總能收到那人欠扁的三條短信,她卻總覺得自己似乎擁有著無窮的力量——無論是對數據挖掘,還是探案!
如此一想,周婺打開了筆記本。
莫如寄顯然還沒跳轉過思路,他只是呆呆地看著周婺熟練地打開了一個程序,有將一個寫著滿屏代碼的文檔打開。
“這是……”莫如寄不是計算機科班出生,自然看不懂這些代碼。
“這是我自己調用深度學習公開數據並進行訓練後的人臉識別模型代碼。”周婺頓了頓,才對上莫如寄的目光,笑得自行從容:“莫大記者,你不要忘了,我參與了影城市的一代人臉識別系統的構建工作,而其中最核心的建模部分,就是我負責的。”
這個瞬間,莫如寄覺得周婺的這道笑容如同暗夜裏閃爍的明星一般,熠熠生輝。
——————————
待蔡翮將視頻整理完畢,已是半個小時之後。
蔡翮看著周婺熟練地將視頻導入她的筆記本電腦,他先撓了撓頭,才解釋道:“周警官,由於我們的視頻是按照一天24小時的容量進行存儲的,視頻的文件有點多,我這邊好像也幫不了您什麽忙,所以剩下的……”
“我看視頻的命名有長有短,但都有一定的規律。你們是怎麽命名的?”周婺及時打斷了蔡翮,看著電腦屏幕問道。
莫如寄自然湊著電腦屏幕看了過去,存放視頻的那個文件夾裏全是密密麻麻的視頻,看這數量,至少也有一萬多條記錄。想到此處,莫如寄倒吸一口涼氣,若這文件讓他自己處理,莫如寄覺得自己還不如用腦袋撞墻!
“是這樣的周警官,地鐵車廂內部的視頻命名方式是地鐵線路編碼+該趟地鐵班次+日期+首發時間+車廂內部攝像頭編碼,這些視頻的命名都比較長。而那些名字長度中等的,命名方式則是地鐵線路編碼+地鐵口編碼/地鐵進出口/地鐵內部區域通道編碼+該區攝像頭編碼。”蔡翮解釋道。
“明白了。”周婺朝蔡翮點了點頭,看周婺的神色,似乎在思考著什麽解決方案。
“周警官,現在要怎麽辦?”莫如寄問得及時。
周婺思索片刻,才道:“先做視頻的預處理工作。還好我以前有處理過這樣的數據經驗,包括對視頻的統一切割、視頻按時間間隔轉成圖片,再根據視頻名稱及時間命名圖片,並根據地鐵站位置或地鐵列車班次給圖片打上標簽。”
“之後呢?難道是要用神經網絡?”莫如寄雖不是科班畢業,但卻聽過神經網絡,畢竟幾年前人類設計的AI系統戰勝世界圍棋冠軍的新聞早已轟動了整個世界,各大報社、新聞網站都爭相報道此事,莫如寄看過這個AI系統的介紹宣傳片,其他覆雜的數學演算他雖是不懂,但他對那個AI系統對外號稱構建了兩個神經網絡模型一事倒是印象深刻。
周婺點了點頭,可她的目光仍看著屏幕,雙手依舊敲擊著鍵盤,電腦屏幕的亮光就這麽映照在了她的臉上,那光照得她面容變得更加冷若冰霜。
這是莫如寄頭一次看到周婺這副模樣,在他看來,周婺的眼神分明比上次在客西馬尼餐廳教訓自己那會兒還要認真。讓莫如寄覺得奇妙的是,即便現在的周婺雖依舊面無表情,可他還是感受到了周婺內心深處的某種熱忱。這種熱忱並不照映在人,也非對應到具體實物,因為周婺分明選擇了擁抱數據,那些枯燥、冗長、繁瑣的數據在她的手上也仿佛被賦予了靈魂。
這一刻,莫如寄似乎徹底明白了周婺對數據的執著,也徹底清楚了那日客西馬尼餐廳裏發生的一切。眼前之人擁有著精湛的數據挖掘知識,而自己的那些自以為是的分析伎倆在她眼裏簡直就是漏洞百出、不值一提!
“確切的說應該是Convolutional Neural Network,簡稱CNN,中文譯名為卷積神經網絡。”周婺的聲音打斷了莫如寄的思緒,只聽周婺繼續用飛快的語速說道:“對於傳統的數據挖掘,也就是業內稱呼的機器學習,一個簡單的全連接神經網絡就能搞定。而神經網絡的思路其實很簡單,無非就是模仿人類神經元的操作,通過輸入變量X再返回輸出變量Y的過程。但由於圖像自身的特殊性,導致若我們直接將圖像作為輸入變量構建全連接神經網絡,那麽就一定會造成維災難。因為這不僅是參數增加的問題,還因高維必然會降低模型的運算速度。假設一張圖片的像素是500x700,在現有計算框架內,每輸入一張圖片,就需要占據350000個空位,而這只是其中一張圖片,倘若輸入的不是一張圖片,而是N張圖片,隨著N的增加,模型的運算速度就可想而知了。而參數過多模型就越發覆雜,可若訓練樣本的數量級偏小,也自然會造成模型的過擬合問題,過擬合會導致預測方差增大,如此,也會導致模型預測的可範化性大打折扣。”
本站無廣告,永久域名(danmei.twking.cc)