第四十四章:發現端倪
關燈
小
中
大
看到項目文檔前幾頁的內容後,周婺有些慶幸,因為這些項目報告雖然格式不同,但所幸第一頁都有負責部門、項目負責人及參與者。
在點開第五份報告時,周婺神色有異,因為這份報告的項目總負責人正是白劍英,而項目的建模和報告的作者卻是死者許威!
只聽周婺不經意地開口,問道:“有人說,你今天和死者發生了劇烈的爭吵。”
對面的白劍英聽罷,笑容變得有些僵硬。
“說吧,你們吵些什麽?”周婺問得不急不慢。
白劍英長嘆一聲,才解釋道:“警察同志,我和許威還能吵什麽,不就是每次新產品上線前的例行爭論麽。您有所不知,許威這人能力拔尖,但個性就是太要強了,只要他認為是對的,就死活不肯服軟。之前他負責這個項目已經半年了,若計劃順利,下個月初產品就能上線了。但他卻非要找我理論,說延遲上線時間。可領導的死命是下月月初必須上線,他倒好,提出了希望項目延長三個月的無理要求!這可是和政府合作的項目,若沒按時上線,真按他這麽做了,我們公司接下來這半年都得喝西北風!”
最後這句話,白劍英說得格外地誇張。
“或許,許威有自己的理由。”周婺看向白劍英。
“能有什麽理由,這個項目的指標體系是我制定的,數據也照著搜集了百萬條,事後模型也建立好了,而且模型的預測準確率高達99%,就這樣,他還有什麽不滿意的,非得拉著我擴維度!警察同志,您說他這不是無理取鬧麽!奇怪,簡直太奇怪了!”白劍英抱怨道。
可就是這番話,竟引起了周婺的註意!
“《關於影城市郊區野生羊群行為軌跡、羊群種類的預測研究》”周婺又滑了滑鼠標,拖著下巴問道:“你和他的爭吵就是圍繞這個項目?”
“對……就是這個……”白劍英擦了擦額頭的細汗。
聽到白劍英的答覆,周婺便徹底地將註意力集中在了這篇報道身上。
周婺閱讀的速度極快,僅花了五分鐘的時間,便將一篇萬字的報告瀏覽了個大概。
在了解了報告基礎機構後,周婺直接拉到了報告中許威的建模部分。
“原來如此,許威的思維方式確實獨到,不愧是身經百戰的高級數據分析師。”周婺的眼裏全是讚許,可當她看到模型預測及其中的混淆矩陣時,周婺臉上的笑容卻變得有些玩味。
周婺隨即掏出了手機,編輯了一連串的文字後,立即把信息傳給李蕊。
大約過了五六分鐘,李蕊打通了周婺的電話。
“都問過了?”周婺問。
而聽到李悅的證實後,周婺的神情變得暗淡莫辨
許久,周婺是這麽對白劍英回說的:“確實很奇怪,這太奇怪了!”
“是吧!警察同志,我說得沒錯吧!我琢磨著,許威這人以前就看我不順眼,就喜歡沒事找事,模型明明預測精度都達到了99%,他還瞎在那叫嚷!”白劍英說得那叫一個情真意切。
“我明白了。”周婺朝白劍英微微一笑,吩咐張義繼續對白劍英進行審問後,她便拿著筆記本電腦、坐著輪椅從審訊室走了出來。
同時從審訊室旁邊的監控室走出的還有顧子愷。
“結果怎麽樣?”顧子愷問道。
周婺此刻的神色變得異常嚴肅,只聽她一字一句地回道:“或許我們之前的猜想都走偏了,白劍英殺害許威的嫌疑比我想象中的還要大。但是我們沒有確切的證據!”
“那怎麽辦?”
怎知周婺聽到此話,嘴角上揚的幅度比平時更大,而這樣的笑容在顧子愷看了竟有些滲人。
顧子愷看了看手表,在咽了口氣後竟倒退了半步,像是預見了什麽,又猛地打了一個寒顫。
“顧隊,今晚,我們所有人恐怕都得加個班了!”周婺說得雲淡風輕,仿佛加班此事與她沒有半毛錢的關系。
果然不出顧子愷的所料!
要知道,在刑偵一隊裏,周婺主動提出加班的次數卻是極少。
因為絕大多數覆雜的案件由她經手,總是能夠提高至少一倍的工作效率!
但只要她申請加班,便可見此案的覆雜性和難度都將是巨大的,或許,還能把整個刑偵隊折騰得人仰馬翻!
警界秘聞錄有雲:林言明說加班,或許你最多只用加班一個小時;顧子愷說加班,往往兩個小時就能搞定;而當你從周婺口中聽到加班二字,恭喜你中獎了,因為你的下班時間不定!
——————————
晚上八點整,刑偵隊全體成員都收到周婺群發的文件壓縮包。
在接到文件壓縮包的瞬間,所有人先是軀身一震,隨後頭上便是愁雲慘淡。
看周婺郵件裏的意思,是要大家把三位嫌疑人和死者所有的分析報告進行篩選歸檔,再把報告已上傳的最後時間命名,同時再將將雲端存儲的PDF文件全都轉化成TXT格式數據。
如果說接到周婺短信的刑偵一隊眾人心情只有那麽一丁點的不安,那在他們在看完壓縮包量級和歸檔處理要求後,全員一副生無可戀的模樣。
周婺這麽做的目的很簡單,既然她察覺到了白劍英的問題,白劍英也把這個大坑給了自己,那她現在就想根據這個大坑做文本挖掘,以此準確地找到白劍英的破綻!
對於刑偵隊來說,文件格式轉換完全沒有任何技術難度。警局自主研發的文檔轉換系統已經能夠做到100%的零誤差,而真正困難的卻在於TXT文件整理後的對分詞文本、停用詞進行編寫。
雖然目前網絡上已有諸多現成的分詞文本、停用詞文本,但由於這些報告專業性極強,涉及較多行業前沿的新詞,而這些新詞恰恰是詞庫中還未更新的,那麽,已有的詞庫並不能夠很好地將諸多專業用語很好區分,對此,編寫分詞文本和選擇挖掘算法的工作就需要周婺親自完成。
就好比傳統的詞庫能實現“線性”、“分層”、“分位”、“回歸”這四個詞語的分割,但是從統計意義上看,這四個詞語至少能組合成“線性回歸”、“分層回歸”、“分位回歸”、“分層分位回歸”及“分層分位線性回歸”這幾種統計分析方法,每一種方法又對應著不同的適用環境,同時,每一個數據分析師解決實際問題偏好的算法也可能存在差異,那麽,如果分詞文本區分錯誤,將會導致整個文本挖掘徹底失敗,而這也是周婺想要避免的。
本站無廣告,永久域名(danmei.twking.cc)
在點開第五份報告時,周婺神色有異,因為這份報告的項目總負責人正是白劍英,而項目的建模和報告的作者卻是死者許威!
只聽周婺不經意地開口,問道:“有人說,你今天和死者發生了劇烈的爭吵。”
對面的白劍英聽罷,笑容變得有些僵硬。
“說吧,你們吵些什麽?”周婺問得不急不慢。
白劍英長嘆一聲,才解釋道:“警察同志,我和許威還能吵什麽,不就是每次新產品上線前的例行爭論麽。您有所不知,許威這人能力拔尖,但個性就是太要強了,只要他認為是對的,就死活不肯服軟。之前他負責這個項目已經半年了,若計劃順利,下個月初產品就能上線了。但他卻非要找我理論,說延遲上線時間。可領導的死命是下月月初必須上線,他倒好,提出了希望項目延長三個月的無理要求!這可是和政府合作的項目,若沒按時上線,真按他這麽做了,我們公司接下來這半年都得喝西北風!”
最後這句話,白劍英說得格外地誇張。
“或許,許威有自己的理由。”周婺看向白劍英。
“能有什麽理由,這個項目的指標體系是我制定的,數據也照著搜集了百萬條,事後模型也建立好了,而且模型的預測準確率高達99%,就這樣,他還有什麽不滿意的,非得拉著我擴維度!警察同志,您說他這不是無理取鬧麽!奇怪,簡直太奇怪了!”白劍英抱怨道。
可就是這番話,竟引起了周婺的註意!
“《關於影城市郊區野生羊群行為軌跡、羊群種類的預測研究》”周婺又滑了滑鼠標,拖著下巴問道:“你和他的爭吵就是圍繞這個項目?”
“對……就是這個……”白劍英擦了擦額頭的細汗。
聽到白劍英的答覆,周婺便徹底地將註意力集中在了這篇報道身上。
周婺閱讀的速度極快,僅花了五分鐘的時間,便將一篇萬字的報告瀏覽了個大概。
在了解了報告基礎機構後,周婺直接拉到了報告中許威的建模部分。
“原來如此,許威的思維方式確實獨到,不愧是身經百戰的高級數據分析師。”周婺的眼裏全是讚許,可當她看到模型預測及其中的混淆矩陣時,周婺臉上的笑容卻變得有些玩味。
周婺隨即掏出了手機,編輯了一連串的文字後,立即把信息傳給李蕊。
大約過了五六分鐘,李蕊打通了周婺的電話。
“都問過了?”周婺問。
而聽到李悅的證實後,周婺的神情變得暗淡莫辨
許久,周婺是這麽對白劍英回說的:“確實很奇怪,這太奇怪了!”
“是吧!警察同志,我說得沒錯吧!我琢磨著,許威這人以前就看我不順眼,就喜歡沒事找事,模型明明預測精度都達到了99%,他還瞎在那叫嚷!”白劍英說得那叫一個情真意切。
“我明白了。”周婺朝白劍英微微一笑,吩咐張義繼續對白劍英進行審問後,她便拿著筆記本電腦、坐著輪椅從審訊室走了出來。
同時從審訊室旁邊的監控室走出的還有顧子愷。
“結果怎麽樣?”顧子愷問道。
周婺此刻的神色變得異常嚴肅,只聽她一字一句地回道:“或許我們之前的猜想都走偏了,白劍英殺害許威的嫌疑比我想象中的還要大。但是我們沒有確切的證據!”
“那怎麽辦?”
怎知周婺聽到此話,嘴角上揚的幅度比平時更大,而這樣的笑容在顧子愷看了竟有些滲人。
顧子愷看了看手表,在咽了口氣後竟倒退了半步,像是預見了什麽,又猛地打了一個寒顫。
“顧隊,今晚,我們所有人恐怕都得加個班了!”周婺說得雲淡風輕,仿佛加班此事與她沒有半毛錢的關系。
果然不出顧子愷的所料!
要知道,在刑偵一隊裏,周婺主動提出加班的次數卻是極少。
因為絕大多數覆雜的案件由她經手,總是能夠提高至少一倍的工作效率!
但只要她申請加班,便可見此案的覆雜性和難度都將是巨大的,或許,還能把整個刑偵隊折騰得人仰馬翻!
警界秘聞錄有雲:林言明說加班,或許你最多只用加班一個小時;顧子愷說加班,往往兩個小時就能搞定;而當你從周婺口中聽到加班二字,恭喜你中獎了,因為你的下班時間不定!
——————————
晚上八點整,刑偵隊全體成員都收到周婺群發的文件壓縮包。
在接到文件壓縮包的瞬間,所有人先是軀身一震,隨後頭上便是愁雲慘淡。
看周婺郵件裏的意思,是要大家把三位嫌疑人和死者所有的分析報告進行篩選歸檔,再把報告已上傳的最後時間命名,同時再將將雲端存儲的PDF文件全都轉化成TXT格式數據。
如果說接到周婺短信的刑偵一隊眾人心情只有那麽一丁點的不安,那在他們在看完壓縮包量級和歸檔處理要求後,全員一副生無可戀的模樣。
周婺這麽做的目的很簡單,既然她察覺到了白劍英的問題,白劍英也把這個大坑給了自己,那她現在就想根據這個大坑做文本挖掘,以此準確地找到白劍英的破綻!
對於刑偵隊來說,文件格式轉換完全沒有任何技術難度。警局自主研發的文檔轉換系統已經能夠做到100%的零誤差,而真正困難的卻在於TXT文件整理後的對分詞文本、停用詞進行編寫。
雖然目前網絡上已有諸多現成的分詞文本、停用詞文本,但由於這些報告專業性極強,涉及較多行業前沿的新詞,而這些新詞恰恰是詞庫中還未更新的,那麽,已有的詞庫並不能夠很好地將諸多專業用語很好區分,對此,編寫分詞文本和選擇挖掘算法的工作就需要周婺親自完成。
就好比傳統的詞庫能實現“線性”、“分層”、“分位”、“回歸”這四個詞語的分割,但是從統計意義上看,這四個詞語至少能組合成“線性回歸”、“分層回歸”、“分位回歸”、“分層分位回歸”及“分層分位線性回歸”這幾種統計分析方法,每一種方法又對應著不同的適用環境,同時,每一個數據分析師解決實際問題偏好的算法也可能存在差異,那麽,如果分詞文本區分錯誤,將會導致整個文本挖掘徹底失敗,而這也是周婺想要避免的。
本站無廣告,永久域名(danmei.twking.cc)