第三十五章:無法反駁
關燈
小
中
大
周婺深吸一口氣,像個機關槍似的對莫如寄說道:“比如說,您幾天前撰寫了一篇關於大數據醫療的文章,該篇文章正反引用信手拈來,觀點提出邏輯清晰,可見您博覽群書,功底紮實。在您的這篇文章中,您以影城市五家大醫院的獨家數據作為分析樣本,以收益率為因變量,其他一系列指標作為自變量,構建了一個多元線性模型,從而推出在醫院的智能化投入生產後,可使醫院盈利總體提高了85%,而影城市在醫療上的這個案例有望在全國範圍內推廣。在此,我必須事先聲明,我並非智能化醫療提案的反對者,相反,對於影城市的醫療在國內處於領先地位我表示由衷的自豪,但是,您的這篇報告結論未免過於武斷。先不說每一個醫院在投入人工智能設備就能使得收益率剛好提高85%,就說您的樣本選取也是值得商榷的。影城市除去有五家大醫院外,還有無數中小型醫院和社區醫院,這些醫院的知名度沒有五家醫院高,因此你的結論勢必會偏向綜合實力及知名度較強的醫院,那麽在統計上,你的樣本選取就是有偏的。再者,區區五個樣本實在是太小了,你變量的維度有多,建模怎麽可能沒有問題?而這就是我認為您的報道漏洞百出的原因!”
“怎麽會……”莫如寄被說得有些發楞。
周婺見此,雖眉心微皺,可在她猛喝了一口水,又不怕死地繼續道:“從結果上看,您確實對社會醫療事業的推動有著正面的作用,這一點我表示由衷地肯定。可是,從科學的角度上看,您的內容在我眼中卻並不可信。因為您並沒有找到事實的真相,也有違一個記者應該保持的客觀態度的初衷。”
聽到此處,莫如寄竟是啞口無言,但莫如寄的神情中卻未透露出絲毫的負面情緒,眼神反倒流露著幾分欣賞。
“難以置信,還真是傳說中的工作狂魔。”一旁的唐子琪背著二人小聲吐槽道。
“還有麽?”只見莫如寄已拿出了自己隨身攜帶的記事本,憑印象記下了幾個關鍵詞。
莫如寄的行動令周婺十分意外,在周婺楞了片刻後才道:“哦……還有就是昨天的那篇關於影城市人工智能設備投入與產出的文章。”
“那篇文章又有什麽問題?”莫如寄早已化身成為了一個三好學生。
“您把影城市近三十六個月的人工智能設備投入的額度和影城市市統計局公布的其他公共衛生建設數據整合在一起,可您構建的還是一個回歸模型。但您似乎忽略了一點,那就是這樣的數據並非截面數據而是時間序列。回歸模型有一個特點,就是自變量之間不能存在高度相關性,對於截面數據,由於各樣本之間的相關性不強,自相關性常常可以忽略。但時間序列不同,t時刻的變量有可能受到t-1、t-2甚至更長時刻變量的影響,而您建模沒能考慮到自相關性,這是您犯的第一個錯誤。”
“第二個錯誤呢?”莫如寄手中的鋼筆並未停下。
“第二個錯誤是在構建多變量的時間序列模型時,您沒考慮到變量自身是否平穩,人工智能設備投入方面的數據我也恰巧關註,數據明顯存在波動上升趨勢,如若構建協整模型,模型事先要進行差分處理。而這一點很多經濟學家也曾犯過,所以您也無需太過在意。”
“還有呢?”
周婺思考片刻,才開口道:“還有就是您的結論,您的結論得出影城市人工智能設備的產出與影城市當月撥給智能設備的投入經費是否充足高度相關,這樣的結論明顯是一句廢話。若這篇文章拿到任何一位大學教授面前,您都會被罵得狗血淋頭。我並不否認數據挖掘的重要性,但是在挖掘的過程中,有時候很多結論都是無意義或者偽相關的,這是當前弱人工智能做不到的地方,可我們卻應該且必須做到。現在建一個數學模型的成本不高,只需要調用R、SAS、Python、SPSS甚至是EXCEL的命令,就能輕松建模,因為計算機能幫你計算所有你想要的任何結果,甚至還能幫你做到選擇變量。可是,很多人常常會忽略數據本身,也常常會忽略建模後模型的診斷。”
“我明白了。”莫如寄看向周婺的神情十分的認真,顯然,這與周圍LOVE氣泡滿滿的客西馬尼餐廳十分不搭。
能把七夕情人節過得和大學教授批改論文一般,唐子琪也算是服了這兩個奇葩。
“有一件事情我一直想說。”周婺拿出了自己的手機,點開了社交網絡的搜索界面,打出“莫如寄”兩字,在他名字後面,界面上自動顯示了“餐館測評”的詞條。
這是莫如寄近日在社交媒體上對影城市各大餐館做的菜系試吃測評活動,而且頗受廣大市民朋友的喜歡。
周婺點開了測評首頁,首頁上赫然寫著“莫如寄帶你吃喝玩樂”這八個大字。
“莫先生,且不說您的測評是否存在舞弊行為,就說您一個人在不同的時間品嘗不同的菜品,最後給予這個菜館一個主觀打分,這本身就是存在問題的。即便是在您能做到相對公允,您卻忽視了其實每個人的口味往往是不一樣的事實。就像有一群人覺得香菜是人間美味,可還是有人對香菜接受無能,因為在他們看來,香菜簡直奇臭無比!繼續回到測評本身,從您以往測評高分的菜館可知,您偏好東南亞的菜系,但是如果一個吃慣東北菜系的人來說,您的推薦對他來說一定是失敗的,而他也會掃興而歸,因為您沒有考慮到測評人本身的生長環境。再者,您測評的時間並不固定,因此您的味覺也會受到不同環境的影響。比如說您當天沒吃早餐,並處於一種餓不擇食的狀態,那不論您吃什麽,您給的測評分數都會偏高。這可能也解釋了為什麽您在有一天給予了一家涮羊肉店8分的高分,但從您以往的飲食喜好來看,您是十分討厭羊肉的膻味的。所以我個人建議,請您改進您的測評方案,至少能改到別人沒法一槍把你給斃掉!”
莫如寄又是一楞,不可否認,周婺的每一句話都有理有據,以至於讓他無法反駁!
本站無廣告,永久域名(danmei.twking.cc)
“怎麽會……”莫如寄被說得有些發楞。
周婺見此,雖眉心微皺,可在她猛喝了一口水,又不怕死地繼續道:“從結果上看,您確實對社會醫療事業的推動有著正面的作用,這一點我表示由衷地肯定。可是,從科學的角度上看,您的內容在我眼中卻並不可信。因為您並沒有找到事實的真相,也有違一個記者應該保持的客觀態度的初衷。”
聽到此處,莫如寄竟是啞口無言,但莫如寄的神情中卻未透露出絲毫的負面情緒,眼神反倒流露著幾分欣賞。
“難以置信,還真是傳說中的工作狂魔。”一旁的唐子琪背著二人小聲吐槽道。
“還有麽?”只見莫如寄已拿出了自己隨身攜帶的記事本,憑印象記下了幾個關鍵詞。
莫如寄的行動令周婺十分意外,在周婺楞了片刻後才道:“哦……還有就是昨天的那篇關於影城市人工智能設備投入與產出的文章。”
“那篇文章又有什麽問題?”莫如寄早已化身成為了一個三好學生。
“您把影城市近三十六個月的人工智能設備投入的額度和影城市市統計局公布的其他公共衛生建設數據整合在一起,可您構建的還是一個回歸模型。但您似乎忽略了一點,那就是這樣的數據並非截面數據而是時間序列。回歸模型有一個特點,就是自變量之間不能存在高度相關性,對於截面數據,由於各樣本之間的相關性不強,自相關性常常可以忽略。但時間序列不同,t時刻的變量有可能受到t-1、t-2甚至更長時刻變量的影響,而您建模沒能考慮到自相關性,這是您犯的第一個錯誤。”
“第二個錯誤呢?”莫如寄手中的鋼筆並未停下。
“第二個錯誤是在構建多變量的時間序列模型時,您沒考慮到變量自身是否平穩,人工智能設備投入方面的數據我也恰巧關註,數據明顯存在波動上升趨勢,如若構建協整模型,模型事先要進行差分處理。而這一點很多經濟學家也曾犯過,所以您也無需太過在意。”
“還有呢?”
周婺思考片刻,才開口道:“還有就是您的結論,您的結論得出影城市人工智能設備的產出與影城市當月撥給智能設備的投入經費是否充足高度相關,這樣的結論明顯是一句廢話。若這篇文章拿到任何一位大學教授面前,您都會被罵得狗血淋頭。我並不否認數據挖掘的重要性,但是在挖掘的過程中,有時候很多結論都是無意義或者偽相關的,這是當前弱人工智能做不到的地方,可我們卻應該且必須做到。現在建一個數學模型的成本不高,只需要調用R、SAS、Python、SPSS甚至是EXCEL的命令,就能輕松建模,因為計算機能幫你計算所有你想要的任何結果,甚至還能幫你做到選擇變量。可是,很多人常常會忽略數據本身,也常常會忽略建模後模型的診斷。”
“我明白了。”莫如寄看向周婺的神情十分的認真,顯然,這與周圍LOVE氣泡滿滿的客西馬尼餐廳十分不搭。
能把七夕情人節過得和大學教授批改論文一般,唐子琪也算是服了這兩個奇葩。
“有一件事情我一直想說。”周婺拿出了自己的手機,點開了社交網絡的搜索界面,打出“莫如寄”兩字,在他名字後面,界面上自動顯示了“餐館測評”的詞條。
這是莫如寄近日在社交媒體上對影城市各大餐館做的菜系試吃測評活動,而且頗受廣大市民朋友的喜歡。
周婺點開了測評首頁,首頁上赫然寫著“莫如寄帶你吃喝玩樂”這八個大字。
“莫先生,且不說您的測評是否存在舞弊行為,就說您一個人在不同的時間品嘗不同的菜品,最後給予這個菜館一個主觀打分,這本身就是存在問題的。即便是在您能做到相對公允,您卻忽視了其實每個人的口味往往是不一樣的事實。就像有一群人覺得香菜是人間美味,可還是有人對香菜接受無能,因為在他們看來,香菜簡直奇臭無比!繼續回到測評本身,從您以往測評高分的菜館可知,您偏好東南亞的菜系,但是如果一個吃慣東北菜系的人來說,您的推薦對他來說一定是失敗的,而他也會掃興而歸,因為您沒有考慮到測評人本身的生長環境。再者,您測評的時間並不固定,因此您的味覺也會受到不同環境的影響。比如說您當天沒吃早餐,並處於一種餓不擇食的狀態,那不論您吃什麽,您給的測評分數都會偏高。這可能也解釋了為什麽您在有一天給予了一家涮羊肉店8分的高分,但從您以往的飲食喜好來看,您是十分討厭羊肉的膻味的。所以我個人建議,請您改進您的測評方案,至少能改到別人沒法一槍把你給斃掉!”
莫如寄又是一楞,不可否認,周婺的每一句話都有理有據,以至於讓他無法反駁!
本站無廣告,永久域名(danmei.twking.cc)