好讀周報/相關不代表因果 數學老師指分析數據應小心「倖存者偏差」
文/林秋華
尋找不同事物之間的關聯性一直是人們有興趣的主題,例如,研究癌症與飲食、生活習慣的關係;研究智商與未來成就、財富的關係;研究自殺與經濟、年齡的關係。這些在在顯示人們渴望尋求答案,想了解世界的運行方式和人類的行為模式。在大數據提供的客觀事實中,是否隱藏我們看不到的訊息?是否有什麼潛在的規則呢?今天,我們就來看看幾個有趣的分析,探討大數據對人類生活的影響。
●相關不代表因果 小心導致錯誤決策
然而,「相關」等於「因果」嗎?關於這個千古難題,身為數學老師還是要再一次強調:相關不代表因果。分析數據時,僅依賴相關性可能導致誤解和錯誤結論。因此,進行更深入的分析,如實驗研究、調查或控制變量的方法,對於確定因果關係至關重要。相關性與因果關係是如此微妙的存在,如果兩件事有因果關係,必然存在高度相關;如果兩件事高度相關,可能存在因果關係,也可能存在偏差觀點。
二次大戰期間,美國哥倫比亞大學統計學亞伯拉罕•沃德教授計算如何減少轟炸機因敵方炮火而遭受損失。研究發現,返回的轟炸機上,彈孔大都出現在機翼,顯示機翼是容易遭受攻擊的目標,因此,促使軍方想在機翼位置加強防護。但亞伯拉罕•沃德教授提出「倖存者偏差」理論,他提出的看法是:返回的飛機之所以返回,乃因為主體沒有受傷;而那些主體受傷,例如引擎被打中的飛機,根本沒有機會返回。若沒有考慮這些無法返回的飛機,會存在某些偏差觀點。最後,軍方採納教授的提議,為引擎增加更高的防護,後來也證實這個決定是正確的。這個案例告訴我們,假如只憑著手中的資料,而沒有合理的邏輯推理分析或第三方觀點,很容易陷入「倖存者偏差」,導致錯誤決策。
●忽略倖存者偏差 以偏蓋全易失敗
再舉個例子,有些人主張「學歷無用論」,舉出不少知名創業家如微軟創辦人比爾蓋茲、蘋果創辦人賈伯斯、臉書創辦人馬克•祖克柏等,這樣的「倖存者偏差」,導致很多人以此為藉口輟學或創業,最後往往以失敗收場。
事實上,這些成功者還擁有其他許多資源,背後也付出了巨大的努力;另一方面,他們是輟學者中的極少數例子,也就是說有更多的輟學者並沒有走向成功之路。當仿效者沒有考慮這些資訊而草率決定時,經常導致不理想的結果。
●挑選分析海量資訊 深度學習居功厥偉
在人工智慧的時代,大數據成為一門顯學,對各行各業產生深遠影響。隨著科技的進步,我們面臨著海量資訊的挑戰,這些數據的規模和複雜性超出了人類的處理能力。愈來愈多的任務和分析被交由電腦執行,其中,深度學習神經網絡的發展是一系列過程中的重要里程碑。這種技術模擬了人類大腦的運作方式,透過多層次的神經元結構,進行資料的處理和分析。神經網絡能夠自動識別模式,從大量數據中提取有用的資訊,進行預測和分類。這個過程涉及複雜的數學計算,包括線性代數、微積分、機率和統計學等。多虧電腦能夠計算繁瑣且多變的數據,找出隱藏訊息,進而讓人們做出準確的決策。
從商業到醫療、從金融到教育,人工智慧技術的廣泛應用使得我們能夠更高效地處理信息,發展各種創新技術與觀點。最後,值得一提的是,今年的諾貝爾物理學獎得主由普林斯頓大學的霍普菲爾德(John Hopfield)和多倫多大學的辛頓(Geoffrey Hinton)共享殊榮,表彰他們在人工神經網絡領域的基礎性發現與創新,讓機器學習得以成為現實。化學獎得主為華盛頓大學的生物化學教授貝克(David Baker)、哈薩比斯(Demis Hassabis)及瓊珀(John Jumper),憑藉DeepMind公司在蛋白質設計與蛋白質結構研究領域的卓越貢獻,拿下本屆化學獎殊榮。兩個獎項皆與人工智慧密切相關,顯示人工智慧已被大量運用在你我生活中,大數據分析正是當中的重要基石。
●作者為臺南市永仁高中數學老師。
延伸閱讀
贊助廣告
商品推薦
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言