《拆穿數據胡扯:信息驅動世界的生存指南》封麵

內容簡介

“用數據說話”是互聯網時代的通用思維方式,有人說數據不會騙人,真的是這樣嗎?

X 讓人看不懂的數據分析和神奇算法

X 莫名奇妙的數學方程

X 強行聯係因果的統計學論文

X 某些新聞報道或PPT中花裏胡哨的圖表

……

我們都曾經或正在被這些東西蒙蔽,卻往往毫無察覺,甚至樂在其中!

一些貌似可靠的數據來源,也可能藏著一本正經的胡說八道。比如TED演講中的統計數字、《紐約時報》等媒體報道的大數據分析新算法、甚至是醫學期刊中的診斷數據……虛假信息都有可能魚目混珠,而你能分辨其中哪些是真正有用的信息,哪些隻是胡扯嗎?

對此,華盛頓大學專門開發了一門尚未開課即爆滿的公開課,而這本書正是源自這門引發熱議的課程。

兩位作者花了多年時間研究打著數學和統計學幌子的胡扯,犀利幽默地對它們分門別類一一剖析,幫助我們培養批判性思維,有效分析海量數據和觀點,拆穿無用數據的精致偽裝,在信息時代做個遊刃有餘的明白人。

話說回來,除了教會你如何識別數據胡扯,當你迫不得已需要胡扯時,它也會成為一本實操性強的工具書呢!

作者簡介

卡爾·伯格斯特龍(CarlBergstrom)

美國華盛頓大學生物學係教授。他研究流行病如何在人群中傳播,以及信息如何大規模地在生物和社會係統中流動——從細胞內對基因表達的控製到社交媒體上錯誤信息的傳播。他最為人所知的是跨界整合自然科學和社會科學思想的能力,特別是在信息研究領域造詣很深。2010年以來,他發表了多篇前瞻性的文章,涉及信息科學、計算機科學、控製論、進化生物學、信息論、科學哲學、物理學等方麵。其中有很多都發表在《自然》《科學》《美國國家科學院院刊》上。

傑文·韋斯特(JevinD.West)

美國華盛頓大學信息學院副教授、公眾知情中心主任。

目錄

推薦序1科學地對抗科學的胡扯的“胡扯”/V
推薦序2撥開扯淡的迷霧/IX
推薦序3閑得沒事也別胡扯/XIII
前言/XVII
第1章 胡扯無處不在
慣於欺騙的甲殼類動物和狡猾的烏鴉/003
狡辯之詞和律師的語言/008
謊言傳千裏,真相難出門/012
第2章 媒體、信息和錯誤信息
印刷廠就是妓院/022
不加渲染的事實宛若鳳毛麟角/025
偏見性、個人化和對立/029
錯誤信息和虛假信息/033
新型造假者/037
第3章 胡扯的本質
胡扯與黑箱/048
刑事機器學習/051
第4章 因果關係
夜晚天空紅豔豔,水手臉上笑容現/060
關於因果關係的思考/064
相關性不會增加報紙銷量/068
延遲享樂與共同原因/076
偽相關性/078
吸煙不會導致死亡?/083
如果其他方法都行不通,那就人為操控吧/084
第5章 數字與胡扯
提取數字/095
有害的百分比/098
古德哈特定律/106
數學濫用/110
僵屍統計數據/115
第6章 選擇偏倚
你看到什麼取決於你看的是哪兒/126
隱藏在墨菲定律背後的原因/129
帥哥和頂級程序員/137
音樂才華的致命危險/143
消除選擇偏倚/148
第7章 數據可視化
數據可視化的發端/158
鴨子!/162
水晶鞋和醜陋的繼姐/166
邪惡的軸/177
比例油墨原理/192
第8章 大數據與胡扯
機器是怎麼看到東西的/213
廢料進,廢品出/219
同性戀雷達和胡扯的結論/221
機器是怎麼思考的/226
機器為什麼失敗/230
第9章 科學的易感性
檢察官謬誤/242
p值操縱和發表偏倚/251
點擊誘餌科學/260
胡扯科學的市場/265
科學為什麼有用/271
第10章 辨別胡扯
1.質疑信息來源/278
2.小心不公平的比較/281
3.如果好得或糟糕得不像是真的……/284
4.從數量級考慮/287
5.避免證真偏差/292
6.考慮多個假設/295
辨別網上的胡扯/296
第11章 駁斥胡扯
使用歸謬法/306
要讓人難以忘記/308
尋找反例/311
使用類比/312
重新繪製圖表/314
使用零模型/316
揭穿者心理/319
致謝/329
注釋/333
參考文獻/349
······

最後修改:2022 年 07 月 13 日