首先舉例了一個簡單的馬拉松比賽的統計時間與人數,直接把資料視覺化,變成了
跟一般的想像不大一樣,有時候我們會期待人們是normal distribution,很可惜這裡分成了兩群,也就是有兩類人,所以是兩個normal,這也說明了為何要讓視覺化,可以很直覺的反應資料的呈現方式,不是靠著猜測
讓我跳到這一章我覺得最重要的事情:資料視覺化是為了演譯資料的內容,而非包裝資料(我照意思翻譯的)。我真的覺得寫得非常好
作者建議的研究步驟有
- 劃出圖形
- 觀察並且辨識出行為模式
- 嘗試驗證資料圖形與行為模型之間的關聯性
- 反覆動作
接著作者給出了兩張圖片,用來驗證他模型跟資料之間的關聯性
最後提到gnuplot只是個繪圖工具,不是統計分析工具,也不是數值分析工具,這讓gnuplot更容易上手。
我覺得gnuplot這工具不夠"完美 ",也就是分析跟GUI的部分,以分析而言,這是工具當初設計的取捨,無法太嚴厲地去批評他,但是GUI就真的是讓我有點無言,以一個繪圖工具,竟然沒有一個好的GUI,實在很難令人接受,或許這部分可以讓人快點上手,可是相對的要花相當時間在調教一些參數上
沒有留言:
張貼留言