◎代理經銷:白象文化
從幾年前開始教管理數學時,發現在教學上,花太多時間在計算上,勾起以前學習數學、統計以及多變數分析時的挫折。同樣的經驗 也出現在教作業管理,有關流程分析或解學習曲線、品質管理的管制圖上;心想若能輔以 R 語言的語法或操作,在瞭解原理後,將複雜的計算交給 R 語言,也會提升學習的效果; 利用 R 語言可以省掉這些相對是細微末節的計算,專注在理解問 題的本質、有效的定義問題以及解決問題的方式,這應該也是「博雅教育」 (Liberal arts)的本質吧 !
R 語言因為具有簡單、互動、有趣特色,讓使用者在學習的過程可以達到這個效果。 可以扮演「寫程式」的能力的第一哩路,甚至在資料分析、圖形呈現的最後一哩路。
第一篇介紹 R 語言概論,但是跟同類的書籍處理上不一樣,因為我們試圖重點放在解決管理領域的問題,所以把第一章擺在附錄 ; 第二篇探討巨量資料、開放資料與 R 語言; 第三篇探討 R 語言在管理數學的應用。第四篇探討 R 語言在作業管理的應用。
◎" If I have seen farther than others,
it is because I have stood on the shoulders of giants."
- Sir Isaac Newton
出版本書是一種意外,從幾年前開始教管理數學時,發現在教學上,花太多 時間在計算上,勾起以前學習數學、統計以及多變數分析時的挫折。同樣的經驗 也出現在教作業管理,有關流程分析或解學習曲線、品質管理的管制圖上;心想若能輔以 R 語言的語法或操作,在瞭解原理後,將複雜的計算交給 R 語言,也會提 升學習的效果; 利用 R 語言可以省掉這些相對是細微末節的計算,專注在理解問題的本質、有效的定義問題以及解決問題的方式,這應該也是「博雅教育」 (Liberal arts)的本質吧 ! 於是開始醞釀及構思本書的寫作。
看了本書封面就知道,本書意在直指學習的核心,荀子在《勸學》中說道:「學不可以已。青,取之於藍,而青於藍;冰,水爲之,而寒於水。」。意思是,學習不可以停止,一定要持之以恆。就如月之恆,如日之升; R 語言因為具有簡 單、互動、有趣特色,讓使用者在學習的過程可以達到這個效果。
第一篇介紹 R 語言概論,但是跟同類的書籍處理上不一樣,因為我們試圖重 點放在解決管理領域的問題,因此,不特別著墨或淡化撰寫 R 程式設計的技巧, 但又不能不交待本書使用到的 R 語言語法、功能、函數、套件等。所以把第一章 擺在附錄,這是跟坊間的書籍不一樣的。
第二篇探討巨量資料、開放資料與 R 語言; 細說巨量資料(Big data)自 2013 年已成為流行語,它經常使用在商業界和流行媒體中;而開放資料從 2010 年開始的隨後幾年在政府公開資料的出版品中顯著增加。兩者除企業及政府機構內部供 行銷、商業分析、國安之用的非公開資料外高度重疊。開放資料可以是巨量資 料,但其強調的是公開的以及有目的的(public and purposeful)資料的開放,而不像巨量資料強調資料的本質。
面對巨量資料產生“3V”一詞來代表數量、速度和多樣,迅速成為巨量資料 的構成維度,巨量資料須處理的資料是廣泛的,基本上可依資料是否容易清楚歸 類分項及表格化分為結構化資料及非結構化資料,結構化資料目前許多程式語言 語可以處理,但對於非結構化資料,例如地理位置資訊、臉書訊息、視訊資料等 是無法處理、而 R 語言正可以解決這方面的問題。另外,第 2章就開放資料帶來 的三大機會我們分別用三個實例以 R 語言來呈現。
當然 R 語言也不是無所不能,其強項在統計分析及可視化的工具呈現。但由 於缺乏 Web 安全性或運算效率考量,幾乎不可能將 R 作為後端伺服器來執行計 算,但是 RStudio 公司打造的一款基於 Web 的開源編輯器 RStudio Server,以 及微軟在 2015 年推出 Microsoft R Server(2017 年除了R 以外增加了 Python 的支援改稱 Microsoft Machine Learning Server)支援 Hadoop、Linux 和 Teradata 平臺都是一種補強。另一方面。R 語言可以整合高效能的程式語言,例 如 Python,C ++或 Java 予以補強。
在這裡捨「大數據」詞彙,而就「巨量資料」,考量到兩個用詞在語義上相 通,採用「巨量資料」與「開放資料」並存,具對偶及押韻之美,讀起來順口。
第三篇探討 R 語言在管理數學的應用。第 3章探討線性函數(linear function)與線性方程組(system of equations)。在商業、經濟領域的許多問題,本質上就是線性的或在特定範圍內呈現線性的關係,因此適合以線性函數表示。 (2) 從文獻中發現: 原來中國古文明「以物易物脈絡」(barter context),可作為線 性方程組教學啟蒙,提供從自然的和悠久歷史的切入點。(3)
市場均衡下求均衡數量與價格,以 R 語言解線性方程組,省去手算求反矩陣,先寫出擴增矩陣,再利用高斯-喬登消去法(Gauss-Jordan elimination method),得到一系列的等價擴增矩陣的冗長計算;同樣的,健康照護費用以最小 平方法,預期未來幾年其健康照護花費,手算時要先列出 x、y 軸各點的值,求算 x、y、x2、xy 各欄總和,再代入正規方程組,求解截距與斜率。以 R 語言解 最小平方法 x、y 軸各點的值代入「lm」套件即可,繁瑣的計算交給 R,解析報 表的工作仍然還給人們。
第 4 章以矩陣代表資料: 如不同工廠生產不同型號的藍芽喇叭,不同加油站 供應不同等級的無鉛汽油,以矩陣表示及彙總生產或消費資料的初階應用,到以 反矩陣來加密及解密的古典加密技術; 應用反矩陣於經濟學的 Leontief 模式,一窺 Leontief 用線性方程式表達多種產業,如何將其產出分散到或影響其他產業的 縮影。也可將矩陣應用於最小平方法,預測第 3 章健康照護費用。在解題的過程,尤其配合 R 的逐條指令,按下「run」會有原來如此的驚呼,這就是學習 R 的樂趣!