新書推薦:
《
同与不同:50个中国孤独症孩子的故事
》
售價:NT$
301.0
《
开宝九年
》
售價:NT$
250.0
《
摄影构图法则:让画面从无序到有序
》
售價:NT$
505.0
《
论僭政:色诺芬《希耶罗》义疏(含施特劳斯与科耶夫通信集)
》
售價:NT$
500.0
《
一个经济杀手的自白
》
售價:NT$
500.0
《
传播与流动:移民、手机与集装箱(新闻与传播学译丛·学术前沿系列)
》
售價:NT$
500.0
《
大唐诡异录
》
售價:NT$
254.0
《
《证券分析》前传:格雷厄姆投资思想与证券分析方法
》
售價:NT$
612.0
|
內容簡介: |
運用各種資料分析套件和統計模型,解決大數據時代所會遇到的各種難題
R語言是公認處理大數據的最佳利器,不只免費、語法簡單、直覺,還具備數千個功能強大的延伸套件,更讓R語言深入各種不同的應用領域。本書由國際知名的資料分析專家執筆,作者具備豐富的R語言教學經驗,從中篩選出R的基本功能和最新、最好用的套件,並以各種資料集案例,具體展現資料分析成果。
對於有心跨足資料科學、數據分析、量化交易、人工智慧、機器學習等領域的讀者,只會R語言的語法自然是不夠的。我們將帶您運用各種資料分析套件和統計模型,解決大數據時代所會遇到的各種難題,包括:向量運算、文字探勘、資料視覺化、趨勢預測、資料建模,以及各種分析結果的輸出、引用與動態呈現等,全面掌握R語言的各種技巧。
本書特色:
●向量運算:全向量化的資料結構,包括:vector、factorvector、data.frame、list、matrix、array等
●文字探勘:各類資料匯入讀取、抽取字串、表格轉換與合併、資料聚合、資料正規化、網路爬蟲
●資料視覺化:最吸睛的ggplot2套件圖表繪製技巧,並利用Shiny套件產生網頁互動展示儀表板
●機率統計:快速領略統計學核心應用,抽樣分佈、假設檢定、變異數分析、資料分群
●趨勢預測:展現大數據威力的強力工具,線性迴歸、廣義線性模型、非線性模型、時間序列與自相關性
●資料建模:機器學習的基礎,利用Caret評斷資料模型配適度,建立資料測試與訓練機制,透過交叉驗證和參數挑選建立最佳模式
●進階應用:資料分析師必學的套件包裝與發佈、報表投影片製作、制式化文件輸出等
|
關於作者: |
JaredP.Lander
其專長為資料管理、多階層模型、機器學習、廣義線性模型、視覺化圖表與統計計算,目前是LanderAnalytics的創始人兼行政總裁,該公司是紐約市的企管顧問公司。作者也是紐約市開源碼大會的主辦人,且是哥倫比亞大學統計系兼任教授。
JaredP.Lander在哥倫比亞大學取得統計碩士,也曾在許多不同的機構任職過,包括關於政治、科技、籌款、音樂、金融、健保和人道救援的工作,在學術研究和業界皆有豐富經驗。
|
目錄:
|
01R語言的下載與安裝
02R的操作環境簡介
03R語言的套件
04R語言基礎
05進階資料結構
06讀取各類資料
07統計繪圖
08建立R函數
09流程控制
10迴圈—迭代元素的傳統作法
11群組資料操作
12更有效率的群組操作–使用dplyr
13使用purrr迭代的做法
14資料整理
15Tidyverse下的資料整理
16字串處理
17機率分佈
18基本統計分析
19線性模型
20廣義線性模型
21模型診斷
22正規化和壓縮方法
23非線性模型
24時間序列與自相關性
25資料分群
26模型配適-使用Caret套件
27用Knitr套件將分析結果轉製成報表
28用Rmarkdown製作富文本
29用Shinny套件建立互動資訊看板
30章建立R套件
附錄AR語言參考資源
附錄B名詞解釋
|
|