2014年8月8日 星期五

Coursera 上課筆記 - R Programming - 第一週 - Packages and File IO

Course note for R programming -  Packages and File IO
R programming 第一週的筆記之一! 

不是什麼正式的學習筆記,可以未來查看我學過什麼+複習XD


packages:

R社群非常活躍,現在有很多的packages(很像是)可以使用!
自己也可以做個人的packages分享給大家使用。

available.packages() 列出可以載的package
install.packages("slidify")
install.packages(c("slidify", "ggplot2"))

用 library() 去load package
search()


File IO:

read.table()
read.csv()
這兩個基本差不多,但是read.table()中間是用空白分開,
read.table可以自由設定表格資料中間用什麼字元分開。
read.csv()中間是用 "," 隔開資料 (CSV format)

看read.table()的help
在大資料時預估多少記憶體,因為R會讀到電腦的RAM中
再算完佔有多少空間後,要大概有兩倍以上的空間比較保險


read.table的參數: colCLasses要判斷是什麼class, 如果能事先告訴他,就能節省時間,可以先讀一行,知道class後再設定


source() ####read R file
dget    ####read R file

load()
=====================================
dump, dput處理文字類格式
有metadata
ex:
y <- data.frame(a = 1, b = "a")
dput(y) #可以deparse y
dput(y, file = "y.R") #儲存
new.y <- dget("y.R") #重新讀進來


多個物件可以用dump吃進去
用source讀出來


=====================================
connection

con <- file("foo.txt", "r")
data <- read.csv(con)
close(con)

writeLines() 可以寫vector進一個connection


readLines() 從一個connection 讀資料(存在vector)
ex:
con <- url("http://www.jhsph.edu", "r")
x <- readLines(con)



If you want to use (copy, paste or quote) my original article, please contact me through email. (autek.roy@gmail.com) If there is any mistake or comment, please let me know. :D

如要使用(複製貼上或轉載)作者原創文章, 請來信跟我聯絡。(autek.roy@gmail.com) 如果有發現任何的錯誤與建議請留言或跟我連絡。 : )

沒有留言:

張貼留言

請留下您的任何想法或建議!
Please leave any thought or comment!