有些內容使用中英雙語,有些只有英文或中文。歡迎使用與分享任何內容,但先來信告知並標示此部落格為出處。
Some parts use both Chinese and English, but some parts use only one language. Feel free to share, but please contact me first and list this blog as your reference.

2014年8月8日 星期五

Coursera 上課筆記 - R Programming - 第一週 - Packages and File IO

Course note for R programming -  Packages and File IO
R programming 第一週的筆記之一! 

不是什麼正式的學習筆記,可以未來查看我學過什麼+複習XD


packages:

R社群非常活躍,現在有很多的packages(很像是)可以使用!
自己也可以做個人的packages分享給大家使用。

available.packages() 列出可以載的package
install.packages("slidify")
install.packages(c("slidify", "ggplot2"))

用 library() 去load package
search()


File IO:

read.table()
read.csv()
這兩個基本差不多,但是read.table()中間是用空白分開,
read.table可以自由設定表格資料中間用什麼字元分開。
read.csv()中間是用 "," 隔開資料 (CSV format)

看read.table()的help
在大資料時預估多少記憶體,因為R會讀到電腦的RAM中
再算完佔有多少空間後,要大概有兩倍以上的空間比較保險


read.table的參數: colCLasses要判斷是什麼class, 如果能事先告訴他,就能節省時間,可以先讀一行,知道class後再設定


source() ####read R file
dget    ####read R file

load()
=====================================
dump, dput處理文字類格式
有metadata
ex:
y <- data.frame(a = 1, b = "a")
dput(y) #可以deparse y
dput(y, file = "y.R") #儲存
new.y <- dget("y.R") #重新讀進來


多個物件可以用dump吃進去
用source讀出來


=====================================
connection

con <- file("foo.txt", "r")
data <- read.csv(con)
close(con)

writeLines() 可以寫vector進一個connection


readLines() 從一個connection 讀資料(存在vector)
ex:
con <- url("http://www.jhsph.edu", "r")
x <- readLines(con)



If you want to use (copy, paste or quote) my original article, please contact me through email. (autek.roy@gmail.com) If there is any mistake or comment, please let me know. :D

如要使用(複製貼上或轉載)作者原創文章, 請來信跟我聯絡。(autek.roy@gmail.com) 如果有發現任何的錯誤與建議請留言或跟我連絡。 : )

沒有留言:

張貼留言

請留下您的任何想法或建議!
Please leave any thought or comment!