01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
data(CO2) # 草本植物の二酸化炭素取得データ
summary(CO2) # 要約を表示
# Qn1, Qc1, Mn1, Mc1 だけを抽出
subset(CO2, Plant=="Qn1" | Plant=="Qc1" | Plant=="Mn1" | Plant=="Mc1") # "|" で指定すると表現が冗長
subset(CO2, Plant %in% c("Qn1", "Qc1", "Mn1", "Mc1")) # "%in%" で指定すると短縮できる
# Qn1, Qc1, Mn1, Mc1 以外を抽出(ヘルプから応用編を勉強)
"%w/o%" <- function(x,y) x[!x %in% y] # "%w/o%"でy以外のxというのを抽出するよう定義
others <- CO2$Plant %w/o% c("Qn1", "Qc1", "Mn1", "Mc1") # "Qn1", "Qc1", "Mn1", "Mc1" 以外の集合
subset(CO2, Plant %in% others) # 上記以外のデータを抽出
subset(CO2, (!Plant %in% c("Qn1", "Qc1", "Mn1", "Mc1"))) # 一気にやる方法
layer <- factor(c("k2","k1","b2","b1","k1","s2","k1","b1","s1","k1","s2","s1","b2","b1","k1","s2")) # 順位なし
layer # 順序がばらばら
table(layer) # 集計してもばらばら
layer <- ordered(layer, levels=c("k2","k1","s2","s1","b2","b1")) # 階層に順位を与える
layer # 順位がついている
table(layer) # 集計が順位どおりにならぶ
summary2 <- function(x) list(comment(x), summary(x)) # 既存の関数にコメントの出力を追加
x <- 1:10
comment(x) <- "テストデータ"
summary(x)
summary2(x)
A⊃B:AはBを含有する。
A∪B:和集合。AかBかどちらかにあるもの(両方にあるものも含む)。
A∩B:積集合。AとBの共通するもの。
A−B:差集合。Aにあって、Bにないもの。
df <- data.frame(fct=factor(c("a","b","a","b","c","d","d")))
df$fct
df$fct[df$fct=="a"] <- "e" # 失敗する
df$fct # NAが入っている
df <- data.frame(fct=factor(c("a","b","a","b","c","d","d")))
levels(df$fct) <- c(levels(df$fct), "e") # 水準を追加する
df$fct
df$fct[df$fct=="a"] <- "e" # 成功する
df$fct
- 声に出して照合する(調査時の筆記では、必ず「復唱」をする)
データ確認用のプログラムを実行する
散布図やヒストグラムなどの図を作成する
2回データを入力する(2回の入力が異なるところは確認をする)
印刷をして確認する(確認したところは鉛筆で「はねる」)
割振った番号との照合などの場合は、チェックデジット(検査番号)を使用する
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
最終更新時間: 2009-12-01 22:42