Wednesday, September 15, 2010

Read data from text file and Plot the variable density

Baca data dari fail:

>fusiondata = read.table("C:\\Datasets\\run1_train.txt",header=T, sep="\t")

Untuk tengok data, cuba ambil dari baris 1 ke baris 8

>fusiondata[1:8,]

akan keluar data begini:

ANN_PREDICTED MIP_PREDICT GBT_PREDICT TARGET
1 0.5013140 0.0051 0.0323186 0
2 0.5015325 0.0051 0.0323186 0
3 0.5057989 0.0051 0.0323186 0
4 0.4961194 0.0109 0.0323186 0
5 0.5018118 0.0051 0.0323186 0
6 0.5024724 0.0109 0.0323186 0
7 0.4986205 0.0051 0.0323186 0
8 0.5017849 0.0051 0.0323186 0

Untuk senangkan kerja, kita umpukkan (assign) setiap pembolehubah (variable) dalam fusiondata ke pembolehubah baru.

> annpre<-fusiondata[,1]
> mippre<-fusiondata[,2]
> gbtpre<-fusiondata[,3]
> target<-fusiondata[,4]

Untuk tengok salah satu data dari pembolehubah, taipkan saja namanya. Contohnya, kita nak tengok annpre (Disebabkan datanya besar, jadi kita tengok 5 baris saja. Taip:

>annpre[1:5]

[1] 0.5013140 0.5015325 0.5057989 0.4961194 0.5018118

R memaparkan 5 data pertama sahaja.

Untuk ambil data ANN_PREDICT dimana targetnya adalah 0, kita ambil ANN_PREDICT bersama data TARGET dulu.

annpre_target<-fusiondata[, c(1,4) ]

ANN_PREDICTED TARGET
1 0.5013140 0
2 0.5015325 0
3 0.5057989 0
4 0.4961194 0
5 0.5018118 0
....

Kemudian baru ambil vektor ANN_PREDICT sahaja.

>annpre_target0<-annpre_target[annpre_target$TARGET==0,1]
>annpre_target0[1:5,]

[1] 0.5013140 0.5015325 0.5057989 0.4961194 0.5018118

No comments:

Post a Comment