Saturday, August 8, 2020

Basics of R- Decison Tree using rpart

library(rpart)

library(rpart.plot)

data1<-read.csv("file:///C:/Users/LENOVO/Desktop/Missing/decison tree mba.csv", stringsAsFactors = TRUE)

dtm1<-rpart(Specialization~Gender+Previous_Degree,data=data1,

minsplit=100, minbucket=10, maxdepth=4, method = "class")

dtm1

rpart.plot(dtm1, type = 0, cex = 0.5)

#-------------

dtm1<-rpart(Specialization~Gender+Previous_Degree+Percentage_in_10_Class+

Percentage_in_12_Class+Percentage_in_Under_Graduate,

data=data1,

minsplit=100, minbucket=10, maxdepth=4)

dtm1

rpart.plot(dtm1, type = 0, cex = 0.5)

#-------------------------------

dtm1<-rpart(Specialization~Percentage_in_10_Class+

Percentage_in_12_Class+Percentage_in_Under_Graduate,

data=data1,

minsplit=100, minbucket=10, maxdepth=4, parms = list(split = 'gini'))

dtm1

rpart.plot(dtm1, type = 0, cex = 0.5)

#CP= complexity parameter, α be some number between 0 and ∞ which measures the ’cost’ of adding another

# variable to the model

# pruning

dtm1prone<-prune(dtm1, cp=0.01)

rpart.plot(dtm1prone, type = 0, cex = 0.5)

library()

printcp(dtm1)

str(data1)

dtm1<-rpart(Age_in_years~Percentage_in_10_Class+

Percentage_in_12_Class+Percentage_in_Under_Graduate,

data=data1, method = "anova" )

rpart.plot(dtm1, type = 0, cex = 0.5)

predict1<-predict(dtm1, type = "class")

confusionMatrix(predict1, data1$Specialization)

Friday, July 3, 2020

Basics of R Session 22- Logistic Regression 1.1 (Caret Package)

library(caret)
library(ISLR)
data1<-read.csv("file:///C:/Users/LENOVO/Desktop/Missing/Chapter 10 Bollywood Box Office Collection Data.csv")

# data partition
data1$Success.Faliure<-as.factor(data1$Success.Faliure)
set.seed(100)
split1<-createDataPartition(data1$Success.Faliure,p=0.7, list = FALSE)

data1train <- data1[split1, ]
data1test <- data1[-split1, ]

fitControl <- trainControl(
method = "cv",
number = 10,
savePredictions = TRUE
)

lreg3<-train(Success.Faliure~
Youtube_Dislikes+Youtube_Likes+Youtube_Views,
method= "glm",
family= "binomial",
trControl=fitControl,
data = data1)

summary(lreg3)

# predicted values and residual

lreg3$finalModel$coefficients

lreg3$finalModel$fitted.values

lreg3$finalModel$residuals

lreg3$results

coef(lreg1$finalModel)

confint(lreg1$finalModel)

# model fit indices

library(blorr)

library(Rcpp)

library(tidymodels)

blr_model_fit_stats(lreg1$finalModel)

blr_test_hosmer_lemeshow(lreg1$finalModel)

blr_bivariate_analysis(lreg1$finalModel)

# walds test, for each IV variables

library(survey)

regTermTest(lreg1$finalModel, "ï..Age")

# confusionmatrix

blr_confusion_matrix(lreg3$finalModel, cutoff = 0.5)

predict1<-predict(lreg3,data1)
confusionMatrix(predict1, data1$Success.Faliure)

# for roc

gainstable<-blr_gains_table(lreg3$finalModel)

blr_roc_curve(gainstable)

library(ROCR)
predict1<-predict(lreg3,data1, type = "prob")

predict_roc<-prediction(predict1[2], data1$Success.Faliure)
predict_roc2<-performance(predict_roc, measure = "tpr", "fpr")
plot(predict_roc2)

predict_roc2<-performance(predict_roc, measure = "auc")
predict_roc2@y.values[[1]]

# forward method, backward method, both

library(blorr)

regfor<-blr_step_aic_forward(lreg1$finalModel)

regfor

regfor1<-blr_step_aic_forward(lreg1$finalModel, details = TRUE)

regback<-blr_step_aic_backward(lreg1$finalModel)

regback

regboth<-blr_step_aic_both(reg1$finalModel)

regboth

#_will take lot of time not advisable #

library(caret)

reg1<-train(Status~.,

method ="glmStepAIC",

family= "binomial",

direction ="forward"

data = datatrain)

reg1$finalmodel

#-----------------------------------------------------------------------------------------#

Saturday, June 20, 2020

Basics of R Session 5.5- Outliers

options(scipen=999) # to turn off scientific notation
data1<-read.csv("file:///C:/Users/LENOVO/Desktop/Missing/outliers sumeer.csv")

#-----------------------#
library(outliers)

library(car)
boxplot(data1$AGE)

#convert the data into standard form
data1$HB_scale<-scale(data1$HB, center = TRUE, scale = TRUE)

summary(data1$HB_scale)
plot(data1$HB_scale)

data1$HB_scale
which(data1$HB_scale>=1.96)
which(data1$HB_scale<=-1.96)

#chi square test
chisq.out.test(data1$HB)
outlier(data1$HB)

#inter quartile range

IQR(data1$HB)
quantile(data1$HB)

score1<-scores(data1$HB, type = "chisq", prob = 0.95)
score1<-scores(data1$HB, type = "z", prob = 0.95)
score1<-scores(data1$HB, type = "t", prob = 0.95)

# mahalobanis distance
library(psych)
# reducing the data using only those variables whcih are required
data2<-data1[,c(2:3)]
outlier(data2, plot = TRUE)

# regression or residual to find outliers

reg1<-lm(AGE~HB+TLC+PLATELET, data = data1)
plot(reg1)

Tuesday, June 16, 2020

Basics of R Session 5.4 - Missing values

data1<-read.csv("file:///C:/Users/LENOVO/Desktop/Missing/missing1.1.csv")

library(descr)
descr(data1)
descr(data1$v1)

is.na(data1) # used to identify the place where there is missing in the data as true or false

sum(is.na(data1)) #total number of missing values
sum(is.na(data1))/(nrow(data1)*ncol(data1)) # % of missing values

sum(is.na(data1$v1))/length(data1$v1) # % of missing in a variable

library(Amelia)
AmeliaView() # only to see the pattern of the missing data
# note if there is perfect multicollinearity between any two variables, it will not work

data1_impute<-amelia(data1, m=3) # default

data1_impute$imputations[[1]] # Imputation data set 1
data1_impute$imputations[[1]]$v1 # Imputation data set 1 variable 2

# save as data1_impute_1
data1_impute_1<-data1_impute$imputations[[1]] # Imputation data set 1
str(data1_impute_1)

# idvars
# a vector of column numbers or column names that indicates identification variables.
# noms
# a vector of numbers or names indicating columns in the data that are nominal variables.
# ords
# a vector of numbers or names indicating columns in the data that should be treated as ordinal variables.

data2_impute<-amelia(data1, m=3, idvars = 1, noms = c(11,12,13), ords = 14 )

data2_impute$imputations[[1]]

# uses bootstrap EM algorithm (Expectation Maximization)

#-------------------------#

library(Hmisc)

impute(data1$v1,mean)
impute(data1$v1,median)
impute(data1$v1,min)
impute(data1$v1,max)
impute(data1$v1,"random")

impute_data1_2<-aregImpute(v1~v2, data1,n.impute = 3,type = "regression")
impute_data1_2$imputed$v2

# there are many more methods- which you can explore yourself

Sunday, February 23, 2020

Session 5.3 Missing Values

missing1.1<-read.csv("file:///D:/1 Teaching Material/R/importfile/missing1.1.csv")

str(missing1.1)
## 'data.frame': 70 obs. of 15 variables:
## $ id : int 204 207 248 232 224 202 255 240 221 216 ...
## $ v1 : num NA NA NA NA NA NA NA NA NA NA ...
## $ v2 : num 1.5 1.5 NA NA NA 0.4 1 1.5 1.6 1.6 ...
## $ v3 : num NA NA 6.4 8.2 8.6 NA NA 9.9 NA 6.4 ...
## $ v4 : num 4.8 4.8 5.3 5 5.7 2.5 3.4 2.7 4.8 5 ...
## $ v5 : num 1.9 1.9 3 3.6 2.7 1.2 1.7 1.3 2 NA ...
## $ v6 : num 2.5 2.5 2.5 2.5 3.7 1.7 1.1 1.2 2.8 2.1 ...
## $ v7 : num 7.2 7.2 7.1 9 6.7 5.2 6.2 1.7 NA 8.4 ...
## $ v8 : int 36 36 46 53 NA 35 35 50 32 25 ...
## $ v9 : num NA NA 4.5 5.2 5 3.3 4.1 5 4.3 3.4 ...
## $ v10: int 1 1 1 1 0 0 1 1 0 1 ...
## $ v11: int 0 0 0 0 1 1 0 0 1 0 ...
## $ v12: int 1 1 1 1 0 0 1 1 0 1 ...
## $ v13: int 0 0 0 1 1 0 0 1 0 1 ...
## $ v14: int 1 1 2 2 1 1 1 2 1 1 ...
fix(missing1.1)
summary(missing1.1)
## id v1 v2 v3
## Min. :201.0 Min. :2.800 Min. :0.400 Min. :5.000
## 1st Qu.:218.2 1st Qu.:3.200 1st Qu.:1.400 1st Qu.:6.700
## Median :235.5 Median :3.800 Median :1.900 Median :8.200
## Mean :235.5 Mean :4.008 Mean :1.944 Mean :8.062
## 3rd Qu.:252.8 3rd Qu.:4.700 3rd Qu.:2.500 3rd Qu.:9.200
## Max. :270.0 Max. :6.500 Max. :3.800 Max. :9.900
## NA's :21 NA's :13 NA's :17
## v4 v5 v6 v7
## Min. :2.500 Min. :1.100 Min. :1.100 Min. :1.700
## 1st Qu.:4.500 1st Qu.:2.200 1st Qu.:2.275 1st Qu.:5.600
## Median :5.000 Median :3.000 Median :2.600 Median :6.800
## Mean :5.168 Mean :2.856 Mean :2.611 Mean :6.823
## 3rd Qu.:5.900 3rd Qu.:3.400 3rd Qu.:3.000 3rd Qu.:8.200
## Max. :7.800 Max. :4.600 Max. :4.000 Max. :9.900
## NA's :7 NA's :9 NA's :6 NA's :9
## v8 v9 v10 v11
## Min. :25.00 Min. :3.300 Min. :0.0000 Min. :0.0000
## 1st Qu.:39.00 1st Qu.:4.150 1st Qu.:0.0000 1st Qu.:0.0000
## Median :47.00 Median :4.900 Median :0.0000 Median :1.0000
## Mean :46.03 Mean :4.759 Mean :0.3676 Mean :0.6471
## 3rd Qu.:54.00 3rd Qu.:5.250 3rd Qu.:1.0000 3rd Qu.:1.0000
## Max. :65.00 Max. :6.200 Max. :1.0000 Max. :1.0000
## NA's :9 NA's :7 NA's :2 NA's :2
## v12 v13 v14
## Min. :0.0000 Min. :0.0000 Min. :1.000
## 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:1.000
## Median :0.0000 Median :0.0000 Median :2.000
## Mean :0.4559 Mean :0.4783 Mean :2.029
## 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:3.000
## Max. :1.0000 Max. :1.0000 Max. :3.000
## NA's :2 NA's :1 NA's :2
#converts into logical values with false for missing and true for non missing

missing_a<-is.na(missing1.1)

missing_a
## id v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11
## 1 FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE
## 2 FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE
## 3 FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 4 FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 5 FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
## 6 FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 7 FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 8 FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 9 FALSE TRUE FALSE TRUE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE
## 10 FALSE TRUE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE
## 11 FALSE TRUE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 12 FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 13 FALSE TRUE FALSE TRUE FALSE TRUE FALSE TRUE TRUE FALSE FALSE FALSE
## 14 FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 15 FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 16 FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 17 FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 18 FALSE TRUE FALSE FALSE TRUE FALSE TRUE TRUE TRUE FALSE FALSE TRUE
## 19 FALSE TRUE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE
## 20 FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 21 FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 22 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 23 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 24 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 25 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 26 FALSE FALSE TRUE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE
## 27 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 28 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 29 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 30 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
## 31 FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 32 FALSE FALSE FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE
## 33 FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE
## 34 FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
## 35 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 36 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE
## 37 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 38 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 39 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 40 FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 41 FALSE FALSE TRUE TRUE FALSE FALSE TRUE TRUE TRUE TRUE FALSE TRUE
## 42 FALSE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE FALSE TRUE FALSE
## 43 FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE
## 44 FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 45 FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 46 FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE TRUE FALSE FALSE
## 47 FALSE FALSE FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE
## 48 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 49 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 50 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 51 FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE
## 52 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 53 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 54 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 55 FALSE FALSE TRUE TRUE FALSE TRUE TRUE FALSE FALSE TRUE FALSE FALSE
## 56 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 57 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 58 FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 59 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 60 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 61 FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 62 FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 63 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 64 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 65 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 66 FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 67 FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE
## 68 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 69 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 70 FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## v12 v13 v14
## 1 FALSE FALSE FALSE
## 2 FALSE FALSE FALSE
## 3 FALSE FALSE FALSE
## 4 FALSE FALSE FALSE
## 5 FALSE FALSE FALSE
## 6 FALSE FALSE FALSE
## 7 FALSE FALSE FALSE
## 8 FALSE FALSE FALSE
## 9 FALSE FALSE FALSE
## 10 FALSE FALSE FALSE
## 11 FALSE FALSE FALSE
## 12 FALSE FALSE FALSE
## 13 TRUE FALSE TRUE
## 14 FALSE FALSE FALSE
## 15 FALSE FALSE FALSE
## 16 FALSE FALSE FALSE
## 17 FALSE FALSE FALSE
## 18 FALSE TRUE FALSE
## 19 FALSE FALSE FALSE
## 20 FALSE FALSE FALSE
## 21 FALSE FALSE FALSE
## 22 FALSE FALSE FALSE
## 23 FALSE FALSE FALSE
## 24 FALSE FALSE FALSE
## 25 FALSE FALSE FALSE
## 26 FALSE FALSE FALSE
## 27 FALSE FALSE FALSE
## 28 FALSE FALSE FALSE
## 29 FALSE FALSE FALSE
## 30 FALSE FALSE FALSE
## 31 FALSE FALSE FALSE
## 32 FALSE FALSE FALSE
## 33 FALSE FALSE FALSE
## 34 FALSE FALSE FALSE
## 35 FALSE FALSE FALSE
## 36 FALSE FALSE FALSE
## 37 FALSE FALSE FALSE
## 38 FALSE FALSE FALSE
## 39 FALSE FALSE FALSE
## 40 FALSE FALSE FALSE
## 41 FALSE FALSE FALSE
## 42 FALSE FALSE FALSE
## 43 FALSE FALSE FALSE
## 44 FALSE FALSE FALSE
## 45 FALSE FALSE FALSE
## 46 FALSE FALSE FALSE
## 47 FALSE FALSE FALSE
## 48 FALSE FALSE FALSE
## 49 FALSE FALSE FALSE
## 50 FALSE FALSE FALSE
## 51 FALSE FALSE FALSE
## 52 FALSE FALSE FALSE
## 53 FALSE FALSE FALSE
## 54 FALSE FALSE FALSE
## 55 TRUE FALSE TRUE
## 56 FALSE FALSE FALSE
## 57 FALSE FALSE FALSE
## 58 FALSE FALSE FALSE
## 59 FALSE FALSE FALSE
## 60 FALSE FALSE FALSE
## 61 FALSE FALSE FALSE
## 62 FALSE FALSE FALSE
## 63 FALSE FALSE FALSE
## 64 FALSE FALSE FALSE
## 65 FALSE FALSE FALSE
## 66 FALSE FALSE FALSE
## 67 FALSE FALSE FALSE
## 68 FALSE FALSE FALSE
## 69 FALSE FALSE FALSE
## 70 FALSE FALSE FALSE
# for particular variable say 1
missing_a[,1]
## 1 2 3 4 5 6 7 8 9 10 11 12 13
## FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 14 15 16 17 18 19 20 21 22 23 24 25 26
## FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 27 28 29 30 31 32 33 34 35 36 37 38 39
## FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 40 41 42 43 44 45 46 47 48 49 50 51 52
## FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 53 54 55 56 57 58 59 60 61 62 63 64 65
## FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 66 67 68 69 70
## FALSE FALSE FALSE FALSE FALSE
# for particular variable say 2
missing_a[,2]
## 1 2 3 4 5 6 7 8 9 10 11 12 13
## TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 14 15 16 17 18 19 20 21 22 23 24 25 26
## TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE FALSE FALSE FALSE FALSE
## 27 28 29 30 31 32 33 34 35 36 37 38 39
## FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 40 41 42 43 44 45 46 47 48 49 50 51 52
## FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 53 54 55 56 57 58 59 60 61 62 63 64 65
## FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 66 67 68 69 70
## FALSE FALSE FALSE FALSE FALSE
#convert the local values into actual values which are missing

missing1.1$v1[missing_a[,1]]
## numeric(0)
missing1.1$v2[missing_a[,2]]
## [1] 1.5 1.5 NA NA NA 0.4 1.0 1.5 1.6 1.6 1.8 1.9 2.0 2.0 2.0 2.1 2.5 2.7 2.8
## [20] 3.3 3.7
str(missing1.1$v2[missing_a[,2]])
## num [1:21] 1.5 1.5 NA NA NA 0.4 1 1.5 1.6 1.6 ...
summary(missing1.1$v2[missing_a[,2]])
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.400 1.525 1.950 1.994 2.400 3.700 3
#reverse th logical values
!missing_a[,2]
## 1 2 3 4 5 6 7 8 9 10 11 12 13
## FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 14 15 16 17 18 19 20 21 22 23 24 25 26
## FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE
## 27 28 29 30 31 32 33 34 35 36 37 38 39
## TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 40 41 42 43 44 45 46 47 48 49 50 51 52
## TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 53 54 55 56 57 58 59 60 61 62 63 64 65
## TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 66 67 68 69 70
## TRUE TRUE TRUE TRUE TRUE
complete.cases(missing1.1)
## [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE
## [25] TRUE FALSE TRUE TRUE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE
## [37] TRUE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE
## [49] TRUE TRUE FALSE TRUE TRUE TRUE FALSE TRUE TRUE FALSE TRUE TRUE
## [61] FALSE FALSE TRUE TRUE TRUE FALSE FALSE TRUE TRUE FALSE
complete.cases(missing1.1$v1)
## [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE
## [25] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [37] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [49] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [61] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
complete.cases(missing1.1$v2)
## [1] TRUE TRUE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [13] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [25] TRUE FALSE TRUE TRUE TRUE TRUE FALSE TRUE TRUE FALSE TRUE TRUE
## [37] TRUE TRUE TRUE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE
## [49] TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE
## [61] FALSE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE FALSE
#store the comlete cases into cv2
cv2<-complete.cases(missing1.1$v2)
cv2
## [1] TRUE TRUE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [13] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## [25] TRUE FALSE TRUE TRUE TRUE TRUE FALSE TRUE TRUE FALSE TRUE TRUE
## [37] TRUE TRUE TRUE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE
## [49] TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE
## [61] FALSE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE FALSE
missing1.1$v2[cv2]
## [1] 1.5 1.5 0.4 1.0 1.5 1.6 1.6 1.8 1.9 2.0 2.0 2.0 2.1 2.5 2.7 2.8 3.3 3.7 1.4
## [20] 2.4 3.8 2.6 2.0 2.8 3.2 3.8 1.9 2.2 0.9 2.6 2.0 3.7 2.8 0.7 1.4 0.8 0.8 2.2
## [39] 0.5 0.9 1.1 3.7 2.4 2.5 1.8 1.6 2.1 1.3 1.3 1.7 1.4 1.9 1.3 1.3 1.4 2.2 0.5
print(missing_a)
## id v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11
## 1 FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE
## 2 FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE
## 3 FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 4 FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 5 FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
## 6 FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 7 FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 8 FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 9 FALSE TRUE FALSE TRUE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE
## 10 FALSE TRUE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE
## 11 FALSE TRUE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 12 FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 13 FALSE TRUE FALSE TRUE FALSE TRUE FALSE TRUE TRUE FALSE FALSE FALSE
## 14 FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 15 FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 16 FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 17 FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 18 FALSE TRUE FALSE FALSE TRUE FALSE TRUE TRUE TRUE FALSE FALSE TRUE
## 19 FALSE TRUE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE
## 20 FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 21 FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 22 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 23 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 24 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 25 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 26 FALSE FALSE TRUE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE
## 27 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 28 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 29 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 30 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
## 31 FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 32 FALSE FALSE FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE
## 33 FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE
## 34 FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
## 35 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 36 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE
## 37 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 38 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 39 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 40 FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 41 FALSE FALSE TRUE TRUE FALSE FALSE TRUE TRUE TRUE TRUE FALSE TRUE
## 42 FALSE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE FALSE TRUE FALSE
## 43 FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE
## 44 FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 45 FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 46 FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE TRUE FALSE FALSE
## 47 FALSE FALSE FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE
## 48 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 49 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 50 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 51 FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE
## 52 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 53 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 54 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 55 FALSE FALSE TRUE TRUE FALSE TRUE TRUE FALSE FALSE TRUE FALSE FALSE
## 56 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 57 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 58 FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 59 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 60 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 61 FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 62 FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 63 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 64 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 65 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 66 FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 67 FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE
## 68 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 69 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 70 FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## v12 v13 v14
## 1 FALSE FALSE FALSE
## 2 FALSE FALSE FALSE
## 3 FALSE FALSE FALSE
## 4 FALSE FALSE FALSE
## 5 FALSE FALSE FALSE
## 6 FALSE FALSE FALSE
## 7 FALSE FALSE FALSE
## 8 FALSE FALSE FALSE
## 9 FALSE FALSE FALSE
## 10 FALSE FALSE FALSE
## 11 FALSE FALSE FALSE
## 12 FALSE FALSE FALSE
## 13 TRUE FALSE TRUE
## 14 FALSE FALSE FALSE
## 15 FALSE FALSE FALSE
## 16 FALSE FALSE FALSE
## 17 FALSE FALSE FALSE
## 18 FALSE TRUE FALSE
## 19 FALSE FALSE FALSE
## 20 FALSE FALSE FALSE
## 21 FALSE FALSE FALSE
## 22 FALSE FALSE FALSE
## 23 FALSE FALSE FALSE
## 24 FALSE FALSE FALSE
## 25 FALSE FALSE FALSE
## 26 FALSE FALSE FALSE
## 27 FALSE FALSE FALSE
## 28 FALSE FALSE FALSE
## 29 FALSE FALSE FALSE
## 30 FALSE FALSE FALSE
## 31 FALSE FALSE FALSE
## 32 FALSE FALSE FALSE
## 33 FALSE FALSE FALSE
## 34 FALSE FALSE FALSE
## 35 FALSE FALSE FALSE
## 36 FALSE FALSE FALSE
## 37 FALSE FALSE FALSE
## 38 FALSE FALSE FALSE
## 39 FALSE FALSE FALSE
## 40 FALSE FALSE FALSE
## 41 FALSE FALSE FALSE
## 42 FALSE FALSE FALSE
## 43 FALSE FALSE FALSE
## 44 FALSE FALSE FALSE
## 45 FALSE FALSE FALSE
## 46 FALSE FALSE FALSE
## 47 FALSE FALSE FALSE
## 48 FALSE FALSE FALSE
## 49 FALSE FALSE FALSE
## 50 FALSE FALSE FALSE
## 51 FALSE FALSE FALSE
## 52 FALSE FALSE FALSE
## 53 FALSE FALSE FALSE
## 54 FALSE FALSE FALSE
## 55 TRUE FALSE TRUE
## 56 FALSE FALSE FALSE
## 57 FALSE FALSE FALSE
## 58 FALSE FALSE FALSE
## 59 FALSE FALSE FALSE
## 60 FALSE FALSE FALSE
## 61 FALSE FALSE FALSE
## 62 FALSE FALSE FALSE
## 63 FALSE FALSE FALSE
## 64 FALSE FALSE FALSE
## 65 FALSE FALSE FALSE
## 66 FALSE FALSE FALSE
## 67 FALSE FALSE FALSE
## 68 FALSE FALSE FALSE
## 69 FALSE FALSE FALSE
## 70 FALSE FALSE FALSE
#all those which are not missing
print(!missing_a)
## id v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12
## 1 TRUE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE
## 2 TRUE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE
## 3 TRUE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 4 TRUE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 5 TRUE FALSE FALSE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE
## 6 TRUE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 7 TRUE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 8 TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 9 TRUE FALSE TRUE FALSE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE
## 10 TRUE FALSE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 11 TRUE FALSE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 12 TRUE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 13 TRUE FALSE TRUE FALSE TRUE FALSE TRUE FALSE FALSE TRUE TRUE TRUE FALSE
## 14 TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 15 TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 16 TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 17 TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 18 TRUE FALSE TRUE TRUE FALSE TRUE FALSE FALSE FALSE TRUE TRUE FALSE TRUE
## 19 TRUE FALSE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 20 TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 21 TRUE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 22 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 23 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 24 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 25 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 26 TRUE TRUE FALSE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE
## 27 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 28 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 29 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 30 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE
## 31 TRUE TRUE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 32 TRUE TRUE TRUE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 33 TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE FALSE TRUE TRUE TRUE TRUE
## 34 TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE
## 35 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 36 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE
## 37 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 38 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 39 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 40 TRUE TRUE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 41 TRUE TRUE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE TRUE FALSE TRUE
## 42 TRUE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE TRUE TRUE
## 43 TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE
## 44 TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 45 TRUE TRUE TRUE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 46 TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE FALSE TRUE TRUE TRUE
## 47 TRUE TRUE TRUE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 48 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 49 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 50 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 51 TRUE TRUE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE
## 52 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 53 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 54 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 55 TRUE TRUE FALSE FALSE TRUE FALSE FALSE TRUE TRUE FALSE TRUE TRUE FALSE
## 56 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 57 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 58 TRUE TRUE TRUE FALSE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 59 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 60 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 61 TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 62 TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 63 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 64 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 65 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 66 TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 67 TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 68 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 69 TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## 70 TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
## v13 v14
## 1 TRUE TRUE
## 2 TRUE TRUE
## 3 TRUE TRUE
## 4 TRUE TRUE
## 5 TRUE TRUE
## 6 TRUE TRUE
## 7 TRUE TRUE
## 8 TRUE TRUE
## 9 TRUE TRUE
## 10 TRUE TRUE
## 11 TRUE TRUE
## 12 TRUE TRUE
## 13 TRUE FALSE
## 14 TRUE TRUE
## 15 TRUE TRUE
## 16 TRUE TRUE
## 17 TRUE TRUE
## 18 FALSE TRUE
## 19 TRUE TRUE
## 20 TRUE TRUE
## 21 TRUE TRUE
## 22 TRUE TRUE
## 23 TRUE TRUE
## 24 TRUE TRUE
## 25 TRUE TRUE
## 26 TRUE TRUE
## 27 TRUE TRUE
## 28 TRUE TRUE
## 29 TRUE TRUE
## 30 TRUE TRUE
## 31 TRUE TRUE
## 32 TRUE TRUE
## 33 TRUE TRUE
## 34 TRUE TRUE
## 35 TRUE TRUE
## 36 TRUE TRUE
## 37 TRUE TRUE
## 38 TRUE TRUE
## 39 TRUE TRUE
## 40 TRUE TRUE
## 41 TRUE TRUE
## 42 TRUE TRUE
## 43 TRUE TRUE
## 44 TRUE TRUE
## 45 TRUE TRUE
## 46 TRUE TRUE
## 47 TRUE TRUE
## 48 TRUE TRUE
## 49 TRUE TRUE
## 50 TRUE TRUE
## 51 TRUE TRUE
## 52 TRUE TRUE
## 53 TRUE TRUE
## 54 TRUE TRUE
## 55 TRUE FALSE
## 56 TRUE TRUE
## 57 TRUE TRUE
## 58 TRUE TRUE
## 59 TRUE TRUE
## 60 TRUE TRUE
## 61 TRUE TRUE
## 62 TRUE TRUE
## 63 TRUE TRUE
## 64 TRUE TRUE
## 65 TRUE TRUE
## 66 TRUE TRUE
## 67 TRUE TRUE
## 68 TRUE TRUE
## 69 TRUE TRUE
## 70 TRUE TRUE
summary(missing_a)
## id v1 v2 v3
## Mode :logical Mode :logical Mode :logical Mode :logical
## FALSE:70 FALSE:49 FALSE:57 FALSE:53
## TRUE :21 TRUE :13 TRUE :17
## v4 v5 v6 v7
## Mode :logical Mode :logical Mode :logical Mode :logical
## FALSE:63 FALSE:61 FALSE:64 FALSE:61
## TRUE :7 TRUE :9 TRUE :6 TRUE :9
## v8 v9 v10 v11
## Mode :logical Mode :logical Mode :logical Mode :logical
## FALSE:61 FALSE:63 FALSE:68 FALSE:68
## TRUE :9 TRUE :7 TRUE :2 TRUE :2
## v12 v13 v14
## Mode :logical Mode :logical Mode :logical
## FALSE:68 FALSE:69 FALSE:68
## TRUE :2 TRUE :1 TRUE :2
#all those which are missing
missing1.1[!missing_a,2]
## [1] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [19] NA NA NA 2.8 2.8 2.8 2.9 3.0 3.0 3.0 3.0 3.0 3.1 3.1 3.1 3.2 3.3 3.3
## [37] 3.4 3.4 3.5 3.6 3.6 3.6 3.7 3.7 3.8 3.8 3.9 4.0 4.0 4.1 4.1 4.2 4.2 4.3
## [55] 4.5 4.5 4.6 4.7 4.7 4.8 4.9 5.1 5.1 5.2 5.2 5.3 5.3 5.6 6.1 6.5 NA NA
## [73] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [91] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [109] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [127] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [145] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [163] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [181] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [199] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [217] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [235] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [253] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [271] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [289] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [307] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [325] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [343] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [361] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [379] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [397] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [415] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [433] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [451] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [469] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [487] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [505] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [523] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [541] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [559] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [577] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [595] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [613] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [631] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [649] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [667] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [685] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [703] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [721] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [739] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [757] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [775] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [793] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [811] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [829] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [847] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [865] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [883] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [901] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [919] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## [937] NA NA NA NA NA NA NA
summary(missing1.1[missing_a])
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## NA NA NA NaN NA NA 107
#all those which are missing

missing1.1[missing_a,]
## id v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14
## NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.3 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.4 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.5 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.6 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.7 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.8 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.9 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.10 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.11 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.12 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.13 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.14 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.15 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.16 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.17 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.18 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.19 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.20 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.21 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.22 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.23 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.24 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.25 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.26 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.27 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.28 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.29 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.30 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.31 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.32 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.33 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.34 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.35 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.36 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.37 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.38 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.39 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.40 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.41 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.42 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.43 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.44 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.45 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.46 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.47 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.48 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.49 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.50 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.51 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.52 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.53 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.54 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.55 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.56 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.57 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.58 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.59 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.60 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.61 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.62 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.63 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.64 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.65 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.66 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.67 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.68 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.69 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.70 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.71 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.72 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.73 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.74 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.75 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.76 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.77 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.78 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.79 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.80 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.81 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.82 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.83 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.84 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.85 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.86 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.87 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.88 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.89 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.90 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.91 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.92 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.93 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.94 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.95 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.96 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.97 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.98 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.99 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.100 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.101 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.102 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.103 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.104 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.105 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
## NA.106 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
summary(missing1.1[missing_a])
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## NA NA NA NaN NA NA 107
#all those which are not missing
missing1.1[!missing_a]
## [1] 204.0 207.0 248.0 232.0 224.0 202.0 255.0 240.0 221.0 216.0 228.0 269.0
## [13] 245.0 260.0 253.0 259.0 238.0 214.0 218.0 256.0 250.0 223.0 234.0 252.0
## [25] 236.0 203.0 265.0 211.0 251.0 244.0 213.0 241.0 219.0 227.0 201.0 268.0
## [37] 226.0 254.0 209.0 257.0 261.0 263.0 231.0 246.0 267.0 235.0 222.0 215.0
## [49] 258.0 243.0 210.0 266.0 247.0 239.0 233.0 270.0 206.0 225.0 230.0 212.0
## [61] 237.0 205.0 242.0 264.0 208.0 249.0 229.0 262.0 217.0 220.0 2.8 2.8
## [73] 2.8 2.9 3.0 3.0 3.0 3.0 3.0 3.1 3.1 3.1 3.2 3.3
## [85] 3.3 3.4 3.4 3.5 3.6 3.6 3.6 3.7 3.7 3.8 3.8 3.9
## [97] 4.0 4.0 4.1 4.1 4.2 4.2 4.3 4.5 4.5 4.6 4.7 4.7
## [109] 4.8 4.9 5.1 5.1 5.2 5.2 5.3 5.3 5.6 6.1 6.5 1.5
## [121] 1.5 0.4 1.0 1.5 1.6 1.6 1.8 1.9 2.0 2.0 2.0 2.1
## [133] 2.5 2.7 2.8 3.3 3.7 1.4 2.4 3.8 2.6 2.0 2.8 3.2
## [145] 3.8 1.9 2.2 0.9 2.6 2.0 3.7 2.8 0.7 1.4 0.8 0.8
## [157] 2.2 0.5 0.9 1.1 3.7 2.4 2.5 1.8 1.6 2.1 1.3 1.3
## [169] 1.7 1.4 1.9 1.3 1.3 1.4 2.2 0.5 6.4 8.2 8.6 9.9
## [181] 6.4 7.7 6.4 9.3 6.9 9.6 5.0 5.2 7.5 8.1 6.7 8.9
## [193] 7.7 9.1 6.6 7.8 6.0 5.5 6.7 5.7 8.6 9.7 9.7 6.4
## [205] 9.9 9.9 8.2 9.0 8.7 6.7 9.1 9.3 5.9 9.4 9.2 7.6
## [217] 8.7 7.9 9.9 7.6 7.4 9.2 9.1 9.7 8.5 9.7 8.2 9.2
## [229] 9.0 4.8 4.8 5.3 5.0 5.7 2.5 3.4 2.7 4.8 5.0 4.5
## [241] 4.7 4.5 5.9 5.4 5.5 5.0 4.5 5.2 3.8 4.9 6.9 7.0
## [253] 7.1 6.6 7.1 5.3 4.9 7.8 4.5 6.8 5.1 4.0 3.3 4.7
## [265] 5.7 3.5 5.8 6.2 6.0 2.9 4.6 4.5 5.4 5.5 4.9 6.2
## [277] 5.4 5.9 4.6 5.8 6.7 4.2 6.9 4.8 5.8 4.5 6.1 3.7
## [289] 6.1 3.1 4.8 7.0 1.9 1.9 3.0 3.6 2.7 1.2 1.7 1.3
## [301] 2.0 3.4 1.5 2.1 3.7 1.1 4.0 2.2 2.5 3.0 2.1 2.5
## [313] 3.3 2.8 3.5 2.4 3.0 3.1 3.4 3.6 2.6 3.6 2.1 2.9
## [325] 2.7 3.5 3.1 3.7 4.5 2.1 2.6 2.2 1.6 2.2 2.4 2.5
## [337] 3.2 3.3 3.1 3.1 3.4 3.0 3.0 3.3 4.6 3.3 3.6 3.3
## [349] 3.2 3.5 4.0 3.3 3.2 2.5 2.5 2.5 2.5 3.7 1.7 1.1
## [361] 1.2 2.8 2.1 1.5 3.1 3.2 2.2 2.4 2.6 3.0 2.7 2.4
## [373] 2.3 1.4 2.6 3.2 3.6 3.4 2.7 3.8 3.0 2.6 4.0 3.1
## [385] 2.9 2.9 1.8 1.5 1.7 3.4 1.7 2.5 2.5 2.3 2.6 2.5
## [397] 2.1 2.6 2.7 2.7 3.9 2.5 2.1 2.8 2.6 2.6 1.4 4.0
## [409] 2.6 2.3 2.7 3.9 1.9 3.9 1.6 2.8 3.7 7.2 7.2 7.1
## [421] 9.0 6.7 5.2 6.2 1.7 8.4 5.9 9.9 8.8 4.6 8.9 7.7
## [433] 8.4 7.6 9.1 6.6 9.2 8.2 7.7 8.2 7.9 8.0 6.0 5.9
## [445] 3.8 6.2 6.3 5.2 4.8 8.4 5.4 9.3 6.8 5.3 5.6 8.3
## [457] 5.0 7.3 7.4 8.5 7.3 4.4 8.8 6.8 4.7 6.8 6.8 5.8
## [469] 9.6 3.8 4.5 7.3 6.7 4.8 6.8 5.3 7.1 8.0 36.0 36.0
## [481] 46.0 53.0 35.0 35.0 50.0 32.0 25.0 40.0 39.0 28.0 60.0 29.0
## [493] 65.0 38.0 39.0 49.0 39.0 32.0 53.0 47.0 55.0 41.0 49.0 43.0
## [505] 43.0 54.0 41.0 47.0 49.0 47.0 49.0 44.0 41.0 45.0 42.0 39.0
## [517] 47.0 31.0 46.0 47.0 49.0 59.0 46.0 50.0 56.0 49.0 54.0 55.0
## [529] 39.0 62.0 49.0 60.0 60.0 54.0 58.0 54.0 55.0 60.0 33.0 4.5
## [541] 5.2 5.0 3.3 4.1 5.0 4.3 3.4 5.6 3.3 3.4 3.3 6.1
## [553] 3.9 6.0 3.6 3.7 3.6 4.8 4.4 3.7 5.0 4.2 5.2 4.1
## [565] 4.4 3.3 4.2 5.2 4.8 4.3 4.4 4.5 4.7 3.8 5.4 4.8
## [577] 4.9 5.0 4.9 5.1 5.0 4.0 5.1 5.3 5.2 6.0 5.6 5.1
## [589] 5.9 5.9 6.0 5.5 6.2 4.9 6.1 5.1 5.8 4.3 5.9 3.9
## [601] 5.2 5.4 1.0 1.0 1.0 1.0 0.0 0.0 1.0 1.0 0.0 1.0
## [613] 0.0 1.0 1.0 1.0 0.0 1.0 0.0 1.0 1.0 1.0 1.0 1.0
## [625] 1.0 0.0 0.0 0.0 1.0 0.0 1.0 0.0 0.0 0.0 1.0 0.0
## [637] 0.0 0.0 0.0 1.0 0.0 1.0 1.0 0.0 0.0 0.0 0.0 0.0
## [649] 0.0 0.0 0.0 0.0 0.0 0.0 1.0 0.0 0.0 0.0 0.0 0.0
## [661] 1.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
## [673] 0.0 0.0 1.0 1.0 0.0 0.0 1.0 0.0 1.0 0.0 0.0 0.0
## [685] 1.0 0.0 1.0 0.0 0.0 0.0 0.0 0.0 1.0 1.0 1.0 0.0
## [697] 1.0 0.0 1.0 1.0 1.0 0.0 1.0 1.0 1.0 1.0 0.0 1.0
## [709] 0.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 0.0 1.0
## [721] 1.0 1.0 0.0 1.0 1.0 1.0 1.0 1.0 0.0 1.0 1.0 1.0
## [733] 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 0.0 0.0
## [745] 1.0 1.0 0.0 1.0 0.0 1.0 1.0 0.0 1.0 0.0 1.0 1.0
## [757] 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
## [769] 0.0 1.0 1.0 0.0 0.0 0.0 1.0 0.0 1.0 1.0 0.0 0.0
## [781] 0.0 0.0 0.0 0.0 0.0 0.0 0.0 1.0 0.0 0.0 0.0 0.0
## [793] 0.0 0.0 0.0 0.0 1.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
## [805] 0.0 0.0 0.0 0.0 0.0 1.0 1.0 0.0 0.0 1.0 0.0 1.0
## [817] 0.0 1.0 1.0 1.0 0.0 1.0 0.0 0.0 1.0 1.0 0.0 1.0
## [829] 0.0 1.0 0.0 0.0 1.0 0.0 1.0 1.0 1.0 0.0 1.0 0.0
## [841] 1.0 0.0 0.0 1.0 1.0 1.0 0.0 0.0 0.0 0.0 0.0 1.0
## [853] 1.0 1.0 1.0 0.0 1.0 0.0 1.0 0.0 0.0 1.0 0.0 0.0
## [865] 0.0 0.0 0.0 0.0 1.0 1.0 0.0 1.0 1.0 1.0 0.0 1.0
## [877] 1.0 2.0 2.0 1.0 1.0 1.0 2.0 1.0 1.0 2.0 1.0 1.0
## [889] 3.0 1.0 3.0 1.0 1.0 1.0 2.0 1.0 1.0 3.0 2.0 3.0
## [901] 1.0 2.0 1.0 2.0 2.0 3.0 1.0 2.0 2.0 3.0 3.0 1.0
## [913] 3.0 2.0 2.0 3.0 2.0 2.0 2.0 1.0 2.0 1.0 3.0 3.0
## [925] 2.0 2.0 3.0 3.0 3.0 3.0 3.0 3.0 2.0 2.0 2.0 3.0
## [937] 3.0 3.0 3.0 3.0 3.0 3.0 1.0
summary(missing1.1[!missing_a])
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 1.00 3.00 22.99 6.10 270.00

Monday, March 4, 2019

Basics of R- Session :- Image classification using JPG images and svm, and knn

# classification of Image into two group
# Library raster, rasterimage

rm(list=ls())

library(imager)

## Loading required package: magrittr

## 
## Attaching package: 'imager'

## The following object is masked from 'package:magrittr':
## 
##     add

## The following objects are masked from 'package:stats':
## 
##     convolve, spectrum

## The following object is masked from 'package:graphics':
## 
##     frame

## The following object is masked from 'package:base':
## 
##     save.image

# import images from Directory or load images of IMCU faculty members
IMCU.Images<- load.dir(path="C:/Users/LENOVO/Desktop/Image classification/institute of Management", pattern=".jpg")
#str(IMCU.Images)
# plot(IMCU.Images[1])

# Use for loop

#--------------------------------------------#
# convert image into gray scale
for (i in 1:length(IMCU.Images))
{
  IMCU.Images[[i]]<- grayscale(IMCU.Images[[i]])  
}

#str(IMCU.Images)
class(IMCU.Images)

## [1] "imlist" "list"

# plot(IMCU.Images[[1]])

#--------------------------------------------#
# conver image to same size- rescale
for (i in 1:length(IMCU.Images))
{
  IMCU.Images[[i]]<-resize(IMCU.Images[[i]], size_x = 100, size_y = 100, size_z = 1, size_c = 1)
}

IMCU.Images

## Image list of size 66

#str(IMCU.Images)
class(IMCU.Images)

## [1] "imlist" "list"

#plot(IMCU.Images[[1]])

#-------------------------------------------------#

# save the each image pixel data as numeric

for (i in 1:length(IMCU.Images))
{
  IMCU.Images[[i]]<-as.numeric(IMCU.Images[[i]]) # convert to number
}

#str(IMCU.Images)
class(IMCU.Images)

## [1] "imlist" "list"

#-------------------------------------------------#
# convert data into data frame

IMCU.Images.data<-as.data.frame(IMCU.Images)
str(IMCU.Images.data)

## 'data.frame':    660000 obs. of  2 variables:
##  $ im: chr  "E1125.jpg" "E1125.jpg" "E1125.jpg" "E1125.jpg" ...
##  $ v : num  1 1 1 1 1 1 1 1 1 1 ...

#---------------------------------------------#
# adding unique ids to the data, 
# since we know each image has 100*100 points

IMCU.Images.data$id<-seq(1:10000)
str(IMCU.Images.data)

## 'data.frame':    660000 obs. of  3 variables:
##  $ im: chr  "E1125.jpg" "E1125.jpg" "E1125.jpg" "E1125.jpg" ...
##  $ v : num  1 1 1 1 1 1 1 1 1 1 ...
##  $ id: int  1 2 3 4 5 6 7 8 9 10 ...

#---------------------------------#
# add grouping variable to the data set
IMCU.Images.data$group1<-"imcu"
str(IMCU.Images.data)

## 'data.frame':    660000 obs. of  4 variables:
##  $ im    : chr  "E1125.jpg" "E1125.jpg" "E1125.jpg" "E1125.jpg" ...
##  $ v     : num  1 1 1 1 1 1 1 1 1 1 ...
##  $ id    : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ group1: chr  "imcu" "imcu" "imcu" "imcu" ...

IMCU.Images.data$group1<-as.factor(IMCU.Images.data$group1)

# rearrange the data
IMCU.Images.data<-IMCU.Images.data[,c("id","group1","im","v")]
str(IMCU.Images.data)

## 'data.frame':    660000 obs. of  4 variables:
##  $ id    : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ group1: Factor w/ 1 level "imcu": 1 1 1 1 1 1 1 1 1 1 ...
##  $ im    : chr  "E1125.jpg" "E1125.jpg" "E1125.jpg" "E1125.jpg" ...
##  $ v     : num  1 1 1 1 1 1 1 1 1 1 ...

#IMCU.Images.data

#----------------------------#
# since the data created is a single col with all pixel positions
# converting 10000 pixels address as variables

library(tidyr)

## 
## Attaching package: 'tidyr'

## The following object is masked from 'package:imager':
## 
##     fill

## The following object is masked from 'package:magrittr':
## 
##     extract

IMCU.Images.data.1<-spread(IMCU.Images.data, id, v)
#str(IMCU.Images.data.1)

now create a data set for the other department Management Science

# import images from Directory or load images of IMCU faculty members
MS.Images<- load.dir(path="C:/Users/LENOVO/Desktop/Image classification/management studies", pattern=".jpg")
#str(MS.Images)
#plot(MS.Images[1])

# Use for loop

#--------------------------------------------#
# convert image into gray scale
for (i in 1:length(MS.Images))
{
  MS.Images[[i]]<- grayscale(MS.Images[[i]])  
}

#str(MS.Images)
class(MS.Images)

## [1] "imlist" "list"

#--------------------------------------------#
# conver image to same size- rescale
for (i in 1:length(MS.Images))
{
  MS.Images[[i]]<-resize(MS.Images[[i]], size_x = 100, size_y = 100, size_z = 1, size_c = 1)
}

MS.Images

## Image list of size 40

#str(MS.Images)
class(MS.Images)

## [1] "imlist" "list"

# plot(MS.Images[[1]])

#-------------------------------------------------#

# save the each image pixel data as numeric

for (i in 1:length(MS.Images))
{
  MS.Images[[i]]<-as.numeric(MS.Images[[i]]) # convert to number
}

#str(MS.Images)
class(MS.Images)

## [1] "imlist" "list"

#-------------------------------------------------#
# convert data into data frame

MS.Images.data<-as.data.frame(MS.Images)

#---------------------------------------------#
# adding unique ids to the data, 
# since we know each image has 100*100 points

MS.Images.data$id<-seq(1:10000)
str(MS.Images.data)

## 'data.frame':    400000 obs. of  3 variables:
##  $ im: chr  "E1247.jpg" "E1247.jpg" "E1247.jpg" "E1247.jpg" ...
##  $ v : num  0.922 0.941 0.945 0.937 0.941 ...
##  $ id: int  1 2 3 4 5 6 7 8 9 10 ...

#---------------------------------#
# add grouping variable to the data set
MS.Images.data$group1<-"MS"
str(MS.Images.data)

## 'data.frame':    400000 obs. of  4 variables:
##  $ im    : chr  "E1247.jpg" "E1247.jpg" "E1247.jpg" "E1247.jpg" ...
##  $ v     : num  0.922 0.941 0.945 0.937 0.941 ...
##  $ id    : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ group1: chr  "MS" "MS" "MS" "MS" ...

MS.Images.data$group1<-as.factor(MS.Images.data$group1)

# rearrange the data
MS.Images.data<-MS.Images.data[,c("id","group1","im","v")]
str(MS.Images.data)

## 'data.frame':    400000 obs. of  4 variables:
##  $ id    : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ group1: Factor w/ 1 level "MS": 1 1 1 1 1 1 1 1 1 1 ...
##  $ im    : chr  "E1247.jpg" "E1247.jpg" "E1247.jpg" "E1247.jpg" ...
##  $ v     : num  0.922 0.941 0.945 0.937 0.941 ...

# MS.Images.data

#----------------------------#
# since the data created is a single col with all pixel positions
# converting 10000 pixels address as variables

library(tidyr)
MS.Images.data.1<-spread(MS.Images.data, id, v)
#str(MS.Images.data.1)

combine the two data set created

CU.images.data<-rbind(IMCU.Images.data.1, MS.Images.data.1)
# str(CU.images.data)

apply model for classification

apply the knn on the whole data

# remove the variable im
CU.images.data<-CU.images.data[,-2]
# use caret package for KNN
library(caret)

## Loading required package: lattice

## Loading required package: ggplot2

fitControl = trainControl(method="cv")

knnMod2 = train(group1 ~ ., data=CU.images.data,
                method="knn",
                trControl=fitControl,
                preProcess=c("center","scale"),
                tuneLength=5)

summary(knnMod2)

##             Length Class      Mode     
## learn           2  -none-     list     
## k               1  -none-     numeric  
## theDots         0  -none-     list     
## xNames      10000  -none-     character
## problemType     1  -none-     character
## tuneValue       1  data.frame list     
## obsLevels       2  -none-     character
## param           0  -none-     list

print(knnMod2)

## k-Nearest Neighbors 
## 
##   106 samples
## 10000 predictors
##     2 classes: 'imcu', 'MS' 
## 
## Pre-processing: centered (10000), scaled (10000) 
## Resampling: Cross-Validated (10 fold) 
## Summary of sample sizes: 96, 95, 96, 95, 95, 96, ... 
## Resampling results across tuning parameters:
## 
##   k   Accuracy   Kappa    
##    5  0.6754545  0.3341953
##    7  0.6690909  0.3081981
##    9  0.6300000  0.2157474
##   11  0.6209091  0.1961218
##   13  0.6127273  0.1482331
## 
## Accuracy was used to select the optimal model using the largest value.
## The final value used for the model was k = 5.

plot(knnMod2)

pred = predict(knnMod2, newdata=CU.images.data)
confusionMatrix(pred, CU.images.data[,1])

## Confusion Matrix and Statistics
## 
##           Reference
## Prediction imcu MS
##       imcu   56 10
##       MS     10 30
##                                           
##                Accuracy : 0.8113          
##                  95% CI : (0.7238, 0.8808)
##     No Information Rate : 0.6226          
##     P-Value [Acc > NIR] : 2.122e-05       
##                                           
##                   Kappa : 0.5985          
##  Mcnemar's Test P-Value : 1               
##                                           
##             Sensitivity : 0.8485          
##             Specificity : 0.7500          
##          Pos Pred Value : 0.8485          
##          Neg Pred Value : 0.7500          
##              Prevalence : 0.6226          
##          Detection Rate : 0.5283          
##    Detection Prevalence : 0.6226          
##       Balanced Accuracy : 0.7992          
##                                           
##        'Positive' Class : imcu            
##

—————————————————-

SUpport vector Machine

library(e1071)

dtm1<-svm(group1~., data = CU.images.data,kernel = "linear",scale = TRUE)
summary(dtm1)

## 
## Call:
## svm(formula = group1 ~ ., data = CU.images.data, kernel = "linear", 
##     scale = TRUE)
## 
## 
## Parameters:
##    SVM-Type:  C-classification 
##  SVM-Kernel:  linear 
##        cost:  1 
##       gamma:  1e-04 
## 
## Number of Support Vectors:  85
## 
##  ( 50 35 )
## 
## 
## Number of Classes:  2 
## 
## Levels: 
##  imcu MS

#dtm1$SV
#dtm1$kernel
#dtm1$tot.nSV
#dtm1$decision.values
#dtm1$fitted
#dtm1$coefs

# to check is it a good classifier we will use confusion matrix
predict1<-predict(dtm1,CU.images.data)
confusionMatrix(predict1,CU.images.data$group1)

## Confusion Matrix and Statistics
## 
##           Reference
## Prediction imcu MS
##       imcu   66  0
##       MS      0 40
##                                      
##                Accuracy : 1          
##                  95% CI : (0.9658, 1)
##     No Information Rate : 0.6226     
##     P-Value [Acc > NIR] : < 2.2e-16  
##                                      
##                   Kappa : 1          
##  Mcnemar's Test P-Value : NA         
##                                      
##             Sensitivity : 1.0000     
##             Specificity : 1.0000     
##          Pos Pred Value : 1.0000     
##          Neg Pred Value : 1.0000     
##              Prevalence : 0.6226     
##          Detection Rate : 0.6226     
##    Detection Prevalence : 0.6226     
##       Balanced Accuracy : 1.0000     
##                                      
##        'Positive' Class : imcu       
##

————————————————————-

Predicting for image out of data set

test data set

import images from Directory or load images of IMCU faculty members

test.Images<- load.dir(path="C:/Users/LENOVO/Desktop/Image classification/test", pattern=".jpg")

# convert image into gray scale
for (i in 1:length(test.Images))
{
  test.Images[[i]]<- grayscale(test.Images[[i]])  
}

# conver image to same size- rescale

for (i in 1:length(test.Images))
{
  test.Images[[i]]<-resize(test.Images[[i]], size_x = 100, size_y = 100, size_z = 1, size_c = 1)
}
# save the each image pixel data as numeric

for (i in 1:length(test.Images))
{
  test.Images[[i]]<-as.numeric(test.Images[[i]]) # convert to number
}

#-------------------------------------------------#
# convert data into data frame

test.Images.data<-as.data.frame(test.Images)

#---------------------------------------------#
# adding unique ids to the data, 
# since we know each image has 100*100 points

test.Images.data$id<-seq(1:10000)

#---------------------------------#
# add grouping variable to the data set
test.Images.data$group1<-"test"
test.Images.data$group1<-as.factor(test.Images.data$group1)

# rearrange the data
test.Images.data<-test.Images.data[,c("id","group1","im","v")]

#----------------------------#
# converting 10000 pixels address as variables

library(tidyr)

test.Images.data.1<-spread(test.Images.data, id, v)
#str(test.Images.data.1)
test.Images.data.1<-test.Images.data.1[,-2]

# to check is it a good classifier we will use confusion matrix
predict1<-predict(dtm1,test.Images.data.1)
predict1

##    1    2    3    4 
## imcu imcu imcu imcu 
## Levels: imcu MS

———————————————-

Random Forest tree

takes lot of time - Not useful

Learn R

Saturday, August 8, 2020

Basics of R- Decison Tree using rpart

Friday, July 3, 2020

Basics of R Session 22- Logistic Regression 1.1 (Caret Package)

Saturday, June 20, 2020

Basics of R Session 5.5- Outliers

Tuesday, June 16, 2020

Basics of R Session 5.4 - Missing values

Sunday, February 23, 2020

Session 5.3 Missing Values

Monday, March 4, 2019

Basics of R- Session :- Image classification using JPG images and svm, and knn

Image Classification

apply model for classification

apply the knn on the whole data

—————————————————-

SUpport vector Machine

————————————————————-

Predicting for image out of data set

test data set

import images from Directory or load images of IMCU faculty members

———————————————-

Random Forest tree

takes lot of time - Not useful

Report Abuse