### script Eg
### Formation RMT Modélia 30/11 au 4/12/2015
### TP1 Mise en jambe sous R

## localisation des données
setwd("D:\\Mes documents\\5-STATISTIQUES - R\\FORMATIONS RMT Modélia\\PARIS 2015")

## import des données
TAB <- read.table("BDD_septoriose.txt",header=TRUE)

dim(TAB)
str(TAB)
edit(TAB)

TAB$annee <- as.factor(TAB$annee)
TAB$dateobs <- as.Date(TAB$dateobs, format = "%d/%m/%y")
TAB$semaine <- as.factor(format(TAB$dateobs, format = "%W"))

## visualisation graphique
boxplot(TAB$obs_val_num, ylab = "Fréquence attaque sur la F3")
boxplot(TAB$obs_val_num~TAB$annee, ylab = "Fréquence attaque sur la F3")
boxplot(TAB$obs_val_num~TAB$region, ylab = "Fréquence attaque sur la F3")

data_summary <- function(x) {
   m <- mean(x)
   ymin <- m-sd(x)
   ymax <- m+sd(x)
   return(c(y=m,ymin=ymin,ymax=ymax))
}

library(ggplot2)

ggplot(TAB) +
      aes(x=semaine, y=obs_val_num, fill = annee ) +
      geom_boxplot()+
      stat_summary(fun.data=data_summary, color="red")+
      facet_grid(annee~.) +
      labs( title = "Fréquence attaque septoriose sur F3 définitive - Vigicultures")+
      xlab ("Semaine d'observation") +
      ylab ("Fréquence d'attaque")

ggplot(TAB[TAB$region == "A",]) +
      aes(x=semaine, y=obs_val_num, fill = annee ) +
      geom_boxplot()+
      stat_summary(fun.data=data_summary, color="red")+
      facet_grid(annee~.) +
      labs( title = "Fréquence attaque septoriose sur F3 définitive - Vigicultures")+
      xlab ("Semaine d'observation") +
      ylab ("Fréquence d'attaque")

ggplot(TAB) +
      aes(x=annee, y=obs_val_num, fill = annee ) +
      geom_boxplot()+
      facet_grid(risque~region) +
      labs( title = "Fréquence attaque septoriose sur F3 définitive - Vigicultures")+
      xlab ("Risque") +
      ylab ("Fréquence d'attaque")

ggplot(TAB) +
      aes(x=annee, y=obs_val_num, col = annee ) +
      stat_summary(fun.data=data_summary)+
      facet_grid(risque~region) +
      labs( title = "Fréquence attaque septoriose sur F3 définitive - Vigicultures")+
      xlab ("Risque") +
      ylab ("Fréquence d'attaque")

## statistiques élémentaires
summary(TAB)

##distribution des données
table(TAB$annee, TAB$region)
prop.table(table(TAB$annee, TAB$region), 1) # proportion en ligne
prop.table(table(TAB$annee, TAB$region), 2) # proportion en colonne
plot(prop.table(table(TAB$annee, TAB$region), 2))

table(TAB$annee, TAB$risque)

##moyenne par risque par annee/region/risque
aggregate(obs_val_num~annee+region+risque, FUN = mean, data = TAB)

##autres stats
aggregate(obs_val_num~annee+region, FUN = mean, data = TAB)
aggregate(obs_val_num~annee+region, FUN = median, data = TAB)

data_summary2 <- function(x) {
   ymoy <- mean(x)
   ysd <- sd(x)
   ymed <- median(x)
   ymin <- min(x)
   ymax <- max(x)
   return(c(ymoy=ymoy,ysd=ysd, ymed=ymed, ymin=ymin,ymax=ymax))
}

aggregate(obs_val_num~annee+region, FUN = data_summary2, data = TAB)