Cuidado alomaterno

Factor de confusion

Este tipo de causalidad implica, por un lado, que la presencia de cuidado alomaterno influye en la lactancia, es decir, es posible que las madres acorten el periodo de lactancia (y aumenten la probabilidad de una mayor cantidad de embarazos) sin que esto represente un problema para la supervivencia de la descendencia cuando dichas madres cuentan con la ayuda en el cuidado de las crias de mujeres que han terminado su ciclo reproductivo. Por otro lado, dicho tipo de causalidad implica que la cantidad de interacciones sociales a las que se enfrente la cria influye en el comportamiento prosocial.

En esta simulacion se simulan 500 infantes, y se asume que la presencia (1) o ausencia (0) del cuidado alomaterno en el i-esimo individuo en la poblacion tiene una probabilidad de \(p_i= 0.5\):

\[eco_i \sim \mathcal{Binom}(1, p_i) \]

Asi mismo, la edad al termino de la lactancia para el i-esimo individuo depende de la variable anterior, es decir de si existe o no cuidado alomaterno. En el primer caso la duracion de la lactancia es mas corta:

\[lact_i \sim \mathcal{Norm}(\mu_i, \sigma_i)\\ \mu_i = eco_i \]

De la misma forma, la cantidad de comportamiento prosocial del i-esimo individuo tambien depende del cuidado alomaterno, en el sentido de que cuando este existe, se observa mayor comportamiento prosocial:

\[comp_i \sim \mathcal{Norm}(\mu_i, \sigma_i)\\ \mu_i = eco_i \]

Simulacion

set.seed(10)
N <- 500 
Eco <- rbinom(N, 1, 0.5) 
Lact <- -rnorm(N, mean = Eco) 
Comp <- rnorm(N, mean = Eco)

# Base de datos con todas las variables creadas
dt <- data.frame(Comp, Lact, Eco)

pairs(dt) # grafico de las asociaciones entre las variables creadas

Inferencia causal

El siguiente modelo puede responder la pregunta cual es el efecto de la lactancia en el comportamiento

coef(lm(Comp ~ Lact, data = dt)) 
## (Intercept)        Lact 
##   0.4381692  -0.1602413

Sin embargo, dicho acercamiento da como resultado una asociacion espuria, es decir, se observa una asociacion estadistica (-0.16) a pesar de que los datos fueron creados de manera explicita sin tal asociacion. El acercamiento correcto implica la utilizacion del criterio de la puerta trasera (capitulo &). En este caso especifico, dicho criterio sugiere que para responder la pregunta de interes se deben incluir los factores de confusion (i.e. Eco) en el modelo.

coef(lm(Comp ~ Eco + Lact, data = dt))
## (Intercept)         Eco        Lact 
## 0.052507317 0.945848601 0.001783561

Lo cual nos da el efecto correcto (i.e. cero) de la lactancia sobre el comportamiento ### Mediador

La causalidad de tipo mediación implica que el efecto de la lactancia sobre el comportamiento se da a traves del contexto social del infante. Para esto se simulan 500 infantes, y se asume que en una poblacion hipotetica, la media (aNOS) de edad al termino de la lactancia de \(\mu_i = 4\) con una desviacion estandar de \(\sigma_i = 1\):

\[lact_i \sim \mathcal{Norm}(\mu_i, \sigma_i)\]

A continuacion, la probabilidad de que existan cuidados aloparentales en la poblacion es mayor \(p_i = 0.8\) cuando la edad al termino de la lactancia de un infante es menor a la edad promedio. De lo contrario, la probabilidad de cuidados aloparentales del i-esimo individuo es menor \(p_i = 0.2\)

\[eco_i \sim \mathcal{Binom}(1, p_i) \]

Finalmente, el comportamiento prosocial del i-esimo individuo depende de la cantidad de cuidado aloparental y de variacion ambiental aleatoria \(e_i\):

\[comp_i \sim \mathcal{Norm}(\mu_i, \sigma_i)\\ \mu_i = eco_i + e_i\]

# Se simulan 500 infantes
set.seed(10)
N <- 500
Lact <- rnorm(N, mean = 4, 1)
Eco <- rbinom(N, 1, ifelse(Lact < mean(Lact), 0.8, 0.2))
e <- rnorm(N)
Comp <- Eco + e

# Base de datos con todas las variables creadas
dmt <- data.frame(Comp, Lact, Eco)

pairs(dmt) # grafico de las asociaciones entre las variables creadas

Inferencia causal

A diferencia del caso anterior, el siguiente modelo es el acercamiento necesario para responder la pregunta de interes cuando existen mediadores. Dicho modelo recupera correctamente la asociacion negativa simulada entre las variables, esto es, cuando el termino de la lactancia se da a una edad temprana se observa un mayor comportamiento prosocial debido a la influencia del cuidado aloparental en la descendencia.

coef(lm(Comp ~ Lact, data = dmt)) 
## (Intercept)        Lact 
##   1.2928691  -0.1920247

Por el contrario, incluir el mediador (i.e. Eco) dentro del modelo llevaria a que la asociacion entre la Lact y el Comp sea nula.

coef(lm(Comp ~ Eco + Lact, data = dmt)) 
## (Intercept)         Eco        Lact 
## -0.30112861  1.04728417  0.07576856

FITNESS

Factor de confusion

Las variables Eco, Lact, Comp se simulan como anteriormente y unicamente se incluye el Fitness, dicha pobabilidad de supervivencia se simula de la siguiente manera :

\[fitness_i \sim \mathcal{Binom}(1, p_i)\\ p_i \sim \mathcal{Logistic}(comp)\]

library(rethinking)
set.seed(10)
N <- 500 
Eco <- rbinom(N, 1, 0.5) 
Lact <- -rnorm(N, Eco) 
Comp <- rnorm(N, Eco)
fitness <- rbinom(N, prob = logistic(Comp), size = 1)

# Base de datos con todas las variables creadas
dt <- data.frame(Comp, Lact, Eco, fitness)

pairs(dt) # grafico de las asociaciones entre las variables creadas

Inferencia causal

Los siguientes modelos de regresion responden a la pregunta de cual es el efecto del comportamiento,

coef(lm(fitness ~ Comp, data = dt))
## (Intercept)        Comp 
##   0.4774826   0.1821641

el contexto social,

coef(lm(fitness ~ Eco, data = dt))
## (Intercept)         Eco 
##    0.486166    0.173753

y la edad al termino de la lactancia, sobre el fitness de los infantes.

coef(lm(fitness ~ Lact, data = dt))
## (Intercept)        Lact 
##  0.56137382 -0.02110261

El efecto encontrado en cada caso es el esperado dado el diagrama de causalidad utilizado para simular los datos. De acuerdo con lo expuesto hasta ahora, cual seria el modelo que responde a la pregunta de interes, cual es el efecto del contexto social en el fitness de las crías

Mediador

Este ejemplo difiere del ejemplo anterior unicamente en la relacion de mediacion que existe entre las variables Eco, Lact, Comp.

set.seed(10)
N <- 1500
Lact <- rnorm(N, 4, 1)
Eco <- rbinom(N, 2, ifelse(Lact < mean(Lact), 0.8, 0.2))
Comp <- Eco + rnorm(N)
fitness <- rbinom(N, prob = logistic(Comp), size = 1)

# Base de datos con todas las variables creadas
dmt <- data.frame(Comp, Lact, Eco, fitness)

pairs(dmt) # grafico de las asociaciones entre las variables creadas

Inferencia causal

Los siguientes modelos de regresion responden a la pregunta de cual es el efecto del comportamiento,

coef(lm(fitness ~ Comp, data = dmt))
## (Intercept)        Comp 
##   0.5133292   0.1644991

el contexto social,

coef(lm(fitness ~ Eco, data = dmt))
## (Intercept)         Eco 
##   0.5115235   0.1642283

y la edad al termino de la lactancia, sobre el fitness de los infantes.

coef(lm(fitness ~ Lact, data = dmt))
## (Intercept)        Lact 
##  1.01798485 -0.08570396

El efecto encontrado en cada caso es el esperado dado el diagrama de causalidad utilizado para simular los datos. De acuerdo con lo expuesto hasta ahora, cual seria el modelo que responde a la pregunta de interes, cual es el efecto del contexto social en el fitness de las crías. Existe diferencia entre la interpretacion que darian estos resultados con la interpretacion que se recupero en el ejemplo anterior.