Esta base de datos contiene información sobre 578 personas que realizaron alguna (una) de cuatro tipos de dietas.Se dispone de información sobre la duración de la dieta (corta, media o larga), la edad en años de las personas sometidas a las dietas , el peso que han perdido, el tiempo en semanas que se ha mantenido la dieta (variable Time) y, por supuesto el tipo de dieta (1,2,3,4)

load(“http://www.uv.es/mlejarza/azar/dietas.RData”) 
require(prob) 
summary(dietas)
##       Time       Dieta           peso      duracion        edad      
## Min. : 0.00 1:220 bajo :326 corta:198 Min. :18.00
## 1st Qu.: 4.00 2:120 medio-bajo:174 media:195 1st Qu.:31.00
## Median :10.00 3:120 medio-alto: 60 larga:185 Median :43.00
## Mean :10.72 4:118 alto : 18 Mean :43.26
## 3rd Qu.:16.00 3rd Qu.:55.00
## Max. :21.00 Max. :67.00

_______________________________________________________________________________________

Puede observarse cómo la edad ha afectado poco a la duración de la dieta. Tampoco parece existir una gran relación entre el tipo de dieta y el tiempo (duración) que se ha mantenido. Sin embargo el peso que se ha conseguido perder y el tiempo durante el que se ha seguido la dieta sí parecen estar relacionados
 ====================================================================================================

El trabajo a realizar va a consistir en

  1.  Seleccionar aleatoriamente 100 individuos de la base de datos suministrada

Para que cada alumno trabaje con datos diferentes la semilla aleatoria que se utilizará será distinta. A cada alumno se le facilitará un número que utilizará como semilla aleatoria:

la función en R es set.seed ( por ejemplo set.seed(62) ) Para llevar a cabo la selección :

   función sample ( para seleccionar los registros)
crear un nuevo data.frame
las instrucciones son:
set.seed(62)# aquí cada alumno pondrá su número correspondiente
muestra<- sample(1:nrow(dietas),size=100,replace=FALSE)
dietasmuestra<- dietas[muestra, ]

2.- Obtener un espacio de probabilidad probabilizado ( función  probspace ) 

3.- Generar los sucesos : al extraer una persona al azar obtener una que : 

4.- Determinar las probabilidades ( no condicionadas) de todos estos sucesos 

5.- Determinar la probabilidad de que una persona elegida la azar sea una persona:

tras determinar las probabilidades a partir de las correspondientes funciones de R comprobar que se cumplen 
las
oportunas relaciones con las probabilidades de los sucesos elementales .

6. Determinar las probabilidades condicionadas:

                        sigue una dieta de duración corta, sabiendo que sigue la dieta 2
  sigue una diets de duracion media, sabiendo que sigue la dieta 2
sigue una dieta de duración larga, sabiendo que sigue la dieta 2
es una persona no-joven , sabiendo que ha perdido un peso bajo
es una persona no-joven, sabiendo que ha perdido un peso medio-bajo
es una persona no-joven,sabiendo que ha perdido un peso elevado(alto)

7.- Teniendo en cuenta las probabilidades calculadas argumentar en qué casos hay independencia, en qué casos no la hay y en qué casos aunque no hay independencia la posible influencia de un suceso en otro parece pequeña

8.- A partir de las probabilidades :( que deben calcularse previamente o haberse calculado ya) 

P( dieta corta duración)

P( dieta media duracion) 

P( dieta larga duración) y

P(perder peso bajo/ dieta de corta duración) 

P(perder peso bajo/ dieta de media duración)

P(perder peso bajo/ dieta de larga duracion)

    Aplicar el esquema de la regla de bayes  para determinar:
P( dieta corta duración/perder peso bajo)
P( dieta media duracion/perder peso bajo)
P( dieta larga duración/perder peso bajo)

9.- Comprobar el resultado  correcto de las probabilidades anteriores ( preg. 8) calculándolas directamente.

10.- Comprobar con la información de la pregunta 8 el teorema de la probabilidad total 

*****************************

ADEMÁS :A realizar con o sin R :

Se conoce que el 15% de las empresas de cierto sector de actividad tienen pérdidas o escasos beneficios, un 60 % tienen beneficios medios y un  25% tienen grandes beneficios. Se sabe también que 80% de las empresas con pérdidas o escasos beneficios desarrollan todavía cierta estrategia obsoleta de marketing. En cambio, este porcentaje baja hasta el 50 % en el caso de las que tienen beneficios medios y es apenas del 20 % entre las que tienen altos beneficios..
Si de una cierta empresa que acabamos de conocer sabemos que sigue desarrollando la estrategia de marketing obsoleta ¿cuál es la probabilidad de que se trate de una empresa con pérdidas o bajos beneficios? ¿Y  de que tenega beneficios medios? ¿y altos?