Esta base de datos contiene información sobre 578 personas que realizaron alguna (una) de cuatro tipos de dietas.Se dispone de información sobre la duración de la dieta (corta, media o larga), la edad en años de las personas sometidas a las dietas , el peso que han perdido, el tiempo en semanas que se ha mantenido la dieta (variable Time) y, por supuesto el tipo de dieta (1,2,3,4)
load(“http://www.uv.es/mlejarza/azar/dietas.RData”)
## Time Dieta peso duracion edad
## Min. : 0.00 1:220 bajo :326 corta:198 Min. :18.00
## 1st Qu.: 4.00 2:120 medio-bajo:174 media:195 1st Qu.:31.00
## Median :10.00 3:120 medio-alto: 60 larga:185 Median :43.00
## Mean :10.72 4:118 alto : 18 Mean :43.26
## 3rd Qu.:16.00 3rd Qu.:55.00
## Max. :21.00 Max. :67.00
_______________________________________________________________________________________
El trabajo a realizar va a consistir en
Para que cada alumno trabaje con datos diferentes la semilla aleatoria que se utilizará será distinta. A cada alumno se le facilitará un número que utilizará como semilla aleatoria:
la función en R es set.seed ( por ejemplo set.seed(62) ) Para llevar a cabo la selección :
función sample ( para seleccionar los registros)
set.seed(62)# aquí cada alumno pondrá su número correspondiente
crear un nuevo data.frame
las instrucciones son:
muestra<- sample(1:nrow(dietas),size=100,replace=FALSE)
dietasmuestra<- dietas[muestra, ]
2.- Obtener un espacio de probabilidad probabilizado ( función probspace )
3.- Generar los sucesos : al extraer una persona al azar obtener una que :
4.- Determinar las probabilidades ( no condicionadas) de todos estos sucesos
5.- Determinar la probabilidad de que una persona elegida la azar sea una persona:
tras determinar las probabilidades a partir de las correspondientes funciones de R comprobar que se cumplen
las
oportunas relaciones con las probabilidades de los sucesos elementales .
6. Determinar las probabilidades condicionadas:
sigue una dieta de duración corta, sabiendo que sigue la dieta 2
sigue una diets de duracion media, sabiendo que sigue la dieta 2
sigue una dieta de duración larga, sabiendo que sigue la dieta 2
es una persona no-joven , sabiendo que ha perdido un peso bajo
es una persona no-joven, sabiendo que ha perdido un peso medio-bajo
es una persona no-joven,sabiendo que ha perdido un peso elevado(alto)
7.- Teniendo en cuenta las probabilidades calculadas argumentar en qué casos hay independencia, en qué casos no la hay y en qué casos aunque no hay independencia la posible influencia de un suceso en otro parece pequeña
8.- A partir de las probabilidades :( que deben calcularse previamente o haberse calculado ya)
P( dieta corta duración)
P( dieta media duracion)
P( dieta larga duración) y
P(perder peso bajo/ dieta de corta duración)
P(perder peso bajo/ dieta de media duración)
P(perder peso bajo/ dieta de larga duracion)
Aplicar el esquema de la regla de bayes para determinar:
P( dieta corta duración/perder peso bajo)
P( dieta media duracion/perder peso bajo)
P( dieta larga duración/perder peso bajo)
9.- Comprobar el resultado correcto de las probabilidades anteriores ( preg. 8) calculándolas directamente.
10.- Comprobar con la información de la pregunta 8 el teorema de la probabilidad total
*****************************
ADEMÁS :A realizar con o sin R :
Se conoce que el 15% de las empresas de cierto sector de actividad tienen pérdidas o escasos beneficios, un 60 % tienen beneficios medios y un 25% tienen grandes beneficios. Se sabe también que 80% de las empresas con pérdidas o escasos beneficios desarrollan todavía cierta estrategia obsoleta de marketing. En cambio, este porcentaje baja hasta el 50 % en el caso de las que tienen beneficios medios y es apenas del 20 % entre las que tienen altos beneficios..