enunciado de creu
Se pretende estimar el número medio de billetes vendidos por app de una cierta línea de OUIGO así como su desviación típica. Para ello se admite un modelo Poisson y se dispone de una muestra aleatoria simple correspondiente a cinco ventas diarias de billetes por app, (10, 12, 14, 16, 18). Determínese razonadamente una estimación para cada una de las características poblacionales indicadas, argumentando los motivos que avalan la propuesta.
\(X\), número de billetes diarios vendidos.
\(X \sim Po(\lambda)\).
\((10, 12, 14, 16, 18)\) m.a.s. tal que \(\overline{x}=14\).
La media de una distribución Poisson resulta igual al parámetro de la misma, de modo que el estimador máximo verosímil de la media se obtiene maximizando la función de verosimilitud del parámetro \(\lambda\) de la distribución Poisson.
\[\begin{equation*} l(\lambda)=\prod_{i=1}^{5} f(x_i;\lambda)=\prod_{i=1}^{5} \exp(-\lambda)\frac{\lambda^{x_i}}{x_i!}=\exp(-5 \lambda) \frac{\lambda^{\sum_{i=1}^{5} x_i}} {\prod_{i=1}^{5} x_i!}. \end{equation*}\]
De modo que la log-verosimilitud es \[\log l(\lambda)=-5 \lambda+ \left( \sum_{i=1}^{5} x_i \right) \log \lambda-\log \prod_{i=1}^{5} x_i!\] y su primera derivada resulta \[\frac{d\log l(\lambda)}{d\lambda}=-5+ \frac{\sum_{i=1}^{5} x_i}{\lambda}\], que igualada a cero proporciona la solución \[\hat{\lambda}=\frac{\sum_{i=1}^{5} x_i}{5}=\overline{x}=14\]. Esta solución es efectivamente el máximo de \(\log l(\lambda)\) (y por la inyectividad de la función logarítmica, también de \(l(\lambda)\)), pues hace negativa su segunda derivada, \[\frac{d^2\log l(\lambda)}{d\lambda^2}= -\frac{\sum_{i=1}^{5} x_i} {\lambda^2}<0, \; \forall \lambda>0\], luego la media muestral \(\overline{X}\) es el estimador má-xi-mo verosímil de la media \(\lambda\) de una población Poisson y, en este caso, \(\underline{\overline{x}=14}\) es la estimación máximo verosímil.
La desviación típica de una distribución Poisson resulta igual a la raíz cuadrada del parámetro de la misma. Como el estimador máximo verosímil es invariante frente a transformaciones biyectivas y la raíz cuadrada positiva lo es, se tiene que el estimador máximo verosímil de la desviación típica es \(\sqrt{\overline{X}}\) y, en este caso, \(\underline{\sqrt{\overline{x}}=3.7417}\) es la estimación máximo verosímil.
(12 DE ENERO 2017) El tiempo de descuento en las segundas partes de un partido de la Champions League se considera una variable aleatoria con distribución Normal. Escogidos al azar 14 partidos disputados en esta temporada 2016-2017, se ha obtenido un tiempo medio de descuento de tres minutos con una desviación típica igual a uno. a) ¿Entre qué valores se sitúa el tiempo medio de descuento con una confianza del 90%? b) ¿Qué cantidades mínima y máxima se pueden proponer para la desviación típica del tiempo de descuento con unas garantías del 95%?
El tiempo de descuento, en las segundas partes de los partidos del europeo de fútbol se considera que es una variable aleatoria con distribución Normal ( tanto para el fútbol femenino como para el masculino) . Escogidos al azar 14 de los partidos disputados, se ha obtenido un tiempo medio de descuento de tres minutos con una desviación típica igual a un minuto. Contesta:
(25-Mayo-2021-ADE-DRET) El tiempo que se tarda en realizar un examen de la asignatura de Introducción a la Inferencia se considera una variable aleatoria con distribución Normal. En la pasada convocatoria cierto profesor registró la duración del examen de 14 alumnos obteniendo un tiempo medio de 90 minutos y una desviación típica igual a 10. Considerando que estos alumnos observados constituyen una muestra aleatoria simple de todos los alumnos, contesta las siguientes cuestiones:
El tiempo que se tarda en realizar un examen de la asignatura de Introducción a la Inferencia se considera una variable aleatoria con distribución Normal. En la pasada convocatoria el profesorado registró una asistencia de 14 estudiantes, entre alumnos y alumnas, obteniendo un tiempo medio de 90 minutos y una desviación típica igual a 10. Si se considera el valor de dicha asistencia como muestra aleatoria simple de estudiantes, contesta las siguientes cuestiones:
(Enero-2019) El director de una cadena televisiva quiere estudiar la audiencia de los programas que emite. a) Si se quiere estimar la proporción de telespectadores que ven los programas deportivos con un error máximo del 3% y una confianza del 90%, ¿a cuántos telespectadores deberá entrevistar? b) Para analizar el tiempo diario que en un hogar se ve dicha cadena, se han seleccionado aleatoriamente 20 hogares y se ha obtenido para los mismos un tiempo medio diario de 2 horas, con una desviación típica de 30 minutos. Obtener una estimación para el tiempo medio diario con una confianza del 95%. Indicar los supuestos necesarios. c) En un programa concurso, los telespectadores pueden participar llamando por teléfono. Se admite que el número de llamadas que recibe el programa, durante su emisión, es una variable aleatoria con distribución de Poisson. Se dispone de una muestra aleatoria simple de 50 de esos programas, para los que se ha obtenido una media de 125 llamadas, con una desviación típica de 10. ¿Qué estimación propondrías para la varianza del número de llamadas recibidas en uno de esos programas? Razonar la respuesta.
La dirección de una cadena televisiva quiere estudiar la audiencia de los programas que emite. Según el análisis planteado, contesta la pregunta requerida.
Se quiere estimar la proporción de telespectadores que ven los programas deportivos con un error máximo del 3% y una confianza del 90%, ¿a cuántos telespectadores se deberá entrevistar?
Para analizar el tiempo diario que en un hogar se ve dicha cadena, se han seleccionado aleatoriamente 20 hogares y se ha obtenido para los mismos un tiempo medio diario de 2 horas, con una desviación típica de 30 minutos. Obtener una estimación para el tiempo medio diario con una confianza del 95%. Indicar los supuestos necesarios.
En un programa concurso, los telespectadores pueden participar llamando por teléfono. Se admite que el número de llamadas que recibe el programa, durante su emisión, es una variable aleatoria con distribución de Poisson. Se dispone de una muestra aleatoria simple de 50 de esos programas, para los que se ha obtenido una media de 125 llamadas/programa, con una desviación típica de 10. ¿Qué estimación propondrías para la varianza del número de llamadas recibidas en uno de esos programas? Razona la respuesta.
(Junio 2012) Para estimar el importe asociado al consumo de energía eléctrica que realizan los hogares, se ha realizado una investigación seleccionando aleatoriamente 20 hogares para los que se ha obtenido un importe medio de la factura mensual de electricidad de 43.58 euros, con una desviación típica de 15.25 euros.
(Enero 2014) En una encuesta dirigida a una muestra aleatoria simple de 200 familias residentes en una ciudad se preguntaban dos variables. V1: ¿Cuál es el gasto mensual medio en alimentación? y V2: ¿Tienen dificultades para llegar a fin de mes? Con referencia a V1 se ha obtenido una media de 120€ y una desviación típica de 40€. Con referencia a V2 se han obtenido 130 respuestas afirmativas.
¿Entre que valores debe admitirse que se sitúa el gasto medio mensual en alimentación con una confianza del 95%?
¿Cuál es el error máximo de la estimación de la proporción de personas que tienen dificultades para llegar a final de mes con una confianza del 90%?
¿Qué debería hacerse si se quisiera conseguir que los dos errores asociados a las estimaciones de V1 y V2 se redujeran a la mitad?
(Junio-2019) Con el fin de establecer si existen o no diferencias importantes en los precios de productos alimenticios en zona urbana o rural, se ha confeccionado una cesta de la compra y se ha procedido a calcular el precio de la misma en distintos comercios de productos de alimentación. En primer lugar, se han seleccionado aleatoriamente 50 establecimientos ubicados en zonas urbanas y otros 45 en zonas rurales. El importe de esta cesta de la compra en los establecimientos de las zonas urbanas da como resultado un valor medio de 175€, con una desviación típica de 55€, mientras que en las zonas rurales estas cantidades son 143€ y 64€, respectivamente.
Calcular una estimación para la diferencia de importes medios entre las zonas urbanas y las zonas rurales, con una confianza del 95%.
Si se pretende estimar la proporción de establecimientos que están regentados por mujeres, manteniendo el mismo nivel de confianza del apartado anterior y con un error máximo del 4%, ¿cuántos establecimientos se deberá seleccionar?
(Relacionado con la distribución normal) Dada una variable aleatoria que sigue una distribución \(N(\mu=3;\sigma^2=1)\), calcula la probabilidad de que un resultado obtenido al azar:
(Sobre IC) Dada una variable aleatoria que sigue una distribución \(N(\mu=3;\sigma^2=1)\), obtén los intervalos de confianza bilaterales con confianza del \(90%, 95%, 97.5%\) y \(99%\).
(Cuestiones sobre estimación puntual y estimación por intervalos) Dado un conjunto de observaciones de un fenómeno (valor del tiempo de descuento en un partido, tiempo de duración de un producto, número de piezas defectuosas producidas, nro. de visitas a una e-tienda).
(Cuestiones sobre la distribución de probabilidad de los estimadores de la media y de la varianza o desviación típica). Razona la siguientes afirmaciones:
(Sobre la ley que rige la media muestral en el caso de m.a.s.) Una variable aleatoria sigue una distribución \(N(\mu=3;\sigma^2=1)\). Dada una m.a.s. con \(n=10\) elementos, se piude:
Con los datos del ejercicio anterior, construye un intervalo (centrado) para el valor medio esperado de la muestra con una confianza del 90%.
Son ejercicios similares a los avanzados pero:
(Junio 2022) En un supermercado de una gran ciudad se quiere analizar las ventas de un producto A que se ha empezado a comercializar este año, este análisis se realiza comparándolo con los resultados del año pasado sobre un producto de características similares (producto B). Así, el producto B obtuvo unas ventas diarias medias de \(63\) unidades, con una desviación típica de \(12\) unidades. Para el producto A, el gerente ha seleccionado \(25\) días al azar, obteniendo unas ventas medias diarias de \(66\) unidadesy una desviación típica de \(10\) unidades. Contesta:
¿Puede aceptarse que la venta media del producto A es igual al valor obtenido el año pasado para el producto similar, para un nivel de significación del \(5\%\)? Indica los supuestos necesarios.
El gerente también está interesado en analizar la variabilidad. Para un nivel de significación del \(5\%\), ¿puede admitirse que la varianza de las ventas del producto A coincide con el valor que se obtuvo el año pasado para el producto de características similares? Indica los supuestos necesarios.
El auge por la práctica deportiva en los últimos tiempos ha motivado el crecimiento de la participación ciudadana en carreras populares, especialmente la participación femenina en las pruebas de carrera a pie. En la última edición de un circuito de la ciudad se ha observado que además del incremento en la representación femenina, se ha reducido la edad de las mujeres participantes. Teniendo en cuenta que en una muestra de 52 corredoras la edad media fue 32.5 años y la desviación típica 8.3 ¿Hasta qué nivel de significación se puede aceptar que la edad media de las mujeres participantes en las carreras populares no es superior a la del año pasado, cifrada en 31.5 años?
Una empresa adquiere plástico triturado en sacas. Un proveedor afirma que puede proporcionar sacas con un peso medio de 1250 kilos; también afirma que la proporción de sacas que necesitan un tratamiento previo para eliminar impurezas es menor que 0,35. Para comprobar las afirmaciones del proveedor, el gerente de la empresa ha seleccionado una muestra aleatoria de 41 sacas cuyo peso medio fue de 1175 kilos con una desviación típica de 80 kilos; además, 15 de las sacas inspeccionadas necesitaron el tratamiento previo de impurezas.
(25 DE JUNY 2015) Una empresa adquireix plàstic triturat en saques. Un proveïdor afirma que pot proporcionar saques amb un pes mitjà de 1250 quilos; també afirma que la proporció de saques que necessiten un tractament previ per eliminar impureses no és superior a 0’35. Per comprovar les afirmacions del proveïdor, el gerent de l’empresa ha seleccionat una mostra aleatòria de 41 saques i el pes mitjà de les mateixes va ser de 1175 quilos amb una desviació típica de 80 quilos; a més, 15 de les saques inspeccionades van necessitar el tractament previ d’impureses.
(12 DE ENERO 2017) Una empresa de telefonía realizó el pasado año un estudio, a nivel nacional, sobre el gasto de las familias en telefonía, y concluyó que el gasto familiar mensual medio por este concepto es de 118 €. En la actualidad está interesada en analizar el gasto de las familias en el área de Levante y el área Cantábrica. Con este fin, ha realizado una encuesta a 400 hogares seleccionados al azar de la zona levantina, obteniendo un gasto medio mensual de 115 € y una desviación típica de 23 €. Igualmente, ha entrevistado a 300 hogares seleccionados al azar en la zona del Cantábrico y ha obtenido un gasto medio mensual de 110 € y una desviación típica de 19 €.
(12 DE GENER 2017) Una empresa de telefonia va realitzar el passat any un estudi, a nivell nacional, sobre la despesa de les famílies en telefonia, i va concloure que la despesa familiar mensual mitjana per este concepte és de 118 €. En la actualitat està interessada en analitzar la despesa de les famílies en l’àrea de Llevant i l’àrea del Cantàbric. Amb esta finalitat, ha realitzat una enquesta a 400 famílies triades a l’atzar de la zona llevantina, obtenint una despesa mitjana mensual de 115 € i una desviació típica de 23 €. Així mateix, ha entrevistat a 300 famílies triades a l’atzar de la zona del Cantàbric i ha obtingut una despesa mitjana mensual de 110 € i una desviació típica de 19 €.
Ejercicio sencillos relacionados con los anteriores.
Para analizar el gasto de las familias en el área de Levante se ha realizado una encuesta a 400 hogares seleccionados al azar. Se ha obtenido un gasto medio mensual de 115€ con una desviación típica de 23€. Se pide:
Combinación de Contraste y Estimación (ADE-DRET-26 DE ENERO 2018) En una ciudad existen 30 hoteles de categoría MEDIA (2* y 3* ), 10 de categoría SUPERIOR (4* y 5*) y 1 de categoría PREMIUM. Al objeto de investigar algunas variables se han realizado entrevistas a los turistas en los establecimientos hoteleros, diferenciando las tres categorías. En la categoría MEDIA se dispone de las respuestas de una m.a.s. de 300 turistas, en la categoría SUPERIOR de otra m.a.s. de 200 turistas, mientras que en la categoría PREMIUM únicamente se dispone de las respuestas de 15 turistas, que también constituyen una m.a.s. Los estadísticos muestrales obtenidos en cada muestra asociados a las variables “gasto medio diario por turista” e “intención de recomendar la ciudad como destino turístico” se recogen en la siguiente tabla:
Categoría | n | Gasto Medio | Desviación Típica gasto | Porcentaje recomendarán |
---|---|---|---|---|
MEDIA | 300 | 90 | 25 | 70% |
SUPERIOR | 200 | 140 | 30 | 60% |
PREMIUM | 15 | 250 | 60 | 20% |
En base a esta información, contestar a las siguientes preguntas. Si en algún caso es preciso asumir alguna hipótesis no contemplada inicialmente indicarla.
Una encuesta reciente ha preguntado a 380 personas por su grado de preocupación por los incendios forestales. Las respuestas indican que 185 personas respondieron sentirse ‘muy preocupadas’, 94 ‘preocupadas’, 43 ‘poco preocupadas’ y 58 ‘nada preocupadas’. Se examina la hipótesis siguiente: la proporción de personas ‘muy preocupadas’ es la mitad, las ‘preocupadas’ una cuarta parte, las ‘poco preocupadas’ un 10% y las ‘nada preocupadas’ un 15%. Responde especificando los supuestos necesarios en cada caso.
En una encuesta reciente sobre el uso de TIC en el medio rural, a la que respondieron 384 personas de Alicante, Castellón y Valencia, declaran disponer de conexión móvil de banda ancha el 70’6% de la muestra, y un porcentaje similar, el 70’8%, declara que dispone de conexión fija de banda ancha en casa. Se plantea la hipótesis de que disponer de un tipo de conexión es independiente de disponer del otro. Responde especificando los supuestos necesarios en cada caso.
Una encuesta reciente sobre el uso de TIC en el medio rural pregunta a 316 personas por el uso de la administración electrónica. Las respuestas indican que 106 mujeres y 98 hombres declararon utilizarla cotidianamente, mientras que 58 hombres 54 y mujeres reconocieron no utilizarla. Se plantea la hipótesis de que el uso de la administración electrónica entre mujeres y hombres se distribuye igual. Responde especificando los supuestos necesarios en cada caso.