CAPITULO 10

DISEÑOS EXPERIMENTALES

10.1 Diseños Experimentales de Clasificación Simple

En un diseño experimental de clasificación simple se trata de comparar varios grupos, generalmente llamados Métodos o Tratamientos. Para esto se usa una variable de respuesta Y que es medida en cada uno de los grupos. Los grupos tambien pueden ser los niveles de una variable cualitativa que es llamada Factor

Los datos deben ser recolectados de la siguiente manera

Grupo 1

Grupo 2

Grupo 3

……….

Grupo k

Y11

Y21

Y31

 

Yk1

Y12

Y22

Y32

 

Yk2

Y13

Y23

Y33

 

Yk3

…..

     

Y1n1

Y2n2

Y3n3

…….

Yknk

Donde el Grupo 1 tiene n1 observaciones, el Grupo 2 tiene n2 observaciones, y asi sucesivamente. Comparar los grupos se reduce a determinar si hay igualdad de medias poblacionales de la variable de respuesta en todos los grupos. Es decir,

Ho: m 1= m 2=m 3=…=m k ( Los k grupos tienen medias poblacionales iguales) versus

Ha: Al menos un grupo tiene distinta media poblacional

La prueba estadística es la prueba de F, la cual es obtenida al completar la tabla del análisis de varianza.

La Tabla del análisis de varianza tiene el siguiente formato:

Fuentes de Variación

Grados de Libertad

Suma de Cuadrados

Cuadrados Medios

F

Entre Grupos

k-1

SSG

MSG=SSG/k-1

MSG/MSE

Dentro de Grupos

n-k

SSE

MSE=SSE/n-k

Total

n-1

SST

 

Donde la suma de cuadrados del total SST se calcula por

SSG, la suma de cuadrados Entre Grupos se calcula por

donde Ti representa el total del i-ésimo Grupo.

SSE es la suma de cuadrados del Error, llamado también Suma de Cuadrados Dentro de Grupos y se calcula por diferencia SSE=SST-SSG.

Si la F calculada es mayor que una F con k-1 y n-k al nivel de significación a entonces se rechaza la hipótesis nula. MINITAB da el "p-value" para la prueba de F y con ese valor se puede llegar a tomar una decisión.

En MINITAB, los Diseños Experimentales se llevan a cabo usando la opción Anova del menú STAT., cuyo submenú aparece en la siguiente figura

 

Figura 10.1. Las opciones del menu ANOVA

La opción oneway del menú Anova se usa para hacer análisis de varianza de clasificación simple cuando los datos de la variable de respuesta van en una sola columna ( se dice que los grupos forman un STACK) y los niveles del factor (o Grupos) van en otra columna.

La opción oneway (unstacked), se usa también para hacer diseños de clasificación simple, pero cuando los datos de los grupos a comparar son entrados columna por columna.

Ejemplo 10.1. Se desea comparar 3 métodos de enseñanza A, B y C, se eligen al azar una muestra de

estudiantes de cada método y se le aplica una prueba final común. Los resultados son como sigue:

metodo A metodo B metodo C

89 78 64

45 85 69

59 93 82

46 81 74

64 79 79

71 98

94

 

Habrá evidencia suficiente para concluir que hay diferencia entre métodos?

Solución: Usando la opción oneway (Unstacked) la ventana de diálogo se completará como sigue:

Figura 10.2. Ventana de diálogo de oneway(unstacked) para el ejemplo 10.1

y la ventana session mostrará el siguiente contenido:

MTB > AOVOneway 'metodo A'-'metodo C'.

One-way Analysis of Variance

Analysis of Variance

Source DF SS MS F P

Factor 2 1957 978 7.44 0.006

Error 15 1971 131

Total 17 3928

Individual 95% CIs For Mean

Based on Pooled StDev

Level N Mean StDev -------+---------+---------+---------

metodo A 6 62.33 16.54 (-------*-------)

metodo B 7 86.86 8.07 (------*-------)

metodo C 5 73.60 7.30 (--------*--------)

-------+---------+---------+---------

Pooled StDev = 11.46 60 72 84

 

 

 

Interpretación: Observando el P-value=.006 se rechaza de que todos los métodos sean iguales, osea en al menos uno de los métodos el rendimiento de los estudiantes es distinto al de los otros métodos. También aparecen los intervalos de confianza para las medias de los tres grupos y se puede ver que no hay superposición entre los intervalos de confianza para los métodos A y B,. lo cual sugiere también que se debe rechazar la hipótesis nula

También se puede hacer una comparación gráfica de los grupos oprimiendo el botón Graph, lo cual produce

 

 

Figura 10.3 Ventana de diálogo para elegir la gráfica en un Anova de clasificación simple.

 

Eligiendo boxplots se obtiene la siguiente gráfica

Figura 10.4. Boxplots para comparar los tres métodos del ejemplo 10.1

Interpretación: La posición de la mediana y las medias sugiere que aún cuando los métodos B y C no están muy distantes si existe una diferencia marcada entre los metodos B y A, lo cual llevará a rechazar la hipótesis de iguldad de medias. Hay que notar que laaa variabilidad del método A es mucho mayor que los otros dos métodos.

Para usar la opción oneway los datos deben ser entrados en dos columnas: Una de ellas conteniendo los valores de la variable de respuesta y la otra los valores que indican a que grupo pertenecen dichos datos. Para el ejemplo anterior serían como sigue:

notas metodo

89 1

45 1

59 1

46 1

64 1

71 1

78 2

85 2

93 2

81 2

79 2

98 2

94 2

64 3

69 3

82 3

74 3

79 3

La ventana de diálogo se completará así:

Figura 10.5. Ventana de diálogo para la opción oneway de ANOVA

y el contenido de la ventana session será similar al anterior

MTB > Oneway 'notas' 'metodos'.

One-way Analysis of Variance

Analysis of Variance for notas

Source DF SS MS F P

metodos 2 1957 978 7.44 0.006

Error 15 1971 131

Total 17 3928

Individual 95% CIs For Mean

Based on Pooled StDev

Level N Mean StDev -------+---------+---------+---------

1 6 62.33 16.54 (-------*-------)

2 7 86.86 8.07 (------*-------)

3 5 73.60 7.30 (--------*--------)

-------+---------+---------+---------

Pooled StDev = 11.46 60 72 84

 

Es posible convertir datos de grupos que aparecen en varias columnas a datos en dos columnas, esto se llama hacer un stack, ver el ejemplo 2.3.

 

10.2 Comparaciones Multiples

Una vez que se ha rechazado que todos los grupos son iguales hay que determinar cuales de ellos son comparables entre si. Existen muchos métodos para hacer estas comparaciones, pero los mas usados son los metodos de Tukey y Fisher. Todos ellos son similares y aplican el siguiente criterio

Los Grupos i y j son comparables entre si, si se cumple

| media del Grupo i -Media del Grupo j | > valor critico

 

La diferencia entre todos ellos está en como se calcula el valor crítico.

En MINITAB las pruebas de comparaciones multiples se obtienen al oprimir el botón Comparisons de Oneway. Aparece la siguiente ventana de diálogo

Figura 10.6. Ventana de diálogo para la opción comparisons de one-way

En este texto solo se verán la método de Tukey, en donde para calcular el valor crítico se usan los valores de la distribución del rango estudentizado, y el método de Fisher, que hace uso de los valores de la distribución t en el cálculo del valor crítico. Los resultados para los datos del ejemplo anterior serán como sigue:

Tukey's pairwise comparisons

Family error rate = 0.0500

Individual error rate = 0.0203

Critical value = 3.67

Intervals for (column level mean) - (row level mean)

1 2

2 -41.08

-7.97

3 -29.28 -4.16

6.75 30.68

 

 

Fisher's pairwise comparisons

Family error rate = 0.117

Individual error rate = 0.0500

Critical value = 2.131

Intervals for (column level mean) - (row level mean)

1 2

2 -38.12

-10.93

3 -26.06 -1.05

3.53 27.56

 

 

 

 

Interpretación: Por cada combinación de Grupos aparecen los limites inferiores y superiores de los intervalos de confianza para la diferencia poblacional de las dos medias. Si los limites de los intervalos son de signos distintos entonces los grupos son comparables de lo contario no. Básicamente esto equivale a ver si CERO esta contenido o no en el intervalo. En este ejemplo los criterios de Tukey y Fisher llevan a la conclusión que los metodos de enseñanza A y C son comparables al igual que B y C pero A y B no lo son. Hay un nivel superior formado por los métodos B y C y un nivel inferior formado por C y A. Notar que C aparece en ambos niveles.

Ejemplo 10.2. Los siguientes datos representan los tiempos de sobrevivencia a varios tipos de cáncer, después que se lo ha diagnosticado

Estomago Pulmon Colon Ovario Seno

248 124 1234 81 1235

377 42 89 461 24

189 25 201 20 1581

1843 45 356 450 1166

180 412 2970 246 40

537 51 456 166 727

519 1112 63 3808

455 46 64 791

406 103 155 1804

365 876 859 3460

942 146 151 719

776 340 166

372 396 37

163 223

101 138

20 72

283 245

 

Hacer un análisis de varianza para probar si hay igual tiempo de sobrevivencia para los diversos tipos de cáncer. Aplicar los metodos de comparaciones múltiples de Fisher y Tukey para identificar los tipos de cáncer con tiempos de sobrevivencia similares.

Solución:

La hipótesis nula es Ho: Los tiempos promedios de sobrevivencia de los pacientes diagnosticados con cancer de estomago, pulmón, colón, ovario y seno son iguales.

La hipotesis alterna es Ha: Al menos uno de los tipos de cáncer tiene tiempo de sobrevivencia promedio distinto a los otros.

Primero se entran los datos en dos columnas: Sobrevivencia, que contiene los tiempos de sobrevivencia y Organo, que contiene los organos donde el cáncer es detectado. Luego se sigue la secuencia Stat 4 Anova 4 Oneway , y oprimiendo el botón comparisons se obtiene los siguientes resultados en la ventana session

One-way Analysis of Variance

Analysis of Variance for sobreviv

Source DF SS MS F P

organo 4 11535761 2883940 6.43 0.000

Error 59 26448144 448274

Total 63 37983905

Individual 95% CIs For Mean

Based on Pooled StDev

Level N Mean StDev --+---------+---------+---------+----

Colon 17 457.4 427.2 (-----*----)

Estomago 13 286.0 346.3 (-----*-----)

Ovario 6 884.3 1098.6 (--------*--------)

Pulmon 17 211.6 209.9 (-----*----)

Seno 11 1395.9 1239.0 (-----*------)

--+---------+---------+---------+----

Pooled StDev = 669.5 0 600 1200 1800

Tukey's pairwise comparisons

Family error rate = 0.0500

Individual error rate = 0.00663

Critical value = 3.98

Intervals for (column level mean) - (row level mean)

Colon Estomago Ovario Pulmon

Estomago -523

866

Ovario -1322 -1528

468 332

Pulmon -400 -620 -222

892 769 1567

Seno -1668 -1882 -1468 -1913

-209 -338 445 -455

 

 

Fisher's pairwise comparisons

Family error rate = 0.278

Individual error rate = 0.0500

Critical value = 2.001

Intervals for (column level mean) - (row level mean)

Colon Estomago Ovario Pulmon

Estomago -322

665

Ovario -1063 -1260

209 63

Pulmon -214 -419 37

705 568 1309

Seno -1457 -1659 -1192 -1703

-420 -561 168 -666

 

Interpretación: El "P-value" de la prueba de F es .0000, lo cual sugiere que la hipótesis nula se rechaza y se concluye que hay suficiente evidencia estadística para afirmar que al menos uno de los tipos de cáncer tiene tiempo de sobrevivencia promedio distinto a los otros.

De acuerdo al método de Tukey:

El tiempo promedio de sobrevivencia para cáncer de Estomago es similar al cáncer al pulmón, al colón y al ovario, pero no al seno.

El tiempo promedio de sobrevivencia para cáncer de pulmón es similar al cáncer al estómago y al colón, pero no al ovario, ni al seno.

El tiempo promedio de sobrevivencia para cáncer de colón es similar al cáncer al estómago, al pulmón y al ovario, pero no al seno.

El tiempo promedio de sobrevivencia para cáncer de ovarios es similar al cáncer al estómago, al colón, al pulmón, y al seno.

El tiempo promedio de sobrevivencia para cáncer de senos es similar al cáncer a los ovarios, pero no al estómago, ni al pulmón, ni al colón.

En resumen: Los cáncer al pulmón, estomago, colón y ovarios tienen tiempos de sobrevivencia similares, formado una categoría inferior. Los cáncer de ovarios y senos tienen tiempos promedios de sobrevivencia similares, formando una categoría superior.

De acuerdo al método de Fisher:

Hay un solo cambio con respecto al método de Tukey y es que los tiempos promedios de sobrevivencia de cáncer de pulmón y ovarios son similares.

En resumen: Los cáncer al pulmón, estómago y colón tienen tiempos sobrevivencia similares y forman una categoría inferior. Los cáncer al estómago, colón y ovarios tienen tiempos sobrevivencia similares y forman una categoría intermedia. Los cáncer de ovarios y senos tienen tiempos promedios de sobrevivencia similares y forman la categoría superior.

 

 

 

10.3 Diseños Experimentales de clasificación Doble

En este caso se trata de comparar métodos pero tomando en cuenta un segundo factor el cual podría afectar la comparación de los mismos. Los datos de un experimento de clasificación doble con dos observaciones por celdas, deben ser recolectados de la siguiente manera:

 

Grupo 1

Grupo 2

……….

Grupo k

Bloque 1

Y111

Y112

Y211

Y212

…..

Yk11

Yk12

Bloque 2

Y121

Y122

Y221

Y222

…..

Yk21

Yk22

….

…..

   

….

…..

   

Bloque B

Y1B1

Y1B2

Y2B1

Y2B2

…….

YkB1

YkB2

Hay dos pruebas de hipótesis que se pueden hacer:

Ho: m 1= m 2=m 3=…=m k ( Los k grupos tienen medias poblacionales iguales) versus

Ha: Al menos un grupo tiene distinta media poblacional que los otros

y,

Ho: m 1= m 2=m 3=…=m B ( Los B bloques tienen medias poblacionales iguales) versus

Ha: Al menos un bloque tiene media poblacional distinta al de los otros.

La prueba estadística es la prueba de F, la cual es obtenida al completar la tabla del análisis de varianza.

La tabla del análisis de varianza para un diseño con k grupos, b bloques y c observaciones en cada celda tiene el siguiente formato:

Fuentes de Variación

Grados de Libertad

Suma de Cuadrados

Cuadrados Medios

F

Grupos

k-1

SSG

MSG=SSG/k-1

MSG/MSE

MSB/MSE

Bloques

b-1

SSB

MSB=SSB/b-1

Error

kbc-k-b+1

SSE

MSE=SSE/kbc-k-b+1

Total

kbc-1

SST

 

Donde MSG es el cuadrado medio de Grupos y MSB es el cuadrado medio de Bloques y MSE es el cuadrado medio del Error. Si la F calculada es mayor que una F con k-1 y kbc-k-b+1 al nivel de significación a entonces se rechaza la hipótesis nula de igualdad de medias de grupos y si la F calculada es mayor que una F con b-1 y kbc-k-b+1 al nivel de significación a entonces se rechaza la hipótesis nula de igualdad de medias de bloques.

MINITAB da el "p-value" para ambas prueba de F y con ese valor se puede llegar a tomar una decisión.

La opción two-way se usa para analizar diseños de clasificación doble siempre y cuando haya igual número de observaciones por celda.

Ejemplo 10.3 Se trata de comparar 3 método de enseñanza (a, b y c) pero tomando en cuenta además el factor turno (m, t y n), es decir el tiempo del día al cual se da clase. Los datos son como siguen:

 

a b c

m 80.000 65.000 66.000

78.000 79.000 49.000

t 69.000 50.000 34.000

72.000 58.000 58.000

n 73.000 62.000 46.000

74.000 65.000 59.000

Solución: Primero se entran los datos en tres columnas

nota metodo turno

80 a m

78 a m

69 a t

72 a t

73 a n

74 a n

65 b m

79 b m

50 b t

58 b t

62 b n

65 b n

66 c m

49 c m

34 c t

58 c t

46 c n

59 c n

Las hipótesis que se deben probar son:

Ho: No hay diferencia entre los tres métodos de enseñanza

Ha: Al menos uno de los métodos de enseñanza tiene un rendimiento distinto a los otros, y

Ho: Hay igual rendimiento de los estudiantes en los tres turnos

Ha: En al menos un de lso turnos los estudiantes rinden distinto a los otrso dos turnos.

Eligiendo la secuencia Stat 4 Anova 4 Twoway se obtiene la siguiente ventana de diálogo

Figura 10.7. Ventana de diálogo para la opción two-way del menu ANOVA.

Notar que la opción Fit Additive model debe aparecer marcada.

Los resultados son los siguientes:

MTB > Twoway 'nota' 'turno' 'metodo';

SUBC> Additive;

SUBC> Means 'turno' 'metodo'.

Two-way Analysis of Variance

Analysis of Variance for nota

Source DF SS MS F P

turno 2 481.3 240.7 4.41 0.034

metodo 2 1496.3 748.2 13.72 0.001

Error 13 708.8 54.5

Total 17 2686.5

Individual 95% CI

turno Mean ---------+---------+---------+---------+--

m 69.5 (--------*---------)

n 63.2 (--------*---------)

t 56.8 (--------*--------)

---------+---------+---------+---------+--

56.0 63.0 70.0 77.0

Individual 95% CI

metodo Mean -----+---------+---------+---------+------

a 74.3 (-----*------)

b 63.2 (-----*------)

c 52.0 (------*------)

-----+---------+---------+---------+------

50.0 60.0 70.0 80.0

 

 

Una mejor alternativa es usar la opción General Linear Model del menu ANOVA la cual permite analizar diseños de clasificación doble aún cuando no haya igual numero de observaciones por celda y además tiene una opción que permite hacer comparaciones multiples. Para el ejemplo anterior la ventana de diálogo lucirá así:

Figura 10.8 Ventana de diálogo para la opción General Linear Model de ANOVA.

Los resultados obtenidos serán

MTB > GLM 'nota' = metodo turno;

SUBC> Brief 2 .

General Linear Model

Factor Type Levels Values

metodo fixed 3 a b c

turno fixed 3 m n t

Analysis of Variance for nota, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F P

metodo 2 1496.33 1496.33 748.17 13.72 0.001

turno 2 481.33 481.33 240.67 4.41 0.034

Error 13 708.83 708.83 54.53

Total 17 2686.50

 

 

Interpretación: Viendo los "P-values" correpondientes a ambos factores se llega a la conclusión de en al menos uno de los métodos de enseñaza el rendimiento es distinto y que en al menos uno de los turnos los estudiantes rinden distinto a los de los otros dos turnos.

Oprimiendo el botón comparisons se puede hacer comparaciones de medias de los dos factores. La ventana de diálogo se muestra en la siguiente figura

Figura 10.9. Ventana de diálogo para hacer comparaciones multiples usando General Linear Model

y los resultados serán:

Tukey 95.0% Simultaneous Confidence Intervals

Response Variable nota

All Pairwise Comparisons among Levels of metodo

metodo = a subtracted from:

metodo Lower Center Upper ----+---------+---------+---------+--

b -22.41 -11.17 0.08 (----------*----------)

c -33.58 -22.33 -11.09 (-----------*----------)

----+---------+---------+---------+--

-30 -20 -10 0

 

metodo = b subtracted from:

metodo Lower Center Upper ----+---------+---------+---------+--

c -22.41 -11.17 0.07766 (----------*----------)

----+---------+---------+---------+--

-30 -20 -10 0

 

Tukey 95.0% Simultaneous Confidence Intervals

Response Variable nota

All Pairwise Comparisons among Levels of turno

turno = m subtracted from:

turno Lower Center Upper ----------+---------+---------+------

n -17.58 -6.33 4.911 (-------------*-------------)

t -23.91 -12.67 -1.422 (-------------*-------------)

----------+---------+---------+------

-16.0 -8.0 0.0

 

turno = n subtracted from:

turno Lower Center Upper ----------+---------+---------+------

t -17.58 -6.333 4.911 (-------------*-------------)

----------+---------+---------+------

-16.0 -8.0 0.0

Interpretación: El método A es comparable con el B pero no con el C. El metodo B es comparable con el C. El turno de la mañana es comparable con el turno de la noche pero no con el de la tarde. El turno de la noche es comparable con el de la tarde.

 

10.4 Modelos con Interacción

En un diseño de clasificación doble, algunas veces es conveniente cotejar si existe un efecto combinado de ambos factores en la variación de la variable de respuesta, este efecto es llamado Interacción,

El efecto interacción puede ser detectado gráficamente, usando los llamados plots de interacción.

La ventana de diálogo de la opción Interaction Plots de ANOVA para los datos del ejemplo anterior se

completará como se muestra en la figura 10.10.

Figura 10.10. Ventana de diálogo para hacer los plots de interacción para el ejemplo 10.3

La siguiente figura muestra los plots de interacción.

Figura 10.11 Interacción plots para el ejemplo 10.3

Interpretación: Si hay cierto paralelismo entre las lineas entonces hay muy poca interacción. Si las lineas se cruzan bastante entonces hay bastante interacción. En el ejemplo se puede ver que no hay interación.

En este caso además de las hipótesis acerca de igualdad de medias de grupos y de igualdad de medias de bloques hay una tercera hipótesis referente a Interacción:

Ho: No hay interacción entre grupos y bloques

Ha: Si hay interacción:

En MINITAB la tabla de Análisis de varianza es obtenida usando two-way con la opción Fit Additve Model sin ser elegida. Los resultados son como siguen:

MTB > Twoway 'nota' 'turno' 'metodo'.

Two-way Analysis of Variance

 

Analysis of Variance for nota

Source DF SS MS F P

turno 2 481.3 240.7 3.29 0.085

metodo 2 1496.3 748.2 10.23 0.005

Interaction 4 50.3 12.6 0.17 0.947

Error 9 658.5 73.2

Total 17 2686.5

 

 

Otra alternativa es usar General Linear Model. La interacción está representada en el modelo por la expresión método*turno. Los resultados son como siguen:

MTB > GLM 'nota' = metodo turno metodo*turno;

SUBC> Brief 2 .

General Linear Model

Factor Type Levels Values

metodo fixed 3 a b c

turno fixed 3 m n t

Analysis of Variance for nota, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F P

metodo 2 1496.33 1496.33 748.17 10.23 0.005

turno 2 481.33 481.33 240.67 3.29 0.085

metodo*turno 4 50.33 50.33 12.58 0.17 0.947

Error 9 658.50 658.50 73.17

Total 17 2686.50

 

Interpretación: El valor del "P-value" para Interacción es .947 que lleva a concluir que se debe aceptar la hipótesis nula de que no existe interacción entre los factores, lo cual ya se habia concluido gráficamente.

 

 

EJERCICIOS

1. Se toma una muestra de la produccion de 36 fincas donde se han sembrado 4 variedades de maiz y se observan los siguientes resultados

 

VAR 1 VAR 2 VAR 3 VAR 4

29.5 30.1 23.7 35.7

24.7 29.0 26.4 36.9

28.0 26.6 26.5 35.0

31.5 36.4 37.5 36.5

39.8 36.6 34.6 34.9

29.8 35.3 35.6 48.2

33.8 54.7 39.7 41.3

37.7 53.2 46.2 43.3

35.5 31.4 34.2 51.7

a)Habrá diferencia entre las producciones promedios de cada variedad de maíz?Escribir las hipótesis y comentar sus resultados.

b)Hacer Boxplots para comparar las producciones promedio por variedad Comentar la gráfica

 

2. Los siguientes datos representan los niveles de colesterol para consumidores de tres tipos de carne

Res Cerdo Pollo/Mariscos

241 245 249

218 197 222

261 199 221

190 162 215

238 191 207

256 182 193

248 160 205

224 180 227

225 208 203

238 227 180

178 174 200

185 209 154

194 225 211

224 271 204

221 187 169

a) Habrá diferencia de niveles de colesterol entre los tres tipos de consumidores?.Escribir las hipótesis y comentar sus resultados.

b)Hacer Boxplots para comparar los niveles de colesterol por tipo de consumidor Comentar la gráfica

3. Se hace un experimento para probar los efectos de 5 diferentes dietas en pavos. Se asignan al azar 6 pavos a cada una de las 5 dietas y se los alimentó por un periodo fijo de tiempo. Luego se registró la ganancia en peso en libras. Los resultados son como siguen.

dieta a dieta b dieta c dieta d dieta e

4.10000 5.20000 6.30000 6.50000 9.50000

3.30000 4.80000 6.50000 6.80000 9.60000

3.10000 4.50000 7.20000 7.30000 9.20000

4.20000 6.80000 7.40000 7.50000 9.10000

3.60000 5.50000 7.80000 6.90000 9.80000

4.40000 6.20000 6.70000 7.00000 9.10000

 

a)Probar si la ganancia en peso es la misma todas las dietas.Justificar su contestación.

b)Hacer comparaciones multiples para detectar que dietas producen igual ganancia en peso. Comentar sus resultados

4. Los siguientes datos representas los niveles de Sarcodiosis en 5 grupos de pacientes

A B C D E

102 64 130 82 123

74 56 136 51 113

63 42 137 72 138

67 39 107 77 126

68 29 155 45 135

58 42 137 85 138

77 61 138 80 124

55 67 120 51 102

80 40 138 76 125

78 89 165 95 103

87 47 138 82 124

89 44 163 92 128

a)Probar si los niveles de sarciodiosis son los mismos para los 5 grupos.Justificar su contestación.

b)Hacer comparaciones multiples para detectar que tipos de pacientes tienen iguales niveles de sarciodiosis. Comentar sus resultados

 

5. Se toma una muestra de los salarios y de los años de educacion de 48 empleados de 4 departamentos de una cierta empresa y se observan los siguientes resultados

 

Filas: EDUC Columnas: DEPT

1 2 3 4

0 29548 30115 23654 35487

24749 28985 26452 36487

27985 26578 26548 34987

Educ: Años de educacion despues de la escuela superior

4 31528 36431 37548 36512

39828 36571 34632 34869

29876 35468 35631 48184

Dept: 1 = ventas, 2 = compras, 3 = publicidad, y 4 = ingenieria.

6 33791 54679 39743 41255

37674 53234 46211 43331

35467 31425 34231 51698

10 28985 24782 36578 65487

32920 56326 68425 58695

31889 47536 69246 54899

 

  1. Habrá diferencia entre los salarios promedios de cada departamento?
  2. Hacer Boxplots para comparar los salarios promedios por departamentos. Comentar la gráfica
  3. Hacer comparaciones multiples para comparar los salarios promedios por deparatamento a que conclusión se llegará?
  4. Hacer un análisis de clasificación doble para ver si la variable educación afecta a la comparación de los salarios por departamentos. A que conclusiones se llegará?

 

6. Se seleccionaron al azar ministros de 3 religiones: 8 metodistas, 10 católicos y 9 pentecostales y se desea probar si poseen el mismo conocimiento sobre enfermedades mentales. Los resultados de un test para medir sus conocimientos son los siguientes

Metodista Católico Pentecostal

32 32 28

30 32 21

30 26 15

29 26 15

26 22 14

23 20 14

18 14 09

19 16 11

14 08

15

    1. Probar si los ministros de las 3 religiones poseen igual conocimiento de enfermedades mentales.
    2. Usar comparaciones multiples para comparar los 3 grupos. Comentar sus resiultados.
    3. Hacer un boxplot para comparar los 3 grupos. Comentar su gráfica

7. Una panaderia desea saber si hay un efecto de la posición ( abajo, en medio, arriba) en que se colocan en los anaqueles y del ancho de los anaqueles (normal, bastante ancho) en la venta de sus panes. Se registran el numero de bolsas de panes vendidas diariamente en 24 supermercados, y los datos que se obtienen son

Posición

Ancho del anaquel

Normal

Bastante Ancho

Abajo

47 43

50 55

46 40

41 38

En Medio

62 68

65 70

67 71

65 69

Arriba

41 39

35 37

42 46

40 45

  1. Hacer una prueba de análisis de varianza para probar las hipótesis de que los promedios de ventas son los misnos para cada posición . Comentar sus resultados
  2. Hacer una gráfica de boxplots para comparar los promedios de ventas según al posición comentar su gráfica
  3. Hacer comparaciones de medias para identificar las posiciones en los anaqueles que producen en promedio iguales ventas de los panes.
  4. Hacer un diseño de clasificación doble para determinar si hay un efecto del ancho del anaquel en las ventas promedio según la posición. A que conclusión se llegará?