Saltar la navegación

2. Tablas de doble entrada

Ejercicio 1

En una determinada estación meteorológica hemos contabilizado las siguientes variables estadísticas que recogen dos índices de contaminación:

  • \(X = \) “Nº de días por mes en los que se supera el límite permitido de concentración de \(NO_2\)”
  • \(Y = \) “Nº de días por mes en los que se supera el límite permitido de concentración de ozono”

A continuación te mostramos los resultados obtenidos en los últimos 36 meses:

(0,3) (1,1) (0,2) (1,1) (2,0) (1,4) (1,4) (3,2) (3,3) (2,1)

(1,4) (1,0) (0,0) (0,3) (1,3) (1,4) (0,0) (1,0) (0,0) (2,3)

(2,0) (1,0) (0,0) (1,1) (3,2) (3,1) (0,0) (1,2) (0,1) (0,2)

(0,0) (3,1) (2,3) (1,0) (0,0) (1,4)

Por ejemplo, si analizamos el primero de los pares de datos, el (0,3) nos indica que la variable bidimensional \((X,Y)\) obtuvo en el primer mes los valores:

\(x_1=0\) indica que en el primer mes hubo \(0\) días en los que se superó el nivel de \(NO_2\)

\(y_1=3\) indica que en el primer mes hubo \(3\) días en los que se superaron el nivel de ozono.

Construyamos la tabla de doble entrada correspondiente para organizar mejor los datos:

\[
\begin{array} {|c|c|c|c|c|c|}
\hline
X/Y&y_1&y_2&y_3&y_4&y_5\\
\hline
x_1&n_{11}&n_{12}&n_{13}&n_{14}&n_{15}\\
\hline
x_2&n_{21}&n_{22}&n_{23}&n_{24}&n_{25}\\
\hline
x_3&n_{31}&n_{32}&n_{33}&n_{34}&n_{35}\\
\hline
x_4&n_{41}&n_{42}&n_{43}&n_{44}&n_{45}\\
\hline
\end{array}
\Rightarrow
\begin{array} {|c|c|c|c|c|c|}
\hline
X/Y&0&1&2&3&4\\
\hline
0&7&1&2&2&0\\
\hline
1&4&3&1&1&5\\
\hline
2&3&0&0&2&0\\
\hline
3&0&2&2&1&0\\
\hline
\end{array}
\]

La tabla se completa con una última fila y una última columna en las que ponemos los totales para cada \(x_i\) e \(y_j\). A estos totales les llamaremos frecuencias marginales. Si sumas todas las \(n_i\) o todas las \(n_j\), debes obtener el total de parejas:

\[
\begin{array} {|c|c|c|c|c|c|c|}
\hline
\bf{X/Y}&\bf{0}&\bf{1}&\bf{2}&\bf{3}&\bf{4}&\color{red}{\bf{n_i}}\\
\hline
\bf{0}&7&1&2&2&0&\color{red}{\bf{12}}\\
\hline
\bf{1}&4&3&1&1&5&\color{red}{\bf{14}}\\
\hline
\bf{2}&3&0&0&2&0&\color{red}{\bf{5}}\\
\hline
\bf{3}&0&2&2&1&0&\color{red}{\bf{5}}\\
\hline
\color{red}{\bf{n_j}}&\color{red}{\bf{14}}&\color{red}{\bf{6}}&\color{red}{\bf{5}}&\color{red}{\bf{6}}&\color{red}{\bf{5}}&\color{red}{\bf{36}}\\
\hline
\end{array}
\]

a) ¿Cuántos meses tuvieron 2 días con niveles excesivos de NO2, pero ninguno con nivel excesivo de ozono?
b) ¿Cuántos meses tuvieron solo un día de exceso de concentración de NO2 en aire?

Ejercicio 2

Recuerda que las tablas de doble entrada son útiles en casos en los que tenemos gran cantidad de datos o en los que los pares de datos pueden aparecer repetidos. En caso contrario, hacemos uso de una tabla simple.

Estamos estudiando las notas de un grupo de alumnos en las asignaturas de Matemáticas (X) y Geografía (Y) y pretendemos recogerlos en una tabla. Los resultados han sido los siguientes: (6,7), (7,8), (9,8), (6,6), (4,3), (7,7), (3,4), (4,5) y (5,5), donde cada par corresponden a las notas de Matemáticas y Geografía de cada alumno, la forma más sencilla de ordenarlos sería:

\[
\begin{array}{|l|c|c|c|c|c|c|c|c|c|}
\hline
\text{Matemáticas (X)}&6&7&9&6&4&7&3&4&5\\
\hline
\text{Geografía (Y)}&7&8&8&6&3&7&4&5&5\\
\hline
\end{array}
\]

A veces es frecuente ordenar estos datos; pero debes tener cuidado, nunca separes los pares de puntos al ordenar una de la variables:

\[
\begin{array}{|l|c|c|c|c|c|c|c|c|c|}
\hline
\text{Matemáticas (X)}&3&4&4&5&6&6&7&7&9\\
\hline
\text{Geografía (Y)}&4&3&5&5&6&7&7&8&8\\
\hline
\end{array}
\]

Ejercicio 3

Hemos preguntado a una serie de familias el número de varones y mujeres que tienen por hijos obteniendo los siguientes resultados:

  • \(X: \) número de varones
  • \(Y: \) número de mujeres

\[
\begin{array} {|c|c|c|c|c|}
\hline
\bf{X/Y}&\bf{0}&\bf{1}&\bf{2}&\color{red}{\bf{n_i}}\\
\hline
\bf{0}&2&1&2&\color{red}{\bf{5}}\\
\hline
\bf{1}&4&3&0&\color{red}{\bf{7}}\\
\hline
\bf{2}&2&2&1&\color{red}{\bf{5}}\\
\hline
\bf{3}&1&2&0&\color{red}{\bf{3}}\\
\hline
\color{red}{\bf{n_j}}&\color{red}{\bf{9}}&\color{red}{\bf{8}}&\color{red}{\bf{3}}&\color{red}{\bf{20}}\\
\hline
\end{array}
\]

  1. ¿Cuántas familias hemos encuestado?
  2. ¿Cuántas familias solo tienen varones?
  3. De las familias con un varón, ¿qué porcentaje tienen una mujer?

Importante

En una variable bidimensional (X,Y), cada una de las variables por separado (X) e (Y) constituyen variables unidimensionales estadísticas. A estas variables se les conoce como marginales.

Las distribuciones marginales de las variables estadísticas X e Y se obtienen a partir de la tabla de doble entrada considerando una sola variable.

  • Para la distribución marginal de X tomamos la primera y última columnas de la tabla de doble entrada.
  • Para la distribución marginal de Y tomamos la primera y última filas de la tabla de doble entrada.

De esta forma, podemos calcular sus medias y sus desviaciones típicas, como hacíamos en el tema anterior.

Ejercicio 4

Responde a las siguientes preguntas en el ejercicio anterior:

  1. ¿Qué media de varones tienen estas familias?
  2. ¿Cuál es la media de hijas?