jueves, 25 de noviembre de 2010

EJERCICIO PARA DATOS NO AGRUPADOS

1.- Se realizo una encuesta al grupo 504 de la Escuela Constitución de 1917 acerca  del color preferido, se obtuvo lo siguiente: Amarillo 3, azul 8, negro 6, rojo 2, rosado 4  y verde 5. Encuentra las medidas de tendecia central y las de variabilidad.


Ø  MEDIDAS DE TENDENCIA CENTRAL


Ø  MEDIDAS DE VARIABILIDAD




EJERCICIO DE DATOS AGRUPADOS

1.-  Los siguientes datos representan la edad de los estudiantes del primer nivel de una Escuela de Idiomas. Calcula las medidas de tendencia central y las de variabilidad, realiza la gráfica.

Ø  MEDIDAS DE TENDENCIA CENTRAL


Ø  MEDIDAS DE VARIABILIDAD







Tabla 1 Edad de estudiantes de primer nivel de una Esc. De Idiomas


FORMULARIO

MEDIDAS DE VARIABILIDAD

MEDIDAS DE VARIABILIDAD: RANGO VARIANZA Y DESVIACION ESTANDAR
Las medidas de variabilidad o de dispersión, indican ciertos aspectos del conjunto de datos que no nos lo dicen las medidas de tendencia central. Se emplean para ubicar el centro de un conjunto de datos, pero con frecuencia resulta importante describir la manera en que los datos están diseminados o dispersos, a cada lado del centro. A esta diseminación se le conoce como variación o dispersión.
Variación o dispersión pequeña: Indica un alto de homogeneidad en los datos, mientras que una variación grande indica poca homogeneidad.
Existen varias medidas de variabilidad que son:
1.      Rango
2.      Varianza
3.      Desviación estándar.

CALCULO DE LAS MEDIDAS DE VARIABILIDAD PARA DATOS NO AGRUPADOS

  • RANGO
Se calcula hallando la diferencia entre los valores máximo y mínimo.
Rango = R = Valor máximo – Valor mínimo
Una de las ventajas es la facilidad con la que se calcula; no obstante, es poco utilizada debido a que, es muy influenciable por la presencia de valores extremos de poca frecuencia, lo que conduce a apreciaciones erróneas ya que por lo general se piensa que cuanto mayor es el rango, mayor es la dispersión de los datos.
  • DESVIACION ESTANDAR:
Medida de variabilidad mas adecuada por sus propiedades algebraicas, se le conoce también como desviación típica.
Se utilizan para valorar la diferencia entre un dato y el valor de la media de conjunto de datos. Si el valor del dato es menor que la media, la diferencia entre el dato y su media, es decir, su desviación, resulta negativa. Para el concepto de desviación no interesa su signo, sino su valor absoluto.
Se calcula con la siguiente formula:  
      Donde:

    X = Valores de los datos
 = Media
    n = Numero de datos.

  • VARIANZA:
Medida de variabilidad que se obtiene elevando al cuadrado la desviación estándar. Se simboliza con S2.
Nota: La desviación estándar para datos agrupados se obtiene con la misma formula de los datos no agrupados; solo que X es la marca de clase del intervalo.




MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL

Son llamadas así, por que tienden a localizarse en el centro de la información (medidas de posición); sirven para resumir todo un conjunto de valores.

Las principales medidas de tendencia central son: Media, mediana y moda.

CALCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS.

  • MEDIA
Se representa  también se le llama promedio. Se define como un conjunto de valores que es igual a la suma de dichos valores dividida entre el número de ellos. Su formula es:


Solo se utiliza cuando las variables son cuantitativas, en medidas, en escalas de intervalo o bien de razón.

  • MEDIANA

Valor que divide al grupo de datos en dos partes iguales, 50% por debajo de el y el otro 50% por arriba del mismo. Se representa con el símbolo Me. Su procedimiento es:

1.- Se ordenan los datos de menor a mayor.
2.- Se identifica el valor que se ubique en medio de los datos.

Existe una formula para conocer la posición de la mediana, la cual es útil cuando el numero de datos n es muy grande. La formula es la siguiente:


Donde:

PMe = posición de la mediana.

n = numero de datos.

Es importante saber que esta formula nos indica el lugar que ocupa la mediana dentro de los datos ya ordenados de menor a mayor; sin embargo no calcula, de manera directa el valor de la misma.

Se utiliza solo cuando se trata de variables medidas en la escala ordinal, de razón o intervalo.

  • MODA
Dato o valor de la variable que ocurre con mayor frecuencia. El símbolo que se utiliza es Mo.

Puede haber casos en los que dos datos tengan la misma frecuencia y esta sea la mas alta, entonces se dice que es bimodal. Si fueran tres o más datos los que presentan dicha característica, se dice que el conjunto es multimodal. Por otro lado, cuando ningún dato se repite, se considera que no hay moda.

Procedimiento.

1.- Organiza los datos en una tabla de frecuencias simple.
2.- Identifica el dato con mayor frecuencia y este será la moda.

El valor de la moda lo encontramos dentro de los valores de la variable. Es más fácil de reconocer en gráficos.

La moda puede hallarse cuando se trata de variables medidas en cualquier escala: Nominal, ordinal, de intervalo o de razón. En general la moda es el estadístico de tendencia central menos utilizada por que tiene un alcance informativo limitada, además de que puede existir más de una moda o bien ninguna.
  • MARCA DE CLASE

Valor que está justo en medio del mismo y se obtiene promediando los limites del intervalo es decir sumándolos y dividiendo el resultado entre dos. Su formula es:


Donde:

MC= Marca de clase.
LI= Limite inferior.
LS= Limite superior.

Así, la MC del intervalo 11-20 es:

MC  = (11 + 20)/2 = 31/2 = 15.5

  • LIMITES REALES
Se obtienen de restar y sumar media unidad a los límites inferior y superior del intervalo.
Así, los limites reales del intervalo 11-20 son:

LRI= 11-0.5 = 10.5
LRS= 20+0.5 = 20.5

  • AMPLITUD O ANCHURA DEL INTERVALO

Tamaño del intervalo, se calcula obteniendo la diferencia entre los límites reales del intervalo.

Amplitud o anchura del intervalo: a = LRS - LRI

Amplitud del intervalo 11-20 es:

a = 20.5 - 10.5 = 10

  • ASIMETRIA POSITIVA:

Cuando la mayor parte de los datos se concentra en los valores menores (hacia la izquierda) del eje horizontal.

  • ASIMETRÍA NEGATIVA:

La mayor parte de los datos se concentra en los valores mayores (hacia la derecha) del mismo.
  • COEFICIENTE DE ASIMETRÍA:

Es positivo cuando la forma del histograma presenta una asimetría positiva; es negativo cuando la asimetría es negativa y es cero cuando la forma es simétrica. Se dice que es una medida de forma por que está asociado con características geométricas del comportamiento de los datos, en este caso con la simetría.