lunes, 17 de marzo de 2008

ESTADISTICA






ESTADISTICA
La estadística es una ciencia matemática que se refiere a la recolección, estudio e interpretación de los datos obtenidos en un estudio. Es aplicable a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, ciencias de la salud como la Psicología y la Medicina, y usada en la toma de decisiones en áreas de negocios e instituciones gubernamentales.

COMENTARIO
Por medio de la estadistica nosotros podremos clasificar,cuautificar, tabular y organizar cualquier dato que sea cualitativo o cuantitativo y lograremos obtener una respuesta concret a cualquier problema de investigacion y que requiera de metodos estadisticos para poder realizarlo.
VARIABLE
Una variable es un simbolo que representa un elemento no especificado de un conjunto dado. Dicho conjunto es llamado conjunto universal de la variable o universo de la variable, y cada elemento del conjunto es un valor de la variable. Sea x una variable cuyo universo es el conjunto {1,3,5,7,9,11,13}; entonces x tiene los valores 1,3,5,7,9,11,13. En otras palabras x puede reemplazarse por cualquier entero positivo impar menor que 14. Por esta razón, a menudo se dice que una variable es un reemplazo de cualquier elemento de su universo.

COMENTARIO:
Es la representacion cuantificable de algun elemento, al cual se le estudiaria para poder darle una respuesta.
VARIABLE CUALITATIVA:
Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores.

COMENTARIO:
Por medio de esta variable se podra estudiar las cualidades de algun objeto o elemento, y asi se podra saber que caracteristicas diferencian un objeto de otro, comol por ejemplo hombre y mujer entre sexo masculino y fenmenino.

1. Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve, moderado, grave

COMENTARIO:
Esta clase de variable nos sirve para ponerle orden a los datos del problema que estamos estudiando y asi nos sera mas facil comprender cada dato.

2. Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia.

COMENTARIO:
En esta variable lo unico que puede hacerse es establecer frecuencias en cada atributo y la igualdad o desigualdad entre los diferentes datos o verificar que grupo es el que tiene mayor frecuencia que es la moda.
VARIABLE CUANTITATIVA:
Aquella que se puede medir y se expresa numéricamente. Estos números reciben el nombre de datos.

COMENTARIO:
Esta clase de variables representa los datos en forma numerica y esta clase de variables es la mas conveniente para realizar cualquier problema cuantificable

Discretos: toman un número determinado de valores.

COMENTARIO
En esta clase de variables los datos tienen que ser concretos, que realmente se puedan contar y se puedan estudiar adecuadamente.

Continuo: Pueden tomar cualquier valor comprendido entre dos valores dados. Estos datos se agrupan en intervalos.

COMENTARIO:
Son aquellos datos que tienen un valor infinito y pueden tomar valor desde cualquier infinidad de valores.

CODIFICACIÓN
El objetivo de este procedimiento es agrupar numéricamente los datos que se expresen en forma verbal para poder luego operar con ellos como si se tratara, simplemente, de datos cuantitativos. Para lograrlo se habrá de partir de un cúmulo de informaciones que tengan una mínima homogeneidad, lo cual es necesario para poder integrarlas. Pueden tratarse de cientos de respuestas a una misma pregunta o de una variedad de posibles situaciones observadas mediante un mismo ítem de una pauta de observación: en ambos casos existirá una determinada variedad de respuesta o de observaciones que presenten las elecciones o los comportamientos de los objetos de estudio. Ejemplo:


COMENTARIO:

La codificacion nos sirve mas que todo para tranaformar datos o numeros con decimales a enteros o tambien se pueden hacer de forma inversa.

DIAGRAMA DE TALLOS Y HOJAS:

Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada observación a lo largo del eje horizontal.

Ejemplo. Considere los siguientes números: 65, 57, 79, 69, 53, 63, 71. Los tallos serán las decenas, y las ramas serán las unidades, de la siguiente manera
Tallo Rama Frecuencia

5 73 2
6 593 5
7 91 3
Total 7

NOTACION SUMATORIA

Una sumatoria nos permite representar sumas muy grandes, de n sumandos o incluso sumas infinitas y se expresa con la letra griega sigma( Σ ) .

Una sumatoria se define como:




CONCEPTOS ESTADISTICOS

1. ESTADISTICA: La estadistica nos sirve para cuantificar hechos o datos y por medio de esto sacar conclusiones sobre esta. ya que la estadistica contiene metodos y pasos que nos ayudan a determinar y sacar conclusiones sobre el problema.

2. INDIVIDUO O UNIDAD ESTRATEGICA: Es cualquier elemento de una poblacion que va a ser estudiado, este elemento puede ser una persona, o algun objeto del cual se quiere obtener informacion.

3. POBLACION: Es el grupo colectivo que se desea estudiar y en donde sacaremos una muestra para poder estudiarla y analizarla mejor.

4. MUESTRA: Es lo que sacaremos de la poblacion para estudiarla y obtener conclusiones sobre la poblacion por medio de esta.

5. PARAMETRO: Es la cantidad de la variable a la cual le podemos asignar un valor numerico.

6. ESTIMADOR O ESTADISTICO: Es algun dato del cual queremos estimarle un valor. Por medio de esto lo evaluaremos y le encontraremos un valor representativo.

7. VARIABLE: Es alguna caracteristica que puede variar segun su valor.

7.1 VARIABLE CUANTITATIVA: Son todos los datos que pueden ser representados numericamente.

7.2 VARIABLE CUALITATIVA: Estas variables no se pueden representar numericamente sino por medio de caracteristicas cualitativas que denotan a un dato.

8. VARIABLE CUANTITATIVA DISCRETA: Es aquella variable con un dato numerico concreto y no contiene mas.

9. VARIABLE CUANTITATIVA CONTINUA: Son aquellos datos que poseen un valor numerico infinito y por eso se denominan continuas.

10. ESCALAS DE MEDICION: Las escalas de medicion son aquellas que nos sirven para poder ordenar las caracteristicas cualitativas o cuantitativas de un dato.

10.1 ESCALA NOMINAL: Esta escala nos sirve para darle un nombre a los datos y ordenarlos.

10.2 ESCALA ORDINAL: Por medio de esta escala, nosotros ordenamos los datos y les asignamos nombres.

11. INFORMACION CUANTITATIVA: Tal y como el nombre lo designa, la informacion cuantitativa no es mas que la informacion que nosotros encontramos de forma numerica o cuantificable.

11.1 ESCALA DE RAZON: Esta escala nos permite ver la relacion que hay entre los datos, ademas de darles nombres, diferencias y orden.

11.2 ESCALA DE INTERVALO: Esta escala nos hace ver las diferencias que existen entre los datos dados y asi como las demas escalas asigna nombres y orden.

12. ESTADIGRAFO: Es aquella variable que nos explica las distribuciones que se dan entre los datos cuantitativos o cualitativos y asi poder entender mejor el problema y sacar conclusiones al respecto.

MEDIDAS DE TENDENCIA CENTRAL

MEDIA: La media o promedio, de una cantidad finita de números, es igual a la suma de todos ellos dividida entre el número de sumandos. Es uno de los principales estadísticos muestrales.


COMENTARIO: como lo indica el concepto anterior es el promedio de una distribucion de datos ya sea simples o agrupadas.

MODA: Es el dato que más se repiten en la cuenta. Si existen dos datos que se repite un numero igual de veces entonces el conjunto será bimodal. Ejemplo:
Numero de personas en distintas casas en una villa:
5-7-4-6-9-5-6-1-5-3-7
en este caso el numero que más se repite es 5 entonces la moda en este caso es 5.

COMENTARIO: la moda es el dato que mas se repite en una distribucion de frecuencias.

MEDIANA: definiremos como mediana al valor de la variable que deja el mismo número de datos antes y después que él.

COMENTARIO: practicamente la mediana es el centro de toda distribucion de frecuencias.

MEDIA CUADRATICA: La media cuadrática es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre el número de datos:


COMENTARIO: Por medio de esta podremos calcular cual es el promedio de los numeros cuadrados.

MEDIA GEOMETRICA: La 'media geométrica' de una cantidad finita de números (digamos 'n' números) es la raíz n-ésima del producto de todos los números.












COMENTARIO: por medio de esta podremos encontrar respuesta a valores que sean infinitos.

MEDIA ARMONICA:La media armónica , representada por H, de una cantidad finita de números es igual al recíproco, o inverso, de la media aritmética de los recíprocos de dichos números
Así, dados los números a1,a2, ... , an, la media armónica será igual a:




MEDIDAS DE DISPERSION

DESVIACION MEDIA: La desviación media es la media de las diferencias en valor absoluto de los valores a la media.

COMENTARIO: La desviacion media nos sirven para ver que tan dispersos estanlos datos con respecto a la media.

DESVIACION ESTANDAR O TIPICA: La desviación estándar (o desviación típica) es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.

COMENTARIO: Al igual que la desviacion media la desviacion estandar nos sirve para verificar que tan dispersos estan los datos a la media o cualquier otro objeto.

MEDIDAS DE POSICION

CUARTILES: Dados una serie de valores X1,X2,X3...Xn ordenados en forma creciente,
Definimos:
Primer cuartil (Q1) como la
mediana de la primera mitad de valores.
Segundo cuartil (Q2) como la propia mediana de la serie.
Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.
En
estadística descriptiva Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la
mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.

COMENTARIO: Los cuartiles lo utilizamos para verificar en que lugar se encuentra el dato con respecto a la media.

PERCENTILES:
Se representan con la letra C.
Es el percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que él y el 100-i % restante son mayores.
Cuando los datos no están agrupados en intervalos los cuartiles, así como el resto de las medidas de posición, tienen un valor claro. Sin embargo, cuando tenemos una agrupación de los datos ya no es tan sencillo realizar el cálculo. Sí que resulta claro ver en cuál de los intervalos está el cuartil (quintil, decil o percentil) buscado, pero para calcular su valor exacto necesitaremos usar una fórmula.

COMENTARIO: Los percentiles al igual que los cuartiles nos sirven para ver en que lugar se encuentra la respuesta del dato estudiado.

MEDIDAS DE ASIMETRIA

SESGO: un sesgo es un error que aparece en los resultados de un estudio debido a factores que dependen de la recogida, análisis, interpretación, publicación o revisión de los datos que pueden conducir a conclusiones que son sistemáticamente diferentes de la verdad o incorrectas acerca de los objetivos de una investigación. Este error puede ser sistemático o no, y es diferente al error aleatorio.

COMENTARIO: El sesgo nos permite ver que grado asimetrico tienen los datos, pueden sen negativos o positivos.

CURTOSIS: En teoría de la probabilidad y estadística, la curtosis es una medida de lo "picudo"(concentrada entorno a la media) de la distribución de probabilidad de una variable aleatoria de número real. Una mayor curtosis implica que la mayor parte de la varianza es debida a desviaciones infrecuentes en los extremos, que se oponen a desviaciones comunes de medidas menos pronunciadas.

COMENTARIO: La curtosis se utiliza para describir que altura obtienen los datos con respecto a la media y si son leptocurticos, mesocurticos o platicurticos.

ESCALA DE LIKERT

La escala de Likert es una escala ordinal y como tal no mide en cuánto es más favorable o desfavorable una actitud, es decir que si una persona obtiene una puntuación de 60 puntos en una escala, no significa esto que su actitud hacia el fenómeno medido sea doble que la de otro individuo que obtenga 30 puntos, pero sí nos informa que el que obtiene 60 puntos tiene una actitud más favorable que el que tiene 30, de la misma forma que 40°C no son el doble de 20°C pero sí indican una temperatura más alta.
A pesar de esta limitación, la escala Likert tiene la ventaja de que es fácil de construir y de aplicar, y, además, proporciona una buena base para una primera ordenación de los individuos en la característica que se mide.


COMENTARIO: La escala de likert nos servira para comprobar que tan deacuerdo o desacuerdo estan las personas con respecto a un item de un problema estudiado, esto lo haran respondiendo cada item descrito en el diagrama de likert al cual a cada uno de estos se le asignara una puntuacion que calificara por medio de las respuestas que ellas contengan.

DIAGRAMA DE CAJAS

Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.
Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente.



COMENTARIO: El diagrama de cajas se utiliza para verificar que tan dispersos se encuentran los datos, que grado de asimetria contienen, para esto se utilizan los cuartiles 1,2 y 3 y aqui se comprueba cual es el centro de la distribucion de datos.

DIAGRAMA DE PUNTOS

El diagrama de puntos resulta de utilidad cuando el conjunto de datos esrazonablemente pequeño o hay relativamente pocos datos distintos. Cada dato se representa con un punto encima de la correspondiente localización en unaescala horizontal de medida. Cuando un valor se repite, hay un punto por cadaocurrencia y se colocan verticalmente. Permite por ejemplo analizar la dispersióny detectar datos atípicos.



COMENTARIO: El diagrama de puntos nos sirve para organizar y clasificar los datos o distribuciones de datos y poder comprender mejor el problema estudiado, los datos se ordenan y el dato repitente se le coloca un punto encima.