Translate

domingo, 3 de junio de 2012

Distribución Poisson




Es una distribución de probabilidad que muestra la probabilidad de x ocurrencias de un evento en un intervalo especificado de tiempo o espacio.


Las propiedades de un experimento de Poisson son:

  • La probabilidad de una ocurrencia es igual en dos intervalos cualesquiera de igual longitud.
  • La ocurrencia o no ocurrencia en cualquier intervalo es independiente de la ocurrencia o no ocurrencia en cualquier otro intervalo.


Se puede usar esta distribución de probabilidad como una aproximación de la distribución binomial cuando p= la probabilidad éxito, es pequeña y n = la cantidad de intentos, es grande. 

Tan sólo se iguala a :  






La distribución de Poisson se expresa como: 

x = cantidad de ocurrencia.




Distribución Geométrica y Hipergeométrica

Distribución Geométrica 

En una serie de intentos independientes, con una probabilidad constante p de éxito, sea la variable X el número de ensayos realizados hasta la obtención del primer éxito. Una característica de esta distribución es que carece  de memoria,  es decir, se puede empezar a contar en cualquier ensayo o intento hasta obtener el éxito. Se halla con la siguiente formula : 




  • Valor Esperado y Varianza 



Distribución Hipergeométrica 

Está estrechamente relacionada con la distribución de probabilidad binomial. La diferencia entre ambas está en la independencia de los intentos y en que la probabilidad de éxito cambia de uno a otro. Se usa para calcular la probabilidad de que una muestra aleatoria de n artículos seleccionados sin reemplazo, obtengamos x elementos identificados como éxitos, y n-x como fracasos. Para que suceda esto debemos obtener x éxitos de los r de la población, y n-x fracasos de los N-r de la población.





Distribución Binomial y Binomial Negativa



Distribución Binomial 

Cantidad de resultados experimentales con exactamente x éxitos en n intentos.Es una distribución discreta de probabilidad conocida por sus variadas aplicaciones que se relaciona con un experimento de etapas múltiples


- Un experimento binomial tiene cuatro propiedades:

  1. El experimento consiste en una sucesión de n intentos idénticos
  2. En cada intento son posibles 2 resultados. Éxito o Fracaso
  3. La probabilidad de éxito, representado por p, no cambia de un intento a otro. En consecuencia, la probabilidad de fracaso, (1-p), no cambia de un intento a otro. Supuesto de estacionariedad
  4. Los intentos son independientes
La fórmula de combinatoria de n objetos seleccionados en un grupo proporciona la cantidad de resultados experimentales que resultan en x éxitos. También es necesario conocer la probabilidad asociada a cada uno de los resultados experimentales el cual se puede determinar a través de la siguiente relación . 
                                                           

Expresión para hallar la distribución binomial : 


P = probabilidad de un exito en cualquier intento 
(1 - p) =  probabilidad de fracaso en cualquier intento 


  • Valor Esperado 



  • Varianza 




Distribución Binomial Negativa 

En una serie de intentos independientes con una probabilidad constante de éxito p, sea la variable aleatoria X en número de ensayos efectuados hasta que se tienen r éxitos. 





Una variable binomial negativa es un conteo del número de ensayos necesarios para obtener r éxitos. Es decir, el número de éxitos está predeterminado y lo aleatorio es el número de ensayos.


  • Valor Esperado  y Varianza







Distribuciones Discretas de Probabilidad


  • Variables Aleatorias : Es una descripción numérica del resultado de un experimento aleatorio. De acuerdo a lo anterior las podemos clasificar como discretas o continuas. Las discretas son variable aleatorias con un rango finito ( o infinito contable). Las continuas son variables que pueden asumir cualquier valor en un intervalo o conjunto de intervalos. Una forma de determinar si una variable es continua o discreta es imaginarse que los valores de esa variable son los puntos en una recta numérica.

  • Distribución de Probabilidad : La distribución de una variable X se define como una descripción del conjunto de valores posibles de X, junto con la probabilidad asociada con cada uno de estos valores. Para una variable aleatoria discreta la distribución de probabilidad se describe mediante una función de probabilidad, representada por f(x). Donde  esta función define la probabilidad de cada valor de la variable analizada
                                                       

  • Función de probabilidad uniforme discreta : Es la representación más sencilla de distribución de probabilidad, se define como:
                                                         f (x) = x /n 



  • Valor esperado de una variable aleatoria discreta : Es una medida de localización central de una variable aleatoria. Es un promedio ponderado de los valores que puede tener una variable en donde los factores de ponderación son las probabilidades y se expresa de acuerdo a: 




  • Varianza de una variable aleatoria discreta : Es una medida de dispersión o variabilidad y corresponde a promedio ponderado de las desviaciones de una variable aleatoria respecto a su promedio, elevadas al cuadrado.







Teorema de Bayes

Expresa la probabilidad condicional de un evento aleatorio A dado en B , en términos de la distribución de la probabilidad condicional del evento B dado A y la distribución marginal de solo A vincula la probabilidad de a dado B con la probabilidad de b dado A. 

A partir de que ha sucedido B deducimos la probabilidad del suceso A. Sea { A1, A3 ,........, Ai ,..... ,Am} un conjunto de sucesos mutuamente excluyentes tales que la probabilidad de cada uno de ellos es distinta a 0 . Sea que b un suceso cualquiera del que se conoce las probabilidades.

                                                                 P ( B/A)

Entonces la probabilidad de Ai dado B esta denotada por la expresión :



 Ejemplo : tres maquinas A, B, C producen un 38% , 31% y 31% de la producción total de una empresa respectivamente , se ha detectado que un 12% , 7% y 2,6% del producto manufacturado por estas maquinas es defectuoso. Sea seleccionado un producto al azar y se encuentra defectuoso. Cual es la probabilidad de que haya sido elaborado en la maquina C ? 



  P= ( 0,38) (0,12) + (0,31) ( 0,07) + ( 0,31) ( 0,026) = 0,0754  = 7, 54 %
  probabilidad de que cualquier maquina haga un producto defectuoso.


Probabilidad de que la maquina C , elabore un producto defectuoso .







Probabilidad Condicional

Cuando la probabilidad de ciertos eventos dependen o se ve influenciada por la ocurrencia de otros a la probabilidad que un evento B sede cuando se sabe que algún otro evento A sea presentado . La probabilidad condicional se denota :

          P ( B / A )  --> probabilidad de B cuando a ocurrido A.

Para cualquier evento o suceso B se tiene :










               

Permutaciones y Combinaciones


  • Permutación :  Permite calcular el número de resultados experimentales, permitiendo su repetición en diferente orden. Es cuando se selecciona N objetos de un conjunto de n .

                  ! = faltorial  
                  3! = 3*2*1
                  0! = 1 


  • Combinación : Arreglo de los elementos. Se define como el número de combinaciones de N objetos de n en n. 


Ejemplos :  Se tiene  A , B , C , D y se desea combinarlas de 2 en 2 . Cuantas combinaciones se pueden hacer ? 







Probabilidad y Diagrama de Árbol


  • Espacio Muestral : Es el conjunto de todos los resultados posibles de un experimento estadísticos , se representa por medio del símbolo S.  A cada resultado en un espacio Muestral se le llama elemento o punto Muestral, se puede  en listar  cada uno de los puntos maestrales en llaves separadas por comas.

     Ejemplo: 
    - Lanzamiento de un moneda            
                                       S= {C,S}  donde C es cara y S es sello


En estadística se puede manejar datos experimentales que representan conteos o mediciones o datos categóricos que se puedan clasificar dentro de algún criterio. 
  • Observación : Cualquier registro de observación ya sea experimental o categórico.
         
En el lanzamiento de una amoneda al aire existen solo dos resultados posibles CARA o SELLO y la observación de un lanzamiento solo permitira uno de ellos cara o sello. al lanzarla varias veces tendremos diferentes observaciones y un conjunto completo de las posibilidades de los lanzamientos.


  • Diagrama de Árbol : Es una representación que nos permite visualizar todos los elementos del espacio Muestral. 



 
  • Evento: Es un subconjunto de un espacio muestral. es una coleccion de espacios muestrales. 
  • Probabilidad de un evento : Es igual a la suma de las probabilidades de los puntos muestrales que forman el evento. 

  • Esperanza de Probabilidad : Es el número E(X) que formaliza la idea de valor medio de un fenómeno aleatorio. 
                                                                   E = n*p   

          Ejemplo : 
En el lanzamiento de 900 veces de 2 dados cual es la esperanza que el valor de la suma de   sus caras sea un valor menos que 6 . 
               
                   n = 900 
                   p = 10 / 36  --> probabilidad 

                                                  E =  900 * ( 10 / 36 )  = 250 







Tabulación Cruzada y Paradoja de Simpson


  • Tabulación Cruzada : Es un método de resumir datos que brinda información de dos variables diferentes ( cualitativa - cuantitativa ) en un mismo momento por medio de una tabla , el análisis de las variables se realiza por fila y columna.La información porcentual que arroja la tabulación cruzada se gráfica en torta - pie. A continuación un pequeño ejemplo básico.



  • Paradoja de Simpson : Conclusiones que se obtienen  a partir de dos o más tabulaciones cruzadas y que se invierten cuando se agregan los datos en una sola tabulación cruzada.

sábado, 2 de junio de 2012

Medidas De Asociación

Son aquellas que nos permiten evaluar la relación entre dos variables  independientes entre si. Para ello tenemos las siguientes medidas: 


  • Covarianza : Es una medida de asociación lineal entre 2 variables.

Muestral


Poblacional





  • Coeficiente de correlación : Mide la relación lineal de 2 variables.
Muestral


Poblacional



  • Diagrama de Dispersión : Es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de 2 variables y observar gráficamente la correlación entre las dos. 





  • Recta de Regresión : Se utiliza para hallar valores de Y a partir de los valores de X. Se halla con la siguiente ecuación : 





                           

Diagrama de Caja

Un diagrama de caja es un resumen gráfico  de los datos con base en el resumen de cinco números para hallarlos es necesario ordenar los datos de menor a mayor.

  • Resumen de cinco números 
             1. Dato menor
             2. Cuartil 1 (Q1)
             3. Cuartil 2 (Q2) = Mediana
             4. Cuartil 3 ( Q3)
             5. Dato mayor

Para gráficar el diagrama de caja se debe hallar el IQR ( rango intercuartilico) y los limites superior e inferior, ademas del resumen de los cinco números.

                           IQR = Q3 - Q1
                             
                              LI = Q1 - 1.5 * ( IQR)
                               
                              LS = Q2 + 1.5 * ( IQR)






Puntos Z y Teorema de Chebyshev


  • Puntos Z : Permiten conocer que tan lejos de la media se encuentra un valor determinado a  partir de la media y la desviación estándar. el punto Z sirve para hallar el area bajo la curva de la campana de Gauss 

  • Teorema de Chebyshev : Permite determinar que proporción de los valores que se tienen en los datos debe estar dentro un determinado número de desviaciones estándar de la media.
Debe ser un valor mayor que  1.

Medidas de Variabilidad y Campana de Gauss


Llamadas medidas de variabilidad o dispersión nos ayudan a determinar la variación de los datos y determinan como se agrupan o se dispersan los datos al rededor de un promedio.

  • Rango Intercuartilico: Representa el 50% de los datos de una muestra.
                                               IQR = Q3 - Q1 

  • Varianza :  Sirve para comparar la varibilidad de 2 ó más variables. 
  1. Muestral 



      2. Poblacional 


 

  • Desviación Estándar : Se utiliza para hallar el desplazamiento máximo de tres desviaciones hacia la izquierda y hacia la derecha de la media para gráficar la campana de Gauss. 
  1. Muestral    

      2. Poblacional 



Campana de Gauss

En la campana de Gauss se pueden observar con más exactitud  la amplitud o limites de los datos.La campana contiene el 99% de los datos.

  • Regla Empírica : Nos muestra el porcentaje de datos que se encuentran en cada desviación.
                                            1. primera desviación : 65%
                                            2. segunda desviación : 95% 
                                            3. tercera desviación : 99%



Medidas de Localización

Las  medidas de localización para una variable son como su nombre lo indica , busca localizar los datos dentro de la muestra.
  • Media : es un promedio de los datos a estudiar. se halla con la siguente formula dependiendo si es una variable discreta o continua.

  1. Variable discreta:  




        2.  Variable continua :
           
               



  • Mediana :  es la que localiza el dato centra de lamuestra que tambien es el cuartil 2 ( Q2).se halla organizando los datos si el numero de datos es impar se toma el numero que este en todo el centro , pero si por lo contrario el numero de datos es par se toman los dos numeros del centro y se suman y se dividen por 2 .
              Ejemplo : 1,2,3,4,5 -->  la mediana sera 3
                             1,2,3,4,5,6 -->   la mediana sera igual a  3+4 = 7 / 2 = 3,5


  • Moda : Son las veces que se repite un dato dentro de la muestra, se puede distingir 4 tipos de moda.
  1.  Amodales: ningun dato se repite
  2. Modales : repetición de un dato 
  3. Bimodales : repetición de dos datos 
  4. Multimodales : repetición de tres datos o más 


  • Percentiles : Los datos son divididos en 100 partes.
  • Deciles: Se dividen los datos de 10 en 10 ( pedazos ) 
  • Cuartiles:  Los datos son divididos en grupos de 25 
                   Los tres anteriores se hallan con la siguiente formula :

                             

                  

                   



VARIABLES


  • VARIABLE DISCRETA : Es  la que puede tomar solo un valor , no permite valores intermedios. Ejemplo: el numero de hijos 2 , 3 ,5 , 6 ,....

  • VARIABLE CONTINUA :  Puede tomar valores intermedios entre números, se observan por intervalos . Ejemplo: la estatura  1.60 , 1.65 , 1.70 ,.....

  • DATOS : Son cifras , hechos , informaciones que se recogen para analizarlos y entregar resultados, podemos encontrar datos cualitativos y datos cuantitativos.
  1. DATOS CUALITATIVOS : Son los datos que muestran características, no numéricas  y posee una escala de medición nominal. por ejemplo : soltero, casado , divorciado , viudo,.....
  2. DATOS CUANTITATIVOS : Son aquellos datos que son numéricos y contables, posee una escala de medición ordinal , de razón o de intervalos.

                                                                                                       

viernes, 11 de mayo de 2012

Origenes de la Esatadistica

El término alemán Statistik, introducido originalmente por Gottfried Achenwall en (1749), se refería al análisis de datos del Estado, es decir, la "ciencia del Estado" (o más bien, de la ciudad-estado). También se llamó aritmética política de acuerdo con la traducción literal del inglés. No fue hasta el siglo XIX cuando el término estadística adquirió el significado de recolectar y clasificar datos. Este concepto fue introducido por el militar británico Sir John Sinclair (1754-1835).Los censos comenzaron a suministrar información regular acerca de la población de cada país. Así pues, los datos estadísticos se referían originalmente a los datos demográficos de una ciudad o estado determinados. Y es por ello por lo que en la clasificación decimal de Chester Dewey empleada en las bibliotecas, todas las obras sobre estadística se encuentran ubicadas al lado de las obras de o sobre la demografía.
Se utilizaban representaciones gráficas y otras medidas en pieles, rocas, palos de madera y paredes de cuevas para controlar el número de personas, animales o ciertas mercancías. Hacia el año 3000 a. C. los babilonios usaban ya pequeños envases moldeados de arcilla para recopilar datos sobre la producción agrícola y de los géneros vendidos o cambiados. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XI a. C. Los libros bíblicos de Números y Crónicas incluyen en algunas partes trabajos de estadística. El primero cona están ubicadas al lado de las demográficas.adístictiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 a. C. Los antiguos griegos realizaban censos cuya información se utilizaba hacia el 594 a. C. para cobrar impuestos.


Estadistica  - (  Statistik )


La estadística es una ciencia que se encarga de analizar e interpretar datos recolectados.El objetivo de la estadística es entregar la descripción de los datos recolectados por medio de gráficos que se emplean para explicar comportamientos o fenómenos que ayudan a una toma de decisiones. 
La estadistica se divide en dos grandes areas: 

  • Estadística Descriptiva: Es el estudio que incluye la obtención, organización, presentación y descripción de información numérica. se dedica a analizar y representar los datos.  

  • Estadística Inferencial : es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones en base a una información parcial o completa obtenida mediante técnicas descriptivas.