domingo, 24 de junio de 2012

Media y desviación estándar de una variable aleatoria discreta.


Consideremos de nuevo el número de puntos que se obtiene al tirar dos dados. La distribución de probabilidad de esta variable aleatoria está dada por la siguiente tabla.
Si el par de dados se tira  muchas veces, ¿cuál será el promedio de puntos que obtengamos? Si pensamos en las probabilidades como la proporción  de veces  que los dados producen los diferentes puntos, entonces esperamos obtener 2 puntos un treintaiseisavo de las veces, tres puntos  dos treintaiseisavos de las veces, etc. Así, el promedio de puntos o valor esperado de puntos es

$2\cdot{\frac{1}{36}}$ +$3\cdot{\frac{2}{36}}$+$4\cdot{\frac{3}{36}}$
+$5\cdot{\frac{4}{36}}$+$6\cdot{\frac{5}{36}}$+7$\cdot{\frac{6}{36}}$
+$8\cdot{\frac{5}{36}}$+$9\cdot{\frac{4}{36}}$+$10\cdot{\frac{2}{36}}$+$11\cdot{\frac{2}{36}}$+$12\cdot{\frac{1}{36}}$=7
Este valor esperado representa el promedio de puntos  que a la larga se obtienen tirando los dados. En general, si una variable  aleatoria toma los valores $ x_1,x_2,x_3,...x_k, $ con probabilidades f($ x_1$), f($ x_2$),f($x_3$),…,f($x_k$), su valor esperado es
$ x_1f(x_1)+x_2f(x_2)+x_3f(x_3)+...+x_kf(x_k)$
Este valor también conocido como la media de la distribución de probabilidad de la variable aleatoria, que también podemos escribir como
Media de la distribución de probabilidad  $ \mu=\sum{x\cdot{f(x)}}$

Recordemos el ejemplo que vimos  de las probabilidades que considerabauna  empresa de seguros  de recuperar algunos autos de un total deocho autos robados. La media de esta distribución de probabilidad representa  el número esperado de autos que la compañía de seguros espera recuperar. De acuerdo con la fórmula, este número es
$\mu=0\cdot{f(0)}+1\cdot{f(1)}+2\cdot{f(2)}+...+8\cdot{f(8)}=0\cdot{0.001}+1\cdot{0.008}+2\cdot{0.041}+...+8\cdot{0.017}$=4.8


Es  conveniente tener una fórmula que nos ahorre hacer estos cálculos que son un poco tediosos. En el caso de la distribución binomial el valor esperado es sencillo de calcular , puesto que tenemos un total de n ensayos  y cada uno de ellos tiene una probabilidad p de éxtio, de modo que la media de una distribución binomial está dada por
Media de la distribución binomial $\mu =n\cdot{p} $



Es importante señalar que esta fórmula tan sencilla sólo es válida para la distribución binomial. El ejemplo que estudiamos sobre el númerode pacientes que se sometieron a un tratamiento para dejar de fumar y quevuelven a fumar corresponde a una variable binomial con n=7 y p=0.4.Su media es $\mu$= 7 x (0.4)=2.8. Por tanto, para grupos de siete pacientes que toman el tratamiento, en promedio 2.8 de cada grupo de vuelven a fumar.
Desviación estándar de una distribución de probabilidad  $\sigma=\sqrt[]{\sum(x- \mu)^2\cdot{f(x)}}$
Observemos que esta fórmula se parece a la expresión orginal para calcular la desviación estándar de una población con las probabilidades f(x) en lugar de  1/N. La varianza de una distribución de probabilidad se define también como el cuadrado de la desviación estándar. La desviación estándar es una medida de la variabilidad de los valores esperados de la variable aleatoria. La siguiente figura muestra dos distribuciones con misma media pero con diferente desviación estándar.


Calculemos la desviación estándar de la distribución de probabilidad de los autos recuperados. Ya vimos que su media es $\mu$=4.8
Podemos agrupar los cálculos necesarios en la tabla de arriba. La suma de la última columna es la varianza de esta distribución y su desviación estándar es su raíz cuadrada   $\sigma=\sqrt[]{(1.921)}=1.386$. Al igual que  para la media es posible calcular la desviación estándar de una distribución binomial por medio de una fórmula:
Desviación estándar de una distribución binomial  $\sigma=\sqrt[]{np(1-p)}$
En el ejemplo anterior n=8 y p=0.4, entonces podemos calcular la desviación estándar directamente por medio de la expresión $\sigma=\sqrt[]{(8)(0.4)(0.6)}=\sqrt[]{1.92}=1.386$. La diferencia de un milésimo en la varianza (antes de sacar la raíz cuadrada) se debe a las aproximaciones a tres decimales de la primera tabla.


sábado, 23 de junio de 2012

Distribuciones binomiales


Es muy frecuente estar interesados en determinar la probabilidad de  que un evento ocurra x veces de un total de n posibilidades. Por ejemplo, a un analista político le interesa la probabilidad de que al realizar una encuesta de intención de votos x entrevistados de un total de n entrevistados se manifiesten a favor de cierto candidato o partido; a un fabricante de cigarrillos le interesa la probabilidad de que en una muestra de n fumadores, x de ellos prefieran su marca; y a un fabricante le interesa la probabilidad de que al someter a un control una muestra de n productos, x de ellos satisfagan sus normas de calidad.
Basándonos en el lenguaje de los juegos, diremos en general, que estamos  interesados en la probabilidad de obtener x éxitos en n ensayos.
En esta sección estudiaremos problemas que satisfacen las siguientes condiciones:
1. El experimento consiste de n ensayos idénticos.
2. Cada ensayo tiene dos resultados posibles, éxito o fracaso.
3. La probabilidad de éxito en cada uno de estos ensayos es la misma en todos los ensayos, digamos p, por lo que la probabilidad de fracaso es 1-p en todos los ensayos.
4. Los ensayos son independientes.
El número de éxitos  que ocurren bajo estas condiciones es una variable aleatoria que se dice tiene una distribución de probabilidad binomial, o simplemente una distribución binomial.
Es muy importante verificar estas hipótesis cuando deseemos aplicar los métodos de esta sección a alguna situación. Veamos algunos ejemplos.
1. Una galería de arte ofrece un lote de dieciocho cuadros de Picasso. Ellos saben que de estos cuadros cuatro de ellos son copias falsificadas. Un millonario que no conoce de arte compra cinco pinturas del lote. El número de cuadros falsificados que adquiere el millonario no es una variable binomial, pues si bien hay un total de cinco ensayos (uno por cada cuadro adquirido por el millonario) y el resultado de cada ensayo es un éxito (el cuadro es falso) o un fracaso (el cuadro es original), cada ensayo no es independiente ya que la probabilidad de que un cuadro sea una copia depende de los resultados de los ensayos anteriores.
2. Se toman cinco cartas (sin reponerlas) de una baraja de póker bien revuelta y se analiza el número de ases que se obtienen. El experimento consta de n=5 ensayos, cada uno con dos resultados posibles, as (éxito) o carta diferente de as (fracaso). La probabilidad de éxito del primer ensayo es 4/52, pero la probabilidad de éxito del segundo ensayo será de 3/51 o de4/51, dependiendo  de si el resultado del primer ensayo fue un éxito o un fracaso. Por lo tanto, en este ejemplo tampoco se satisface que las probabilidad de éxito de los ensayos sean fijas ni que los ensayos sean independientes.
3. Se toman cinco cartas de una baraja de póker bien revuelta, pero se repone inmediatamente cada una de las cartas elegidas y se vuelve a revolver la baraja. Se analiza el número de ases que se obtienen. El experimento consta de n =5 ensayos, cada uno con dos resultados posibles as (éxito) o carta diferente de as (fracaso). La probabilidad de éxito de cada ensayo es 4/52 y cada ensayo es ahora independiente. En este caso sí se satisfacen las hipótesis arriba mencionadas.
Supongamos que p y 1-p son las probabilidades de éxito t fracaso de n ensayos independientes. ¿Cuál es la probabilidad de tener x éxitos en n ensayos? Puesto que los ensayos son independientes, la probabilidad de obtener dos éxitos en los primeros dos ensayos es $p^2$, la probabilidad de obtener dos éxitos en los primeros tres ensayos es  $p^3$, y de esta manera, la probabilidad de obtener x éxitos en los primeros p ensayos es $p^x$. Empleando de nuevo la independencia de los ensayos y la regla multiplicativa vemos que la probabilidad de obtener  x éxitos en los primeros x ensayos  y un fracaso en el siguiente ensayo es $p^x(1-p)$, la probabilidad de obtener x exítos en  los primeros ensayos y  dos fracasos en los siguientes dos ensayos es $p^x(1-p) ^2$,etc. Por lo tanto, la probabilidad de obtener x éxitos en los primeros x ensayos y n-x  fracasos en los  últimos n-x ensayos es $p^x(1-p)^{n-x}$. Por medio de un  análisis similar es fácil ver que  la probabilidad $p^x(1-p)^{n-x}$ permanece constante para cada otro orden predeterminado de x éxitos. Como hay en total $\displaystyle\binom{n}{x}$ ordenes posibles en que podemos predeterminar los x éxitos, se tiene el siguiente resultado.
Distribución binomial 
La probabilidad de obtener x éxitos en n ensayos independientes es
$f(x)=\displaystyle\binom{n}{x}p^x(1-p)^{n-x}$
Donde p es la probabilidad de éxito de cualquier ensayo.
El nombre de distribución binomial surgió del hecho de que los valores de las probabilidad de esta distribución son los términos de la expansión binomial $((1-p)+p)^n$. A continuación presentamos algunos ejemplos para ilustrar el uso de estas probabilidades.
1. De acuerdo con  datos de la asociación mexicana de automóviles la probabilidad de recuperar un auto robado en México es de 0.6. Si en una semana una compañía de seguros tiene reportados ocho autos reportados cierta semana, ¿cuáles son las probabilidad de que se recuperen 0,1, 2,…,7 y 8 de los autos robados?
Si suponemos que la recuperación de los diferentes automóviles son eventos independientes (no hay bandas que tengan dos o más de los ocho autos robados) podemos aplicar la fórmula de arriba de la distribución binomial. Aquí la probabilidad de éxito es p= 0.6 y el total de ensayos es n=8. La probabilidad de recuperar x de los ocho automóviles robados es
$f(x)=\displaystyle\binom{8}{x}0.6^x(1-0.6)^{8-x}=\displaystyle\binom{8}{x}0.6^x(0.4)^{8-x}$
Por ejemplo, la probabilidad de que se recuperen 3 de los 8 autos son
$f(3)=\displaystyle\binom{8}{3}0.6^3(0.4)^{5}=\frac{8\cdot{7}\cdot{6}}{3\cdot{2}}(0.6)^3(0.4)^5=(56)(0.216)(0.01)=0.124$
Procediendo de igual manera, podemos ver que f(0)=0.001, f(1)=0.008, f(2)=0.041, f(4)=0.232.f(5)=0.279,f(6)=0.209, f(7)=0.090 y finalmente f(8)=0.017. En la figura mostramos el histograma correspondiente a esta distribución de probabilidad.

Como estos cálculos son muy tediosos existen tablas de probabilidades binomiales como esta tabla de distribuciones binomiales donde aparecen los valores explícitos de x para algunos valores de n y p.

2. Después de seguir un tratamiento especial para dejar de fumar la probabilidad de volver a fumar despues  del primer mes es de 0.4. Determina las probabilidades de que
a) a lo más 3 de 7 pacientes vuelven a fumar antes de un mes;
b) al menos  5 de 7 pacientes vuelven a fumar antes de un mes.
En este caso llamamos “éxito” a volver a fumar en menos de un mes después del tratamiento. Ahora n=7  y p=0.4.  Usando la fórmula arriba mencionada o buscando en una tabla  podemos hallar que los valores correspondientes a x=0, x=1,x=2 y x=3 son respectivamente 0.028,0.131,0.261 y 0.29. La probabilidad de que a lo más tres de los siete pacientes vuelvan a fumar dentro de un mes es
0.028  + 0.131 + 0.261 +0.29=0.71.
Si buscamos ahora los valores para x=5, x06 y x=7 obtenemos  0.077, 0.017 y 0.002, por lo que su suma es la probabilidad de que vuelvan a fumar cinco  o más de los pacientes, que es 0.096. Vemos así que es poco probable  que cinco o más de los pacientes vuelvan a fumar y que es altamente probable que vuelvan a fumar hasta tres de los pacientes que se sometieron al tratamiento.
3. En una fábrica los lotes de artículos recibidos necesarios para la producción se inspeccionan para detectar lotes defectuosos por medio de muestras de 12 artículos. Se examinan estos doce artículos y el lote es rechazado si se encuentran dos o más artículos defectuosos. ¿Cuál es la probabilidad de rechazar un lote que contiene 5% de artículos defectuosos?

La probabilidad de rechazar un lote que contiene 5% de artículos defectuosos es la suma de f(2)+f(3)+…+f(12), donde f(x) es la probabilidad binomial de x éxitos con n=12 y p=0.05. Como la suma de todas  las probabilidades de la distribución es igual a 1, entonces
F(2) +f(3) + …+f(12)=1- f(0) -  f(1)
Que es más sencillo de calcular. Por lo tanto, la probabilidad de rechazar un lote con 5% de artículos defectuosos es igual a
$1-\displaystyle\binom{12}{0}(0.05)^0 (0.95)^{12}-\displaystyle\binom{12}{1}(0.05)^1 (0.95)^{11}=0.118.$
¿Cómo cambia esta probabilidad si aumenta el porcentaje de artículos defectuosos del lote? Si el lote contiene un 10%, 20%,30% ó un 40% de artículos defectuosos la probabilidad de rechazarlos se calcula de la misma manera, sólo que ahora con p=0.1, 0.2 o 0.3
$1-\displaystyle\binom{12}{0}(0.1)^0 (0.9)^{12}-\displaystyle\binom{12}{1}(0.1)^1 (0.9)^{11}=0.341.$,             
$1-\displaystyle\binom{12}{0}(0.2)^0 (0.8)^{12}-\displaystyle\binom{12}{1}(0.2)^1 (0.8)^{11}=0.725.$,
$1-\displaystyle\binom{12}{0}(0.3)^0 (0.7)^{12}-\displaystyle\binom{12}{1}(0.3)^1 (0.7)^{11}=0.915.$
Y
$1-\displaystyle\binom{12}{0}(0.4)^0 (0.6)^{12}-\displaystyle\binom{12}{1}(0.4)^1 (0.6)^{11}=0.981.$
Aun cuando en la realidad se desconoce el porcentaje de artículos defectuosos de un lote, este ejemplo ilustra cómo las probabilidades de rechazo aumentan considerablemente al aumentar el porcentaje de artículos defectuosos. Podríamos haber obtenido las posibilidades de rechazar los lotes recurriendo también a una tabla de probabilidades binomiales.



martes, 19 de junio de 2012

Variables aleatorias y distribuciones de probabilidad

Cuando un científico mide el nivel de ozono de la Ciudad de México, un maestro pasa lista en su clase, un fabricante analiza el número de unidades defectuosas en cierto proceso de producción o un gerente consulta el nivel de ocupación de su hotel, todos están interesados en el resultado de una situación incierta o azarosa. A cantidades que pueden tomar diferentes valores dependiendo del azar les llamamos variables aleatorias. Entre otros ejemplos de variables aleatorias podemos citar además el número de unidades vendidas de cierto producto en una semana, el número de asistentes a un concierto de Café Tácuba, el precio del café en el mercado internacional y la precipitación pluvial anual en cierta región.


Distinguimos dos tipos de variables aleatorias, las discretas y las continuas. Una variable aleatoria es discreta si podemos enumerar todos sus posibles valores. Los siguientes son ejemplos típicos de variables aleatorias discretas:

1. El número de circuitos defectuosos en una muestra de 30 circuitos.

2. El número de fallas de una maquinaria en una fábrica en un periodo de tiempo.

3. El número de pacientes que ingresan a una clínica de salud en cierto mes.

4.- El número de personas que esperan en la fila de una ventanilla para ser atendidos.

Las variables aleatorias continuas surgen al considerar cantidades que son medidas en una escala continua como:

1. El tiempo requerido para efectuar un proceso de fabricación.

2.-El peso neto de un paquete.

3. La estatura de una persona en una población.

4.-La cantidad de alcohol en la sangre de un conductor detenido por exceso de velocidad en un sábado por la noche.

En el estudio de las variables aleatorias es necesario poder asignar probabilidades a sus valores. Consideremos, por ejemplo, el número de puntos que se obtiene al tirar dos dados. Es claro que los valores posibles de esta variable aleatoria son los números enteros entre 2 y 12. Obtenemos dos puntos únicamente cuando ambos dados caen en uno. Para obtener tres puntos tenemos dos posibles combinaciones, que son que el primer dado caiga en uno y el segundo en dos, o bien, que el primer dado caiga en dos y el segundo en uno. Denotaremos estas posibilidades por (1,2) y (2,1) respectivamente. Para obtener cuatro puntos tenemos entonces que las combinaciones posibles de los dados son (1,3), (2,2) y (3,1), donde de nuevo cada pareja de números indica el valor del primer dado y el valor del segundo dado. Por la regla del producto sabemos que hay un total de 6 x 6= 36 maneras posibles de tirar los dados, y por supuesto todas ellas igualmente probables. En la siguiente tabla se muestran los diferentes casos que producen cada uno de los puntos posibles y sus probabilidades.

 A la función que asocia a cada uno de los puntos posibles su probabilidad le llamamos una distribución de probabilidad. Si denotamos por y a esta variable aleatoria, es decir al número de puntos que obtenemos al tirar dos dados, vemos en la tabla que la probabilidad de que y sea 9 es de 4/36. También, p(6)= 5/36, esto es, la probabilidad de que los puntos obtenidos al tirar los dados sean 6 es 5/36, esto es la probabilidad de que los puntos obtenidos al tirar los dados sean 6 es 5/36. La suma de la última columna es igual a 1, ya que la variable aleatoria debe tomar alguno de sus valores posibles. Es frecuente describir una distribución de probabilidad son su histograma.



Las alturas de las barras en el histograma representan las probabilidades de que la variable aleatoria tome el correspondiente valor. Es fácil apreciar en el histograma que el valor más probable es de 7 puntos y que los valores extremos,2  y 12 puntos son los menos probables.

sábado, 16 de junio de 2012

Algunas reglas de probabilidad

En estadística llamamos espacio muestral al conjunto de posibles resultados de un experimento o de una observación y usualmente lo representamos por la letra S.

Por ejemplo, si el gerente de ventas de una empresa debe escoger a dos de sus cuatro vendedores para visitar una zona, el espacio muestral está formado por las $\displaystyle\binom{44}{2}= \frac{44\cdot{43}}{2}=946$ posibles elecciones que tiene el gerente, Si ahora consideramos el número de días que llueve en la región occidental del estado de Tlaxcala durante el mes de Julio, el espacio muestral es el conjunto $S=\left\{{0,1,2,3,...,31}\right\}$.

Cabe aclarar que en estadística empleamos los términos experimento y resultado en un sentido muy amplio. Por experimento entenderemos cualquier proceso de observación o medición. Así, un experimento puede ser el proceso de contar cuántos alumnos de tercero de secundaria en una escuela han fumado en al menos una ocasión, o el proceso de realizar una encuesta preelectoral para estimar cómo se integrara la próxima cámara de diputados de un estado, o bien procesos muy complejos para obtener datos que permitan evaluar el desarrollo de la economía, las causas de alguna enfermedad, o el estado de ánimo de los obreros en una empresa. Los resultados obtenidos en un experimento pueden ser medidos con instrumentos, pueden ser contados, pueden ser respuestas “si o no”, o bien, valores obtenidos por medio de operaciones complejas.

Los espacios muestrales se clasifican de acuerdo con el número de elementos o puntos que los conforman. La mayoría de los espacios que hemos estudiado tienen un número fijo de elementos y se les llama espacios finitos. En este post solo nos referiremos a este tipo de espacios. A los espacios muestrales con una infinidad de elementos o puntos se les llama espacios infinitos. Los espacios muestrales infinitos surgen, por ejemplo, al considerar cantidades que son medidas en una escala continua como es la cantidad de alcohol en la sangre de una persona, el peso neto de un paquete, etc. A cualquier subconjunto del espacio muestral se le llama un evento. Un subconjunto del espacio muestral es una parte de él, esto es, cualquier colección de puntos del espacio muestral. Recordemos que entre todos los subconjuntos debemos considerar al espacio muestral mismo y al conjunto vacío, que denotamos por ∅, no tiene elementos.

Por ejemplo, el espacio de los días de lluvia en julio en la parte occidental de Tlaxcala es el conjunto de $S= \left\{{0.1.2.3....,31}\right\}.$ Tomemos los subconjuntos


$A=\left\{{0,1,2,3,4,5,6}\right\},$
$B=\left\{{20,21,22,23,24,25,26,27,28,29,30,31}\right\},$

$C=\left\{{0,15,31}\right\},$
$D=\left\{{18,19,20,21,22,23,24}\right\},$
$E=\left\{{22}\right\}.$

A es el evento que llueva a lo más seis días; B es el evento que llueva cuando menos 22 días; C es el evento que llueva a todos los días del mes o, quince días, o bien ningún día del mes; D es el evento que llueva entre 18 y 24 días; y finalmente,E es el evento que llueva exactamente 22 días del mes.


En muchos problemas de probabilidad debemos considerar eventos que se forman por medio de uniones, intersecciones y complementos. La unión de dos eventos A y B es el evento formado por los elementos o resultados de A, de B o de ambos y se denota por ${A}\cup{B}$.La intersección de dos eventos A y B es el evento formado por los elementos o resultados de que pertenecen tanto a A como a B y se denota por ${A}\cap{B}$. El complemento de A, denotado por $\bar{A}$, es el evento formado por los elementos o resultados que no pertenecen a A.



Para ilustrar estos conceptos analicemos los eventos

a) ${A}\cup{D}$;

b) ${B}\cup{D}$;

c) ${D}\cap{B}$;

d) ${A}\cap{B}$;

e) $\bar{B}$;

f) $\bar{D}$;

g) ${\bar{D} }\cup{\bar{B}}$;

h) ${\bar{B} }\cap{\bar{A}}$;

a) Como ${A}\cup{D}$ es el evento de los resultados que están es A o en D ${A}\cup{D}$ es por tanto el evento$ \left\{{0,1,2,3,4,5,6,18,19,20,21,22,23,24}\right\}$, esto es que llueva cuando más seis días, o bien llueva de 18 a 24 días.

b) ${B}\cup{D}$ =$\left\{{18,19,20,21,22,23,24,25,26,27,28,29,30,31}\right\} $es que llueva 18 o más días.

c) ${D}\cap{B}$ es el evento de los resultados que están en D como en B, por lo que ${D}\cap{B}$=

$\left\{{20,21,22,23,24}\right\}$ representa que llueva de 20 a 24 días durante el mes de julio.

d)Observemos que A y B no tienen elementos o resultados en común, de modo que la intersección de A y B es el elemento vacio ${A}\cap{B}=\emptyset$. Cuando dos eventos no tienen resultados en común decimos que son mutuamente excluyentes y equivale a que no pueden ocurrir los dos simultáneamente.

e) $\bar{B}$ es el evento formado por los resultados que no están en B, así que $\bar{B}=\left\{{0,1,2,…19}\right\}$. $\bar{B}$ es el evento que llueva a lo más 19 días.

f) Como $\bar{D}= \left\{{0,1,2,…,16,17,25,26,27,28,29,30,31}\right\}$ entonces $\bar{D}$ es el evento de que llueva a lo más 17 días o bien más de 25 días.

g) Como  $\bar{D}=\left\{{0,1,2,...,16,17,25,26,...,30,31}\right\}$ y $\bar{B}=\left\{{0,1,2,…19}\right\}$, entonces  ${\bar{D} }\cup{\bar{B}}= \left\{{0,1,2,...,16,17,25,26,...,30,31}\right\}$
h) Como  $\bar{B}=\left\{{0,1,2,..., 19}\right\}$ y $\bar{A}=\left\{{7,8,9,…31}\right\}$, entonces  ${\bar{B} }\cap{\bar{A}}$ es el evento   $\left\{{7,8,9,10,11,12,13,14,15,16,17,18,19}\right\}$ que llueve de 7 a 19 días.
Los espacios muestrales, los eventos y las relaciones entre los eventos son a menudo representados gráficamente  por medio de diagramas de Venn como los de las siguientes figuras. En cada caso, el espacio muestral es representado por un rectángulo y los eventos por regiones dentro del rectángulo, usualmente círculos, elipses o partes de ellos. Las regiones grises de los cuatro diagramas representan el evento X, su complemento, el evento ${X}\cup{Y}$ y el evento ${X}\cap{Y}$.


X

 $\bar{X}$
 ${X}\cup{Y}$

   

${X}\cap{Y}$

Diagramas de Venn


Supongamos que X es el evento de que un cierto alumno que concluyo la secundaria sea admitido al Conalep y Y es el evento de que sea admitido a la preparatoria; ¿Qué representan las regiones grises de estos diagramas?

La primera región representa que el alumno es admitido al Conalep; la región $\bar{X}$ representa el evento de que el alumno sea rechazado por el Conalep; la región ${X}\cup{Y}$ representa el evento de que el alumno sea aceptado por el Conalep , o por la preparatoria, o quizás por ambos programas; y la región del último diagrama , ${X}\cap{Y}$, representa el evento de que el alumno sea aceptado por los dos programas.

Cuando necesitamos considerar tres o más eventos y sus relaciones dibujamos círculos como los de la siguiente figura. Ahora el espacio muestral queda dividido en ocho regiones diferentes.
Digamos que X es el evento que los autos nuevos que lleguen a la agencia sean automáticos, Y es el evento que los autos nuevos que lleguen a la agencia sean de cuatro puertas, y Z que los autos nuevos que lleguen a la agencia tengan rines deportivos; ¿Qué representan las siguientes regiones?

a)La región 2.

b)La región 1y 4

c).- La región 8 y 7.

La región 3 está formada por los resultados que están en X y Y , pero que no están en Z, de modo que representa el evento que los autos nuevos que lleguen a la agencia sean automáticos, de cuatro puertas y no tengan rines deportivos, la región 1 y 4 está formada por los resultados que están en X y en Z, es decir ${X}\cap{Y}$, y representa el evento los autos que lleguen sean automáticos con rines deportivos; la región 8 y 7 está formada por los resultados que no están ni en Y ni en Z, por lo que representa el evento que los autos que lleguen a la agencia no tengan cuatro puertas ni tampoco rines deportivos.
Una vez que ya nos hemos familiarizado con los eventos y sus relaciones vamos ahora a describir algunas reglas sencillas que nos permitan determinar la probabilidad de que ocurra algún evento. Para expresar simbólicamente estas reglas denotaremos por P (A) a la probabilidad de que ocurra el evento A.

Ya hemos visto que la probabilidad de que suceda un evento es un número real entre cero y uno y que entre más pequeño sea este número el evento es menos probable y entre más cercano sea a uno el número el evento es más probable. Las reglas que describiré adelante son fáciles de entender si representamos los eventos por medio de diagramas de Venn y pensamos en las probabilidades como las áreas de las regiones que representan los eventos.

Reglas básicas de probabilidad

1.- Las probabilidades son números reales entre 0 y 1.

2.P (S)=1 Y $P(\emptyset)= 0$.

3.Su los eventos A y B son mutuamente excluyentes , entonces P (${A}\cup{B}$) = P(A)+P(B).

4.-P($\bar{A}$) = 1- P(A).

Como el espacio muestral S contiene a todos los posibles resultados que pueden ocurrir, se tienen que el evento S ocurre con certeza, de modo que P(S)= 1. Esto significa que el área asociada al rectángulo es uno. La regla 2 nos dice que cuando un evento sucede con certeza su probabilidad es 1, y que cuando con certeza un evento no puede ocurrir, su probabilidad es cero. La regla 3 es fácil de imaginar , pues si los eventos A y B son mutuamente excluyente no tienen resultados en común y entonces su diagrama de Venn es de la forma
y el área de los dos círculos es la suma de las áreas de cada uno de ellos. Finalmente la regla 4 es consecuencia de las dos reglas anteriores, ya que los eventos A y $\bar{A}$ son mutuamente excluyentes por no tener elementos en común y su unión es todo S.
Consideremos un ejemplo donde se emplean estas reglas. Supóngamos que A es el evento el martes a las 16: 00 estará lloviendo, B es el evento el martes a las 16:00 hrs estará despejado y que de acuerdo al Observatorio Nacional P(A)=0.45 y P(B)= 0.3, ¿cuáles son las probabilidades P($\bar{A}$), P (${A}\cup{B}$) y P (${A}\cap{B}$)?

La probabilidad de que no llueva el martes a las 16:00 se puede obtener por medio de la regla 4, ya que P($\bar{A}$)= 1-P(A)= 1 -0.45=0.55. Para poder calcular las probabilidades de  ${A}\cup{B}$ y  de  ${A}\cap{B}$ debemos observar primero que los eventos A y B son mutuamente excluyentes, ya que el tiempo no puede estar lluvioso y despejado simultáneamente, por lo  que P (${A}\cap{B}$) = P ($\emptyset$)) = 0 de acuerdo con la regla 2, y además P (${A}\cup{B}$)= P (A)+P(B)=0.45+0.3=0.75.
La regla 3 es un tipo especial de reglas llamadas reglas aditivas. Supongamos que A,B y C son ahora tres eventos mutuamente excluyentes, esto es, si ocurre alguno de ellos no pueden ocurrir los otros. Si pensamos en la probabilidad de ${A}\cup{B}\cup{C}$ como en el área de 3 círculos que no se cruzan, es claro que P (${A}\cup{B}\cup{C}$)= P(A)+P(B)+P(C).

Procediendo de esta manera se obtiene
Si k eventos son mutuamente excluyentes, la probabilidad de que ocurra alguno de ellos es igual a la suma de sus respetivas posibilidades, esto es,

${A_1}\cup{A_2}\cup{...}\cup{A_k}= P(A_1)+...+...P(A_k)$.

Si las probabilidades de que una agencia de automóviles venda 0, 1, 2, 3,4 y 5 automóviles durante cierta semana son respectivamente 0.05, 0.1, 0.15, 0.18, 0.12 y 0.05, ¿cuáles son las probabilidades de que vendan de 2 a 5 automóviles y de que vendan 5 o más automóviles?


Como estos eventos son mutuamente excluyentes , usando la regla de arriba vemos que la agencia venderá de 2 a 5 automóviles con probabilidad 0.15 +0.18+0.12 +0.05= 0.5. Para calcular la probabilidad de que se vendan 5 o más automóviles debemos primero calcular la probabilidad de nder a lo más cuatro automóviles, que procediendo como arriba vemos que es 0.05+0.1+0.15+0.18+0.12 =0.6. Por la regla 4, la probabilidad de que se vendan 5 o más autos es 1-0.6 =0.4.

Si en particular, al aplicar la regla aditiva anterior se tienen que cada evento $A_i$ consta de un único resultado, tenemos la siguiente regla general para calcular probabilidades de espacios finitos:

La probabilidad de un evento A está dada por la suma de las probabilidades de cada uno de los resultados que conforman A.

Esta regla, de hecho, la empleamos implícitamente para calcular las probabilidades de eventos igualmente probables, ya que si un evento S está formado de k resultados de un total de n resultados posibles, entonces cada uno de los resultados debe tener probabilidad $ \frac{1}{n}$, y como el evento está compuesto de k resultados,


$ P(A)=\frac{1}{n}+\frac{1}{n}+...+\frac{1}{n}=\frac{k}{n}$

Observemos que esta probabilidad coincide con nuestra primera definición de probabilidad para eventos donde todos los posibles resultados son igualmente probables.

Las reglas de adición que hemos estudiado hasta ahora siempre suponen que los eventos son mutuamente excluyentes. ¿Es posible generalizar la regla para eventos que no son mutuamente excluyentes? Consideremos dos eventos A y B que no sean mutuamente excluyentes y representémoslos por medio de un diagrama de Venn. Representado las probabilidades por medio de áreas es fácil ver el área de $ A\cup B $ es menor que las suma de las áreas de cada uno de los círculos. La razón es que si sumamos el área del círculo A con el área del círculo B cuando estamos tomando en cuenta dos veces el área comprendida en la intersección de los dos círculos.


Observemos que la regla 3 es un caso especial de esta nueva regla, ya que si los eventos son mutuamente excluyentes $P({A}\cap{B})=0$ y en consecuencia $P({A}\cup{B})$ = P(A) + P(B).
Veamos cómo emplear esta regla. Supongamos que un estudio de mercado estima que las probabilidades de que una familia en cierta zona vea el noticiero de TV Azteca es de 0.3, que vea el noticiero de Televisa es de 0.2 y de que vea ambos es de 0.02  ¿Cuál es la probabilidad de que una familia vea al menos uno de estos dos noticieros? Sea A el evento la familia ve el noticiero de TV Azteca y sea B el evento la familia ve el noticiero de Televisa. Entonces P(A)=0.3, P(B)=0.2 y $P({A}\cap{B})$=0.02. Notemos primero que como la probabilidad de que vean ambos noticieros es mayor a cero, los eventos A y B no son mutuamente excluyentes. Por lo tanto se deben transmitir a diferente horario. Debemos calcular la probabilidad de que la familia vea uno de los dos o ambos noticieros, esto es , $P({A}\cup{B})$. Por la regla anterior $P({A}\cup{B}) = P(A)+P(B)-P({A}\cap{B})$=0.3+0.2-0.02=0.48.
Sería deseable tener también una forma de calcular $P({A}\cap{B})$ en términos de P(A) y de P (B). Desafortunadamente la regla general que nos permite calcular $P({A}\cap{B})$ es un poco más elaborada. Se dice que dos eventos A y B son independientes si el hecho de que ocurra uno de los eventos afecta la probabilidad del otro. Estudiemos la independencia de algunos eventos:


1.-Si A es el evento que una moneda caiga águila en un primer volado y B es el evento que la moneda caiga águila en un segundo volado, entonces son independientes pues es claro que el resultado del segundo volado no depende del resultado del primero.

2.- Se toma una carta de una baraja de poker bien revuelta. Se regresa la carta y después de revolver la baraja se toma una segunda carta. Si A es el evento que la primera carta sea as y B es el evento que la segunda carta sea reina, los eventos son independientes, pues de nuevo el resultado de tomar la segunda carta no depende de cuál fue la primera ya que se vuelve a revolver la baraja después de regresar la priemra carta.

3.-Se toma una carta de una baraja de póker bien revuelta. Sin regresar esta carta se toma una segunda carta. Si A es el evento que la primer carta sea as y B es el evento que la segunda cart sea reina, los eventos son ahora dependientes, ya que la probabilidad de que la segunda carta sea reina sí depende de cuál fue la primer carta. Si bien la primer carta no fue reina, de las 51 cartas restantes 4 son reinas y la probabilidad de que la segunda sea reina será de $\frac{4}{51}$; pero si la primer carta fue reina, de las 51 restantes sólo 3 son reinas, de modo que la probabilidad de que la segunda sea reina sería $\frac{3}{51}$.

4. Si A es el evento que el automovilista maneja en estado de ebriedad y B es el evento el automovilista tuvo un accidente, entonces los eventos son dependientes, ya que la probabilidad de tener un accidente aumenta si el automovilista conduce en estado de ebriedad.

En el ejemplo 3 calculamos las probabilidades de que la segunda carta fuese una reina dependiendo de cuál fue la elección de la primera carta. A este tipo de probabilidades les llamamos probabilidades condicionales. A la probabilidad de que ocurra el evento X suponiendo de que ha ocurrido el evento Y se denota por P(X I Y). Así , si X es el evento que la segunda carta tomada de una baraja es una reina, Y el evento que la primer carta tomada de la baraja no es una reina y Z es el evento que la primer carta tomada de la baraja es una reina, entonces como vimos en el ejemplo3, P(X I Y)= $\frac{4}{51}$ y P(X I Z)= $\frac{3}{51}$.


Ahora sí podemos establecer la llamada regla multiplicativa para calcular $P({A}\cap{B})$ que afirma que la probabilidad de que ocurran dos eventos es el producto de la probabilidad de que ocurra uno de ellos por la probabilidad condicional de que ocurra el otro dado que el primero ha ocurrido:

$P({A}\cap{B})$ = P(A) P(B I A )

Un caso especial de esta regla es cuando los eventos son independientes. Cuando A y B son independientes, la probabilidad de que ocurra B no se ve afectada por el hecho de haber ocurrido A, esto es, P (B I A)= P(B) y la regla multiplicativa es

$P({A}\cap{B})$ = P(A)P(B), cuando A y B son eventos independientes.

Los siguientes ejemplos muestran cómo emplear estas reglas.

1. ¿Cuál es la probabilidad de obtener dos águilas al tirar dos volados?

Puesto que la probabilidad de obtener un águila es $\frac{1}{2}$ en cada volado y como los eventos son independientes, la respuesta es $\frac{1}{2}\cdot{}\frac{1}{2}=\frac{1}{4}$.

2. ¿Cuál es la probabilidad de obtener de una baraja bien revuelta dos ases sin regresar la primer carta?

Sea A el evento de que la primer carta es as y sea B el evento de que la segunda carta es as . Deseamos calcular $P({A}\cap{B})$. Pero como ahora los eventos son dependientes debemos calcular primero p (B I A) para poder emplear la regla multiplicativa $P({A}\cap{B})$= P(A)P (B I A). En este caso P (B I A) es la probabilidad de que la segunda carta sea as suponiendo que la primera también lo fue. Como quedan 3 ases en un total de 51 cartas se tiene que P (B I A ) = $\frac{3}{51}$ y la probabilidad de que ambos sean ases es P $P({A}\cap{B})$= P(A) P (B l A)= $\frac{4}{52}\cdot{}\frac{3}{51}= \frac{1}{221}$. Esta probabilidad se puede obtener observando que de un total de $\displaystyle\binom{52}{2}= \frac{52\cdot{51}}{2}=1326$ formas igualmente probables de tomar dos cartas sólo hay $\displaystyle\binom{4}{2}= \frac{52\cdot{4}}{3}=6$ que corresponden a elegir dos ases. La probabilidad de obtener dos ases es por lo tanto $\frac{6}{1326}=\frac{1}{221}$.

3.El departamento de servicio de una tienda de artículos eléctricos cuenta con ocho técnicos para atender las reparticiones a domicilio. De estos ocho técnicos cinco han recibido entrenamiento especial. Las evaluaciones de los clientes muestran que el 80% de las reparaciones con técnicos entrenados son satisfactorias y que este porcentaje baja a 60% cuando los técnicos no han sido entrenados. Si los técnicos se asignan al azar a los diferentes trabajos de reparación ¿cuál es la probabilidad de ser atendido por un técnico que ha recibido entrenamiento y que efectué una reparación satisfactoria?

Denotemos por A el evento que el técnico enviado ha sido entrenado y por B al evento que la reparación sea satisfactoria. La probabilidad condicional de que la reparación sea satisfactoria dado que el técnico haya sido entrenado es p (B I A)=0.8 y la probabilidad de que el técnico enviado haya sido entrenado es de $\frac{5}{8}$. Por lo tanto, la probabilidad de que el técnico enviado este entrenado y efectúe una reparación satisfactoria es

$P({A}\cap{B})$ = P (A) $\cdot{}$ P (B I A) = $\frac{5}{8}\cdot{} 0.8 = 0.5.$












sábado, 2 de junio de 2012

Probabilidad

La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teoría de la probabilidad se usa extensamente en áreas como la estadística, la física, la matemática, la ciencia y la filosofía para sacar conclusiones sobre la probabilidad discreta de sucesos potenciales y la mecánica subyacente discreta de sistemas complejos.

El concepto de probabilidad se desarrollo históricamente para estudiar los juegos de azar. Con el objeto de familiarizarnos con el concepto de probabilidad comenzamos por dar una definición que sólo es válida cuando todos los resultados son igualmente probables.

Si hay n posibilidades igualmente probables y una de ellas debe ocurrir, entonces la probabilidad de que ocurra alguna de k de esas n posibilidades es
$\frac{k}{n}$
 Veamos algunos ejemplos. 1. Si se tira un volado, se tienen dos alternativas igualmente probables: cae águila o cae sol, por lo que n=2. De acuerdo a la definición de arriba, la probabilidad de que caiga águila es $\frac{1}{2}$, como también lo es la probabilidad de que caiga sol.
2.-Se tira un dado. ¿Cuáles son las probabilidades de que el número que caiga pertenezca a cada uno de los siguientes conjuntos:  $\left\{{2}\right\}$ , $\left\{{2,4,6}\right\}$ y $\left\{{2,3,4,5}\right\}$?

Hay un total de 6 posibilidades, esto es , n=6. Los valores de k en cada uno de estos casos son 1,3 y 4. Así, la probabilidad de que al tirar el dado el resultado sea 2 es de $\frac{1}{6}$ , la probabilidad de que al tirar el dado el resultado sea 2,4 o 6 es $\frac{3}{6}$ = $\frac{1}{2}$, y en el último caso, la probabilidad de que al tirar el dado caiga 2,3,4 o 5 es de
$\frac{4}{6}$ = $\frac{2}{3}$.

La probabilidad es una medida de la incertidumbre de que suceda algún evento de interés. De este ejemplo podemos deducir que la probabilidad de que suceda un evento es un número real entre cero y uno. Entre más pequeño sea este número el evento es menos probable, y entre más cercano a uno sea este número, el evento es más probable. Cuando la probabilidad es igual a ½ el evento tiene la misma probabilidad de ocurrir que de no ocurrir. Coloquialmente también hablamos de probabilidades empleando porcentajes. Así , la expresión el dado cae en 2 o 5 el 33.33% de las veces significa que la probabilidad de que al tirar el dado el resultado sea 2 o 5 es de

$\frac{1}{3}$. De igual forma decimos que al tirar una moneda el resultado es águila el 50% de las veces y es sol el otro 50%.

3.- ¿Cuál es la probabilidad de obtener un as de una baraja de póker?
Si la baraja está bien revuelta, todas las cartas son igualmente probables y hay 52 de ellas. Puesto que hay cuatro ases, entonces n=52 y k=4. La probabilidad de obtener un as es por tanto
$\frac{k}{n}=\frac{4}{52}=\frac{1}{13}=0.077$

4.- ¿Cuál es la probabilidad de obtener dos cartas negras de una baraja de poker?
Debemos primero determinar el número total de posibilidades. Como ahora se toman dos cartas de una baraja de 52 tenemos que hay
$\displaystyle\binom{52}{2}=\frac{52\cdot{51}}{2} =1326$ posibilidades. De nuevo , si los naipes están bien barajados , cada una de estas posibilidades es igualmente probable. Sabemos que hay 26 cartas negras y 26 cartas rojas, de modo que de estas 1326 posibilidades sólo
$\displaystyle\binom{26}{2}=\frac{26\cdot{25}}{2}=325$ constan de dos cartas negras. La probabilidad de obtener dos cartas negras es entonces $\frac{235}{1326}=0.245$

5.- ¿Cuál es la probabilidad de obtener un par al tomar dos cartas de una baraja de póker?
Ya vimos que hay en total 1326 maneras posibles de obtener dos cartas ¿Cuántas de estas son pares? Analicemos primero cuántos posibles pares de reyes tenemos. Como hay cuatro reyes, hay en total $\displaystyle\binom{4}{2}=\frac{4\cdot{3}}{2}=6$ pares posibles de reyes. Además de pares de reyes hay otros tipos de pares posibles. Por la regla del producto hay 13 ∙ 6= 78 pares posibles. La probabilidad de obtener un par con dos cartas es $\frac{78}{1326}=.059$. Este número es una medida de lo difícil que es obtener un par al tomar dos cartas de una baraja.

6.-Un inspector de Hacienda practicará una auditoria a un grupo de veinte empleados de una empresa. El inspector sólo tiene tiempo de investigar a tres de los veinte empleados. Si dos de los veinte empleados presentaron una declaración anual alterada, ¿cuál es la probabilidad de que el inspector no los detecte?

Hay un total de $n=\displaystyle\binom{20}{3}=1140$ maneras en que el inspector puede realizar las tres auditorías. Puesto que dieciocho empleados presentaron su declaración anual correctamente, de estas 1140 hay k=
$\displaystyle\binom{18}{3}=816$ maneras en que el inspector no detectara declaraciones alteradas. La probabilidad de que el inspector no detecte declaraciones alteradas es por lo tanto de $\frac{k}{n}=\frac{816}{1140}=0.716$.(los valores de los coeficientes binomiales se pueden obtener de la tabla mostrada en este post )

La definición de probabilidad que hemos empleado hasta ahora tiene una restricción muy seria ya que solo es posible aplicarla cuando todas las posibilidades son igualmente probables. Sin embargo, hay muchas situaciones donde las diferentes posibilidades no son igual de probables. La pregunta ¿lloverá mañana? Es muy relevante para los agricultores. Su análisis es mucho más delicado y complejo que el tipo de análisis que veníamos haciendo para los juegos de azar. Hay en este casos dos posibilidades en total; mañana lloverá, o bien mañana no lloverá. Así, n =2. Sin embargo , cada una de estas posibilidades no es igualmente probable. De hecho, sería necesario contar con más información para poder estimar las probabilidades de cada una de estas dos posibilidades. El lugar al que nos referimos, la época del año y las condiciones climatológicas recientes son algunas cuestiones relevantes para poder estimar estas probabilidades.


Otro concepto de probabilidad que también resulta muy útil es el asociado a la frecuencia relativa con que un evento sucede.

La probabilidad de un evento o de un resultado es la proporción de eventos del mismo tipo que ocurren a largo plazo.

Si los datos de una compañía aérea muestran que de los últimos 850 vuelos de Monterrey a México han llegado a tiempo, ¿cuál será la probabilidad de que el vuelo de la mañana del próximo viernes llegue a tiempo? De acuerdo con la interpretación de la probabilidad como frecuencia relativa la probabilidad de que el vuelo del viernes por la mañana llegue a tiempo es la proporción de veces que vuelos del mismo han llegado a tiempo, es decir , $\frac{540}{850}=0.635$. También podemos decir que el vuelo del viernes por la mañana llegara a tiempo con una probabilidad del 63.5%.


Veamos otro ejemplo donde esta interpretación de la probabilidad es útil. Una ensambladora de computadoras ha encontrado que de 5800 circuitos de cierto que ha instalado sólo 32 han resultado defectuosos. ¿Cuál es la probabilidad de que uno de estos circuitos este defectuoso? De nuevo, simplemente dividimos el número de veces que los circuitos han resultado defectuosos por el total de circuitos instalados para obtener que la probabilidad de que uno de estos circuitos esté defectuoso es de $ \frac{32}{5800}=0.0055$.

Al interpretar la probabilidad como frecuencia relativa no siempre nos referimos a eventos exactamente iguales. Por ejemplo, si un paciente tiene un tumor de cáncer y el médico le dice: “Este tipo de tumor es curable en un 95% de las veces”, el médico quiere decir que con una probabilidad de 0.95 el tumor es curable. Es claro que no hay ni habrá casos de tumores de cáncer exactamente iguales al del paciente, sin embargo la expresión del médico significa que de acuerdo a récords de tumores semejantes, en el 95% de los casos los pacientes responden positivamente al tratamiento. Esto ilustra que para hacer afirmaciones probabilísticas sobre eventos únicos e irrepetibles, la interpretación de la probabilidad como frecuencia relativa la debemos emplear en un conjunto de eventos semejantes.

Sería deseables que los dos conceptos de probabilidad que hemos discutido coincidieran en aquellos casos es que es posible asignar la probabilidad a un evento con cualquiera de ellos. Tomemos por ejemplo el caso del volado. Ya vimos que como se tienen dos alternativas igualmente probables la probabilidad de que caiga águila es 0.5. ¿Cómo interpretamos esto como una frecuencia relativa? El valor de 0.5 nos dice que si tiramos una moneda cierto número de veces debemos de esperar que la mitad de ellas caiga águila y la otra mitad sol. Sin embargo, todos sabemos que al tirar una moneda cierto número de veces, digamos cuatro veces, no siempre la mitad de ellas cae águila. Existe un resultado importante, llamado la ley de los grandes números, que afirma que si una situación se continúa repitiendo, la proporción de veces que ocurre un evento se acerca a la probabilidad del evento.

En el caso del volado, la ley de los grandes números nos indica que si tirásemos un volado un suficiente número de veces, la proporción de ellas que cae águila sería muy cercana a 0.5.