viernes, 3 de junio de 2011

JUEGO DE SUMA CERO BIPERSONALES



En un juego bipersonal de suma cero, cada uno de dos jugadores tiene que escoger entre unas acciones dictadas a cada turno, y la pérdida de cada jugador es igual al beneficio del su contrincante, es decir, si se conoce lo que gana uno, se sabe o que perdió el otro y viceversa El tradicional juego infantil, puede ser un juego de suma cero si, ganr y perder tiene el mismo valor, para cada victoria o derrota.

La matriz de pagos de un juego bipersonal de suma cero tiene reglones etiquetados por las acciones del "jugador renglón" y columnas etiquetadas por las acciones del su contrincante, el "jugador columna." La entrada ij de la matriz es el pago que gana el jugador renglón en caso de que el jugador renglón usa acción i y el jugador columna usa acción j, para el caso de papel tijera y piedra, la matriz de pagos es:



El jugador renglón(JR), saca papel y el jugador columna (JC) saca piedra, entonces el JC  debe pagar una 1 al JR.

  • Solución óptima a juegos de suma cero.
La solución óptima selecciona una estrategia constante o varias. Un jugador usa una estrategia pura si usa la misma acción a cada turno del juego. El jugador usa una estrategia mixta si a cada turno escoge al azar un acción para que cada acción se está usado una fracción determinada del tiempo. Representamos una estrategia mixta (o pura) del jugador reglón por una matriz con un solo renglón (vector probabilidad):    R = [a   b   c  . . . ] con lo mismo número de entradas que renglones, y en cual cada entrada representa la fracción de tiempo que está usada la correspondiente acción (o la probabilidad de usar aquel acción) y donde a + b + . . . = 1. Una estrategia mixta para el jugador renglón se represente por un vector probabilidad similar, pero en forma de columna C. Para ambos jugadores, estrategias puras son representadas por vectores probabilidad con un solo 1 y el resto de las entradas 0.


Supongamos ahora que tenemos esta matriz de pagos, los positivos(+) son la ganancia de JR  y los negativos(-) son la ganancia el jugador JC; en este caso el JR siempre debería sacar papel(estrategia dominante), por que sin importar lo que haga JC, va a ganar. La solución de este juego se basa en asegurar lo peor para cada jugador al elegir cada estrategia.









Lo peor que puede pasar por ejemplo  JR  si elige la estrategia papel es que gane solo 1, si elige tijera lo peor es que pierda 1 y si elige piedra lo peor es perder 2. Por su parte el  JC; si elige papel lo peor es perder 2; tijera, perder 2 y piedra, perder 1.







Lo siguiente es elegir los criterios "lo mejor de lo peor" o MAXIMIN para JR y lo "peor de lo mejor" o MINIMAX, para JC.  y esos resultados deben ser la elección de estrategias de JC y JR.  En este caso  JR  debe elegir la estrategia papel, como ya lo se hbaia mencionado y JC  debe elegir la estrategia piedra. Este resultado es a favor de JR. 



El valor del juego ValorJ, es el valor donde se cruzan las estrategias de ambos jugadores, en este caso el ValorJ = 1,   ambos jugadores usan la solución de punto de equilibrio o punto de silla.

Un juego es estrictamente determinado si tiene por lo menos uno punto de silla. Las siguientes declaraciones se aplican a los juegos estrictamente determinado:
  1. Todos los puntos de silla en un juego tienen los mismos valores de pago.
  2. Elegir el renglón y la columna que pasan por cualquier punto de silla de estrategias minimax para ambos jugadores. Es decir, el juego es solucionado por el uso de estas estrategias puras.



El valorJ de un juego estrictamente determinado es el valor del punto de silla. Un juego justo tiene un valor igual a cero, si no, es injusto o parcial.


Se le llama punto de silla por que la función que define a este punto es el paraboloide hiperbólico,  cuya gráfica parace una silla de montar a caballo, donde el púnto de silla es el centro, el punto donde se encuentran todas las lineas:


Podemos encontrar paraboloides hiperbólicos en los trabajos del arquitecto español-mexicano, Félix Candela (1910-1997), el “maestro de las cubiertas de hormigón” llevó al extremo las posiblidades estructurales de estas formas curvilíneas inversas, a través de finas estructuras laminares, con encofrados de madera, armado sencillo y vaciado de concreto.


Referencias:
Tomado del libro: INVESTIGACIÓN DE OPERACIONES UNA INTRODUCCIÓN; Hamdy A. Taha; Sexta edición.

http://www.zweigmedia.com/MundoReal/Summary3b.html

No hay comentarios:

Publicar un comentario

... deja aquí tus comentarios y recomiendo esta Web a tus conocidos.