TEORÍA DE JUEGOS APLICADA AL
MANEJO DE STOCK DE INVENTARIO
PERECEDERO

GAME THEORY APPLIED TO PERISHABLE INVENTORY

MANAGEMENT

Gibrán Aguilar Rangel

Universidad Autónoma de Querétaro
pág. 7472
DOI:
https://doi.org/10.37811/cl_rcm.v9i4.19340
Teoría de juegos aplicada al manejo de stock de inventario perecedero

Gibrán Aguilar Rangel
1
gibran.aguilar@uaq.mx

https://orcid.org/
0000-0002-5865-2875
Universidad Autónoma de Querétaro

México

RESUMEN

El manejo de inventario es un tema delicado en cualquier negocio, más aún cuando se trata de
inventario perecedero. Mucho se ha dicho sobre problemas en el manejo de inventario en cuanto a la
cadena de suministro y problemas con los proveedores, pero no se ha estudiado tanto el rol que tienen
los propios empleados del negocio para un correcto manejo del stock evitando que se descomponga
dicho inventario. En un negocio de venta de yogurt helado, en el que el stock principal es un producto
altamente perecedero, se estudia el conflicto de intereses entre dueño y empleados, utilizando un juego
dinámico para lograr alinear los intereses y obtener el mejor resultado para ambos.

Palabras clave: teoría de juegos, inventario perecedero, manejo de stock

1
Autor principal
Correspondencia:
gibran.aguilar@uaq.mx
pág. 7473
Game theory applied to perishable inventory management

ABSTRACT

Managing inventory
is a sensible subject in any business, specially when it comes to perisable
inventory.
Much has been said about inventory management issues in the supply chain and supplier
problems, but less has been studied about the role that employees play in properly managing stock and

preventing inventory spoilage. In a frozen yogurt business, where the main stock is a highly perishable

product, the conflict of interest between the owner and employees is studied, using a dynamic game to

align interests and achieve the best outcome for both.

Keywords
: game theory, perishable inventory stock management
Artículo recibido 22 julio 2025

Aceptado para publicación: 29 agosto 2025
pág. 7474
INTRODUCCIÓN

Para cualquier negocio que no sea de servicios, el área de almacén, es decir donde se almacena la
materia prima, es uno de los puntos más sensibles del negocio, ya que ahí reside el material
fundamental para las operaciones diarias, y un descontrol en el mismo puede conllevar graves
consecuencias para el resto de las actividades, el control de inventario es lo que permite a una empresa
ajustar y colocar el inventario requerido en los niveles necesarios (Movahed & Mokhtari, 2023). Tener
una falta o exceso de material causa perjuicios que pueden ir desde el pago extraordinario de costos de
almacenamiento, hasta la pérdida de clientes o incumplimiento de fechas compromiso, lo cual va
erosionando las relaciones comerciales. Cuando se habla de inventario, se utiliza el término stock, que
podrían verse como términos intercambiables pero tienen una definición más precisa. Stock consiste
en todos los bienes y materiales que son almacenados por una organización. Es una serie de objetos
que son guardados para un uso futuro. Un inventario es una lista de los artículos mantenidos en stock
(Donald Waters, p.4).

A decir de Waters (2003), un stock dentro de un negocio se va creando cuando dicho negocio va
adquiriendo material el cual no utilizara en ese momento, el material llega de un proveedor o es
comprado al proveedor y debe mantenerse dentro del stock hasta que vaya a utilizarse.

Existen dos modelos principales de inventarios: El modelo de cantidad fija de pedido y el modelo de
periodo de tiempo fijo. La diferencia principal entre ambos es que el modelo de cantidad fija está
impulsado por un evento y el modelo de periodo de tiempo fijo está impulsado por el tiempo.

Para ponerlo de una manera más clara, el modelo de cantidad fija de pedido inicia un nuevo pedido
cuando se presenta el evento de alcanzar un nivel específico para el nuevo pedido; este evento puede
ocurrir en cualquier momento, dependiendo de la demanda de los artículos considerados para este
modelo en el inventario. Por el contrario, el modelo de periodo de tiempo fijo se limita a colocar
pedidos al final de un periodo de tiempo predeterminado, solo el paso del tiempo impulsa el modelo.

En el modelo de cantidad fija de pedido (que coloca un pedido cuando el inventario restante cae a un
punto de pedido predeterminado) el inventario restante debe monitorearse continuamente. Así, el
modelo de cantidad fija de pedido es un sistema perpetuo que requiere que cada vez que se haga un
retiro o una adición al inventario, los registros deban actualizarse para asegurar que el punto del nuevo
pág. 7475
pedido se ha alcanzado o no. En un modelo de periodo de tiempo fijo, el conteo tiene lugar solo
durante el periodo de revisión.

En cuanto a los sistemas de manejo de inventario, dos de los más utilizados se tratan de los sistemas
Ultimas Entradas Primeras Salidas (UEPS) y Primeras Entradas Primeras Salidas (PEPS). Como sus
nombres lo indican, la diferencia entre ambos es como se comportará al stock, en el primero, lo más
reciente en inventario será lo primero que salga cuando el cliente adquiera un producto, mientras que
en el segundo lo más antiguo en inventario será lo que se surta primero al cliente.

Las discrepancias de inventario se refieren cuando el stock que se tiene varía del inventario registrado
por la compañía, esto puede ser que se tenga más producto del registrado o menos, comúnmente es
más frecuente el segundo caso. Existen diversas causas para estas discrepancias de inventario, desde
un error de captura cuando ingresa el stock, robo de productos por parte de clientes o empleados,
daños al inventario o expiración del producto (Li, Wang, & Chan, 2016).

La problemática de los inventarios perecederos

Se estima que un tercio del volumen total de productos alimenticios producidos se pierden o se tiran
(Ketzenberg, Gaukler, & Salin, 2017), esto derivado de diversos factores, entre ellos se cuenta el mal
manejo de inventarios. Ya sea por una sobreestimación de productos a vender, o condiciones
inadecuadas en el almacenaje de los mismos, el resultado se convierte en una perdida para el
vendedor, ya que, a diferencia de otros tipos de producto, los productos alimenticios al pasar cierto
tiempo, o al no almacenarse en ciertas condiciones, se vuelven imposibles de vender ni siquiera a
precio rebajado, ya que el consumidor no lo aceptaría, o bien podría causar problemas de salud
pública.

Un problema importante surge cuando no es evidente que parte del stock ya no es apto para su venta,
esto se da principalmente cuando el daño no es visible por la naturaleza propia del

producto, en productos empaquetados y/o que no expiden un olor evidente o muestran un color que lo
denote, por ejemplo (Abbou, Loiseau, Khaldi, & Farraa, 2017). Es en estos casos que el vendedor
tendrá una discrepancia en inventario sin saberlo hasta que realice una inspección o bien saque parte
del stock para su venta, si las inspecciones de inventario se realizan de manera frecuente, esto podrá
arreglarse de manera relativamente simple rellenando el stock con el proveedor. El vendedor incurrirá
pág. 7476
en una perdida por el inventario, pero será menor. En cambio, si la discrepancia es detectada hasta que
ese stock es lo último que queda de ese producto, se perderá una venta a cliente, se tendrá que realizar
un pedido de manera acelerada (si esa opción existe), siendo así no solo el costo del inventario
perdido, sino el costo de perder un cliente o clientes, aunado a los gastos por cubrir el stock faltante en
poco tiempo. Este es el problema que puede resultar de usar un sistema de control UEPS cuando se
manejan inventarios perecederos.

Teoría de juegos para problemas de inventario

La teoría de juegos busca analizar las opciones que tienen los participantes de un entorno, ya sea en
competencia, cooperación, conflicto, por medio de la construcción de un marco analítico que se centra
en participantes, estrategias, pagos e información (Lu, 2024). Si bien uno de los ejemplos más clásicos
es el dilema del prisionero, la teoría de juegos ha sido utilizada en el entorno de negocios para ayudar
en la toma de decisiones, permitiendo predecir por medio de un modelo matemático lo que harán los
competidores, o incluso los clientes y accionistas (Mahajan & Kaur, 2024).

La aplicación de teoría de juegos en situaciones de manejo de inventario no es algo novedoso en sí, ha
sido usada en trabajos previos para realizar modelos de cómo se comportará el inventario dentro de
una cadena de suministro, para la toma de decisiones en los modelos de inventario, ayudando a
determinar qué modelo escoger y cuando se deben hacer el resurtido del inventario, y también en el
manejo de inventarios perecederos, del lado del vendedor y del cliente (Herbon, 2017). Una
característica que tienen este tipo de trabajos es que ven a la organización como un ente con un
objetivo común, maximizando ganancias y reduciendo costos o gastos evitables. Sin embargo la
realidad es que las organizaciones están conformadas por grupos de personas que pueden tener
diferentes intereses entre si, no son los mismos objetivos los de los directivos que los de los
empleados, e incluso entre empleados habrá diferencia de objetivos de acuerdo al cargo. Antes de
preguntarse como la organización debe actuar ante el cliente como un jugador externo, este trabajo
propone tratar de alinear los objetivos de empleador y empleado tomándolos como dos jugadores con
objetivos distintos.

La franquicia de helado

Para el presente caso se analiza una situación real, que trata sobre el tema de inventario, y en
pág. 7477
específico el acomodo del mismo, es decir el tratamiento de stock, se estudia una heladería de una
franquicia, en la cual sus materias primas principales son de botes de helado de yogurt, se requiere
tener un stock del mismo, ya que el reabastecimiento es por intervalos de tiempo y no se puede
comprar materia prima si no es del franquiciatario

METODOLOGÍA

Con el objetivo de diseñar el modelo, se deben definir dentro de la situación planteada quienes son los
jugadores que son lo que participan dentro del juego, en este caso se trataría del dueño y del empleado.

El dueño, se encarga de adquirir la materia prima y pagar a los empleados, su rol principal en las
actividades directas del negocio incluye el comprar la materia prima en intervalos regulares de tiempo,
o bien en situaciones extraordinarias, en las que haya una baja de stock importante. Su objetivo
principal es maximizar utilidad, mediante la reducción de gastos y costos innecesarios.

El empleado, tiene como objetivo principal maximizar su ganancia personal, para esto cuenta con el
salario que le paga el dueño, así como las propinas que puede obtener de atender a los clientes, por lo
que las actividades que le reduzcan tiempo de atención a cliente, no le resultan tan importantes.

Para efectos del juego, las acciones de cada jugador son las decisiones que puede tomar ante una
situación. En el caso del empleado tiene la opción cuando llega la materia prima de Acomodar o No
acomodar. En el caso del dueño, ante las decisiones que tome el empleado respecto al acomodo de
materia prima, tiene las opciones de Sancionar o Bonificar.

El empleado tiene diversas funciones, la menos redituable de ellas (ya que no existe potencial de
propinas, es decir ingreso extra) es acomodar los botes nuevos de materia prima (helado) que van
llegando cada semana. El procedimiento ideal sería sacar los botes existentes de helado, acomodar los
nuevos al fondo y colocar los más antiguos al frente para su uso. Esto le toma más tiempo que
simplemente poner los nuevos al frente e ir empujando los antiguos atrás, sin embargo, esto causa que
exista producto que va caducando y afecta los ingresos del dueño.

El dueño prefiere que los empleados tomen más tiempo para acomodar la materia prima, para lograr
esto puede tomar dos rutas, Sancionar y Bonificar.

Sancionar implica que se va descontando la materia prima caducada del sueldo de los empleados.
pág. 7478
Bonificar implica que, de los ahorros por no tener materia prima caducada, da una parte a los
empleados. Si el dueño sanciona, no tendrá perdida de materia prima, y creará un antecedente con los
empleados, lo cual podría lograr que acomodaran el material de manera correcta, pero también podría
generar descontento, lo cual podría causar que renunciaran, situación no ideal para el dueño. Si
bonifica, creará un incentivo para los empleados para acomodar de manera correcta, sin embargo, no
garantiza que lo harán si consideran que las propinas pueden ser mayores al bono, y no crea una
disciplina en los empleados.

Planteamiento del juego

Se propone un juego dinámico en el que se buscan las estrategias posibles para cada jugador dado un
escenario y las decisiones del otro jugador. Se muestran las variables que se utilizan para realizar el
planteamiento del juego:

𝐽1: El jugador 1, que en este caso sería el dueño.

𝐽2: El jugador 2, que en este caso sería el empleado.

𝐴: Acomodar, el empleado coloca la materia prima más antigua primero.

𝑁𝐴: No Acomodar, el empleado ubica la materia prima más reciente primero.

𝑆: Sancionar, el dueño impone una sanción económica al empleado.

𝐵: Bonifica, el dueño da una recompensa económica, aparte del sueldo, al empleado. 𝐺: Ganancia,
para el empleado es el sueldo.

𝐵1: Representa el costo de acomodar, para el empleado es negativo cuando acomoda ya que es tiempo
que perdió de ganar propinas potenciales, para el dueño será positivo cuando el empleado acomoda ya
que representa que no perdió materia prima.

𝐵2 : Representa el costo de la sanción, para el empleado será negativo ya que es un descuento de su
sueldo, para el dueño es positivo ya que es dinero que ahorra en pagar al empleado.

𝐺1 : Para el dueño representa la ganancia por ventas.

𝐵3: Representa el costo de bonificar por acomodar, para el empleado será positivo ya que lo

recibe, para el dueño negativo, ya que lo otorga.
pág. 7479
Figura 1 Opciones del dueño

𝐸: Representa el costo de perder un empleado.

Las opciones del empleado por lo tanto sería acomodar o no acomodar, para el dueño sus opciones
serían sancionar o bonificar, dependiendo del comportamiento del empleado. Por lo que el árbol de
decisión en primera instancia quedaría de la siguiente manera

Figura 2 Opciones del empleado

Figura 3 Árbol de decisión inicial

Para definir los pagos en cada decisión, se asume que el costo de E será mayor que el de 𝐵2 en el caso
del jugador 2, para el jugador 1, se asume que la bonificación que recibirá por acomodar 𝐵3, será
mayor que el costo de acomodar 𝐵1.

Agregando la función de pagos para cada uno de los casos, con el fin de analizar los diferentes

𝐽
1 Dueño
Sanciona

Bonifica

𝐽
2 Empleado
Acomoda

No acomoda

𝐽
2
𝐽
1
𝐽
1
S

B

S

B

A

NA
pág. 7480
escenarios, queda ya un árbol con esta estructura.

Figura 4 Árbol con pagos

Para resolver este juego, será necesario partir de lo que sería la opción ideal para el jugador que elige
al final y resolverlo hacia atrás. Por tanto, en el caso de que el empleado acomode el inventario (A), el
jugador 1 tendrá dos opciones, que serán bonificar y sancionar, como el costo de perder un empleado
resulta mayor que el costo de otorgar una bonificación, el jugador 1 elegirá bonificar. En caso de que
el empleado elija no acomodar (NA), al jugador 1 le convendrá más sancionar, ya que la ganancia del
negocio, menos la perdida por no acomodas, más la sanción que impone al empleado, será mayor que
la ganancia del empleado, menos el costo de acomodar, menos el costo de bonificación.

Representado gráficamente quedaría de la siguiente manera

𝐽
2
𝐽
1
𝐽
1
S

B

S

B

A

NA

𝐺
𝐵1 + 𝐵3, 𝐺1 + 𝐵1 𝐵3
𝐺
𝐵1 𝐵2, 𝐺1 + 𝐵1 + 𝐵2 𝐸
𝐺
+ 𝐵1 + 𝐵3, 𝐺1 𝐵1 𝐵3
𝐺
+ 𝐵1 𝐵2, 𝐺1 𝐵1 + 𝐵2
pág. 7481
Figura 5 Resultado si el jugador 2 acomoda

Figura 6 Resultado si el jugador 2 no acomoda

Por lo que se concluye que para el jugador 1 la estrategia óptima será Bonificar / Sancionar. Al
conocer el jugador 2 cuál será la decisión que tomará el jugador 1 en cada opción, su opción como
jugador racional queda entre acomodar, cuyo pago es su sueldo menos el costo de acomodar, más la
bonificación, y no acomodar, cuyo pago es el sueldo más el costo de acomodar, menos la sanción, ya
que las otras opciones no son viables. Como se estableció que el pago de la bonificación resulta mayor
que el costo de acomodar para el empleado, su mejor opción queda como Acomodar.

El equilibrio de Nash en sub-juegos queda por tanto representado como A (B,S).

𝐽
2
𝐽
1
𝐽
1
S

B

S

B

A

NA

𝐺
𝐵1 + 𝐵3, 𝐺1 + 𝐵1 𝐵3
𝐺
𝐵1 𝐵2, 𝐺1 + 𝐵1 + 𝐵2 𝐸
𝐺
+ 𝐵1 + 𝐵3, 𝐺1 𝐵1 𝐵3
𝐺
+ 𝐵1 𝐵2, 𝐺1 𝐵1 + 𝐵2
𝐽
2
𝐽
1
𝐽
1
S

B

S

B

A

NA

𝐺
𝐵1 + 𝐵3, 𝐺1 + 𝐵1 𝐵3
𝐺
𝐵1 𝐵2, 𝐺1 + 𝐵1 + 𝐵2 𝐸
𝐺
+ 𝐵1 + 𝐵3, 𝐺1 𝐵1 𝐵3
𝐺
+ 𝐵1 𝐵2, 𝐺1 𝐵1 + 𝐵2
pág. 7482
Tabla 1 Pagos en el juego para determinar equilibrio de Nash

Si bien existe otro equilibrio al ponerlo en tabla, en A (B,B) eso implicaría asumir que el dueño va a
bonificar cuando el empleado no acomode, lo cual no sería una decisión racional, por lo que es un
escenario implausible.

RESULTADOS Y DISCUSIÓN

En la siguiente figura se muestran los mejores y peores resultados para cada jugador

Figura 7 Árbol de mejores y peores resultados para cada jugador.

El mejor resultado para el jugador 2, resulta el peor para el jugador 1, por lo que es imposible que vaya
a elegir dicho resultado, y siendo el jugador 1 el que toma la última decisión (puesto que es el que
emite el cheque del empleado), la opción de no acomodar se vuelve menos atractiva si se asume que es
un agente racional. El jugador 1 podría tener una opción más interesante en la opción de que el
empleado acomode y aun así sea sancionado, pero eso traería consigo la perdida de dicho empleado, lo
cual implicaría un costo mayor, convirtiéndose en una opción menos atractiva que la de pagar un
bono.

BB
BS SB SS
A
𝑮𝑩𝟏 +𝑩𝟑 𝑮𝑩𝟏 +𝑩𝟑 𝐺𝐵1 𝐵2 𝐺𝐵1 𝐵2
𝑮𝟏 + 𝑩𝟏 𝑩𝟑
𝑮𝟏 + 𝑩𝟏 𝑩𝟑 𝐺1 + 𝐵1 + 𝐵2 𝐸 𝐺1 + 𝐵1 + 𝐵2 𝐸
NA
𝐺 + 𝐵1 + 𝐵3 𝐺+𝐵1 𝐵2 𝐺+𝐵1 +𝐵3 𝐺 + 𝐵1 𝐵2
𝐺1 𝐵1 𝐵3
𝐺1 𝐵1 +𝐵2 𝐺1 𝐵1 𝐵3 𝐺1 𝐵1 +𝐵2
𝐽
2
𝐽
1
𝐽
1
S

B

S

B

A

NA

𝐺
𝐵1 + 𝐵3, 𝐺1 + 𝐵1 𝐵3
𝐺
𝐵1 𝐵2, 𝐺1 + 𝐵1 + 𝐵2 𝐸
𝐺
+ 𝐵1 + 𝐵3, 𝐺1 𝐵1 𝐵3
𝐺
+ 𝐵1 𝐵2, 𝐺1 𝐵1 + 𝐵2
pág. 7483
Representando esto en cantidades, con un estimado de los sueldos y ganancias reales de una franquicia
de este tipo, quedaría de la siguiente manera (las cantidades están expresadas en miles, para
simplificar).

𝐺: 1.5

𝐵1: .3

𝐵2 : .8

𝐺1 : 6

𝐵3: .5

𝐸: 1.5

Figura 8 Árbol de resultados con cantidades en dinero (expresado en miles).

Al reemplazar las cantidades en las ecuaciones queda de la siguiente forma

Esto permite ver el juego de una manera más clara, se observa que el mayor pago para el dueño resulta
de que el empleado no acomode y sea sancionado, mientras que el mayor pago para el empleado
resulta de no acomodar y ser bonificado, ese sub-juego no tendría un equilibrio puesto que el
empleado siempre preferirá sancionar a bonificar. En el primer sub- juego el dueño gana más al
bonificar que al sancionar y el empleado gana más al ser bonificado que al ser sancionado, por lo que
sería la solución al juego completo.

0.4, 5.6

𝐽
2
𝐽
1
𝐽
1
S

B

S

B

A

NA

1
.7, 5.8
2
.3, 5.2
1
, 6.5
pág. 7484
Figura 9 Árbol de resultados con mejor opción

CONCLUSIONES

El caso utilizado para el presente trabajo ha sido una problemática constante para el dueño de la
franquicia mencionada, la solución que ha estado empleando ha sido la de sancionar, sin embargo, esto
ha traído consigo una alta rotación de personal ya que su sueldo termina siendo menor de lo deseado y
de lo que podrían conseguir en otros trabajos de atención a clientes en los que no lidien con
inventarios perecederos.

La teoría de juegos ayuda a tomar decisiones más racionales y que beneficien a ambas partes, en el
presente caso, se denota que la decisión más adecuada sería bonificar a los empleados en lugar de
sancionarlos, lo cual evitaría la rotación de personal y la perdida de materia prima por expiración. Se
utilizó una estrategia de juegos dinámicos ya que las decisiones son secuenciales, cuando el empleado
está decidiendo si acomodar o no acomodar, será una vez que tome esa decisión que el dueño deberá
decidir si bonifica o sanciona, una acción depende de otra, un juego estático no serviría para este tipo
de situaciones.

El modelo aquí presentado podría ser útil no solo para este caso, sino para casos similares en los que
los dueños de negocios tengan que lidiar con inventarios perecederos y empleados, con el fin de
alinear los objetivos de los empleados a los objetivos de la organización.

0.4, 5.6

𝐽
2
𝐽
1
𝐽
1
S

B

S

B

A

NA

1
.7, 5.8
2
.3, 5.2
1
, 6.5
pág. 7485
REFERENCIAS BIBLIOGRÁFICAS

Abbou, R., Loiseau, J. J., Khaldi, H., & Farraa, B. B. (2017).
On Inventory Control For Perishable
Inventory Systems Subject To Uncertainties On Customer Demands. IFAC
-PapersOnLine,
50(1), 10172
10177. https://doi.org/10.1016/j.ifacol.2017.08.1765
Herbon, A. (2017). A non
-cooperative game model for managing a multiple-aged expiring inventory
under consumers’ heterogeneity to price and time. Applied Mathematical Modelling, 51, 38

57.
https://doi.org/10.1016/j.apm.2017.06.006
Ketzenberg, M., Gaukler, G., & Salin, V. (2017). Expiration Dates and Order Quantities for

Perishables. European Journal of Operational Research, 0, 1
16.
https://doi.org/10.1016/j.ejor.2017.10.005

Li, M., Wang, Z., & Chan, F. T. S. (2016). A robust inventory routing policy under inventory

inaccuracy and replenishment lead
-time. Transportation Research Part E: Logistics and
Transportation Review, 91, 290
305. https://doi.org/10.1016/j.tre.2016.05.001
Lu, J. (2024). Exploration on the Application of Game Theory in Business Competition Strategies.

International Journal of Global Economics and Management, 5(1), 20
26.
https://doi.org/10.62051/ijgem.v5n1.03

Mahajan, S., & Kaur, T. (2024). Game Theory in Business: Strategic Decision
- Making for
Competitive Advantage.

Movahed, A. B., & Mokhtari, H. (2023). Development of an Inventory Control Model for Reusable

Items: Economic Quantities of Order and Recovery.

Waters, D. (2008). Inventory control and management.
Wiley.