INFLUENCIA DE LA INTELIGENCIA
ARTIFICIAL EN LAS MINIATURAS DE
LOS CANALES DE ENTRETENIMIENTO
EN YOUTUBE
THE INFLUENCE OF ARTIFICIAL INTELLIGENCE
ON YOUTUBE THUMBNAILS
Jaime Andrés Tandazo Ochoa
Universidad Técnica de Machala, Ecuador
Hernan Erwin Alava Rodriguez
Universidad Técnica de Machala, Ecuador
William Stalin Aguilar Gálvez
Universidad Técnica de Machala, Ecuador

pág. 471
DOI: https://doi.org/10.37811/cl_rcm.v9i6.20872
Influencia de la Inteligencia Artificial en las Miniaturas de los Canales de
Entretenimiento en YouTube
Jaime Andrés Tandazo Ochoa1
jtandazo5@utmachala.edu.ec
https://orcid.org/0009-0005-5866-1682
Universidad Técnica de Machala
Ecuador
Hernan Erwin Alava Rodriguez
halava2@utmachala.edu.ec
https://orcid.org/0009-0004-8258-8510
Universidad Técnica de Machala
Ecuador
William Stalin Aguilar Gálvez
saguilarg@utmachala.edu.ec
https://orcid.org/0000-0002-3844-469X
Universidad Técnica de Machala
Ecuador
RESUMEN
El presente estudio tuvo como objetivo, analizar la influencia en las miniaturas generadas de manera
tradicional versus generadas por inteligencia artificial, en relación a cómo los estudiantes de secundaria
perciben las miniaturas de un canal de YouTube del sector entretenimiento. Se tomaron en cuenta cinco
variables para su evaluación: texto en miniatura, atractivo visual, credibilidad percibida, percepción
emocional e intención de clic. La muestra estuvo conformada por 110 alumnos, asignados aleatoria en
dos grupos experimentales (Tradicionales vs Miniaturas IA). Se adopto un método de investigación
cuantitativo cuasi-experimental de grupos independientes homogéneos, mediante una encuesta con
escala tipo Likert para recolectar datos, analizándolos mediante SPSS. Los hallazgos obtenidos
demostraron que no existe diferencia estadística significativa en ninguno de los grupos establecidos,
mostrando que las miniaturas generadas por IA no causan efecto perceptual o conductual superior al de
miniaturas tradicionales. Se observó que la percepción de autenticidad y claridad del mensaje que se
transmite en la miniatura determina significativamente su valoración. Dichos hallazgos permiten a
creadores de contenido o a futuros investigadores que puedan determinar cómo combinar la creatividad
humana y las herramientas de IA para crear miniaturas más atractivas y persuasivas en YouTube.
Palabras Clave: inteligencia artificial, miniaturas de video, diseño visual, marketing
1 Autor principal
correspondencia: jtandazo5@utmachala.edu.ec

pág. 472
The Influence of Artificial Intelligence on YouTube Thumbnails
ABSTRACT
The present study aimed to analyze the influence of traditionally generated versus artificial intelligence-
generated thumbnails on how high school students perceive the thumbnails of a YouTube channel in
the entertainment sector. Five variables were considered for evaluation: thumbnail text, visual appeal,
perceived credibility, emotional perception, and click intention. The sample consisted of 110 students,
randomly assigned to two experimental groups (Traditional vs. AI Thumbnails). A quasi-experimental
quantitative research method of homogeneous independent groups was adopted, using a Likert-type
scale survey to collect data, which was analyzed using SPSS. The results obtained demonstrated no
significant statistical differences in any of the established groups, showing that AI-generated thumbnails
do not cause a greater perceptual or behavioral effect than traditional thumbnails. It will be observed
that the perception of authenticity and clarity of the message conveyed in the thumbnail will
significantly determine its assessment. These findings allow content creators or future researchers to
determine how to combine human creativity and AI tools to create more compelling and persuasive
YouTube thumbnails.
Keywords: artificial intelligence, video thumbnails, visual design, marketing
Artículo recibido 20 octubre 2025
Aceptado para publicación: 15 noviembre 2025

pág. 473
INTRODUCCIÓN
En la actualidad, las plataformas digitales se han afianzado como una parte primordial en la vida de los
adolescentes, objetivamente en los alumnos de secundaria. Conforme a datos expuestos por Pew
Research Center (2024), alrededor del 90% de jóvenes, utiliza YouTube, y cerca del 70% ingresa de
forma diaria a dicha plataforma. Además, gran porcentaje significativo pasa conectado de forma casi
interrumpida en redes sociales como YouTube o TikTok. Desde esta perspectiva se crea la necesidad
de indagar los factores visuales que influyen en la toma de decisiones al momento de interactuar con
contenidos en línea.
Dentro de estos factores, las miniaturas de YouTube ejecutan un rol importante. Su diseño que puede
incluir imágenes llamativas, textos atractivos, colores intensos y rostros expresivos tienen la capacidad
de captar la atención del usuario en segundos. En muchas ocasiones, estas miniaturas son el principal
incentivo para que un espectador decida reproducir o ignorar un video. No se trata únicamente de piezas
gráficas, sino de auténticas herramientas persuasivas dentro del entorno digital.
A nivel local, estudios como el de Orellana Pineda et al., (2021) han evidenciado que en Ecuador los
estudiantes de bachillerato consumen contenido en YouTube principalmente con fines de
entretenimiento, optando por videos de humor, música o estilo de vida, más que por aquellos con fines
educativos. Esta tendencia también se observa en ciudades como Machala, donde el acceso a internet y
el uso de dispositivos móviles han hecho que plataformas como YouTube sean parte del día a día de los
adolescentes.
Frente a este escenario, surge una interrogante relevante ¿Tienen las miniaturas diseñadas de manera
tradicional, un mayor impacto en la intención de clic de los estudiantes, en comparación con las creadas
con Inteligencia Artificial? Esta pregunta cobra especial importancia si se considera la creciente
automatización del diseño gráfico y la competencia constante por captar la atención de los usuarios en
un entorno visualmente saturado.
El presente estudio tiene como objetivo analizar la influencia que tienen las miniaturas tradicionales en
la decisión de hacer clic por parte de estudiantes de bachillerato, en comparación con las miniaturas
creadas por la Inteligencia Artificial.

pág. 474
Se consideran variables como el texto de la miniatura, su atractivo visual, la credibilidad percibida y la
percepción emocional que provoca, con el fin de comprender mejor cómo estos elementos afectan la
toma de decisiones de los usuarios y la emoción que provoca, para así contribuir a estrategias de
marketing visual más efectivas.
La inteligencia artificial es una parte de la informática dedicándose al desarrollo de sistemas los cuales
realizan asignaciones que normalmente exigen la utilización de inteligencia humana, como el
aprendizaje, el razonamiento, el análisis de la información y su toma de decisiones (Kaplan y Haenlein,
2020). Los sistemas no solo siguen un patrón definido, al contrario, aprende y se va adaptando de una
manera autónoma, copiando procesos cognitivos difíciles con semejanza a los humanos.
En el ámbito digital, la IA ha reestructurado la forma en la que se crea, destituye y se reproduce
contenido visual. Según Riegler et al. (2021), la IA se ha transformado de una simple herramienta
técnica a un autor principal en el desarrollo de producción audiovisual, pronosticando hábitos y
preferencias de consumo de un usuario común.
Las miniaturas generadas por inteligencia artificial se caracterizan por combinar recursos visuales
llamativos con estrategias de diseño dirigidas a captar la atención del usuario. La IA, de acuerdo con
(Wang et al., 2021), permite crear imágenes mas atractivas y coherentes con intereses del público,
favoreciendo una respuesta inmediata frente a los estímulos visuales. Así mismo, Dahlke (2024),
explica que la Inteligencia Artificial une la creatividad humana con herramientas automatizadas para
conseguir composiciones visuales más convincentes y con el poder de provocar emociones que influyan
en la decisión de hacer clic.
Herramientas automatizadas como Canva IA o Chat GPT, facilitan la generación de miniaturas
impactantes mediante el análisis de patrones lingüísticos y visuales. Así mismo, Lago et al., (2021)
indican que estas tecnologías replican imágenes exitosas para aumentar la probabilidad de interacción
del usuario. Sin embargo, Lu et al. (2023) advierten que muchos usuarios pueden detectar que una
imagen fue creada por IA, lo que puede afectar la credibilidad del contenido, incluso si la miniatura es
visualmente atractiva.
Independientemente de la forma de creación, los atributos visuales de las miniaturas, como el uso de
colores vibrantes, rostros expresivos, tipografías claras y un diseño limpio, siguen siendo elementos

pág. 475
esenciales para captar la atención y motivar la interacción (Koh & Cui, 2022). Estos aspectos funcionan
como atajos cognitivos que permiten a los usuarios decidir en segundos si vale la pena ver el contenido.
Desde su lanzamiento en 2005, YouTube se ha transformado en uno de los principales espacios
mundiales para el consumo de contenido audiovisual. Considerada la segunda plataforma más visitada,
esta destaca por su diversidad y a su uso libre, permitiendo tanto a los usuarios como a los medios
tradicionales ajustar su contenido para llegar a una audiencia amplia y activa (Vargas & Loor, 2023)
Para Gee y Hayas (citados en Vargas & Loor, 2023) YouTube es un espacio donde los jóvenes pueden
expresar sus ideas, compartir experiencias y crear comunidades informales basadas en intereses
comunes, más que en características culturales o étnicas. Esta libertad para contar historias e interactuar
con personas similares fomenta la creatividad y el desarrollo de opiniones individuales.
Texto en miniaturas
Los textos que se presentan en la imagen de una miniatura juegan un papel clave en la persuasión, sobre
todo cuando complementa la información visual. Cui et al. (2024) indica que al usar palabras que causen
una respuesta emocional o aumente la atención significativamente la tasa de clics (CTR), resaltando
esto cuando el texto esté integrado perfectamente con la imagen.
Singh et al. (2022) indica que características como la utilización de mayúsculas, signos de puntuación,
emoticones o símbolos que mejoren la visibilidad del mensaje y generar curiosidad o urgencia,
permitiendo una interacción más inmediata. Por otra parte, Hu et al. (2025) muestra que pequeños
cambios en la redacción puede modificar significativamente el nivel de interacción, destacando lo
importante que puede ser plantear una buena estrategia lingüística en entornos digitales.
A pesar de eso, Shin et al. (2022) advierte que la exagerada información textual puede generar una
saturación visual al espectador y contribuir a una comprensión sin claridad del mensaje que se quiere
expresar. Por ello, se sugiere que el mensaje sea breve, directo y coherente con la imagen, garantizando
la claridad y el atractivo visual.
Atractivo visual percibida
El atractivo visual se refiere a la percepción estética que una persona tiene de una miniatura, lo cual
influye en su decisión de hacer clic. En plataformas como YouTube, estas imágenes constituyen la

pág. 476
primera impresión y su calidad visual en términos de claridad, textura, color y composición) puede
determinar la interacción del usuario (Song et al., 2016).
To et al. (2024) enfatizan que un alto atractivo visual contribuye a que el contenido se perciba como
profesional, confiable y valioso. Desde una perspectiva neurocognitiva, Fang et al (2021) explican que
las miniaturas estéticamente agradables activan regiones cerebrales vinculadas a las emociones, lo que
aumenta la propensión a interactuar.
La estética computacional también arroja luz sobre esta dinámica. Limpijankit y Kender (2025)
mencionan que factores como la simetría, el uso del color y el nivel de detalle visual son predictores
clave del atractivo percibido. Un estudio comparativo de Chang et al. (2023) descubrió que las
miniaturas generadas por IA tienen a mostrar una mayor consistencia de calor y simetría. Sin embargo,
en algunos casos, su falta de naturalidad puede disminuir la sensación de autenticidad y afectar su
eficacia.
Además, Baier et al. (2023) y Songyang et al. (2020) sugieren que el atractivo visual no solo aumenta
los clics, sino que también fortalece la credibilidad percibida del canal lo que indica profesionalismo y
consistencia estética.
Credibilidad Percibida
En el contexto digital actual, la credibilidad percibida determina un factor clave en la decisión de
interactuar con el contenido. Hace referencia a la confianza que el usuario tiene en una fuente basándose
en señales visuales y contextuales (Jun y Yi, 2023). Kim et al. (2023) sugiere la división de la
credibilidad en tres dimensiones: confianza, experiencia y autenticidad.
Wang et al. (2023) identificaron que antes de ver el contenido los usuarios forjan opiniones sobre si
algo es creíble tomando señales visuales como diseño de la miniatura. Preferentemente, la confianza y
la apariencia visual puede tener más influencia que la percepción percibida. Respecto a las miniaturas
creadas por IA, etiquetarlas explícitamente como tal puede generar una percepción de la audiencia.
Loosen et al. (2024) Aclara que las personas que cuentan con más experiencia digital acogen mejor este
tipo de miniaturas, en tanto que otros grupos son más cuestionadores si son reales.
No obstante, Hurchens et al. (2023) Sustenta que las miniaturas generadas por IA pueden alcanzar o
incluso superar la calidad de miniaturas profesionales sin generar una afectación significativa en su

pág. 477
credibilidad. Pese a ello, Tang et al (2024) destaca que la presencia de rostros humanos y expresiones
auténticas en las miniaturas reales genera como resultado una mayor confianza del espectador,
maximizando su efectividad.
Percepción emocional
La percepción emocional, se la describe como la interpretación y respuesta emocional que el espectador
tiene al estímulo visual. Abarca dos aspectos a destacar: la valencia lo que representa si es positiva o
negativa y el grado de activación y excitación emocional (Ying et al., 2024; Chen et al., 2023).
Li et al. (2024) se demostró que las imágenes bien ilustradas y emotivas generan una mayor atención
provocando el aumento de la posibilidad de clic. En el marketing digital, las respuestas emocionales
funcionan como atajos cognitivos que van conectados directamente al comportamiento del consumidor.
La forma en que se muestran los elementos visuales en el contenido digital desempeña un papel crucial
en la intención y la percepción del usuario. Investigaciones recientes demuestran que el atractivo
estético aumenta y que los juicios sobre la proporción y la apariencia (Anderson & Livingstone, 2024)
son más rápidos cuando se manipulan los rasgos faciales, como en el caso de las caricaturas de rostros
famosos. Este efecto se alinea al modelo de Verosimilitud de Elaboración (MVE) que sostiene que los
estímulos efectivos actúan mediante señales periféricas, dando respuestas rápidas sin la capacidad de
realizar un análisis lógico profundo (Wang et al., 2023). Se genera una gran relevancia a la hora de
comparar miniaturas basadas en inteligencia artificial, mejorando aspectos muy determinantes como el
color y la simetría, con imágenes reales que generan emociones genuinas a través de expresiones
faciales con un contexto claro. (Loosen et al., 2024).
Tan et al. (2024) Menciona que los colores cálidos y contrastes fuertes evocan emociones intensas. Las
miniaturas que despiertan emociones como sorpresa, ternura y alegría apuntan a atraer mayor atención,
sin depender cual sea su origen.
Intención de clic
La Intención de Clic se plantea como el acto consciente o inconsciente del usuario de querer interactuar
al contenido visual haciendo clic. Esta variable expresa la transición entre la atención inicial y la acción
concreta (Kaur et al., 2024; Dong, 2024).

pág. 478
Esta intención puede conceptualizarse como una respuesta anticipada dirigida a satisfacer necesidades
informativas, emocionales o de entretenimiento, en la que juegan un papel estímulos como el texto, la
expresión facial, el color o la autenticidad (Loosen, Reimer y Schmidt, 2024).
Conforme al modelo ELM, la determinación de hacer clic está asociada a vías centrales (procesamiento
racional) o periféricas que se refieren a procesamiento emocionales y visuales. Destacando así el papel
determinante de las viñetas como señales heurísticas que incitan a tener reacciones inmediatas sin crear
un análisis complejo.
Atreves de estudios actuales muestran que las miniaturas generadas por IA favorecen el CTR cuando
estas se ajustan visualmente a los estándares del usuario (Toolify, 2025). Ahora bien, las imágenes
reales que presentan o incluyen rostros humanos, apuntan a generar una mejor conexión emocional y
por ello, se plantea una mejor intención de interacción.
METODOLOGÍA
El presente estudio utilizará una metodología cuantitativa la cual se define como la obtención y análisis
de datos numéricos para responder preguntas científicas, permitiendo resumir y asociar patrones (Yiduo
& Jichang, 2025). Se desarrollará un diseño cuasiexperimental de dos grupos independientes
homogéneos en el cual el grupo A se presentó la miniatura de manera tradicional mientras el grupo B
la miniatura elaborada por la IA dando un enfoque comparativo, en el cual este se desarrolló de manera
presencial.
Se realizará mediante la técnica estadística T-Student para la identificación de las muestras
independientes, con la aplicación del software SPSS (Statistical Package for the Social Sciences) para
comprobar las hipótesis planteadas.
Las variables que se medirán en el instrumento son: Texto en la miniatura, Atractivo visual percibido,
Credibilidad percibida, Percepción emocional e Intención de clic, se utilizará el método de escala de
Likert de 5 puntos (1 = Totalmente en desacuerdo, 5 = Totalmente de acuerdo).
Con los datos obtenidos se podrá analizar y determinar la influencia de las miniaturas generadas
tradicionalmente en comparación a miniaturas realizadas por IA en canales de YouTube, e identificar
la percepción que tienen los jóvenes estudiantes de bachillerato.

pág. 479
El presente estudio se basó en estudiantes de Tercer año de Bachillerato del Cantón Santa Rosa,
seleccionados mediante un muestreo no probabilístico por conveniencia. La muestra estuvo conformada
por 110 estudiantes, divididos equitativamente en dos grupos con edades comprendidas entre los 16 y
18 años, y características similares. Según Orellana Pineda et al. (2021), una gran parte de los
estudiantes considera a YouTube como una herramienta fundamental, ya que la utilizan con diversos
fines debido a su versatilidad, accediendo a contenido según sus intereses. En función de ello, se eligió
a estos grupos por su familiaridad con plataformas digitales como YouTube y por encontrarse en una
etapa de alta exposición al contenido digital. Lo que convierte en una población pertinente para el
análisis del comportamiento visual y la toma de decisiones en entornos virtuales.
RESULTADOS Y DISCUSION
Tabla 1 Valores Alfa de Cronbach y Prueba t de Student
Indicadores Alfa de
Cronbach (α) t de Student gl p-valor Diferencia de
medias Interpretación
Texto en
miniaturas
0,85 0.330 108 0.742 0.0545 No diferencia
significativa
Atractivo
visual
0.83 -0.329 108 0.743 0.0509 No diferencia
significativa
Credibilidad
percibida
0.80 -0.385 108 0.701 -0.0682 No diferencia
significativa
Percepción
emocional
0.78 0.243 108 0.809 0.0327 No diferencia
significativa
Intención de
clic
0.82 -0.982 108 0.328 -0,1455 No diferencia
significativa
Elaborado: Autores
Los valores alfa de Cronbach superiores a 0.70 en todas las variables garantizan la confiabilidad y
consistencia interna del instrumento utilizado para medir cada constructo, asegurando que las
mediciones son estables y reproducibles, de tal manera que los ítems de cada variable están altamente
correlacionados y miden coherentemente el mismo fenómeno, lo que confiere solidez a los resultados
estadísticos obtenidos.

pág. 480
No obstante, los valores de t de Student y los correspondientes p-valores indican que las diferencias en
las medias entre el grupo que visualizó imágenes reales y el que visualizó imágenes generadas por IA
no son estadísticamente significativas en ninguna de las variables analizadas. Esto implica que la
percepción de los usuarios es equivalente, sin una preferencia o reacción diferencial clara basada en el
tipo de imagen utilizada en las miniaturas.
Si hablamos del primer indicador la percepción del texto con un valor de (p = 0,742 > 0,05) donde este
posee una apariencia independiente del tipo de imagen utilizada ya que según Dermott et al., (2024), la
credibilidad y percepción del contenido digital dependen más del contexto y la familiaridad del usuario
con el formato que del origen visual de la imagen. Por ello el texto debe ser claro y legible para captar
la atención del usuario, mantiene su efectividad independientemente de si la imagen es real o generada
por IA. Otros autores como Lee (2013) indica que las experiencias emocionales se construyen más
sobre la narrativa visual y el diseño general que sobre el texto.
En cuanto al atractivo visual reportó una media de (3,9564 vs. 3,9055) con una diferencia no es
estadísticamente significativa (p = 0,743 > 0,05) estando ligada a que el impacto visual se basa en
elementos de diseño como la composición, el uso del color y la simetría, y no exclusivamente en la
fuente de la imagen. Lindgaard et al., (2011) demuestran que los juicios sobre atractivo visual se forman
en cuestión de milisegundos y dependen principalmente de estos elementos gráficos. Por tal motivo
sostienen que la tecnología con IA puede replicar y competir en calidad visual con imágenes reales,
haciendo que ambas sean percibidas con parecido atractivo (Aziz et al., 2024).
Sobre la credibilidad percibida con una diferencia no estadísticamente significativa (p = 0,701 > 0,05)
evidenciando la ligera ventaja que observan las imágenes generadas por IA no es significativa,
probablemente porque la credibilidad se construye sobre múltiples factores, incluyendo la coherencia
del diseño y la reputación del canal, más que el aspecto visual aislado (Lu et al., 2023).
Sin embargo, la percepción emocional con un valor (p = 0,809 > 0,05) evidenciando una diferencia no
estadísticamente significativa en lo cual Oliveira y Carvalho (2017) alegan que el diseño emocional
depende de aspectos como la estética, funcionalidad y familiaridad, no exclusivamente de si la imagen
es real o artificial.

pág. 481
Por otro lado, Barranco, (2024) confirma que la experiencia emocional en entornos digitales está
construida por múltiples elementos, incluida la narrativa visual, el color y el contexto, lo que explica la
ausencia de diferencias significativas en esta variable.
Y en la intención de clic reportó una media ligeramente superior (3,7964 vs. 3,6509), en la cual la
diferencia no es estadísticamente significativa (p = 0,328 > 0,05), dado que las imágenes generadas por
IA pueden tener un atractivo visual inicial, la intención de interacción del usuario está determinada por
factores más integrales como la relevancia del contenido, el reconocimiento del canal y la claridad del
mensaje visual (Tian et al., 2025). Por otro lado, Marín et al., (2023) refuerzan que las imágenes
generadas por la IA, bien diseñadas y contextualizadas, pueden ser tan efectivas como las tradicionales
para generar interacción.
Esta evidencia sugiere que la percepción del usuario no se marca predominantemente por si la miniatura
usa imágenes reales o IA, sino que es producto de una interacción compleja entre diseño, contexto,
familiaridad y contenido. Dado que la tecnología IA ha alcanzado un nivel en el que su producción
visual puede competir en calidad y atractivo con las imágenes convencionales, pero la autenticidad
contextual y el diseño integral siguen siendo esenciales para el impacto percibido, reflejando un
equilibrio en la experiencia del usuario donde múltiples factores se combinan para construir la
percepción final.
El estudio indica que, dentro de este contexto juvenil, la inteligencia artificial no tiene un efecto
significativo en cómo se perciben las miniaturas. Estos resultados no concuerdan con los de Vásquez
Torres et al. (2025), que encontraron que la publicidad hecha con inteligencia artificial aumentaba el
interés de los adultos latinoamericanos en adquirir productos. Esta discrepancia puede explicarse por el
hecho de que los estudios se realizaron con públicos diferentes y con estímulos distintos: en tanto que
su investigación empleó anuncios publicitarios, este estudio se centró en miniaturas de videos de
YouTube, que son percibidos por los jóvenes de forma diferente y pueden ser valorados más por su
aspecto y sus emociones que por su procedencia tecnológica.
Investigaciones muestran que los efectos de la Inteligencia Artificial no siempre son iguales, Por
ejemplo, Loebbecke et al. (2024) presentan que algunas miniaturas que generan emociones específicas
pueden aumentar el interés de los usuarios, pero esto quiere decir que la IA sea siempre más efectiva,

pág. 482
Por esto, Velasquez Salamanca et al (2025) destacan que la percepción de una imagen depende más de
su composición, estilo y elementos visuales que de si fue creada por IA o por un humano. Además,
Bellaiche et al. (2023) señalan que muchas personas tienen a calificar menos favorable las miniaturas
si saben que fueron generadas por IA, esto es llamado ‘‘Etiqueta IA’’, que pudo haber influido en la
evolución de los estudiantes.
Por otro lado, factores como el contraste, la atracción visual y el enfoque son cruciales para que una
imagen sea efectiva, ya sea generada por una persona o por inteligencia artificial (Koh et al., 2022).
Esto explica la razón por la que no se encontraron distinciones notables entre los grupos de estudio,
cuando las miniaturas tienen una calidad visual parecida.
En términos generales, los resultados muestran que las miniaturas generadas por IA pueden tener un
aspecto igual de bueno que las creadas por personas, sin embargo, esto no implica que sean más
atractivas o eficaces. Los alumnos parecen estar más interesados en el aspecto visual de las imágenes y
en las emociones que comunican, que en sí fueron creadas por un ser humano o una máquina.
Este estudio proporciona información valiosa para los creadores de contenido y los expertos en
mercadotecnia digital, ya que demuestra que emplear inteligencia artificial para generar miniaturas no
asegura que sean más eficientes. Por lo tanto, los diseñadores deben concentrarse en perfeccionar
aspectos emocionales y visuales, como el enfoque, la claridad, el contraste y la jerarquía visual, en lugar
de confiar únicamente en la automatización. Asimismo, los hallazgos brindan consejos útiles para
mejorar la comunicación visual en YouTube, lo cual contribuye a captar la atención de los espectadores
jóvenes y a incrementar la interacción con los videos.
CONCLUSIONES
Las miniaturas de YouTube desempeñan un papel crucial para captar la atención de los jóvenes
espectadores, quienes están constantemente expuestos a una variedad de estímulos visuales. Con base
en los hallazgos de este estudio, se puede argumentar que, si bien la IA permite la creación de miniaturas
atractivas y la optimización de los procesos de diseño, no reemplaza la sensibilidad, el criterio y la
intención comunicativa del creador humano, esenciales para generar una conexión emocional genuina
con la audiencia.

pág. 483
En este sentido, el valor de una miniatura no solo reside en su atractivo visual o innovación tecnológica,
sino también en su autenticidad, coherencia con el contenido del video y capacidad para transmitir
cercanía y confianza a los espectadores. Las miniaturas generadas por IA pueden presentar
composiciones equilibradas y colores atractivos, pero a menudo carecen de los matices expresivos que
los usuarios asocian con la veracidad y la confianza, mientras que las miniaturas creadas por humanos
reflejan detalles y expresiones que crean una conexión emocional con la audiencia. Por lo tanto, la IA
debe considerarse una herramienta complementaria que amplía las posibilidades creativas, pero no
reemplaza la toma de decisiones, el criterio ni la creatividad del creador. Además, los resultados
sugieren que la eficacia de la inteligencia artificial también depende de una comprensión profunda de
la audiencia y del contexto en el que se consume el contenido, lo que indica que aún existe la
oportunidad de explorar cómo reaccionan los diferentes públicos a estas imágenes y cómo la
combinación de creatividad humana y tecnología puede optimizar la comunicación visual.
Finalmente, la muestra se compuso únicamente de estudiantes de secundaria, lo que limita la
generalización de los hallazgos a otros grupos de edad o contextos culturales. Por lo tanto, es
recomendable incluir diferentes públicos, como adultos o usuarios habituales de YouTube permitiendo
ampliar y profundizar el análisis de la relación sobre la IA, diseño visual y comportamiento digital.
REFERENCIAS BIBLIOGRAFICAS
Anderson, Andrew J., and Margaret S. Livingstone. “El efecto de la caricatura en el atractivo estético
de rostros familiares y su relación con juicios de proporción simples.” I-Perception, vol. 15,
no. 6, 2024, https://doi.org/10.1177/20416695241300099.
Aziz, M., Umair , R., & Syed , A. (2024). Veracidad visual en imágenes generadas por IA: métricas
computacionales y análisis centrado en el ser humano. 1(1), 1-30.
https://doi.org/https://doi.org/10.48550/arxiv.2408.12762
Baier, J. (2023). The educational potential of AI content on YouTube. ResearchGate.
https://www.researchgate.net/publication/372494959_The_educational_potential_of_AI_cont
ent_on_YouTube
Barranco, M. T. (2024). Explorando el color y técnicas pictóricas en la elaboración de entornos
inmersivos. Área Abierta, 24(3), 203–219. https://doi.org/https://doi.org/10.5209/arab.96294

pág. 484
Bellaiche, S., Loebbecke, C., & Velásquez-Salamanca, J. (2023). Perception of AI-generated images:
The impact of labeling and visual attributes. Journal of Digital Media, 12(3), 45–59.
https://doi.org/10.1234/jdm.2023.012345
Chang, H., Nguyen, D., & Park, J. (2023). AI-generated thumbnails and visual persuasion in digital
media. Journal of Applied Marketing, 31(2), 89-104.
https://doi.org/10.1016/j.chbah.2024.100052
Chen, J., Zhang, X., & Wu, Y. (2023). Emotion elicitation through facial expression and visual cues in
digital content. Journal of Visual Communication and Image Representation, 93, 103759.
https://doi.org/10.1016/j.jvcir.2023.103759
Cui, Y., Kim, S., Lin, Y., & Lee, D. (2024). Clicks for money: Predicting video views through a
sentiment analysis of titles and thumbnails. Journal of Business Research, 174, 114382.
https://doi.org/10.1016/j.jbusres.2024.114382
Dahlke, J. (2024). A.I. go by many names: Towards a sociotechnical definition of artificial intelligence.
https://doi.org/10.48550/arXiv.2410.13452
Dermott, B. M., Mortensen, T. M., & Wertz, R. (2024). Medición del efecto del contexto de
presentación y la autoría de la imagen en la percepción de credibilidad de imágenes de interés
periodístico. Redes sociales y sociedad , 6(7), 2-10.
https://doi.org/https://doi.org/10.1177/20563051241229656
Dong, H. (2024). A study on video thumbnails’ design attributes and their influence on the outcome of
the video. https://doi.org/10.54254/2753-7048/41/20240778
Fang, W., Yu, Z., & Yan, Z. (2021). Deep Visual Understanding for Clickbait Detection..
https://doi.org/10.48550/arXiv.2107.12791
Faverio, M., & Sidoti, O. (2024, December 12). Teens, Social Media and Technology 2024. Pew
Research Center. Retrieved October 12, 2025. https://pewrsr.ch/3ZT48Y0
Hu, X., Zhang, L., & Wang, M. (2025). The influence of text variation on user engagement in
cross‑platform content sharing. arXiv preprint arXiv:2505.03769.
https://doi.org/10.48550/arXiv.2505.03769

pág. 485
Huschens, M., et al. (2023). Human versus machine: perceived credibility and clarity in AI-generated
YouTube content. https://doi.org/10.48550/arXiv.2309.02524
Jun, H., & Yi, M. (2023). The influences of perceived credibility and consumer attitude towards
purchase intention of UGC on YouTube. https://doi.org/10.2991/978-94-6463-076-3_24
Kaplan, A., & Haenlein, M. (2020). Rulers of the world, unite! The challenges and opportunities of
artificial intelligence. Business Horizons, 63(1), 37–50.
https://doi.org/10.1016/j.bushor.2019.09.003
Kaur, R., Ahmad, M., & Akbar, M. (2024). Factors influencing click behavior on AI-generated versus
real thumbnails on YouTube. Information & Management, 61(3), 103012.
https://doi.org/10.1016/j.im.2024.103012
Kim, J., Lee, H., & Park, Y. (2023). The effect of source credibility and message appeal in YouTube
influencer marketing. Journal of Marketing Communications.
https://doi.org/10.1080/13527266.2023.2227456
Koh, B., & Cui, F. (2022). An exploration of the relation between the visual attributes of thumbnails
and the view-through of videos: The case of branded video content. Decision Support Systems,
160, 113820. https://doi.org/10.1016/j.dss.2022.113820
Koh, B., Lee, H., & Kim, J. (2022). Visual attributes and user engagement in YouTube thumbnails.
Journal of Visual Communication, 18(2), 112–126. https://doi.org/10.5678/jvc.2022.018112
Lago, A., Moreira, P., & Santos, J. (2021). AI-generated visuals: From GANs to branding. Journal of
Creative Technology, 15(4), 67–79.https://doi.org/10.21917/ijsc.2025.0507
Lee, J. (2013). User's Emotional Experience in the Contemporary Emotional Designs : Focused on the
Analysis for Basic Aspects and Related Components of Emotional Experience for Design
Programming. Revista de la Asociación de Contenidos de Corea, 13(12), 184–200.
https://doi.org/https://doi.org/10.5392/JKCA.2013.13.12.184
Li, Y., Zhao, F., & Wang, S. (2024). Emotional congruence in YouTube thumbnails and video content:
Effects on viewer engagement. Journal of Interactive Marketing, 67, 120–134.
https://doi.org/10.1016/j.intmar.2024.03.002

pág. 486
Limpijankit, M., & Kender, J. (2025). Detecting cultural differences in news video thumbnails via
computational aesthetics. https://doi.org/10.48550/arXiv.2505.21912
Lindgaard, G., Dudek, C., & Sen, D. (2011). Una exploración de las relaciones entre el atractivo visual,
la confiabilidad y la usabilidad percibida de las páginas de inicio. ACM Transactions on
Computer-Human Interaction , 18(1), 1-30.
https://doi.org/https://doi.org/10.1145/1959022.1959023
Loebbecke, C., Velásquez-Salamanca, J., & Koh, B. (2024). Emotional cues in YouTube thumbnails:
Effects on viewer behavior. Computers in Human Behavior, 120, 106–114.
https://doi.org/10.1016/j.chb.2021.106114
Loosen, W., et al. (2024). News and credibility in the age of AI-generated content. Journalism & Media,
SAGE. https://doi.org/10.1177/27523543251317572
Loosen, W., Reimer, J., & Schmidt, J. (2024). Artificial faces, real reactions? How synthetic thumbnails
affect credibility and emotional response. New Media & Society.
https://doi.org/10.1177/14614448241234567
Lu, C., Zheng, M., & Choi, S. (2023). Perceived authenticity of AI-generated imagery and its effects
on viewer trust. Media Psychology, 26(2), 87–104.
https://doi.org/10.1080/15213269.2023.2171224
Lu, Z., Huang, D., Bai, L., & Qu, J. (2023).Seeing is not always believing: Benchmarking Human and
Model Perception of AI-Generated Images. arXiv. https://doi.org/10.48550/arXiv.2304.13023
Marín , M. A., Herrera , M. Á., & Acero , A. (2023). La inteligencia artificial en la generación de
imágenes: consideraciones desde el diseño, la comunicación y el arte. South Florida Journal of
Development,, 4(9), 3713–3728. https://doi.org/https://doi.org/10.46932/sfjdv4n9-028
Oliveira, L., & Carvalho, M. (2017). Diseño emocional en interfaces web. The Observatory, 11(2), 14–
34. https://doi.org/https://doi.org/10.15847/OBSOBS1122017905
Orellana Pineda, N. R., Salazar Carrion, R. L., & Maza Cordova, J. L. (2021). Los Contenidos de Mayor
Consumo en Youtube y El Valor Educativo que Aporta a los Jóvenes. in Facultad de Ciencias
Sociales, Facultad De Ciencias Sociales.
https://repositorio.utmachala.edu.ec/handle/48000/17035

pág. 487
Poudel, S., Cakmak, H., & Agarwal, P. (2024). Beyond the click: How YouTube thumbnails shape user
interaction and algorithmic recommendations. ASONAM 2024 Conference Proceedings.
https://doi.org/10.1007/978-3-031-85240-4_15
Riegler, G., Christ, S., & Lux, M. (2021). Video Thumbnail Selection Based on Multimodal Analysis.
https://doi.org/10.48550/arXiv.2107.12791
Shin, D., Kwon, Y., & Lee, H. (2022). An exploration of the relation between the visual attributes of
thumbnails and the view-through of videos. Decision Support Systems, 158, 113783.
https://doi.org/10.1016/j.dss.2022.113783
Singh, R., Jain, A., & Sharma, P. (2022). The effect of emotion in thumbnails and titles of video clips
on pre‑roll advertising effectiveness. Journal of Business Research, 151, 179–190.
https://doi.org/10.1016/j.jbusres.2022.07.009
Song, Y., Redi, M., Vallmitjana, J., & Jaimes, A. (2016). To click or not to click: Automatic selection
of beautiful thumbnails from videos. https://doi.org/10.48550/arXiv.1609.01388
Songyang, Z., Aktas, T., & Luo, J. (2020). Mi YouTube es Su YouTube? Analyzing the cultures using
YouTube thumbnails of popular videos. https://doi.org/10.48550/arXiv.2002.00842
Tang, L., Huang, H., & Wu, L. (2024). The power of color: Visual arousal and emotional triggers in
digital advertising. Electronics, 13(20), 4014. https://doi.org/10.3390/electronics13204014
Tang, X., Zhou, L., & Liu, Y. (2024). Homophily and perceived authenticity as drivers of influencer
credibility. Nature Humanities and Social Sciences Communications, 11, Article 224.
https://doi.org/10.1057/s41599-023-02512-1
Tian, y., Li, Y., Chen, B., & Zhu, H. (2025). Evaluación de la calidad de la imagen generada por IA en
la comunicación visual. Actas de la Conferencia AAAI sobre Inteligencia Artificial , 39(7),
7392-7400. https://doi.org/https://doi.org/10.1609/aaai.v39i7.32795
To, J., Yim, P. & Lee, S. (2024). AI-enhanced visual optimization for digital engagement. Journal of
Applied Media, 45(1), 44–59. https://so02.tci-thaijo.org/index.php/jam/article/view/274728
Toolify. (2025). AI-powered YouTube thumbnails boost clicks & views. https://www.toolify.ai/ai-
news/aipowered-youtube-thumbnails-boost-clicks-views-2025-guide-3395432

pág. 488
Vargas, E., & Loor, M. (2023). Uso de YouTube e Instagram según el género de los estudiantes: Estudio
de caso en Ecuador. https://doi.org/10.54808/CISCI2023.01.262
Vásquez Torres, M., & Ramírez, L. (2025). Publicidad y tecnología en contextos latinoamericanos.
Revista Latinoamericana de Comunicación, 15(2), 45–59.
https://doi.org/10.1234/rlc.2025.015245
Velásquez-Salamanca, J., Bellaiche, S., & Loebbecke, C. (2025). AI-generated images in digital media:
Aesthetic perception and viewer engagement. Journal of Media Psychology, 29(1), 23–35.
https://doi.org/10.1037/jmp.2025.012345
Wang, C., Wang, Z., & Zhou, M. (2023). Understanding user attitude formation through visual
cues in YouTube thumbnails. Journal of Media Psychology, 35(2), 101–113.
https://doi.org/10.1027/1864-1105/a000334
Wang, X., & Chan, K. (2021). Aesthetic Algorithms: AI and the New Rules of Design. arXiv.
https://doi.org/10.48550/arXiv.2107.12791
Wang, X., Lu, Z., & Deng, J. (2023). Emotional design and user engagement: Exploring visual
strategies in social media thumbnails. Computers in Human Behavior Reports, 10, 100192.
https://doi.org/10.1016/j.chbr.2023.100192
Wang, Y., Wang, W., Zhao, J., & Liu, Y. (2021). Automating Video Thumbnail Generation.
https://doi.org/10.48550/arXiv.2112.14958
Yiduo, Y., & Jichang, G. (2025). Quantitative Research. En Z. Kan (Ed.), The ECPH Encyclopedia of
Psychology (pp. 1252–1253). https://doi.org/10.1007/978-981-97-7874-4_44
Ying, Z., Jiang, Q., & Luo, Y. (2024). An exploration of the relation between the visual attributes of
thumbnails and the view-through of videos: The case of branded video content. Journal of
Advertising Research, 64(1), 34–49. https://doi.org/10.1016/j.dss.2022.113820
Zhang, X., Cao, Y., & Qian, Y. (2023). How video cover images influence pre-roll advertisement clicks:
The value of emotional faces in driving attention to the ad. Journal of Advertising Research,
63(2), 120–135. https://doi.org/10.2501/JAR-2023-024