Nivelia.
nivelia.com.ar
● Módulo de muestra gratisEstás viendo el Módulo 00 de 11. Desbloqueá el resto por $14.500.Comprar curso →
Módulo 00 · Lectura · 13min

La trampa del prompt visual: por qué tu primer intento sale feo

Hay una frustración que casi todos los que prueban Nano Banana atraviesan en los primeros diez minutos. Abren Gemini, escriben "hacé un post para Instagram sobre café", miran lo que sale, y piensan: "esto es feo". A veces ni feo. A veces es pasable, pero genérico, sin alma, indistinguible de lo que devolvería cualquier otro modelo. Y cierran la pestaña pensando que la IA visual no está lista todavía.

Es un patrón tan común que tiene un nombre interno entre la gente que enseña IA visual: "el desencanto del primer prompt". Le pasa a todos, sin excepción. Le pasó a CMs con 10 años de experiencia que vieron las demos de Nano Banana en Twitter y pensaron que iba a ser mágico. Le pasó a emprendedores que pagaron Gemini Advanced pensando que pagar mejoraba el resultado. Le pasó al mismo Masud cuando empezó a probar la herramienta. La diferencia entre los que abandonan y los que siguen es entender qué pasó.

Lo que pasó no es un problema del modelo. Es un problema de descripción.

Pensalo así: si vos contratás a un fotógrafo y le decís "tomame una foto de café", ¿qué te entrega? Te entrega un café. Genérico. Tomado de arriba o de costado, en una taza cualquiera, fondo cualquiera. Si te entrega algo que sirve para tu marca, es porque interpretó cosas que vos no le dijiste — y la mitad de las veces no las interpreta bien y rehacés todo.

Si en cambio le decís "foto cenital de un cortado en taza de cerámica color crema, sobre mesa de madera oscura, plato chico al lado con dos medialunas, luz natural lateral de mañana, plano cerrado, paleta cálida y baja saturación, estilo café de barrio porteño tipo Palermo, no estilo Starbucks", el fotógrafo te entrega algo que tiene tu marca encima. Misma persona, misma cámara, mismas habilidades. La diferencia es lo que le pediste.

Nano Banana funciona exactamente así. Es un fotógrafo, un ilustrador y un diseñador que solo entiende lo que vos le describís. Si le decís poco, te da poco. Si le decís mucho, en español natural, con detalles concretos sobre estilo, paleta, luz, encuadre y contexto, te da una imagen que parece pensada.

Los cuatro ingredientes de un buen prompt visual

Todo prompt que sirve tiene estos cuatro ingredientes. No siempre todos, pero cuantos más, mejor.

IngredientePregunta claveEjemplo
SUJETO¿Qué es lo que aparece?"Un cortado en taza de cerámica"
ESCENA¿Dónde y cuándo está?"Mesa de madera oscura, luz de mañana lateral"
ESTILO¿Cómo se ve la imagen?"Estilo fotografía editorial cálida, baja saturación"
ENCUADRE¿Cómo está enmarcado?"Plano cenital, primer plano cerrado"

La trampa de los adjetivos vacíos

"Lindo", "profesional", "moderno", "limpio", "minimalista". Son palabras que no significan nada para Nano Banana porque significan demasiado. Cada uno entiende algo distinto por "moderno". Si le pedís un post "moderno y profesional", te va a defaultear a la estética más promedio que aprendió: oficina yanqui, fondo blanco, sans serif gris. Vómito visual.

El truco es reemplazar adjetivos por descripciones concretas. En vez de "moderno" decí "estilo flat design con paleta de tres colores y sin sombras". En vez de "profesional" decí "fotografía editorial estilo Apto Studio, plano medio, fondo neutro". En vez de "limpio" decí "fondo blanco crudo, espacio negativo amplio en la parte superior, sujeto centrado".

Cuanto más concreto, más tuyo el resultado.

Por qué la primera imagen casi nunca es la final

Otro malentendido común: pensar que un prompt = una imagen final. No. Un prompt es el principio de una conversación. La primera imagen que devuelve Nano Banana te muestra hasta dónde entendió. Si te falta algo, le decís en lenguaje natural: "quitá la persona del fondo", "hacé el cielo más cálido", "cambiá la mesa por una de madera más oscura". Itera. En tres o cuatro vueltas tenés algo bueno. En seis o siete tenés algo muy bueno.

La gente que se frustra es la que esperaba acertar al primer prompt. Los que aprovechan Nano Banana son los que asumen que va a llevar 5 minutos de ida y vuelta y planifican esos 5 minutos.

Trampa común de este módulo

No empieces escribiendo el prompt. Empezá imaginando la imagen.

Antes de tocar el teclado, cerrá los ojos por diez segundos y tratá de ver la imagen. ¿Qué hay en el centro? ¿Qué luz tiene? ¿Es de día o de noche? ¿Es foto o ilustración? ¿Qué paleta? ¿Cuál es el ánimo, alegre o melancólico, frío o cálido?

Cuando tenés esa imagen mental, escribir el prompt es traducir. Sin la imagen mental, lo que escribís es palabras vacías y el resultado va a ser palabras vacías.

Comparación lado a lado: prompt vago vs prompt completo

Para que se vea concreto, mirá esta tabla con cuatro casos típicos. La columna de la izquierda es lo que escribe la persona promedio en su primer intento. La de la derecha es lo que escribe alguien que terminó este curso.

CasoPrompt vago (típico)Prompt completo (recomendado)
Post de café"Hacé un post para Instagram sobre café""Post cuadrado 1:1 para cafetería de barrio porteño. Foto cenital de un cortado en taza de cerámica color crema sobre mesa de madera oscura, plato con dos medialunas al costado, luz natural lateral cálida de mañana, paleta sepia y caramelo. Estilo fotografía editorial gastronomía argentina, plano cerrado."
Foto de equipo"Foto de equipo trabajando""Foto editorial de tres profesionales argentinos (dos mujeres, un hombre, edades 30-40) reunidos alrededor de una mesa de madera con notebooks abiertas, en oficina pyme de Capital con plantas y cuadros. Plano medio frontal, luz natural de tarde, vestimenta formal sport. Estilo fotografía corporativa argentina contemporánea."
Mockup de producto"Mockup de remera con mi logo""[Adjunto: PNG del logo] Mockup fotorrealista de remera oversized blanco crudo colgada en percha de madera natural sobre fondo de pared cemento alisado. Logo aplicado en el pecho a tamaño real, plano frontal, luz lateral suave, encuadre 4:5, estilo catálogo nórdico minimalista."
Ilustración de blog"Ilustración sobre liderazgo""Ilustración editorial conceptual sobre liderazgo. Visualmente: una persona caminando al frente, otras tres figuras siguiéndola en una niebla suave, escenario de campo con sendero de tierra. Paleta limitada a tres colores: gris azulado, ocre cálido, verde apagado. Estilo acuarela editorial sobre papel texturado, inspirado en ilustración del New Yorker. Sin texto. Encuadre 16:9."

La diferencia entre cada par no es talento, no es experiencia con IA, no es la versión que estás usando. Es ocho minutos más de pensamiento antes de escribir el prompt. Esa es toda la curva del curso.

Tres errores que cometen el 90% de los principiantes

Error A: usar listas de adjetivos en vez de descripciones. Mal: "moderno, profesional, limpio, minimalista, elegante, premium". Eso es una pila de adjetivos sin sustancia. Bien: "fondo blanco roto con sutil textura granulada, sujeto centrado con espacio negativo amplio, paleta limitada a dos colores: crema y bordó, sin sombras pesadas, estilo editorial argentina contemporánea".

Error B: copiar prompts genéricos de Pinterest. Pinterest está lleno de prompts en inglés, optimizados para Midjourney, copiados de cuentas que se hicieron virales un mes. Si los pegás en Nano Banana sin adaptación, tu post sale igual al de otras 5.000 cuentas. La regla: usá los prompts del curso como plantilla, pero personalizá con tu cliente, tu rubro, tu paleta. Lo que te diferencia es la personalización, no el prompt en sí.

Error C: dar por hecho que la primera imagen es la final. La primera imagen es feedback. Te dice qué entendió Nano Banana de lo que escribiste. Si algo está mal — el sujeto está mal posicionado, falta un elemento, el estilo es otro —, en vez de empezar de cero, le decís en lenguaje natural lo que querés cambiar. La segunda imagen suele estar 70% mejor. La tercera, 90%. La cuarta es la final.

Cómo "leer" la imagen que devuelve Nano Banana

Mirar bien una imagen generada es una habilidad. La gente apurada solo ve "linda" o "fea" y cierra. La gente que aprovecha la herramienta mira con criterio:

  1. ¿El sujeto principal está donde lo querés? Si no, decile la posición exacta: "movelo a la izquierda 30%, ocupando 40% del ancho izquierdo".
  2. ¿La paleta coincide con lo que pediste? Si los colores quedaron aproximados, en el siguiente prompt dale el hex code o el Pantone.
  3. ¿La luz tiene la dirección y temperatura correctas? Si la luz está mal, decile "luz natural lateral entrando desde la derecha, temperatura cálida tipo tarde de otoño".
  4. ¿El estilo es el que pediste? Si quedó "demasiado IA" o "demasiado plano", dale referencia más específica: "estilo fotografía editorial Anfibia" o "estilo ilustración del New Yorker, no estilo flat design genérico".
  5. ¿Hay elementos no deseados? Si apareció algo que no pediste, en el siguiente prompt decile explícitamente "sin [eso que apareció]".

El glosario mínimo que te conviene tener en la cabeza

Antes de seguir, hay 12 términos que aparecen en todos los módulos del curso y conviene tenerlos claros para no perder tiempo después. Si ya manejás cosas de fotografía o diseño podés saltearlo. Si venís de cero, leelo bien.

TérminoQué significaPor qué importa
Aspect ratio (relación de aspecto)La proporción ancho:alto de una imagen. Ejemplo: 1:1 cuadrado, 9:16 vertical, 16:9 horizontalCada red social usa el suyo. Pedir el correcto es la base.
Plano cenitalFoto/imagen vista desde arriba, perpendicular al sujetoMucho usado en gastronomía, layout de objetos, mockups planos
Plano medioEncuadre de la cabeza al pecho/cinturaEl que más se usa para retratos profesionales
Plano americanoEncuadre de la cabeza a la caderaÚtil para mostrar gestos de manos sin mostrar piernas
Plano completoTodo el cuerpo de piePara mostrar vestimenta, postura, contexto del entorno
Profundidad de campoEl desenfoque del fondo respecto al sujeto"Profundidad de campo suave" = fondo desenfocado, más profesional
PaletaConjunto de colores dominantes de la imagenSi no la nombrás, defaultea a colores promedio
Mood / atmósferaEl "ánimo" general — alegre, melancólico, urgente, serenoDefine la sensación, no solo la estética visual
EstiloEl género visual — fotografía editorial, ilustración acuarela, flat designSin esto, defaultea a digital plano
EncuadreCómo está dispuesto el sujeto dentro del frame"Centrado", "regla de tercios", "espacio negativo a la izquierda"
Espacio negativoEl área "vacía" alrededor del sujetoEspacio para texto, CTAs, sensación de respirar
ReferenciaLa imagen que adjuntás para que NB la tome como baseEl truco más poderoso — sin esto, cada generación es nueva

Estos 12 términos son el lenguaje en común que vas a usar en todos los prompts. Aprendetelos esta semana.

Las cuatro preguntas obligatorias antes de promptear

Más allá del checklist final del curso, estas son las cuatro preguntas que te tenés que hacer cada vez antes de tocar el teclado. Si no podés responder al menos tres, tu prompt va a salir flojo:

Pregunta 1 — ¿Qué se ve en la imagen? Ser específico con el sujeto. No "una persona" sino "una mujer argentina de 32 años, instructora de yoga, pelo castaño largo". No "un café" sino "un cortado en taza de cerámica color crema".

Pregunta 2 — ¿Dónde y cuándo está? Contexto. "Oficina de Belgrano, tarde de otoño, luz natural cálida lateral". "Calle empedrada de Palermo en una mañana lluviosa". "Cocina de departamento argentino con muebles claros".

Pregunta 3 — ¿Cómo se ve? Estilo y mood. "Fotografía editorial argentina contemporánea, paleta cálida tierra, mood profesional pero relajado". O "ilustración acuarela editorial estilo New Yorker, paleta de tres colores, mood reflexivo".

Pregunta 4 — ¿Cómo está enmarcado? Plano y formato. "Plano medio frontal, formato cuadrado 1:1". "Plano cenital cerrado, formato vertical 9:16".

Si tu prompt no tiene respuesta a las cuatro, las cosas que falten van a ser inventadas por Nano Banana, y la chance de que las invente como vos imaginabas es baja.

Lo que vamos a hacer en el resto del curso

Cada módulo de acá en adelante toma un caso real — un dolor concreto que tienen los CMs, los emprendedores y los creadores en Argentina —, y te muestra el prompt completo, copy-paste, que lo resuelve. Vamos a empezar por dónde acceder a la herramienta y qué versión usar para cada cosa, porque hay tres versiones y elegir mal te hace gastar plata o tiempo. Después saltamos a casos prácticos: stock con sabor argentino, consistencia de marca, texto en imagen, mockups, thumbnails, edición de fotos propias. Y cerramos con honestidad: los siete casos donde Nano Banana no es la herramienta y qué usar en su lugar.


Módulo de muestra terminado

Desbloqueá los otros 10 módulos. Más los ejercicios y el quiz de todo el curso.

$14.500 · acceso de por vida · sin suscripción
Contenido digital · sin reembolso · temario completo arriba antes de comprar