La trampa del prompt visual: por qué tu primer intento sale feo
Hay una frustración que casi todos los que prueban Nano Banana atraviesan en los primeros diez minutos. Abren Gemini, escriben "hacé un post para Instagram sobre café", miran lo que sale, y piensan: "esto es feo". A veces ni feo. A veces es pasable, pero genérico, sin alma, indistinguible de lo que devolvería cualquier otro modelo. Y cierran la pestaña pensando que la IA visual no está lista todavía.
Es un patrón tan común que tiene un nombre interno entre la gente que enseña IA visual: "el desencanto del primer prompt". Le pasa a todos, sin excepción. Le pasó a CMs con 10 años de experiencia que vieron las demos de Nano Banana en Twitter y pensaron que iba a ser mágico. Le pasó a emprendedores que pagaron Gemini Advanced pensando que pagar mejoraba el resultado. Le pasó al mismo Masud cuando empezó a probar la herramienta. La diferencia entre los que abandonan y los que siguen es entender qué pasó.
Lo que pasó no es un problema del modelo. Es un problema de descripción.
Pensalo así: si vos contratás a un fotógrafo y le decís "tomame una foto de café", ¿qué te entrega? Te entrega un café. Genérico. Tomado de arriba o de costado, en una taza cualquiera, fondo cualquiera. Si te entrega algo que sirve para tu marca, es porque interpretó cosas que vos no le dijiste — y la mitad de las veces no las interpreta bien y rehacés todo.
Si en cambio le decís "foto cenital de un cortado en taza de cerámica color crema, sobre mesa de madera oscura, plato chico al lado con dos medialunas, luz natural lateral de mañana, plano cerrado, paleta cálida y baja saturación, estilo café de barrio porteño tipo Palermo, no estilo Starbucks", el fotógrafo te entrega algo que tiene tu marca encima. Misma persona, misma cámara, mismas habilidades. La diferencia es lo que le pediste.
Nano Banana funciona exactamente así. Es un fotógrafo, un ilustrador y un diseñador que solo entiende lo que vos le describís. Si le decís poco, te da poco. Si le decís mucho, en español natural, con detalles concretos sobre estilo, paleta, luz, encuadre y contexto, te da una imagen que parece pensada.
Los cuatro ingredientes de un buen prompt visual
Todo prompt que sirve tiene estos cuatro ingredientes. No siempre todos, pero cuantos más, mejor.
La trampa de los adjetivos vacíos
"Lindo", "profesional", "moderno", "limpio", "minimalista". Son palabras que no significan nada para Nano Banana porque significan demasiado. Cada uno entiende algo distinto por "moderno". Si le pedís un post "moderno y profesional", te va a defaultear a la estética más promedio que aprendió: oficina yanqui, fondo blanco, sans serif gris. Vómito visual.
El truco es reemplazar adjetivos por descripciones concretas. En vez de "moderno" decí "estilo flat design con paleta de tres colores y sin sombras". En vez de "profesional" decí "fotografía editorial estilo Apto Studio, plano medio, fondo neutro". En vez de "limpio" decí "fondo blanco crudo, espacio negativo amplio en la parte superior, sujeto centrado".
Cuanto más concreto, más tuyo el resultado.
Por qué la primera imagen casi nunca es la final
Otro malentendido común: pensar que un prompt = una imagen final. No. Un prompt es el principio de una conversación. La primera imagen que devuelve Nano Banana te muestra hasta dónde entendió. Si te falta algo, le decís en lenguaje natural: "quitá la persona del fondo", "hacé el cielo más cálido", "cambiá la mesa por una de madera más oscura". Itera. En tres o cuatro vueltas tenés algo bueno. En seis o siete tenés algo muy bueno.
La gente que se frustra es la que esperaba acertar al primer prompt. Los que aprovechan Nano Banana son los que asumen que va a llevar 5 minutos de ida y vuelta y planifican esos 5 minutos.
Trampa común de este módulo
No empieces escribiendo el prompt. Empezá imaginando la imagen.
Antes de tocar el teclado, cerrá los ojos por diez segundos y tratá de ver la imagen. ¿Qué hay en el centro? ¿Qué luz tiene? ¿Es de día o de noche? ¿Es foto o ilustración? ¿Qué paleta? ¿Cuál es el ánimo, alegre o melancólico, frío o cálido?
Cuando tenés esa imagen mental, escribir el prompt es traducir. Sin la imagen mental, lo que escribís es palabras vacías y el resultado va a ser palabras vacías.
Comparación lado a lado: prompt vago vs prompt completo
Para que se vea concreto, mirá esta tabla con cuatro casos típicos. La columna de la izquierda es lo que escribe la persona promedio en su primer intento. La de la derecha es lo que escribe alguien que terminó este curso.
La diferencia entre cada par no es talento, no es experiencia con IA, no es la versión que estás usando. Es ocho minutos más de pensamiento antes de escribir el prompt. Esa es toda la curva del curso.
Tres errores que cometen el 90% de los principiantes
Error A: usar listas de adjetivos en vez de descripciones. Mal: "moderno, profesional, limpio, minimalista, elegante, premium". Eso es una pila de adjetivos sin sustancia. Bien: "fondo blanco roto con sutil textura granulada, sujeto centrado con espacio negativo amplio, paleta limitada a dos colores: crema y bordó, sin sombras pesadas, estilo editorial argentina contemporánea".
Error B: copiar prompts genéricos de Pinterest. Pinterest está lleno de prompts en inglés, optimizados para Midjourney, copiados de cuentas que se hicieron virales un mes. Si los pegás en Nano Banana sin adaptación, tu post sale igual al de otras 5.000 cuentas. La regla: usá los prompts del curso como plantilla, pero personalizá con tu cliente, tu rubro, tu paleta. Lo que te diferencia es la personalización, no el prompt en sí.
Error C: dar por hecho que la primera imagen es la final. La primera imagen es feedback. Te dice qué entendió Nano Banana de lo que escribiste. Si algo está mal — el sujeto está mal posicionado, falta un elemento, el estilo es otro —, en vez de empezar de cero, le decís en lenguaje natural lo que querés cambiar. La segunda imagen suele estar 70% mejor. La tercera, 90%. La cuarta es la final.
Cómo "leer" la imagen que devuelve Nano Banana
Mirar bien una imagen generada es una habilidad. La gente apurada solo ve "linda" o "fea" y cierra. La gente que aprovecha la herramienta mira con criterio:
- ¿El sujeto principal está donde lo querés? Si no, decile la posición exacta: "movelo a la izquierda 30%, ocupando 40% del ancho izquierdo".
- ¿La paleta coincide con lo que pediste? Si los colores quedaron aproximados, en el siguiente prompt dale el hex code o el Pantone.
- ¿La luz tiene la dirección y temperatura correctas? Si la luz está mal, decile "luz natural lateral entrando desde la derecha, temperatura cálida tipo tarde de otoño".
- ¿El estilo es el que pediste? Si quedó "demasiado IA" o "demasiado plano", dale referencia más específica: "estilo fotografía editorial Anfibia" o "estilo ilustración del New Yorker, no estilo flat design genérico".
- ¿Hay elementos no deseados? Si apareció algo que no pediste, en el siguiente prompt decile explícitamente "sin [eso que apareció]".
El glosario mínimo que te conviene tener en la cabeza
Antes de seguir, hay 12 términos que aparecen en todos los módulos del curso y conviene tenerlos claros para no perder tiempo después. Si ya manejás cosas de fotografía o diseño podés saltearlo. Si venís de cero, leelo bien.
Estos 12 términos son el lenguaje en común que vas a usar en todos los prompts. Aprendetelos esta semana.
Las cuatro preguntas obligatorias antes de promptear
Más allá del checklist final del curso, estas son las cuatro preguntas que te tenés que hacer cada vez antes de tocar el teclado. Si no podés responder al menos tres, tu prompt va a salir flojo:
Pregunta 1 — ¿Qué se ve en la imagen? Ser específico con el sujeto. No "una persona" sino "una mujer argentina de 32 años, instructora de yoga, pelo castaño largo". No "un café" sino "un cortado en taza de cerámica color crema".
Pregunta 2 — ¿Dónde y cuándo está? Contexto. "Oficina de Belgrano, tarde de otoño, luz natural cálida lateral". "Calle empedrada de Palermo en una mañana lluviosa". "Cocina de departamento argentino con muebles claros".
Pregunta 3 — ¿Cómo se ve? Estilo y mood. "Fotografía editorial argentina contemporánea, paleta cálida tierra, mood profesional pero relajado". O "ilustración acuarela editorial estilo New Yorker, paleta de tres colores, mood reflexivo".
Pregunta 4 — ¿Cómo está enmarcado? Plano y formato. "Plano medio frontal, formato cuadrado 1:1". "Plano cenital cerrado, formato vertical 9:16".
Si tu prompt no tiene respuesta a las cuatro, las cosas que falten van a ser inventadas por Nano Banana, y la chance de que las invente como vos imaginabas es baja.
Lo que vamos a hacer en el resto del curso
Cada módulo de acá en adelante toma un caso real — un dolor concreto que tienen los CMs, los emprendedores y los creadores en Argentina —, y te muestra el prompt completo, copy-paste, que lo resuelve. Vamos a empezar por dónde acceder a la herramienta y qué versión usar para cada cosa, porque hay tres versiones y elegir mal te hace gastar plata o tiempo. Después saltamos a casos prácticos: stock con sabor argentino, consistencia de marca, texto en imagen, mockups, thumbnails, edición de fotos propias. Y cerramos con honestidad: los siete casos donde Nano Banana no es la herramienta y qué usar en su lugar.