Ir al contenido principal

Modelos de imágenes

AI-Public utiliza el catálogo central de modelos para modelos de texto-a-imagen. Qué modelos son visibles depende de la configuración del proveedor del entorno.

Catálogo actual

ProveedorRentableAlta calidad
OpenAIGPT Image 1 miniGPT Image 2
GoogleNano BananaNano Banana 2
Black Forest LabsFLUX.2 FlexFLUX.2 Pro Preview

Nano Banana es el nombre que AI-Public utiliza para los modelos Gemini Flash Image. Los modelos de imagen europeos se proporcionan a través de Black Forest Labs.

¿Para qué elegir cada modelo?

ModeloAdecuado para
GPT Image 1 miniRápidas imágenes conceptuales, bocetos, pruebas e iteración a menor costo.
GPT Image 2Imágenes finales más limpias, texto más claro en las imágenes y mayor control sobre el acabado.
Nano BananaImágenes rápidas y asequibles, muchas variantes y ediciones simples.
Nano Banana 2Generación de imágenes fluida y edición interactiva de imágenes con Google.
FLUX.2 FlexGeneración de imágenes europea flexible con control, edición y buena calidad.
FLUX.2 Pro PreviewGeneración de imágenes europea de alta calidad para imágenes realistas y estilo consistente.

Formatos centrales

AI-Public muestra a los usuarios cuatro opciones de formato generales:

OpciónSignificado
AutomáticoAI-Public elige la configuración más adecuada para el modelo elegido.
CuadradoUna imagen cuadrada.
HorizontalUna imagen amplia, por ejemplo para presentaciones.
VerticalUna imagen vertical, por ejemplo para carteles.

En el catálogo central de modelos se especifica cómo se traducen estas elecciones por proveedor a la configuración técnica correcta. Por eso, un usuario no necesita saber si un proveedor trabaja con 16:9, 1536x1024, ancho/alto u otro valor.

Edición e imágenes de inspiración

Los modelos de imágenes modernos también pueden usar imágenes como entrada. AI-Public distingue entre:

  • Imágenes de inspiración: imágenes de referencia que guían estilo, color, composición u tema.
  • Imágenes de edición: una imagen fuente que debe ser ajustada por el modelo.

En el modo de edición, el usuario no elige una relación de aspecto. AI-Public no envía dimensiones manuales ni configuraciones de formato para permitir que el modelo mantenga las dimensiones y la proporción de la imagen fuente.

Mejora de prompts

Con generación de imágenes directa, AI-Public puede usar un paso adicional de IA para mejorar el prompt y las configuraciones automáticas. Este paso observa el prompt actual, las configuraciones y el historial reciente del chat. Las configuraciones elegidas explícitamente siguen siendo las principales; las configuraciones automáticas o vacías pueden completarse.