Modelos de imágenes
AI-Public utiliza el catálogo central de modelos para modelos de texto-a-imagen. Qué modelos son visibles depende de la configuración del proveedor del entorno.
Catálogo actual
| Proveedor | Rentable | Alta calidad |
|---|---|---|
| OpenAI | GPT Image 1 mini | GPT Image 2 |
| Nano Banana | Nano Banana 2 | |
| Black Forest Labs | FLUX.2 Flex | FLUX.2 Pro Preview |
Nano Banana es el nombre que AI-Public utiliza para los modelos Gemini Flash Image. Los modelos de imagen europeos se proporcionan a través de Black Forest Labs.
¿Para qué elegir cada modelo?
| Modelo | Adecuado para |
|---|---|
| GPT Image 1 mini | Rápidas imágenes conceptuales, bocetos, pruebas e iteración a menor costo. |
| GPT Image 2 | Imágenes finales más limpias, texto más claro en las imágenes y mayor control sobre el acabado. |
| Nano Banana | Imágenes rápidas y asequibles, muchas variantes y ediciones simples. |
| Nano Banana 2 | Generación de imágenes fluida y edición interactiva de imágenes con Google. |
| FLUX.2 Flex | Generación de imágenes europea flexible con control, edición y buena calidad. |
| FLUX.2 Pro Preview | Generación de imágenes europea de alta calidad para imágenes realistas y estilo consistente. |
Formatos centrales
AI-Public muestra a los usuarios cuatro opciones de formato generales:
| Opción | Significado |
|---|---|
| Automático | AI-Public elige la configuración más adecuada para el modelo elegido. |
| Cuadrado | Una imagen cuadrada. |
| Horizontal | Una imagen amplia, por ejemplo para presentaciones. |
| Vertical | Una imagen vertical, por ejemplo para carteles. |
En el catálogo central de modelos se especifica cómo se traducen estas elecciones por proveedor a la configuración técnica correcta. Por eso, un usuario no necesita saber si un proveedor trabaja con 16:9, 1536x1024, ancho/alto u otro valor.
Edición e imágenes de inspiración
Los modelos de imágenes modernos también pueden usar imágenes como entrada. AI-Public distingue entre:
- Imágenes de inspiración: imágenes de referencia que guían estilo, color, composición u tema.
- Imágenes de edición: una imagen fuente que debe ser ajustada por el modelo.
En el modo de edición, el usuario no elige una relación de aspecto. AI-Public no envía dimensiones manuales ni configuraciones de formato para permitir que el modelo mantenga las dimensiones y la proporción de la imagen fuente.
Mejora de prompts
Con generación de imágenes directa, AI-Public puede usar un paso adicional de IA para mejorar el prompt y las configuraciones automáticas. Este paso observa el prompt actual, las configuraciones y el historial reciente del chat. Las configuraciones elegidas explícitamente siguen siendo las principales; las configuraciones automáticas o vacías pueden completarse.