برو به محتوای اصلی

مدل‌های تصویر

AI-Public از کاتالوگ مرکزی مدل‌ها برای مدل‌های متن-به-تصویر استفاده می‌کند. اینکه کدام مدل‌ها قابل مشاهده هستند به تنظیمات ارائه‌دهنده محیط بستگی دارد.

کاتالوگ فعلی

ارائه‌دهندهکارآمد هزینهکیفیت بالا
OpenAIGPT Image 1 miniGPT Image 2
GoogleNano BananaNano Banana 2
Black Forest LabsFLUX.2 FlexFLUX.2 Pro Preview

Nano Banana نامی است که AI-Public برای مدل‌های Gemini Flash Image استفاده می‌کند. مدل‌های تصویری اروپایی از طریق Black Forest Labs ارائه می‌شوند.

برای چه چیزی هر مدل را انتخاب می‌کنید؟

مدلمناسب برای
GPT Image 1 miniتصاویر مفهومی سریع، طرح‌ها، آزمایش و تکرار با هزینه پایین‌تر.
GPT Image 2تصاویر نهایی تر، متن واضح‌تر در تصاویر و کنترل بیشتر بر پرداخت کار.
Nano Bananaتصاویر سریع و مقرون‌به‌صرفه، ویرایش‌های فراوان و تغییرات ساده.
Nano Banana 2تولید تصویر روان و ویرایش تعاملی تصویر با Google.
FLUX.2 Flexتولید تصویر اروپایی منعطف با کنترل، ویرایش و کیفیت خوب.
FLUX.2 Pro Previewتولید تصویر اروپایی با کیفیت بالا برای تصاویر واقع‌گرایانه و استایل منسجم.

گزینه‌های فرمت مرکزی

AI-Public به کاربران چهار گزینه فرمت عمومی نشان می‌دهد:

گزینهمعنای آن
خودکارAI-Public مناسب‌ترین تنظیم را برای مدل انتخاب می‌کند.
مربعییک تصویر مربعی.
افقییک تصویر پهن، برای مثال برای ارائه‌ها.
عمودییک تصویر عمودی، برای مثال برای پوسترها.

در کاتالوگ مرکزی مدل، روش ترجمه این گزینه‌ها برای هر ارائه‌دهنده به تنظیم فنی مناسب تعیین شده است. بنابراین کاربر نباید بداند که یک ارائه‌دهنده با 16:9، 1536x1024، عرض/ارتفاع یا مقدار دیگری کار می‌کند.

ویرایش و تصاویر الهام

مدل‌های تصویری مدرن می‌توانند از تصاویر به عنوان ورودی استفاده کنند. AI-Public بین دو نوع تصویر الهام و تصاویر ویرایش تفاوت قائل می‌شود:

  • تصاویر الهام: تصاویر مرجع که سبک، رنگ، ترکیب یا موضوع را هدایت می‌کنند.
  • تصاویر ویرایش: یک تصویر منبع که مدل باید تغییر دهد.

در حالت ویرایش، کاربر نسبت نسبت را مشخص نمی‌کند. AI-Public ابعاد یا تنظیمات فرمت دستی ارسال نمی‌کند تا مدل بتواند ابعاد و نسبت تصویر منبع را حفظ کند.

بهبود Prompt

در تولید تصویر مستقیم، AI-Public می‌تواند یک گام اضافی هوش مصنوعی برای بهبود prompt و تنظیمات خودکار استفاده کند. این گام به prompt فعلی، تنظیمات و تاریخچه گفتگوی اخیر نگاه می‌کند. تنظیمات صریح انتخاب‌شده همچنان مقدم‌اند؛ تنظیمات خودکار یا خالی می‌تواند تکمیل شود.