لطفا صبرکنید...
آموزش هوش مصنوعی نانو بنانا گوگل برای ساخت عکس

آموزش هوش مصنوعی نانو بنانا گوگل برای ساخت عکس

 
 
 

هوش مصنوعی نانو بنانا (Nano Banana)، نام مستعار مدل‌های هوش مصنوعی تولید و ویرایش تصویر گوگل، یکی از نوآورانه‌ترین ابزارهای مولد مبتنی بر خانواده Gemini است. این مدل‌ها، که توسط Google DeepMind توسعه یافته‌اند، بر پایه معماری چندوجهی (multimodal) Gemini ساخته شده و تمرکز اصلی‌شان بر ترکیب هوشمندانه ورودی‌های متنی، تصویری و دانش جهان واقعی برای خلق و ویرایش تصاویر با دقت استودیویی است.

درمورد آموزش جیمینی لایو در گوشی با برنامه Gemini Live بخوانید.

نانو بنانا کدام مدل است و در حال حاضر کدام نسخه بهترین خروجی را دارد؟

به‌طور دقیق، نانو بنانا به دو نسخه اصلی اشاره دارد:

نانو بنانا پرو (Gemini 3 Pro Image): نسخه پیشرفته‌تر، معرفی‌شده در نوامبر ۲۰۲۵ (آبان ۱۴۰۴)، که بر پایه Gemini 3 Pro ساخته شده و قابلیت‌های استدلال پیشرفته‌تری برای تولید تصاویر با رزولوشن تا ۴K ارائه می‌دهد. این مدل نه تنها تولید تصویر، بلکه ویرایش‌های مفهومی عمیق مانند حفظ هویت شخصیت‌ها در سناریوهای پیچیده را پشتیبانی می‌کند.

نانو بنانا (Gemini 2.5 Flash Image): نسخه سریع و کارآمد، بهینه‌شده برای وظایف با حجم بالا و تأخیر کم، که در اوت ۲۰۲۵ (مرداد ۱۴۰۴) معرفی شد. این مدل با رزولوشن پایه ۱۰۲۴ پیکسل، بر تولید تصاویر واقع‌گرایانه و ویرایش‌های مکالمه‌ای تمرکز دارد و در بنچمارک‌هایی مانند LMArena (که نام مستعار “nano-banana” از آن گرفته شده) عملکرد برتر در ویرایش تصاویر نشان داده است.

  • نام رسمی فعلی: Gemini 3 Pro Image (در جامعه ایرانی همچنان «نانو بنانا ۲» یا «نانو بنانا پرو» نامیده می‌شود)
  • بهترین کیفیت واقعی‌گرایانه محصول: Gemini 3 Pro Image
  • سریع‌ترین مدل برای تست‌های زیاد: Gemini-2.5-flash-image
  • تنها جایی که هر دو مدل همزمان در دسترس هستند: Google AI Studio و lmarena.ai

درمورد هوش مصنوعی Gemini بخوانید.


مزایای کلیدی نانو بنانا: برتری‌های فنی و کاربردی

نانو بنانا با بهره‌گیری از دانش جهانی Gemini، ویرایش‌های دقیق و سرعت بالا، استاندارد جدیدی در ابزارهای AI مولد تصویر تعریف کرده است. در ادامه، مزایای تخصصی آن را به صورت فهرست‌وار بررسی می‌کنیم، با تمرکز بر جنبه‌های فنی که آن را از رقبایی مانند Midjourney یا DALL·E متمایز می‌سازد:

۱. سرعت و کارایی بالا (Low-Latency Processing)
  • تولید تصویر در کمتر از ۱–۵ ثانیه، حتی برای ویرایش‌های پیچیده، که آن را ایده‌آل برای workflowهای حرفه‌ای مانند طراحی تبلیغاتی می‌کند.
  • بهینه‌سازی برای حجم بالا: در Vertex AI، هزینه هر تصویر حدود ۰.۰۳۹ دلار است، با توکن‌های خروجی ۱۲۹۰ توکنی برای هر تصویر.
۲. ویرایش مکالمه‌ای و تکرارشونده (Conversational & Iterative Refinement)
  • برخلاف مدل‌های سنتی که هر درخواست را از صفر شروع می‌کنند، نانو بنانا زمینه (context) را حفظ کرده و اجازه ویرایش‌های تدریجی می‌دهد – مثلاً “نور را گرم‌تر کن بدون تغییر پس‌زمینه”.
  • پشتیبانی از ورودی‌های ترکیبی: متن + تا ۳ تصویر مرجع، برای ترکیب عناصر (multi-image fusion) با حفظ انسجام صحنه.
۳. حفظ هویت و consistency شخصیت‌ها (Character Consistency)
  • تا ۵ شخصیت را در تصاویر متوالی حفظ می‌کند، که برای داستان‌سرایی بصری (مانند کمیک‌ها یا کمپین‌های تبلیغاتی) حیاتی است.
  • انتقال سبک (style transfer): اعمال سبک یک تصویر بر دیگری بدون از دست دادن جزئیات، با دقت بالا در بافت‌ها و رنگ‌ها.
۴. رندر دقیق متن و چندزبانه (High-Fidelity Text Rendering)
  • تولید متن خوانا و دقیق در تصاویر، حتی به زبان‌های غیرانگلیسی (مانند فارسی در نسخه پرو)، ایده‌آل برای پوسترها، موکاپ‌ها و محتوای بین‌المللی.
  • دقت ۹۵% در اولین تلاش، بر اساس تست‌های داخلی گوگل.
۵. کنترل پیشرفته دوربین و نورپردازی (Advanced Camera & Lighting Controls)
  • شبیه‌سازی لنزهای واقعی (مانند ۵۰mm یا macro) و نورپردازی سینمایی (cinematic lighting)، برای خروجی‌های فوتورئالیستیک.
  • ویرایش محلی (inpainting): تغییر عناصر خاص بدون تأثیر بر کل صحنه، مانند حذف اشیاء یا تغییر pose با حفظ عمق میدان.
۶. رزولوشن و کیفیت بالا (Up to 4K Output)
  • خروجی native 2K با آپ‌اسکیلینگ به 4K، با جزئیات بافتی دقیق (مانند انعکاس‌های شیشه‌ای یا بافت چرم).
  • نسبت‌های انعطاف‌پذیر (aspect ratios) برای پلتفرم‌های مختلف، از اینستاگرام تا بنرهای وب.
۷. ادغام با اکوسیستم گوگل و ایمنی (Ecosystem Integration & Safety)
  • دسترسی آسان از Gemini App، Google Ads و Workspace، با فیلترهای ایمنی پیشرفته برای جلوگیری از محتوای مضر.
  • SynthID برای شفافیت: تشخیص آسان تصاویر AI، که اعتماد کاربران و برندها را افزایش می‌دهد.

درمورد آموزش ساخت ویدیو با هوش مصنوعی Sora بخوانید.

آموزش هوش مصنوعی نانو بنانا گوگل برای ساخت عکس

آموزش هوش مصنوعی نانو بنانا

روش ۱ – ساده‌ترین و سریع‌ترین (پیشنهاد ۹۰٪ کاربران): Gemini.google.com

گام ۱ – ورود به سایت

  • VPN را روشن کنید و کشور را روی آمریکا، کانادا، فرانسه یا امارات بگذارید (این چهار کشور ۱۰۰٪ کار می‌کنند).
  • مرورگر کروم یا اج را باز کنید و به آدرس زیر بروید:
    https://gemini.google.com

گام ۲ – ورود با حساب گوگل

  • با حساب گوگل خودتان لاگین کنید (اگر حساب ندارید، همین‌جا بسازید).
  • بعد از ورود، صفحه چت Gemini باز می‌شود.

گام ۳ – فعال کردن ابزار ساخت عکس (آیکون موز)

  • در پایین صفحه، سمت چپ کادر تایپ پیام، یک آیکون موز زردرنگ 🟡 می‌بینید. روی آن کلیک کنید.
  • اگر آیکون موز را نمی‌بینید → VPN را عوض کنید و کش مرورگر را پاک کنید (Ctrl+Shift+Delete) و دوباره وارد شوید.

گام ۴ – نوشتن پرامپت و ساخت عکس

  • حالا کافی است پرامپت انگلیسی خود را مستقیم در کادر بنویسید و Enter بزنید.
  • در کمتر از ۱۰–۲۰ ثانیه چهار تصویر به شما نشان داده می‌شود.
  • روی عکسی که دوست دارید کلیک کنید → دکمه Download ظاهر می‌شود.

نکته مهم: در Gemini معمولی روزانه حدود ۵۰–۱۰۰ تصویر می‌توانید بسازید (بستگی به حساب دارد).

بیشتر بخوانید: هوش مصنوعی گراک 4.1 چیست


روش ۲ – حرفه‌ای‌ترین و بدون محدودیت (پیشنهاد عکاسان و فروشگاه‌داران): Google AI Studio

گام ۱ – ورود

  • VPN آمریکا/کانادا/فرانسه روشن باشد.
  • به آدرس زیر بروید:
    https://aistudio.google.com

گام ۲ – انتخاب مدل نانو بنانا

  • بعد از ورود، در صفحه اصلی روی New chat یا Gallery کلیک کنید.
  • در سمت راست بالای صفحه، روی نام مدل فعلی (مثلاً Gemini 1.5 Pro) کلیک کنید.
  • از لیست مدل‌ها یکی از این دو را انتخاب کنید:
    → gemini-2.5-flash-image (سریع)
    → gemini-3-pro-image-preview (بهترین کیفیت واقعی‌گرایانه – آبان ۱۴۰۴)

گام ۳ – غیرفعال کردن فیلترهای ایمنی (برای آزادی عمل کامل)

  • در همان صفحه چت، سمت راست پایین روی آیکون شیلد (Safety settings) کلیک کنید.
  • هر چهار گزینه را روی Block none یا Block low بگذارید → Save کنید.
    حالا دیگر تقریباً هیچ پرامپتی بلاک نمی‌شود.

گام ۴ – نوشتن پرامپت و تولید

  • پرامپت انگلیسی خود را در کادر بزرگ بنویسید و دکمه Run (فلش آبی) را بزنید.
  • تصویر در چند ثانیه ساخته می‌شود و دکمه Download بالای آن ظاهر می‌شود.
  • محدودیت روزانه بسیار بالا (بیش از ۵۰۰ تصویر در روز هم تست شده).

بیشتر بخوانید: هوش مصنوعی شورت ویدیو آپارات چیست؟


روش ۳ – کاملاً رایگان و بدون نیاز به VPN دائمی: lmarena.ai (بهترین گزینه فعلی)

  1. به آدرس https://lmarena.ai بروید (بدون VPN هم باز می‌شود، اما با VPN آمریکا سرعت بهتر است).
  2. با حساب گوگل خودتان Sign in کنید (۳۰ ثانیه طول می‌کشد).
  3. در صفحه اصلی، در قسمت جستجو تایپ کنید: Gemini 3 Pro Image یا Nano Banana مدل ظاهر می‌شود → روی آن کلیک کنید.
  4. در کادر چت، پرامپت انگلیسی بنویسید و Enter بزنید.
  5. هر روز اعتبار رایگان می‌دهد و کیفیت دقیقاً همان Gemini 3 Pro Image رسمی گوگل است.

درمورد مقایسه گراکی پدیا و ویکی پدیا بخوانید.


مقایسه سریع سه روش ساخت عکس با نانو بنانا

روشنیاز به VPNمحدودیت روزانهبهترین کیفیتمناسب برای
Gemini.google.comبلهمتوسط (۵۰–۱۰۰)بسیار خوباستفاده روزمره و سریع
Google AI Studioبلهبسیار بالاعالیعکاسان حرفه‌ای و فروشگاه‌ها
lmarena.aiخیر/اختیاریبالا + اعتبار رایگانعالیهمه کاربران ایرانی

ساختار اجباری یک پرامپت حرفه‌ای برای خروجی فوق‌واقعی (فرمول ۵ لایه)

هر پرامپت موفق دقیقاً این ۵ لایه را به همین ترتیب دارد:

۱. نوع عکس + سبک کلی ۲. سوژه اصلی + جزئیات فیزیکی دقیق ۳. نورپردازی + کیفیت نور ۴. دوربین و ترکیب‌بندی ۵. مشخصات فنی و کیفیت نهایی

تکنیک‌های پیشرفته نورپردازی که ۹۰٪ افراد نمی‌دانند

هدف نهاییعبارت دقیق برای نورپردازینتیجه واقعی در خروجی
عکس استودیویی فروشگاهیsoft three-point studio lighting with subtle rim lightسایه‌های نرم و انعکاس طبیعی روی محصول
حس لوکس و گران‌قیمتdramatic golden rim light + soft key light from 45°هایلایت طلایی روی لبه‌های محصول
عکاسی جواهرات یا ساعتmacro close-up with cross-polarized studio lightingحذف کامل بازتاب‌های ناخواسته
عطر و شیشهsoft diffused front light + subtle backlightingانعکاس زیبا داخل شیشه و مایع
عکاسی غذا یا نوشیدنیwarm overhead softbox + cool side fill lightاشتها‌آور و واقعی

کنترل دقیق دوربین و ترکیب‌بندی (حرفه‌ای‌ها فقط از این‌ها استفاده می‌کنند)

زاویه دلخواهعبارت دقیق انگلیسیکاربرد رایج
نمای بالای فلت‌لیtop-down flat lay, 90-degree overhead viewغذا، لوازم آرایشی، موکاپ
نمای ۴۵ درجه کلاسیک45-degree angle, three-quarter viewاکثر محصولات فروشگاهی
کلوزآپ جواهراتextreme macro close-up, 100mm macro lensنمایش بافت و الماس
نمای سینماییcinematic wide shot, 35mm lens, shallow depth of fieldلایف‌استایل و بنر تبلیغاتی
نمای از پایین (قدرت)low-angle hero shot, looking upکفش، ماشین، محصولات تکنولوژی

تکنیک «دوبار توصیف کردن متریال»

به جای «leather bag» بنویسید: premium full-grain leather handbag with visible natural leather grain and subtle stitching details

ترفندهای حذف مشکلات رایج

مشکل رایجراه‌حل دائمی در پرامپت
دست و انگشتان خرابno hands, floating product, levitating object
متن خراب یا ناخواستهno text, no watermark, no logo, clean image
بازتاب‌های غیرواقعیrealistic reflections only on reflective surfaces
سایه‌های غیرطبیعیphysically accurate shadows, soft shadow falloff
رنگ‌های اشباع بیش از حدnatural color palette, true-to-life colors, accurate white balance
چک‌لیست نهایی قبل از زدن دکمه Generate (حرفه‌ای‌ها این را حفظ هستند)
  • پرامپت کاملاً انگلیسی است
  • حداقل یک‌بار کلمه photorealistic یا hyper-realistic دارد
  • نورپردازی دقیق توصیف شده
  • زاویه دوربین مشخص است
  • کیفیت 8K یا ultra detailed ذکر شده
  • no text, no watermark, no hands اضافه شده (در صورت نیاز)
  • پس‌زمینه دقیقاً همان چیزی است که می‌خواهید.

درمورد آموزش ساخت عکس با نوت بوک ال ام بخوانید.


سوالات متداول تخصصی (فقط سوالات واقعی عکاسان و مارکترها)

سوال ۱: چرا گاهی عکس کاملاً کارتونی می‌شود؟

پاسخ: چون در پرامپت کلمه realistic ننوشته‌اید یا از کلماتی مثل illustration, cartoon, digital art استفاده کرده‌اید.

سوال ۲: چطور انعکاس روی شیشه عطر واقعی نیست، چه کنم؟

پاسخ: حتماً این عبارت را اضافه کنید: realistic glass refraction, visible caustics, subtle internal reflections

سوال ۳: چطور سایه محصول روی پس‌زمینه سفید طبیعی باشد؟

پاسخ: physically accurate soft shadow, contact shadow, subtle gradient shadow

سوال ۴: چرا گاهی محصول شناور به نظر می‌رسد؟

پاسخ: حتماً بنویسید: product resting naturally on surface with realistic contact point

سوال ۵: بهترین مدل فعلی برای عکاسی محصول کدام است؟

پاسخ: در آبان ۱۴۰۴، Gemini 3 Pro Image (در lmarena.ai یا Google AI Studio) بهترین واقع‌گرایی را دارد.

سوال ۶: آیا می‌توانم همزمان چند محصول با نور و سایه هماهنگ داشته باشم؟

پاسخ: بله. عبارت کلیدی: cohesive lighting across all objects, unified shadow direction

اکنون شما تمام تکنیک‌های لازم برای ساخت عکس‌های تبلیغاتی غیرقابل تشخیص از عکس واقعی با نانو بنانا را دارید. این دقیقاً همان روشی است که در حال حاضر بهترین عکاسان تبلیغاتی و فروشگاه‌های بزرگ ایرانی استفاده می‌کنند.

5 از 5 (1 رای)

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *