
آموزش هوش مصنوعی نانو بنانا گوگل برای ساخت عکس
فهرست مطالب
هوش مصنوعی نانو بنانا (Nano Banana)، نام مستعار مدلهای هوش مصنوعی تولید و ویرایش تصویر گوگل، یکی از نوآورانهترین ابزارهای مولد مبتنی بر خانواده Gemini است. این مدلها، که توسط Google DeepMind توسعه یافتهاند، بر پایه معماری چندوجهی (multimodal) Gemini ساخته شده و تمرکز اصلیشان بر ترکیب هوشمندانه ورودیهای متنی، تصویری و دانش جهان واقعی برای خلق و ویرایش تصاویر با دقت استودیویی است.
درمورد آموزش جیمینی لایو در گوشی با برنامه Gemini Live بخوانید.
نانو بنانا کدام مدل است و در حال حاضر کدام نسخه بهترین خروجی را دارد؟
بهطور دقیق، نانو بنانا به دو نسخه اصلی اشاره دارد:
نانو بنانا پرو (Gemini 3 Pro Image): نسخه پیشرفتهتر، معرفیشده در نوامبر ۲۰۲۵ (آبان ۱۴۰۴)، که بر پایه Gemini 3 Pro ساخته شده و قابلیتهای استدلال پیشرفتهتری برای تولید تصاویر با رزولوشن تا ۴K ارائه میدهد. این مدل نه تنها تولید تصویر، بلکه ویرایشهای مفهومی عمیق مانند حفظ هویت شخصیتها در سناریوهای پیچیده را پشتیبانی میکند.
نانو بنانا (Gemini 2.5 Flash Image): نسخه سریع و کارآمد، بهینهشده برای وظایف با حجم بالا و تأخیر کم، که در اوت ۲۰۲۵ (مرداد ۱۴۰۴) معرفی شد. این مدل با رزولوشن پایه ۱۰۲۴ پیکسل، بر تولید تصاویر واقعگرایانه و ویرایشهای مکالمهای تمرکز دارد و در بنچمارکهایی مانند LMArena (که نام مستعار “nano-banana” از آن گرفته شده) عملکرد برتر در ویرایش تصاویر نشان داده است.
- نام رسمی فعلی: Gemini 3 Pro Image (در جامعه ایرانی همچنان «نانو بنانا ۲» یا «نانو بنانا پرو» نامیده میشود)
- بهترین کیفیت واقعیگرایانه محصول: Gemini 3 Pro Image
- سریعترین مدل برای تستهای زیاد: Gemini-2.5-flash-image
- تنها جایی که هر دو مدل همزمان در دسترس هستند: Google AI Studio و lmarena.ai
درمورد هوش مصنوعی Gemini بخوانید.
مزایای کلیدی نانو بنانا: برتریهای فنی و کاربردی
نانو بنانا با بهرهگیری از دانش جهانی Gemini، ویرایشهای دقیق و سرعت بالا، استاندارد جدیدی در ابزارهای AI مولد تصویر تعریف کرده است. در ادامه، مزایای تخصصی آن را به صورت فهرستوار بررسی میکنیم، با تمرکز بر جنبههای فنی که آن را از رقبایی مانند Midjourney یا DALL·E متمایز میسازد:
۱. سرعت و کارایی بالا (Low-Latency Processing)
- تولید تصویر در کمتر از ۱–۵ ثانیه، حتی برای ویرایشهای پیچیده، که آن را ایدهآل برای workflowهای حرفهای مانند طراحی تبلیغاتی میکند.
- بهینهسازی برای حجم بالا: در Vertex AI، هزینه هر تصویر حدود ۰.۰۳۹ دلار است، با توکنهای خروجی ۱۲۹۰ توکنی برای هر تصویر.
۲. ویرایش مکالمهای و تکرارشونده (Conversational & Iterative Refinement)
- برخلاف مدلهای سنتی که هر درخواست را از صفر شروع میکنند، نانو بنانا زمینه (context) را حفظ کرده و اجازه ویرایشهای تدریجی میدهد – مثلاً “نور را گرمتر کن بدون تغییر پسزمینه”.
- پشتیبانی از ورودیهای ترکیبی: متن + تا ۳ تصویر مرجع، برای ترکیب عناصر (multi-image fusion) با حفظ انسجام صحنه.
۳. حفظ هویت و consistency شخصیتها (Character Consistency)
- تا ۵ شخصیت را در تصاویر متوالی حفظ میکند، که برای داستانسرایی بصری (مانند کمیکها یا کمپینهای تبلیغاتی) حیاتی است.
- انتقال سبک (style transfer): اعمال سبک یک تصویر بر دیگری بدون از دست دادن جزئیات، با دقت بالا در بافتها و رنگها.
۴. رندر دقیق متن و چندزبانه (High-Fidelity Text Rendering)
- تولید متن خوانا و دقیق در تصاویر، حتی به زبانهای غیرانگلیسی (مانند فارسی در نسخه پرو)، ایدهآل برای پوسترها، موکاپها و محتوای بینالمللی.
- دقت ۹۵% در اولین تلاش، بر اساس تستهای داخلی گوگل.
۵. کنترل پیشرفته دوربین و نورپردازی (Advanced Camera & Lighting Controls)
- شبیهسازی لنزهای واقعی (مانند ۵۰mm یا macro) و نورپردازی سینمایی (cinematic lighting)، برای خروجیهای فوتورئالیستیک.
- ویرایش محلی (inpainting): تغییر عناصر خاص بدون تأثیر بر کل صحنه، مانند حذف اشیاء یا تغییر pose با حفظ عمق میدان.
۶. رزولوشن و کیفیت بالا (Up to 4K Output)
- خروجی native 2K با آپاسکیلینگ به 4K، با جزئیات بافتی دقیق (مانند انعکاسهای شیشهای یا بافت چرم).
- نسبتهای انعطافپذیر (aspect ratios) برای پلتفرمهای مختلف، از اینستاگرام تا بنرهای وب.
۷. ادغام با اکوسیستم گوگل و ایمنی (Ecosystem Integration & Safety)
- دسترسی آسان از Gemini App، Google Ads و Workspace، با فیلترهای ایمنی پیشرفته برای جلوگیری از محتوای مضر.
- SynthID برای شفافیت: تشخیص آسان تصاویر AI، که اعتماد کاربران و برندها را افزایش میدهد.
درمورد آموزش ساخت ویدیو با هوش مصنوعی Sora بخوانید.

آموزش هوش مصنوعی نانو بنانا
روش ۱ – سادهترین و سریعترین (پیشنهاد ۹۰٪ کاربران): Gemini.google.com
گام ۱ – ورود به سایت
- VPN را روشن کنید و کشور را روی آمریکا، کانادا، فرانسه یا امارات بگذارید (این چهار کشور ۱۰۰٪ کار میکنند).
- مرورگر کروم یا اج را باز کنید و به آدرس زیر بروید:
https://gemini.google.com
گام ۲ – ورود با حساب گوگل
- با حساب گوگل خودتان لاگین کنید (اگر حساب ندارید، همینجا بسازید).
- بعد از ورود، صفحه چت Gemini باز میشود.
گام ۳ – فعال کردن ابزار ساخت عکس (آیکون موز)
- در پایین صفحه، سمت چپ کادر تایپ پیام، یک آیکون موز زردرنگ 🟡 میبینید. روی آن کلیک کنید.
- اگر آیکون موز را نمیبینید → VPN را عوض کنید و کش مرورگر را پاک کنید (Ctrl+Shift+Delete) و دوباره وارد شوید.
گام ۴ – نوشتن پرامپت و ساخت عکس
- حالا کافی است پرامپت انگلیسی خود را مستقیم در کادر بنویسید و Enter بزنید.
- در کمتر از ۱۰–۲۰ ثانیه چهار تصویر به شما نشان داده میشود.
- روی عکسی که دوست دارید کلیک کنید → دکمه Download ظاهر میشود.
نکته مهم: در Gemini معمولی روزانه حدود ۵۰–۱۰۰ تصویر میتوانید بسازید (بستگی به حساب دارد).
بیشتر بخوانید: هوش مصنوعی گراک 4.1 چیست
روش ۲ – حرفهایترین و بدون محدودیت (پیشنهاد عکاسان و فروشگاهداران): Google AI Studio
گام ۱ – ورود
- VPN آمریکا/کانادا/فرانسه روشن باشد.
- به آدرس زیر بروید:
https://aistudio.google.com
گام ۲ – انتخاب مدل نانو بنانا
- بعد از ورود، در صفحه اصلی روی New chat یا Gallery کلیک کنید.
- در سمت راست بالای صفحه، روی نام مدل فعلی (مثلاً Gemini 1.5 Pro) کلیک کنید.
- از لیست مدلها یکی از این دو را انتخاب کنید:
→ gemini-2.5-flash-image (سریع)
→ gemini-3-pro-image-preview (بهترین کیفیت واقعیگرایانه – آبان ۱۴۰۴)
گام ۳ – غیرفعال کردن فیلترهای ایمنی (برای آزادی عمل کامل)
- در همان صفحه چت، سمت راست پایین روی آیکون شیلد (Safety settings) کلیک کنید.
- هر چهار گزینه را روی Block none یا Block low بگذارید → Save کنید.
حالا دیگر تقریباً هیچ پرامپتی بلاک نمیشود.
گام ۴ – نوشتن پرامپت و تولید
- پرامپت انگلیسی خود را در کادر بزرگ بنویسید و دکمه Run (فلش آبی) را بزنید.
- تصویر در چند ثانیه ساخته میشود و دکمه Download بالای آن ظاهر میشود.
- محدودیت روزانه بسیار بالا (بیش از ۵۰۰ تصویر در روز هم تست شده).
بیشتر بخوانید: هوش مصنوعی شورت ویدیو آپارات چیست؟
روش ۳ – کاملاً رایگان و بدون نیاز به VPN دائمی: lmarena.ai (بهترین گزینه فعلی)
- به آدرس https://lmarena.ai بروید (بدون VPN هم باز میشود، اما با VPN آمریکا سرعت بهتر است).
- با حساب گوگل خودتان Sign in کنید (۳۰ ثانیه طول میکشد).
- در صفحه اصلی، در قسمت جستجو تایپ کنید: Gemini 3 Pro Image یا Nano Banana مدل ظاهر میشود → روی آن کلیک کنید.
- در کادر چت، پرامپت انگلیسی بنویسید و Enter بزنید.
- هر روز اعتبار رایگان میدهد و کیفیت دقیقاً همان Gemini 3 Pro Image رسمی گوگل است.
درمورد مقایسه گراکی پدیا و ویکی پدیا بخوانید.
مقایسه سریع سه روش ساخت عکس با نانو بنانا
| روش | نیاز به VPN | محدودیت روزانه | بهترین کیفیت | مناسب برای |
|---|---|---|---|---|
| Gemini.google.com | بله | متوسط (۵۰–۱۰۰) | بسیار خوب | استفاده روزمره و سریع |
| Google AI Studio | بله | بسیار بالا | عالی | عکاسان حرفهای و فروشگاهها |
| lmarena.ai | خیر/اختیاری | بالا + اعتبار رایگان | عالی | همه کاربران ایرانی |
ساختار اجباری یک پرامپت حرفهای برای خروجی فوقواقعی (فرمول ۵ لایه)
هر پرامپت موفق دقیقاً این ۵ لایه را به همین ترتیب دارد:
۱. نوع عکس + سبک کلی ۲. سوژه اصلی + جزئیات فیزیکی دقیق ۳. نورپردازی + کیفیت نور ۴. دوربین و ترکیببندی ۵. مشخصات فنی و کیفیت نهایی
تکنیکهای پیشرفته نورپردازی که ۹۰٪ افراد نمیدانند
| هدف نهایی | عبارت دقیق برای نورپردازی | نتیجه واقعی در خروجی |
|---|---|---|
| عکس استودیویی فروشگاهی | soft three-point studio lighting with subtle rim light | سایههای نرم و انعکاس طبیعی روی محصول |
| حس لوکس و گرانقیمت | dramatic golden rim light + soft key light from 45° | هایلایت طلایی روی لبههای محصول |
| عکاسی جواهرات یا ساعت | macro close-up with cross-polarized studio lighting | حذف کامل بازتابهای ناخواسته |
| عطر و شیشه | soft diffused front light + subtle backlighting | انعکاس زیبا داخل شیشه و مایع |
| عکاسی غذا یا نوشیدنی | warm overhead softbox + cool side fill light | اشتهاآور و واقعی |
کنترل دقیق دوربین و ترکیببندی (حرفهایها فقط از اینها استفاده میکنند)
| زاویه دلخواه | عبارت دقیق انگلیسی | کاربرد رایج |
|---|---|---|
| نمای بالای فلتلی | top-down flat lay, 90-degree overhead view | غذا، لوازم آرایشی، موکاپ |
| نمای ۴۵ درجه کلاسیک | 45-degree angle, three-quarter view | اکثر محصولات فروشگاهی |
| کلوزآپ جواهرات | extreme macro close-up, 100mm macro lens | نمایش بافت و الماس |
| نمای سینمایی | cinematic wide shot, 35mm lens, shallow depth of field | لایفاستایل و بنر تبلیغاتی |
| نمای از پایین (قدرت) | low-angle hero shot, looking up | کفش، ماشین، محصولات تکنولوژی |
تکنیک «دوبار توصیف کردن متریال»
به جای «leather bag» بنویسید: premium full-grain leather handbag with visible natural leather grain and subtle stitching details
ترفندهای حذف مشکلات رایج
| مشکل رایج | راهحل دائمی در پرامپت |
|---|---|
| دست و انگشتان خراب | no hands, floating product, levitating object |
| متن خراب یا ناخواسته | no text, no watermark, no logo, clean image |
| بازتابهای غیرواقعی | realistic reflections only on reflective surfaces |
| سایههای غیرطبیعی | physically accurate shadows, soft shadow falloff |
| رنگهای اشباع بیش از حد | natural color palette, true-to-life colors, accurate white balance |
چکلیست نهایی قبل از زدن دکمه Generate (حرفهایها این را حفظ هستند)
- پرامپت کاملاً انگلیسی است
- حداقل یکبار کلمه photorealistic یا hyper-realistic دارد
- نورپردازی دقیق توصیف شده
- زاویه دوربین مشخص است
- کیفیت 8K یا ultra detailed ذکر شده
- no text, no watermark, no hands اضافه شده (در صورت نیاز)
- پسزمینه دقیقاً همان چیزی است که میخواهید.
درمورد آموزش ساخت عکس با نوت بوک ال ام بخوانید.
سوالات متداول تخصصی (فقط سوالات واقعی عکاسان و مارکترها)
سوال ۱: چرا گاهی عکس کاملاً کارتونی میشود؟
پاسخ: چون در پرامپت کلمه realistic ننوشتهاید یا از کلماتی مثل illustration, cartoon, digital art استفاده کردهاید.
سوال ۲: چطور انعکاس روی شیشه عطر واقعی نیست، چه کنم؟
پاسخ: حتماً این عبارت را اضافه کنید: realistic glass refraction, visible caustics, subtle internal reflections
سوال ۳: چطور سایه محصول روی پسزمینه سفید طبیعی باشد؟
پاسخ: physically accurate soft shadow, contact shadow, subtle gradient shadow
سوال ۴: چرا گاهی محصول شناور به نظر میرسد؟
پاسخ: حتماً بنویسید: product resting naturally on surface with realistic contact point
سوال ۵: بهترین مدل فعلی برای عکاسی محصول کدام است؟
پاسخ: در آبان ۱۴۰۴، Gemini 3 Pro Image (در lmarena.ai یا Google AI Studio) بهترین واقعگرایی را دارد.
سوال ۶: آیا میتوانم همزمان چند محصول با نور و سایه هماهنگ داشته باشم؟
پاسخ: بله. عبارت کلیدی: cohesive lighting across all objects, unified shadow direction
اکنون شما تمام تکنیکهای لازم برای ساخت عکسهای تبلیغاتی غیرقابل تشخیص از عکس واقعی با نانو بنانا را دارید. این دقیقاً همان روشی است که در حال حاضر بهترین عکاسان تبلیغاتی و فروشگاههای بزرگ ایرانی استفاده میکنند.



