آموزش هوش مصنوعی نانو بنانا گوگل برای ساخت عکس

سید علی ابراهیمی
11 بهمن 1404

فهرست مطالب

هوش مصنوعی نانو بنانا (Nano Banana)، نام مستعار مدل‌های هوش مصنوعی تولید و ویرایش تصویر گوگل، یکی از نوآورانه‌ترین ابزارهای مولد مبتنی بر خانواده Gemini است. این مدل‌ها، که توسط Google DeepMind توسعه یافته‌اند، بر پایه معماری چندوجهی (multimodal) Gemini ساخته شده و تمرکز اصلی‌شان بر ترکیب هوشمندانه ورودی‌های متنی، تصویری و دانش جهان واقعی برای خلق و ویرایش تصاویر با دقت استودیویی است.

درمورد آموزش جیمینی لایو در گوشی با برنامه Gemini Live بخوانید.

نانو بنانا کدام مدل است و در حال حاضر کدام نسخه بهترین خروجی را دارد؟

به‌طور دقیق، نانو بنانا به دو نسخه اصلی اشاره دارد:

نانو بنانا پرو (Gemini 3 Pro Image): نسخه پیشرفته‌تر، معرفی‌شده در نوامبر ۲۰۲۵ (آبان ۱۴۰۴)، که بر پایه Gemini 3 Pro ساخته شده و قابلیت‌های استدلال پیشرفته‌تری برای تولید تصاویر با رزولوشن تا ۴K ارائه می‌دهد. این مدل نه تنها تولید تصویر، بلکه ویرایش‌های مفهومی عمیق مانند حفظ هویت شخصیت‌ها در سناریوهای پیچیده را پشتیبانی می‌کند.

نانو بنانا (Gemini 2.5 Flash Image): نسخه سریع و کارآمد، بهینه‌شده برای وظایف با حجم بالا و تأخیر کم، که در اوت ۲۰۲۵ (مرداد ۱۴۰۴) معرفی شد. این مدل با رزولوشن پایه ۱۰۲۴ پیکسل، بر تولید تصاویر واقع‌گرایانه و ویرایش‌های مکالمه‌ای تمرکز دارد و در بنچمارک‌هایی مانند LMArena (که نام مستعار “nano-banana” از آن گرفته شده) عملکرد برتر در ویرایش تصاویر نشان داده است.

نام رسمی فعلی: Gemini 3 Pro Image (در جامعه ایرانی همچنان «نانو بنانا ۲» یا «نانو بنانا پرو» نامیده می‌شود)
بهترین کیفیت واقعی‌گرایانه محصول: Gemini 3 Pro Image
سریع‌ترین مدل برای تست‌های زیاد: Gemini-2.5-flash-image
تنها جایی که هر دو مدل همزمان در دسترس هستند: Google AI Studio و lmarena.ai

درمورد هوش مصنوعی Gemini بخوانید.

مزایای کلیدی نانو بنانا: برتری‌های فنی و کاربردی

نانو بنانا با بهره‌گیری از دانش جهانی Gemini، ویرایش‌های دقیق و سرعت بالا، استاندارد جدیدی در ابزارهای AI مولد تصویر تعریف کرده است. در ادامه، مزایای تخصصی آن را به صورت فهرست‌وار بررسی می‌کنیم، با تمرکز بر جنبه‌های فنی که آن را از رقبایی مانند Midjourney یا DALL·E متمایز می‌سازد:

۱. سرعت و کارایی بالا (Low-Latency Processing)

تولید تصویر در کمتر از ۱–۵ ثانیه، حتی برای ویرایش‌های پیچیده، که آن را ایده‌آل برای workflowهای حرفه‌ای مانند طراحی تبلیغاتی می‌کند.
بهینه‌سازی برای حجم بالا: در Vertex AI، هزینه هر تصویر حدود ۰.۰۳۹ دلار است، با توکن‌های خروجی ۱۲۹۰ توکنی برای هر تصویر.

۲. ویرایش مکالمه‌ای و تکرارشونده (Conversational & Iterative Refinement)

برخلاف مدل‌های سنتی که هر درخواست را از صفر شروع می‌کنند، نانو بنانا زمینه (context) را حفظ کرده و اجازه ویرایش‌های تدریجی می‌دهد – مثلاً “نور را گرم‌تر کن بدون تغییر پس‌زمینه”.
پشتیبانی از ورودی‌های ترکیبی: متن + تا ۳ تصویر مرجع، برای ترکیب عناصر (multi-image fusion) با حفظ انسجام صحنه.

۳. حفظ هویت و consistency شخصیت‌ها (Character Consistency)

تا ۵ شخصیت را در تصاویر متوالی حفظ می‌کند، که برای داستان‌سرایی بصری (مانند کمیک‌ها یا کمپین‌های تبلیغاتی) حیاتی است.
انتقال سبک (style transfer): اعمال سبک یک تصویر بر دیگری بدون از دست دادن جزئیات، با دقت بالا در بافت‌ها و رنگ‌ها.

۴. رندر دقیق متن و چندزبانه (High-Fidelity Text Rendering)

تولید متن خوانا و دقیق در تصاویر، حتی به زبان‌های غیرانگلیسی (مانند فارسی در نسخه پرو)، ایده‌آل برای پوسترها، موکاپ‌ها و محتوای بین‌المللی.
دقت ۹۵% در اولین تلاش، بر اساس تست‌های داخلی گوگل.

۵. کنترل پیشرفته دوربین و نورپردازی (Advanced Camera & Lighting Controls)

شبیه‌سازی لنزهای واقعی (مانند ۵۰mm یا macro) و نورپردازی سینمایی (cinematic lighting)، برای خروجی‌های فوتورئالیستیک.
ویرایش محلی (inpainting): تغییر عناصر خاص بدون تأثیر بر کل صحنه، مانند حذف اشیاء یا تغییر pose با حفظ عمق میدان.

۶. رزولوشن و کیفیت بالا (Up to 4K Output)

خروجی native 2K با آپ‌اسکیلینگ به 4K، با جزئیات بافتی دقیق (مانند انعکاس‌های شیشه‌ای یا بافت چرم).
نسبت‌های انعطاف‌پذیر (aspect ratios) برای پلتفرم‌های مختلف، از اینستاگرام تا بنرهای وب.

۷. ادغام با اکوسیستم گوگل و ایمنی (Ecosystem Integration & Safety)

دسترسی آسان از Gemini App، Google Ads و Workspace، با فیلترهای ایمنی پیشرفته برای جلوگیری از محتوای مضر.
SynthID برای شفافیت: تشخیص آسان تصاویر AI، که اعتماد کاربران و برندها را افزایش می‌دهد.

درمورد آموزش ساخت ویدیو با هوش مصنوعی Sora بخوانید.

آموزش هوش مصنوعی نانو بنانا

روش ۱ – ساده‌ترین و سریع‌ترین (پیشنهاد ۹۰٪ کاربران): Gemini.google.com

گام ۱ – ورود به سایت

VPN را روشن کنید و کشور را روی آمریکا، کانادا، فرانسه یا امارات بگذارید (این چهار کشور ۱۰۰٪ کار می‌کنند).
مرورگر کروم یا اج را باز کنید و به آدرس زیر بروید:
https://gemini.google.com

گام ۲ – ورود با حساب گوگل

با حساب گوگل خودتان لاگین کنید (اگر حساب ندارید، همین‌جا بسازید).
بعد از ورود، صفحه چت Gemini باز می‌شود.

گام ۳ – فعال کردن ابزار ساخت عکس (آیکون موز)

در پایین صفحه، سمت چپ کادر تایپ پیام، یک آیکون موز زردرنگ 🟡 می‌بینید. روی آن کلیک کنید.
اگر آیکون موز را نمی‌بینید → VPN را عوض کنید و کش مرورگر را پاک کنید (Ctrl+Shift+Delete) و دوباره وارد شوید.

گام ۴ – نوشتن پرامپت و ساخت عکس

حالا کافی است پرامپت انگلیسی خود را مستقیم در کادر بنویسید و Enter بزنید.
در کمتر از ۱۰–۲۰ ثانیه چهار تصویر به شما نشان داده می‌شود.
روی عکسی که دوست دارید کلیک کنید → دکمه Download ظاهر می‌شود.

نکته مهم: در Gemini معمولی روزانه حدود ۵۰–۱۰۰ تصویر می‌توانید بسازید (بستگی به حساب دارد).

بیشتر بخوانید: هوش مصنوعی گراک 4.1 چیست

روش ۲ – حرفه‌ای‌ترین و بدون محدودیت (پیشنهاد عکاسان و فروشگاه‌داران): Google AI Studio

گام ۱ – ورود

VPN آمریکا/کانادا/فرانسه روشن باشد.
به آدرس زیر بروید:
https://aistudio.google.com

گام ۲ – انتخاب مدل نانو بنانا

بعد از ورود، در صفحه اصلی روی New chat یا Gallery کلیک کنید.
در سمت راست بالای صفحه، روی نام مدل فعلی (مثلاً Gemini 1.5 Pro) کلیک کنید.
از لیست مدل‌ها یکی از این دو را انتخاب کنید:
→ gemini-2.5-flash-image (سریع)
→ gemini-3-pro-image-preview (بهترین کیفیت واقعی‌گرایانه – آبان ۱۴۰۴)

گام ۳ – غیرفعال کردن فیلترهای ایمنی (برای آزادی عمل کامل)

در همان صفحه چت، سمت راست پایین روی آیکون شیلد (Safety settings) کلیک کنید.
هر چهار گزینه را روی Block none یا Block low بگذارید → Save کنید.
حالا دیگر تقریباً هیچ پرامپتی بلاک نمی‌شود.

گام ۴ – نوشتن پرامپت و تولید

پرامپت انگلیسی خود را در کادر بزرگ بنویسید و دکمه Run (فلش آبی) را بزنید.
تصویر در چند ثانیه ساخته می‌شود و دکمه Download بالای آن ظاهر می‌شود.
محدودیت روزانه بسیار بالا (بیش از ۵۰۰ تصویر در روز هم تست شده).

بیشتر بخوانید: هوش مصنوعی شورت ویدیو آپارات چیست؟

روش ۳ – کاملاً رایگان و بدون نیاز به VPN دائمی: lmarena.ai (بهترین گزینه فعلی)

به آدرس https://lmarena.ai بروید (بدون VPN هم باز می‌شود، اما با VPN آمریکا سرعت بهتر است).
با حساب گوگل خودتان Sign in کنید (۳۰ ثانیه طول می‌کشد).
در صفحه اصلی، در قسمت جستجو تایپ کنید: Gemini 3 Pro Image یا Nano Banana مدل ظاهر می‌شود → روی آن کلیک کنید.
در کادر چت، پرامپت انگلیسی بنویسید و Enter بزنید.
هر روز اعتبار رایگان می‌دهد و کیفیت دقیقاً همان Gemini 3 Pro Image رسمی گوگل است.

درمورد مقایسه گراکی پدیا و ویکی پدیا بخوانید.

مقایسه سریع سه روش ساخت عکس با نانو بنانا

روش	نیاز به VPN	محدودیت روزانه	بهترین کیفیت	مناسب برای
Gemini.google.com	بله	متوسط (۵۰–۱۰۰)	بسیار خوب	استفاده روزمره و سریع
Google AI Studio	بله	بسیار بالا	عالی	عکاسان حرفه‌ای و فروشگاه‌ها
lmarena.ai	خیر/اختیاری	بالا + اعتبار رایگان	عالی	همه کاربران ایرانی

ساختار اجباری یک پرامپت حرفه‌ای برای خروجی فوق‌واقعی (فرمول ۵ لایه)

هر پرامپت موفق دقیقاً این ۵ لایه را به همین ترتیب دارد:

۱. نوع عکس + سبک کلی ۲. سوژه اصلی + جزئیات فیزیکی دقیق ۳. نورپردازی + کیفیت نور ۴. دوربین و ترکیب‌بندی ۵. مشخصات فنی و کیفیت نهایی

تکنیک‌های پیشرفته نورپردازی که ۹۰٪ افراد نمی‌دانند

هدف نهایی	عبارت دقیق برای نورپردازی	نتیجه واقعی در خروجی
عکس استودیویی فروشگاهی	soft three-point studio lighting with subtle rim light	سایه‌های نرم و انعکاس طبیعی روی محصول
حس لوکس و گران‌قیمت	dramatic golden rim light + soft key light from 45°	هایلایت طلایی روی لبه‌های محصول
عکاسی جواهرات یا ساعت	macro close-up with cross-polarized studio lighting	حذف کامل بازتاب‌های ناخواسته
عطر و شیشه	soft diffused front light + subtle backlighting	انعکاس زیبا داخل شیشه و مایع
عکاسی غذا یا نوشیدنی	warm overhead softbox + cool side fill light	اشتها‌آور و واقعی

کنترل دقیق دوربین و ترکیب‌بندی (حرفه‌ای‌ها فقط از این‌ها استفاده می‌کنند)

زاویه دلخواه	عبارت دقیق انگلیسی	کاربرد رایج
نمای بالای فلت‌لی	top-down flat lay, 90-degree overhead view	غذا، لوازم آرایشی، موکاپ
نمای ۴۵ درجه کلاسیک	45-degree angle, three-quarter view	اکثر محصولات فروشگاهی
کلوزآپ جواهرات	extreme macro close-up, 100mm macro lens	نمایش بافت و الماس
نمای سینمایی	cinematic wide shot, 35mm lens, shallow depth of field	لایف‌استایل و بنر تبلیغاتی
نمای از پایین (قدرت)	low-angle hero shot, looking up	کفش، ماشین، محصولات تکنولوژی

تکنیک «دوبار توصیف کردن متریال»

به جای «leather bag» بنویسید: premium full-grain leather handbag with visible natural leather grain and subtle stitching details

ترفندهای حذف مشکلات رایج

مشکل رایج	راه‌حل دائمی در پرامپت
دست و انگشتان خراب	no hands, floating product, levitating object
متن خراب یا ناخواسته	no text, no watermark, no logo, clean image
بازتاب‌های غیرواقعی	realistic reflections only on reflective surfaces
سایه‌های غیرطبیعی	physically accurate shadows, soft shadow falloff
رنگ‌های اشباع بیش از حد	natural color palette, true-to-life colors, accurate white balance

چک‌لیست نهایی قبل از زدن دکمه Generate (حرفه‌ای‌ها این را حفظ هستند)

پرامپت کاملاً انگلیسی است
حداقل یک‌بار کلمه photorealistic یا hyper-realistic دارد
نورپردازی دقیق توصیف شده
زاویه دوربین مشخص است
کیفیت 8K یا ultra detailed ذکر شده
no text, no watermark, no hands اضافه شده (در صورت نیاز)
پس‌زمینه دقیقاً همان چیزی است که می‌خواهید.

درمورد آموزش ساخت عکس با نوت بوک ال ام بخوانید.

سوالات متداول تخصصی (فقط سوالات واقعی عکاسان و مارکترها)

سوال ۱: چرا گاهی عکس کاملاً کارتونی می‌شود؟

پاسخ: چون در پرامپت کلمه realistic ننوشته‌اید یا از کلماتی مثل illustration, cartoon, digital art استفاده کرده‌اید.

سوال ۲: چطور انعکاس روی شیشه عطر واقعی نیست، چه کنم؟

پاسخ: حتماً این عبارت را اضافه کنید: realistic glass refraction, visible caustics, subtle internal reflections

سوال ۳: چطور سایه محصول روی پس‌زمینه سفید طبیعی باشد؟

پاسخ: physically accurate soft shadow, contact shadow, subtle gradient shadow

سوال ۴: چرا گاهی محصول شناور به نظر می‌رسد؟

پاسخ: حتماً بنویسید: product resting naturally on surface with realistic contact point

سوال ۵: بهترین مدل فعلی برای عکاسی محصول کدام است؟

پاسخ: در آبان ۱۴۰۴، Gemini 3 Pro Image (در lmarena.ai یا Google AI Studio) بهترین واقع‌گرایی را دارد.

سوال ۶: آیا می‌توانم همزمان چند محصول با نور و سایه هماهنگ داشته باشم؟

پاسخ: بله. عبارت کلیدی: cohesive lighting across all objects, unified shadow direction

اکنون شما تمام تکنیک‌های لازم برای ساخت عکس‌های تبلیغاتی غیرقابل تشخیص از عکس واقعی با نانو بنانا را دارید. این دقیقاً همان روشی است که در حال حاضر بهترین عکاسان تبلیغاتی و فروشگاه‌های بزرگ ایرانی استفاده می‌کنند.

5 از 5 (1 رای)

سید علی ابراهیمی وب‌سایت

سید علی ابراهیمی ( Seyed Ali Ebrahimi ) ملقب به SAE22 بلاگر حوزه تکنولوژی و نرم افزار متولد ۲۸ دی ۱۳۸۲ از شهر ساری . دانشجو رشته نرم افزار کامپیوتر از دانشگاه امام محمد باقر ساری. سید علی ابراهیمی مدرس و موسس آپالرن و وردپرس پارسی می باشد.

آموزش هوش مصنوعی نانو بنانا گوگل برای ساخت عکس

نانو بنانا کدام مدل است و در حال حاضر کدام نسخه بهترین خروجی را دارد؟

مزایای کلیدی نانو بنانا: برتری‌های فنی و کاربردی

۱. سرعت و کارایی بالا (Low-Latency Processing)

۲. ویرایش مکالمه‌ای و تکرارشونده (Conversational & Iterative Refinement)

۳. حفظ هویت و consistency شخصیت‌ها (Character Consistency)

۴. رندر دقیق متن و چندزبانه (High-Fidelity Text Rendering)

۵. کنترل پیشرفته دوربین و نورپردازی (Advanced Camera & Lighting Controls)

۶. رزولوشن و کیفیت بالا (Up to 4K Output)

۷. ادغام با اکوسیستم گوگل و ایمنی (Ecosystem Integration & Safety)

آموزش هوش مصنوعی نانو بنانا

روش ۱ – ساده‌ترین و سریع‌ترین (پیشنهاد ۹۰٪ کاربران): Gemini.google.com

روش ۲ – حرفه‌ای‌ترین و بدون محدودیت (پیشنهاد عکاسان و فروشگاه‌داران): Google AI Studio

روش ۳ – کاملاً رایگان و بدون نیاز به VPN دائمی: lmarena.ai (بهترین گزینه فعلی)

مقایسه سریع سه روش ساخت عکس با نانو بنانا

ساختار اجباری یک پرامپت حرفه‌ای برای خروجی فوق‌واقعی (فرمول ۵ لایه)

تکنیک‌های پیشرفته نورپردازی که ۹۰٪ افراد نمی‌دانند

کنترل دقیق دوربین و ترکیب‌بندی (حرفه‌ای‌ها فقط از این‌ها استفاده می‌کنند)

تکنیک «دوبار توصیف کردن متریال»

ترفندهای حذف مشکلات رایج

چک‌لیست نهایی قبل از زدن دکمه Generate (حرفه‌ای‌ها این را حفظ هستند)

سوالات متداول تخصصی (فقط سوالات واقعی عکاسان و مارکترها)

سوال ۱: چرا گاهی عکس کاملاً کارتونی می‌شود؟

سوال ۲: چطور انعکاس روی شیشه عطر واقعی نیست، چه کنم؟

سوال ۳: چطور سایه محصول روی پس‌زمینه سفید طبیعی باشد؟

سوال ۴: چرا گاهی محصول شناور به نظر می‌رسد؟

سوال ۵: بهترین مدل فعلی برای عکاسی محصول کدام است؟

سوال ۶: آیا می‌توانم همزمان چند محصول با نور و سایه هماهنگ داشته باشم؟

دیدگاهتان را بنویسید لغو پاسخ

دسته بندی

دسترسی سریع

مجوز های ما

نانو بنانا کدام مدل است و در حال حاضر کدام نسخه بهترین خروجی را دارد؟

مزایای کلیدی نانو بنانا: برتری‌های فنی و کاربردی

۱. سرعت و کارایی بالا (Low-Latency Processing)

۲. ویرایش مکالمه‌ای و تکرارشونده (Conversational & Iterative Refinement)

۳. حفظ هویت و consistency شخصیت‌ها (Character Consistency)

۴. رندر دقیق متن و چندزبانه (High-Fidelity Text Rendering)

۵. کنترل پیشرفته دوربین و نورپردازی (Advanced Camera & Lighting Controls)

۶. رزولوشن و کیفیت بالا (Up to 4K Output)

۷. ادغام با اکوسیستم گوگل و ایمنی (Ecosystem Integration & Safety)

آموزش هوش مصنوعی نانو بنانا

روش ۱ – ساده‌ترین و سریع‌ترین (پیشنهاد ۹۰٪ کاربران): Gemini.google.com

روش ۲ – حرفه‌ای‌ترین و بدون محدودیت (پیشنهاد عکاسان و فروشگاه‌داران): Google AI Studio

روش ۳ – کاملاً رایگان و بدون نیاز به VPN دائمی: lmarena.ai (بهترین گزینه فعلی)

مقایسه سریع سه روش ساخت عکس با نانو بنانا

ساختار اجباری یک پرامپت حرفه‌ای برای خروجی فوق‌واقعی (فرمول ۵ لایه)

تکنیک‌های پیشرفته نورپردازی که ۹۰٪ افراد نمی‌دانند

کنترل دقیق دوربین و ترکیب‌بندی (حرفه‌ای‌ها فقط از این‌ها استفاده می‌کنند)

تکنیک «دوبار توصیف کردن متریال»

ترفندهای حذف مشکلات رایج

چک‌لیست نهایی قبل از زدن دکمه Generate (حرفه‌ای‌ها این را حفظ هستند)

سوالات متداول تخصصی (فقط سوالات واقعی عکاسان و مارکترها)

سوال ۱: چرا گاهی عکس کاملاً کارتونی می‌شود؟

سوال ۲: چطور انعکاس روی شیشه عطر واقعی نیست، چه کنم؟

سوال ۳: چطور سایه محصول روی پس‌زمینه سفید طبیعی باشد؟

سوال ۴: چرا گاهی محصول شناور به نظر می‌رسد؟

سوال ۵: بهترین مدل فعلی برای عکاسی محصول کدام است؟

سوال ۶: آیا می‌توانم همزمان چند محصول با نور و سایه هماهنگ داشته باشم؟

آموزش دریافت یوزرنیم واتساپ و رزرو نام کاربری در واتساپ

آموزش اپلیکیشن سلکام لایف برای مدیریت سیم کارت مالزی

علت های قطع شدن صدای گوشی هوشمند + رفع مشکل

دلایل خاموشی ناگهانی گوشی هوشمند چیست؟

دیدگاهتان را بنویسید لغو پاسخ