قوقل تستعد لإطلاق نماذج الذكاء الاصطناعي Gemini 3 و Nano Banana 2 بقدرات غير مسبوقة

المشاغب

Administrator
قوقل تستعد لإطلاق نماذج الذكاء الاصطناعي Gemini 3 و Nano Banana 2 بقدرات غير مسبوقة


تستعد شركة قوقل لإطلاق الجيل الجديد من نماذج الذكاء الاصطناعي المتمثل في “جيميناي 3” Gemini 3 ونسخته البصرية المتقدمة “نانو بنانا 2” Nano Banana 2، في خطوة تعتبر الأضخم في تاريخ الشركة ضمن مجالات الذكاء الاصطناعي التوليدي المتعدد الوسائط. ويهدف هذا الإطلاق إلى تعزيز التكامل بين الفهم النصي، والتصميم البصري، والتفاعل اللغوي الذكي، لتقديم تجربة أكثر واقعية واحترافية في إنشاء المحتوى.

يُعد Gemini 3 النموذج الرئيسي في السلسلة الجديدة، والمصمم للتعامل مع النصوص والصور والفيديوهات في وقت واحد، بينما يُعتبر Nano Banana 2 التطبيق البصري المباشر لهذه التقنية، حيث يعتمد على المحرك الجديد Gemini 3 Pro Image لتوليد صور عالية الجودة بسرعة فائقة.

قفزة نوعية في الذكاء البصري والتوليد الإبداعي مع جيميناي 3 ونانو بنانا 2


يأتي نموذج جيميناي 3 بتحسينات جذرية تشمل فهم النصوص الطويلة والمعقدة بدقة لغوية عالية، وتحليل المشاهد البصرية بتفاصيل دقيقة، مما يجعله نموذجًا شاملًا متعدد القدرات. أما أداة نانو بنانا 2 (التي تُعرف داخليًا باسم GEMPIX 2) فتمثل نقلة نوعية في عالم توليد الصور الإبداعية، إذ تمكّن المستخدم من إنتاج صور وتصاميم احترافية بجودة 2K قابلة للترقية حتى 4K دون الحاجة إلى برامج تعديل خارجية مثل “فوتوشوب”.

النسخة الأولى من الأداة كانت قد حققت نجاحًا واسعًا بعدما حوّلت صور المستخدمين إلى مجسمات ثلاثية الأبعاد جذبت أكثر من 10 ملايين مستخدم جديد لتطبيق Gemini خلال أسابيع، لتتفوق لأول مرة على ChatGPT من حيث عدد التحميلات.

أبرز المميزات والتحسينات في “نانو بنانا 2” Nano Banana 2


قوقل تستعد لإطلاق نماذج الذكاء الاصطناعي Gemini 3 و Nano Banana 2 بقدرات غير مسبوقة


وفقًا لتقرير نشره موقع iLounge، سيحصل الإصدار الجديد على خمس ترقيات رئيسية تشمل:


  1. دقة أعلى ونصوص أوضح
    تعتمد الأداة على نموذج Gemini 3 Pro Image القادر على رسم النصوص داخل الصور بدقة احترافية، مع دعم ترقية العرض إلى 4K.
    هذا التطوير يجعلها مثالية لتصميم الملصقات، الواجهات، والمواد التسويقية بجودة مطبعية عالية.


  2. ذكاء سياقي عالمي
    تستطيع الأداة فهم الطابع الثقافي والمكاني للأوامر النصية مثل “نزهة في ربيع طوكيو” أو “جلسة تصوير في شتاء برلين”.
    النتيجة صور واقعية تعكس البيئة الجغرافية والضوء الطبيعي والمزاج العام للمكان المطلوب.


  3. ثبات العناصر والشخصيات
    تركز الأداة على الحفاظ على مظهر الأشخاص والعناصر في أكثر من صورة دون تغييرات عشوائية. هذه الميزة مهمة لصُنّاع المحتوى والمصممين الذين يحتاجون إلى تسلسل بصري متناسق ومتكرر لشخصياتهم أو منتجاتهم.


  4. وضع التحرير الذكي
    تتيح ميزة “Edit with Gemini” تعديل الصور الحالية بدلًا من توليد صور جديدة بالكامل. يمكن للمستخدم تغيير الملابس، الخلفيات، أو الإضاءة بسلاسة دون إعادة العمل من البداية، مما يوفّر وقتًا وجهدًا كبيرين.


  5. سرعة استجابة فائقة
    بفضل المعمارية الجديدة المبنية على Gemini 3، يمكن للأداة معالجة الطلبات المعقدة خلال أقل من 10 ثوانٍ فقط. وهذه السرعة تجعلها منافسًا مباشرًا لأدوات مثل Midjourney وFirefly، مع كفاءة أعلى في فهم الأوامر وتنفيذها.

ما الذي يقدّمه نموذج Gemini 3 الجديد؟


قوقل تستعد لإطلاق نماذج الذكاء الاصطناعي Gemini 3 و Nano Banana 2 بقدرات غير مسبوقة


يعتبر Gemini 3 Pro Image الجيل الثالث من نماذج قوقل البصرية، ويجمع بين الذكاء اللغوي والسياقي وقدرات التوليد البصري.
ويُعدّ قفزة كبيرة في تحويل النصوص إلى صور واقعية واحترافية يمكن استخدامها مباشرة في المجال التجاري والإبداعي.


  1. تحويل النص إلى صورة بدقة عالية
    يُحوّل الأوامر النصية المعقدة إلى صور واقعية غنية بالتفاصيل الدقيقة والعناصر البصرية الطبيعية.


  2. فهم متعدد اللغات والثقافات
    يدعم لغات متعددة من بينها العربية، ويفهم الاختلافات الثقافية ليُنتج صورًا تتناسق مع البيئات المحلية لكل منطقة.


  3. دقة عرض 2K مع ترقية إلى 4K
    يقدم صورًا بدقة 2K يمكن ترقيتها تلقائيًا إلى 4K، ما يجعلها مناسبة للاستخدام التجاري والتصميم الاحترافي.


  4. ثبات العناصر والألوان
    يحافظ على الملامح والإضاءة والألوان نفسها في أكثر من مشهد، ليضمن اتساقًا بصريًا مثاليًا للمشروعات المتعددة الإطارات.


  5. سرعة معالجة متقدمة
    يعتمد على محرك Gemini 3 Flash Image لتوليد الصور خلال ثوانٍ معدودة مع إمكانية التعديل الفوري عليها.


  6. تكامل بصري ولغوي متطور
    يجمع بين التحليل اللغوي والفهم البصري لتوليد صور “واعية بالسياق”، تفهم تفاصيل النص داخل الصورة وتنفذها بدقة.


  7. دقة نصوص داخل الصور
    يعرض النصوص المكتوبة مثل العناوين والشعارات بوضوح فائق مقارنة بنماذج مثل Midjourney وFirefly.


  8. تحسين الأداء بنسبة 40٪
    أسرع وأكثر كفاءة في التوليد والمعالجة، مع خفض استهلاك الموارد بشكل كبير.

نحو الجيل القادم من الذكاء البصري


يعتمد Nano Banana 2 على بنية متعددة الوسائط تجمع بين النص، الصورة، والفيديو، وهي التقنية التي ستُدمج قريبًا في خدمات Google Photos وGoogle Workspace. ووفقًا للتقارير، سيُسمح للمستخدمين بإنشاء صور احترافية من أوامر نصية كاملة مثل:

“أنشئ خمسة تصاميم بانر لتطبيق سفر بأسلوب رسومي بسيط.”

وسيكون بإمكان المستخدم تصدير هذه التصاميم مباشرة بجودة عالية، ما يجعل Nano Banana 2 أداة تصميم ذكية متكاملة داخل منظومة Gemini.

موعد الإطلاق


تشير التسريبات إلى أن Nano Banana 2 سيُطرح في منتصف نوفمبر 2025 بنسخة محدودة، قبل أن يتم دمجه رسميًا داخل واجهة Gemini ومنصة Vertex AI في عام 2026. كما تتوقع المصادر أن تدعم التقنية مستقبلاً هواتف Pixel Fold 2 وPixel 9 Pro مع إمكانية المعالجة محليًا على الجهاز دون الحاجة للاتصال بالسحابة.

اقرأ أيضًا: أهم ما جاء في تحديثات تطبيق واتساب الأخيرة

المصدر

المصدر: سعودي اندرويد
 
عودة
أعلى