عاجل

Google I/O 2026: Gemini Spark وGemini Omni وبداية عصر الوكلاء الذكيين

كشفت Google في مؤتمر I/O 2026 عن موجة جديدة من أدوات الذكاء الاصطناعي، من Gemini Spark الوكيل الشخصي العامل في الخلفية، إلى Gemini Omni للفيديو، وUniversal Cart للتسوق الذكي، وخطة Google AI Ultra الجديدة.

فريق بوصلة نيوز· 20 مايو 2026·9 دقائق قراءة
Google I/O 2026: Gemini Spark وGemini Omni وبداية عصر الوكلاء الذكيين

لم يكن مؤتمر Google I/O 2026 مجرد حدث تقني جديد تعلن فيه Google عن نماذج ذكاء اصطناعي أسرع أو أدوات أكثر لمعاناً. الرسالة الأهم هذا العام كانت أوضح من ذلك: Google تريد نقل Gemini من خانة “المساعد الذي يجيب” إلى خانة الوكيل الذي يخطط وينفّذ ويتابع المهام نيابة عن المستخدم.

هذا التحول يشرح معظم الإعلانات الكبرى في المؤتمر: Gemini Spark كوكيل شخصي يعمل في الخلفية، Gemini Omni كنموذج متعدد الوسائط يبدأ من الفيديو، Gemini 3.5 Flash كنموذج أسرع للمهام الطويلة والوكلاء، إضافة إلى Universal Cart للتسوق الذكي، ودمج Gemini في YouTube وAndroid XR وأدوات Google المختلفة.

وتقول Google إن تطبيق Gemini تجاوز 900 مليون مستخدم نشط شهرياً، بينما تعالج منتجاتها أكثر من 3.2 كوادريليون توكن شهرياً، مع نحو 19 مليار توكن في الدقيقة عبر واجهات النماذج البرمجية.

بالنسبة للمستخدم العربي، لا تكمن أهمية هذه الإعلانات في أسماء المنتجات فقط، بل في الاتجاه نفسه: البحث، البريد، الفيديو، التسوق، المتصفح، وحتى النظارات الذكية، كلها تتحول تدريجياً إلى بيئات عمل مدعومة بوكلاء ذكاء اصطناعي قادرين على الفهم والتنفيذ.


أبرز ما أعلنت عنه Google في دقيقة

  • Gemini أصبح طبقة مركزية داخل Search وYouTube وWorkspace والتسوق والأجهزة.
  • Gemini Spark هو أبرز إعلان للمستخدمين: وكيل شخصي يعمل 24/7 في الخلفية، مع قدرة على متابعة المهام حتى بعد إغلاق الهاتف أو الحاسوب.
  • Gemini Omni يفتح مرحلة جديدة في إنشاء الفيديو وتحريره من خلال النص والصور والفيديو والصوت.
  • Gemini 3.5 Flash نموذج سريع مصمم للمهام الطويلة، البرمجة، وسير العمل الوكيلي.
  • Google AI Ultra حصلت على خطة جديدة تبدأ من 100 دولار شهرياً، مع خفض الخطة الأعلى من 250 إلى 200 دولار.
  • Universal Cart يحاول تحويل التسوق عبر Google إلى تجربة يديرها الذكاء الاصطناعي، من تتبع الأسعار إلى الدفع الوكيلي.
  • Ask YouTube يجعل البحث داخل YouTube أقرب إلى محادثة ذكية بدلاً من قائمة نتائج تقليدية.

لماذا هذا اليوم مهم؟

الذكاء الاصطناعي كان خلال السنوات الماضية يدور غالباً حول سؤال واحد: أي نموذج يجيب بشكل أفضل؟ لكن Google I/O 2026 كشف عن سؤال جديد: أي منظومة تستطيع تنفيذ العمل فعلياً؟

لم تعد المنافسة مقتصرة على كتابة نص أفضل أو تلخيص أسرع. المنافسة الآن تدور حول وكلاء يستطيعون البحث، التخطيط، إدارة البريد، إنشاء المستندات، تنظيم الجداول، تحرير الفيديو، مقارنة الأسعار، تنفيذ عمليات شراء محدودة، ثم طلب موافقة المستخدم عند القرارات الحساسة.

هذا التحول مهم لسببين. الأول أنه سيؤثر في أدوات العمل اليومية التي يستخدمها الطلاب، الموظفون، رواد الأعمال وصنّاع المحتوى. والثاني أنه يفرض أسئلة جديدة حول الخصوصية، الصلاحيات، اللغة، الدفع، وحدود الثقة في الوكلاء الآليين.


1. Google I/O 2026: بداية عصر Gemini الوكيلي

قدّم Sundar Pichai مؤتمر هذا العام تحت عنوان واضح: Gemini لم يعد منتجاً منفصلاً داخل Google، بل أصبح بنية ذكاء اصطناعي تمتد عبر البحث، التطبيقات، أدوات المطورين، الفيديو، التجارة، والأجهزة.

تقول Google إن AI Overviews وصل إلى أكثر من 2.5 مليار مستخدم نشط شهرياً، وإن AI Mode تجاوز مليار مستخدم نشط شهرياً خلال عام واحد. كما تقول إن تطبيق Gemini تجاوز 900 مليون مستخدم نشط شهرياً، مع نمو يومي كبير في الطلبات. هذه الأرقام تكشف أن Google لا تتعامل مع Gemini كميزة تجريبية، بل كطبقة جديدة داخل منتجاتها الأساسية. والأهم من الأرقام هو الاتجاه: Google تريد أن تصبح Gemini واجهة تنفيذ فوق الإنترنت، لا مجرد محرك بحث يعرض روابط.


2. Gemini Spark: وكيل شخصي يعمل في الخلفية

Gemini Spark هو الإعلان الأكثر حساسية وتأثيراً في المؤتمر، لأنه ينقل Gemini من مساعد يرد على الأسئلة إلى وكيل قادر على العمل في الخلفية.

بحسب Google، يعمل Spark على Gemini 3.5 ويستخدم منصة Antigravity، ويتكامل مع أدوات Workspace مثل Gmail وDocs وSlides. وبما أنه وكيل قائم على السحابة، يستطيع متابعة المهام حتى عند إغلاق الحاسوب أو قفل الهاتف.

الفكرة ليست أن تطلب من Gemini “اكتب لي رسالة” فقط، بل أن تطلب منه متابعة مهمة كاملة. على سبيل المثال: جمع ملاحظات اجتماع من البريد والمحادثات، تلخيص النقاط المهمة، إنشاء مستند Google Docs، صياغة رسالة متابعة، ثم انتظار موافقتك قبل إرسالها.

وتؤكد Google أن Spark يعمل تحت توجيه المستخدم، وأنه مصمم لطلب الإذن قبل تنفيذ إجراءات عالية الحساسية مثل إرسال رسائل بريدية أو إنفاق المال. كما تخطط الشركة لربطه بتطبيقات خارجية عبر MCP، مع اتصالات مبدئية بتطبيقات مثل Canva وOpenTable وInstacart.

لكن من المهم عدم المبالغة في توفره. Spark سيبدأ أولاً مع مختبرين موثوقين، ثم كنسخة Beta لمشتركي Google AI Ultra في الولايات المتحدة. لذلك لا يجب تقديمه للقارئ العربي وكأنه متاح عالمياً من اليوم الأول.


3. Gemini Omni: الفيديو يصبح محادثة

أعلنت Google أيضاً عن Gemini Omni، وهو نموذج متعدد الوسائط يهدف إلى إنشاء مخرجات من أنواع مختلفة اعتماداً على مدخلات متنوعة، لكنه يبدأ حالياً من الفيديو. يمكن للمستخدم إدخال نص أو صورة أو فيديو أو صوت، ثم إنتاج فيديو عالي الجودة أو تعديله عبر أوامر طبيعية.

الميزة المهمة هنا ليست “توليد فيديو” فقط. الفكرة الأكثر تقدماً هي أن تحرير الفيديو يصبح أقرب إلى المحادثة. يمكنك أن تطلب تغيير الخلفية، تعديل زاوية التصوير، الحفاظ على شخصية داخل المشهد، تغيير الأسلوب البصري، أو إعادة بناء لقطة كاملة دون استخدام أدوات مونتاج معقدة.

بالنسبة لصنّاع المحتوى، هذا يغير طريقة الإنتاج. بدلاً من الاعتماد الكامل على برامج تحرير تقليدية، تصبح العملية أقرب إلى توجيه مخرج رقمي يفهم السياق، المشهد، الحركة، والأسلوب المطلوب.

وتقول Google إن Gemini Omni Flash يتوفر عبر Gemini app وGoogle Flow وYouTube Shorts، مع خطط لتوسيع أنواع المخرجات مستقبلاً. كما تشير الشركة إلى استخدام SynthID للوسم الرقمي غير المرئي في مقاطع الفيديو الناتجة عن Omni، وهي نقطة مهمة في سياق الشفافية ومكافحة التضليل.


4. Gemini 3.5 Flash: السرعة تصبح جزءاً من المنافسة

أطلقت Google Gemini 3.5 Flash كأول نموذج في عائلة 3.5 الجديدة. تركيز هذا النموذج لا يقتصر على الذكاء الخام، بل يشمل السرعة، التكلفة، والقدرة على تنفيذ مهام طويلة متعددة المراحل.

تقول Google إن Gemini 3.5 Flash متاح عبر Google Antigravity وGemini API في Google AI Studio وAndroid Studio، إضافة إلى Gemini app وAI Mode في Search. وهذا يجعله نموذجاً مركزياً ليس فقط للمستخدمين، بل للمطورين والشركات التي تريد بناء وكلاء وتطبيقات تعتمد على الذكاء الاصطناعي.

أهمية Flash تظهر تحديداً في المهام الوكيلية. الوكيل الذكي لا يجيب على سؤال واحد ثم ينتهي، بل يحتاج إلى التخطيط، تنفيذ خطوات متتالية، مراجعة النتائج، ثم تعديل المسار. وكلما زادت هذه الخطوات، أصبحت السرعة والتكلفة عاملين حاسمين.

إذا نجحت Google في الجمع بين جودة عالية وتكلفة تشغيل أقل، فقد يتحول Gemini 3.5 Flash إلى نموذج أساسي للشركات التي تريد تشغيل وكلاء بكثافة دون فواتير ضخمة.


5. Google AI Ultra: خطة 100 دولار وتصحيح مهم في التسعير

أعلنت Google عن خطة Google AI Ultra جديدة تبدأ من 100 دولار شهرياً، وتستهدف المطورين، قادة الفرق التقنية، العاملين المعرفيين، وصنّاع المحتوى المتقدمين. وتشمل الخطة حدود استخدام أعلى من خطة Pro، ودمج Gemini 3.5 Flash، وأولوية في Google Antigravity، و20 تيرابايت من التخزين السحابي، إضافة إلى YouTube Premium الفردي.

لكن هنا توجد نقطة مهمة: Google لم تخفض “خطة Ultra من 250 إلى 100 دولار”. الشركة أطلقت خطة AI Ultra جديدة بسعر 100 دولار شهرياً، وفي الوقت نفسه خفضت سعر الخطة الأعلى من 250 إلى 200 دولار شهرياً. الخطة الأعلى توفر حدود استخدام أكبر تصل إلى 20 ضعفاً مقارنة بخطة Pro، بينما خطة 100 دولار توفر حدوداً أعلى بخمسة أضعاف.

كذلك يجب الانتباه إلى أن بعض المزايا، مثل Gemini Spark، مرتبطة جغرافياً بالولايات المتحدة في المرحلة الأولى. لذلك الأفضل كتابة: “تبدأ Google AI Ultra من 100 دولار شهرياً، مع اختلاف التوفر والميزات حسب البلد ونوع الاشتراك”.


6. Android XR: عودة Google إلى الواجهات القابلة للارتداء

ضمن إعلانات I/O 2026، عرضت Google رؤيتها للنظارات الذكية المبنية على Android XR بالتعاون مع Samsung وQualcomm، وبشراكات تصميم مع Gentle Monster وWarby Parker.

تقول Google إن هناك نوعين من النظارات الذكية: نظارات صوتية تقدم المساعدة عبر الصوت، ونظارات مزودة بعرض بصري لإظهار المعلومات في الوقت المناسب. النسخ الصوتية ستصل أولاً في الخريف، بينما تأتي التجارب البصرية الأكثر تقدماً لاحقاً.

Google تريد أن تجعل Gemini حاضراً في السياق الحقيقي للمستخدم: فهم ما يراه، تقديم الاتجاهات، قراءة اللافتات، ترجمة الكلام والنصوص، تلخيص الرسائل، التقاط الصور والفيديو، وتنفيذ بعض المهام دون إخراج الهاتف.

وتقول Google إن هذه النظارات ستعمل مع هواتف Android وiOS، ما يعني أنها لا تريد حصر التجربة داخل نظام Android فقط.

المنافس الواضح هنا هو منظومة Meta Ray-Ban، لكن Google تراهن على قوة البحث، الخرائط، التطبيقات، وGemini داخل تجربة واحدة.


7. Ask YouTube: البحث داخل الفيديو يصبح محادثة

أحد أكثر الإعلانات فائدة للمستخدمين هو Ask YouTube. بدلاً من كتابة كلمات مفتاحية والحصول على قائمة طويلة من الفيديوهات، يستطيع المستخدم طرح سؤال أكثر تعقيداً، ثم الحصول على إجابة منظمة تقوده إلى الفيديوهات أو المقاطع الأكثر صلة.

بحسب YouTube، يستطيع Ask YouTube التعامل مع أسئلة مركبة، عرض مقاطع مناسبة من الفيديوهات الطويلة وShorts، والسماح بأسئلة متابعة لتضييق النتائج. الميزة متاحة حالياً لمشتركي Premium بعمر 18 عاماً فما فوق في الولايات المتحدة عبر youtube.com/new، مع خطة لتوسيعها لاحقاً.

هذا مهم لصنّاع المحتوى أيضاً. إذا أصبح البحث داخل YouTube محادثاتياً، فلن يكون تحسين العنوان والوصف والكلمات المفتاحية كافياً وحده. سيصبح وضوح المحتوى، بنية الفيديو، الفصول، جودة الشرح، والسياق داخل الفيديو عوامل أكثر أهمية لاكتشاف المحتوى.


8. Universal Cart: التسوق يتحول إلى مهمة يديرها الوكيل

أعلنت Google عن Universal Cart، وهو مركز تسوق ذكي يعمل عبر Search وGemini وYouTube وGmail. يستطيع المستخدم إضافة منتجات إلى سلة واحدة أثناء البحث أو الدردشة مع Gemini أو مشاهدة YouTube أو قراءة Gmail. بعد ذلك يبدأ النظام في متابعة الأسعار، رصد العروض، عرض سجل السعر، والتنبيه عند عودة المنتج للمخزون.

وتقول Google إن Universal Cart يمكنه أيضاً اكتشاف بعض مشكلات التوافق بين المنتجات، مثل مكونات الحاسوب، واقتراح بدائل عند الحاجة. كما يستفيد من Google Wallet لفهم مزايا بطاقات الدفع وبرامج الولاء والعروض التجارية.

لكن التوفر محدود في البداية. ستبدأ Universal Cart في الولايات المتحدة عبر Search وGemini app خلال الصيف، مع وصول YouTube وGmail لاحقاً.

الأكثر أهمية هو أن Google تعمل على بنية للتجارة الوكيلية من خلال Universal Commerce Protocol وAgent Payments Protocol. هذه البروتوكولات تهدف إلى تمكين الوكلاء من تنفيذ عمليات شراء ضمن حدود يحددها المستخدم، مع سجل رقمي واضح ومراجعة للمدفوعات.

إذا نجح هذا النموذج، فقد تتغير العلاقة بين المتاجر، محركات البحث، ومنصات الدفع. لن يكون السؤال فقط: “أين أشتري هذا المنتج؟”، بل: “أي وكيل أثق به ليبحث ويقارن ويدفع نيابة عني؟”


ما الذي يعنيه ذلك للمستخدمين العرب؟

إعلانات Google I/O 2026 لا تعني أن كل هذه المزايا ستصل فوراً إلى المنطقة العربية. كثير منها يبدأ في الولايات المتحدة أو داخل خطط مدفوعة أو ضمن اختبارات محدودة. لكن الاتجاه واضح: الذكاء الاصطناعي ينتقل من أدوات منفصلة إلى طبقة مدمجة في كل شيء.

بالنسبة للمستخدم العربي، هذا يفتح فرصاً كبيرة. يمكن لصانع المحتوى إنتاج فيديوهات أسرع. يمكن للطالب تنظيم المراجع والملاحظات. يمكن لصاحب مشروع صغير متابعة البريد والعملاء والعروض. ويمكن للمحترف استخدام وكلاء ذكيين لتقليل المهام الروتينية.

لكن هناك جانباً آخر لا يقل أهمية: كلما أصبحت الوكلاء قادرة على التنفيذ، زادت الحاجة إلى فهم الصلاحيات. هل تسمح للوكيل بقراءة بريدك؟ هل تسمح له بإنشاء ملفات؟ هل تسمح له بإرسال رسائل؟ هل تسمح له بالدفع؟ وهل تعرف كيف تراجع ما فعله؟

المصادر