جوجل تطلق Gemini Embedding 2: متجهات متعددة الوسائط
جدول المحتويات
جوجل تكشف عن Gemini Embedding 2 في معاينة عامة
لقد أطلقت جوجل للتو Gemini Embedding 2، وهو أول نموذج تضمين متعدد الوسائط أصليًا. متاح الآن في معاينة عامة على Vertex AI وواجهة برمجة تطبيقات Gemini. هذا الشيء ينتج متجهات بـ3072 بعدًا من النصوص والصور والوثائق والصوت وحتى الفيديو. انظروا، التضمينات كانت ملعبًا خاصًا بالنصوص لفترة طويلة جدًا. Gemini Embedding 2 يوحد كل شيء في فضاء متجه واحد. الاختبارات الأولية؟ إنه يتفوق على النماذج السابقة في مهام الاسترجاع عبر الوسائط، وفقًا لـإعلان جوجل. لقد جربت أدوات مشابهة. هذا يبدو خطوة حقيقية إلى الأمام. يحصل المطورون على بحث دلالي يفهم مقاطع الفيديو إلى جانب استفسارات النصوص. لا مزيد من الوسائط المعزولة.
كيف يقارن بتضمينات النصوص فقط
سيطرت تضمينات النصوص على الساحة — فكر في ada-002 من OpenAI أو إصدارات Gemini القديمة. قوية للكلمات. عديمة الفائدة لعروض فيديو أو مسارات صوتية. Gemini Embedding 2 يغير ذلك. متعدد الوسائط من الأساس. يتصدر لوحات MTEB في الاسترجاع عبر الوسائط، كما هو مفصل في وثائق Vertex AI. الشيء هنا: نماذج الوسيطة الواحدة تفرض حيلًا. ربط المتجهات يدويًا؟ كابوس. هذا يوحد الأمر. التويست — ليس مجرد أفضل؛ إنه أساسي لسير العمل لأي شيء أبعد من الروبوتات الدردشة العادية. لن أكذب — توقعت تحسينات تدريجية. لا. اختبارات عبر الوسائط تظهر قفزات في الدقة.
يهز سير عمل الذكاء الاصطناعي التوليدي
يأتي Gemini Embedding 2 في الوقت المثالي. يحصل الاسترجاع المعزز بالتوليد (RAG) على دفعة متعددة الوسائط. تخيل سحب مراجع فيديو أو إشارات صوتية إلى مطالباتك. بالنسبة لأدوات الصور والفيديو، هذا يعني تهيئة أذكى. مطابقات أفضل بين استفسارات المستخدمين وبيانات التدريب. مبدعون يضمّنون مقاطع NSFW أو مراجع أنماط؟ اللعبة مفتوحة. التقدم في التضمينات متعددة الوسائط مثل Gemini Embedding 2 يُشغل بالفعل إنشاء محتوى NSFW، يدمج النصوص والصور والصوت لنتائج حية. نصيحة: ابدأ بسيطًا. ضع إطار فيديو ووصف نصي معًا. استعلم عن قاعدة بياناتك. شاهد الصلة ترتفع إلى السماء. لكن هل يتوسع؟ العلامات الأولى تقول نعم — إذا قسمت المدخلات بشكل صحيح. رأي ساخن: RAG النصوص فقط ميت. متعدد الوسائط هو المستقبل. جادل معي.
Film it on AiExotic
أفضل مولد إباحي بالذكاء الاصطناعي مصنف #1: صور وفيديوهات NSFW
Make this fantasy nowGemini Embedding 2: إجابات سريعة
متى يكون Gemini Embedding 2 متاحًا؟
معاينة عامة الآن على Vertex AI وواجهة برمجة تطبيقات Gemini، اعتبارًا من 10 مارس 2026. تحقق من مدونة جوجل لتفاصيل الإطلاق.
ما أنواع المدخلات التي يدعمها؟
نصوص، صور، وثائق، صوت، وفيديو. كلها مرسومة إلى متجهات بـ3072 بعدًا.
كيف يعمل التسعير لـGemini Embedding 2؟
راجع وثائق تسعير Vertex AI الرسمية — يختلف حسب نوع المدخل والمنطقة.
هل هناك حدود لحجم المدخل؟
استشر وثائق الواجهة للحدود الدقيقة للرموز أو الملفات لكل وسيطة؛ تقسيم موصى به للفيديوهات الطويلة.
أفضل الممارسات للمطالبات متعددة الوسائط؟
ادمج الوسائط بعناية — مثل استعلام نصي + مرجع صورة. عَدِّل المتجهات لتشابه كوساينوس.
ما التالي لـGemini Embedding 2؟
لم تفصّل جوجل الخارطة الطريق بعد. راقب الإصدار الكامل بعد المعاينة واختبارات موسعة.
أنشئ فيديو إباحي بالذكاء الاصطناعي
حوّل أي خيال إلى فيديو Full HD واقعي. أكثر من 1,000 سيناريو ووضعية — خصوصية 100%.
ابدأ الإنشاء الآنعن الكاتب
محلل تقني مستقل
محلل تقني مقيم في لندن. يغطي اتجاهات صناعة AI والـ AI الإبداعي بصدق غير عادي — بما في ذلك الاعتراف بأنه يستمتع فعلاً بالمنتجات التي يراجعها.