Google تطلق Gemini 3.1 Flash Live لتطوير المحادثات الصوتية الفورية بالذكاء الاصطناعي

أعلنت Google إطلاق ميزة Gemini 3.1 Flash Live باعتبارها أحدث نماذجها الصوتية المخصصة للمحادثات الحية، في خطوة تهدف إلى تقديم تجربة أكثر طبيعية وسرعة في التفاعل الصوتي المباشر بين المستخدم والذكاء الاصطناعي.
توجه الشركة
تأتي الميزة الجديدة ضمن توجه Google لتوسيع قدرات النماذج متعددة الوسائط، مع التركيز على الاستجابة الفورية وتحسين جودة الحوار في التطبيقات الصوتية.
آلية العمل
ويعتمد النموذج الجديد على آلية audio-to-audio، بما يتيح استقبال الصوت ومعالجة الطلب ثم الرد صوتيًا بزمن استجابة منخفض. وتشمل التحسينات فهم النبرة، ورفع دقة التعامل مع الأرقام، وتعزيز الوعي بالمحتوى المتعدد الوسائط أثناء المحادثة.
مجالات الاستخدام
وأكدت Google أن النموذج صُمم خصيصًا للتطبيقات التي تتطلب تفاعلًا مباشرًا، مثل المساعدات الصوتية، وخدمات العملاء، ووكلاء الذكاء الاصطناعي المعتمدين على الصوت.
إتاحة للمطورين
وأوضحت الشركة أن Gemini 3.1 Flash Live متاح للمطورين عبر Gemini Live API داخل Google AI Studio، بما يسمح ببناء تطبيقات صوتية وبصرية قادرة على التفاعل بسرعة قريبة من سرعة المحادثة البشرية.
تقليل التأخير
كما أشارت Google إلى أن هذه التقنية تمثل خطوة جديدة في تقليل زمن التأخير ورفع موثوقية الاستجابة، بما يدعم الجيل الجديد من التطبيقات الصوتية الذكية.
استخدامات عملية
وفي جانب الاستخدامات العملية، تراهن Google على توظيف الميزة الجديدة في حلول متعددة، من بينها وكلاء الدعم الصوتي، والمساعدات التفاعلية، والأدوات التي تجمع بين الصوت والرؤية في الوقت الحقيقي.
ضمن المنتجات
وبدأت الشركة أيضًا في إتاحة التجربة داخل بعض منتجاتها، مثل Gemini Live وSearch Live، ضمن مساعيها لتوسيع حضور الذكاء الاصطناعي الصوتي في الخدمات اليومية للمستخدمين.
مرحلة تجريبية
وتشير المعلومات الرسمية إلى أن الإصدار الحالي لا يزال مطروحًا بصيغة Preview، ما يعكس استمرار Google في تطوير الميزة وتحسينها قبل التوسع الكامل في استخدامها على نطاق أوسع.
تعزيز المنافسة
ويعزز هذا الإطلاق من حدة المنافسة في سوق الذكاء الاصطناعي الصوتي، في ظل تزايد اهتمام الشركات بتقديم تجارب أكثر سلاسة وواقعية في التفاعل الصوتي المباشر.



