متابعة – أمل علوي
تواصل شركة SoundHound AI، المعروفة بدورها الرائد في مجال المساعدات الصوتية، تطوير تقنيتها من خلال إضافة “الرؤية” إلى الذكاء الاصطناعي. إذ تتيح هذه التقنية الجديدة، المعروفة باسم Vision AI، للمستخدمين التفاعل بشكل أكثر طبيعية وسلاسة مع الأجهزة الذكية.
تخيل أن تقود سيارتك بجوار معلم مشهور، وتستطيع أن تسأل سيارتك: “ما هذا المبنى هناك؟” لتحصل على إجابة فورية دون الحاجة إلى استخدام هاتفك. هذا هو ما تسعى SoundHound لتحقيقه.
تجمع Vision AI بين الصوت والصورة، مما يعكس كيفية تفاعل البشر بشكل طبيعي. فبدلاً من الاكتفاء بسماع الكلمات، يمكن للذكاء الاصطناعي الآن رؤية الإيماءات وما ينظر إليه المستخدم، مما يسهل الفهم والتفاعل.
يقول كيفان مهاجر، الرئيس التنفيذي لشركة SoundHound AI: “نعتقد أن مستقبل الذكاء الاصطناعي ليس فقط متعدد الأنماط، بل هو متكامل وعميق الاستجابة، مصمم لتحقيق تأثير حقيقي في العالم”.
كيف تعمل هذه التقنية؟ تستخدم Vision AI تغذية حية من الكاميرا وتدمجها مع تقنية الصوت الخاصة بالشركة، التي تتميز بالفعل بفهم الكلام الطبيعي. من خلال معالجة ما تراه وما تسمعه في نفس الوقت، يمكن للنظام فهم نية المستخدم بشكل أفضل بكثير مما يمكن للمساعد الصوتي العادي.
تخيل ميكانيكيًا يرتدي نظارات ذكية، يمكنه ببساطة النظر إلى جزء من المحرك وطلب التعليمات، ليحصل على إرشادات بصرية وصوتية في الوقت الفعلي. في المتاجر، يمكن للموظف المسح عن الأرفف بمجرد النظر إليها للحصول على عدد المخزون الفوري.
من التحديات التقنية الكبرى في إنشاء مثل هذا النظام هو ضمان تزامن العناصر الصوتية والبصرية بشكل مثالي. أي تأخير قد يدمر الإحساس بالمحادثة الطبيعية.
يضيف براناف سينغ، نائب رئيس الهندسة في SoundHound AI: “نحن ندمج التعرف على الصورة والذكاء الحواري في تدفق واحد متزامن. كل إطار، وكل عبارة، وكل نية يتم تفسيرها ضمن نفس النظام البيئي—مما يضمن تجارب مستخدم أسرع وأكثر طبيعية”.
لدى الشركات التي تعتمد هذه التقنية، الوعد بتوفير خدمة أسرع، وأخطاء أقل، ورضا أكبر للعملاء. الهدف هو إزالة العقبات وجعل التكنولوجيا تشعر أكثر كرفيق يساعدك على إنجاز المهام.
تسعى SoundHound أيضًا إلى تحسين “عقل” نظامها من خلال تحديث جديد، وهو Amelia 7.1، مما يجعل وكلاء الذكاء الاصطناعي أسرع وأكثر دقة.
من خلال دمج الصوت والرؤية، تهدف SoundHound إلى دفعنا نحو عالم حيث يصبح التفاعل مع الذكاء الاصطناعي سهلًا وبديهيًا كالتحدث مع شخص آخر.
هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي.