ساندهاوند (SoundHound) که تاکنون بهعنوان یکی از بازیگران اصلی دستیارهای صوتی شناخته میشد، حالا با معرفی «Vision AI» گامی تازه برداشته است؛ ترکیب صدا و تصویر در یک سیستم یکپارچه که میتواند تجربه تعامل انسان و فناوری را متحول کند.
معرفی Vision AI؛ ترکیب صدا و تصویر
ساندهاوند (SoundHound) که تاکنون بهعنوان یکی از بازیگران اصلی دستیارهای صوتی شناخته میشد، حالا با معرفی «Vision AI» گامی تازه برداشته است. این فناوری صدا و تصویر را ترکیب میکند تا تعامل با فناوری طبیعیتر شود.
تجربهای شبیه به انسان
تصور کنید هنگام رانندگی از کنار یک ساختمان عبور میکنید و بدون نیاز به گوشی میپرسید: «این ساختمان چیست؟» و بلافاصله پاسخ میگیرید. Vision AI دقیقاً برای چنین سناریوهایی طراحی شده است.
اظهارات مدیرعامل
کیوان مهاجر، مدیرعامل ساندهاوند میگوید:
«آینده هوش مصنوعی فقط چندوجهی نیست. باید یکپارچه، واکنشپذیر و متناسب با دنیای واقعی باشد. Vision AI نقطه عطفی در بازتعریف تعامل انسان با محصولات و خدمات است.»
کاربردهای واقعی
این فناوری با ترکیب دوربین و پردازش صوت، میتواند نیت واقعی کاربر را بهتر تشخیص دهد.
- مکانیک با نگاه به موتور دستورالعمل دریافت میکند.
- فروشنده تنها با نگاه به قفسهها موجودی را بررسی میکند.
- کیوسکهای رستوران سفارش مشتری را همزمان تأیید میکنند.
چالش همگامسازی صدا و تصویر
یکی از مشکلات اصلی، هماهنگسازی کامل صدا و تصویر است. پراناو سینگ، معاون مهندسی ساندهاوند، توضیح میدهد:
«Vision AI هر فریم تصویر و هر واژه صوتی را در یک اکوسیستم واحد پردازش میکند. این هماهنگی تجربهای سریعتر و طبیعیتر ایجاد میکند.»
مزیت برای کسبوکارها
برای کسبوکارها، Vision AI نوید خدمات سریعتر، کاهش خطا و رضایت بیشتر مشتریان را میدهد. صنایع مختلف از خودرو و رستوران گرفته تا کارخانهها میتوانند از این نوآوری بهرهمند شوند.
ارتقای دیگر: Amelia 7.1
علاوه بر Vision AI، ساندهاوند نسخه جدید Amelia 7.1 را معرفی کرده است. این بهروزرسانی دقت و سرعت سیستم را افزایش میدهد و کنترل بیشتری به کسبوکارها میدهد.
ساندهاوند با ترکیب صدا و تصویر در حال برداشتن گامی مهم است. هدف آن ایجاد تجربهای طبیعیتر و انسانیتر از تعامل با فناوری است؛ تجربهای که برای بازاریابی و خدمات مشتری اهمیت زیادی خواهد داشت.