AI

اسپچیفای قابلیت تایپ صوتی و دستیار صوتی را به افزونه کروم خود اضافه کرد

3 دقیقه مطالعه
منبع
اسپچیفای قابلیت تایپ صوتی و دستیار صوتی را به افزونه کروم خود اضافه کرد
چکیده کوتاه
Speechify با ادغام تایپ صوتی پیشرفته و دستیار مکالمه‌ای در افزونه کروم خود، در حال پیشبرد تعاملات صوتیاول (voicefirst) با هوش مصنوعی است و هدفش این است که صدا به جای یک فکر ثانویه، به حالت پیش‌فرض برای تعامل با هوش مصنوعی تبدیل شود.
- تعامل با هوش مصنوعی را با تایپ صوتیاول و یک دستیار اختصاصی بهبود ببخشید.
- کاربران کروم را با رویکردی متمرکز بر صدا به جای چت هدف قرار دهید.

اسپچیفای عمدتاً ابزاری برای گوش دادن به مقالات، فایل‌های PDF و اسناد بوده است. این شرکت اکنون قابلیت‌های تشخیص صدا را به افزونه کروم خود اضافه می‌کند، از جمله تایپ صوتی و دستیار صوتی که به سوالات شما پاسخ می‌دهد.

در ۱۲ ماه گذشته، با بهبود کلی مدل‌های تشخیص گفتار، شاهد افزایش ابزارهای تشخیص صدا بوده‌ایم. اسپچیفای نیز با راه‌اندازی ابزار دیکته خود با پشتیبانی از زبان انگلیسی، به این موج پیوسته است. درست مانند سایر ابزارهای دیکته، تایپ صوتی اسپچیفای خطاها را تصحیح کرده و کلمات اضافی را حذف می‌کند.

در تست کوتاهی که بیش از یک روز انجام دادم، احساس کردم که ابزار اسپچیفای جای زیادی برای بهبود دارد. به عنوان مثال، این ابزارها در جیمیل و گوگل داکس به خوبی کار می‌کنند، اما در سایت‌هایی مانند وردپرس، در فعال کردن دیکته صوتی و کارکرد صحیح آن با مشکل مواجه شدم. این شرکت اعلام کرد که به تدریج در حال بهینه‌سازی برای سایت‌های محبوب است.

از نظر دقت، نرخ خطای کلمات نسبت به برخی ابزارهای دیگر مانند Wispr Flow، Willow و Monologue بالاتر بود. اسپچیفای خاطرنشان کرد که مدل آن با استفاده بیشتر شما سریع‌تر یاد می‌گیرد و نرخ خطا به تدریج کاهش می‌یابد.

این استارتاپ همچنین یک دستیار صوتی مکالمه‌ای را راه‌اندازی می‌کند که در نوار کناری مرورگر شما قرار می‌گیرد. می‌توانید سوالاتی درباره وب‌سایت از آن بپرسید، مانند "سه ایده کلیدی چیست؟" یا "این را به زبان ساده‌تر توضیح بده."

در حالی که ChatGPT و Gemini حالت‌های مکالمه‌ای دارند، استدلال اسپچیفای این است که در برنامه‌های آن‌ها به عنوان یک فکر ثانویه تلقی می‌شوند، در حالی که ابزار خود این استارتاپ، صدا را در اولویت قرار داده است.

روهان پاولووری، مدیر ارشد تجاری این شرکت، در ایمیلی به تک‌کرانچ گفت: "ما معتقدیم که چت همیشه تجربه کاربری پیش‌فرض در ChatGPT و Gemini هنگام باز کردن برنامه‌ها خواهد بود. این همان چیزی است که کاربرانشان انتظار دارند. صدا همیشه ثانویه خواهد بود - و در بسیاری از موارد، برای ChatGPT و Gemini یک فکر ثانویه. ما از چندین سال ساخت اسپچیفای می‌دانیم که بخش بزرگی از بازار، از جمله کاربران ما، می‌خواهند صدا به عنوان تنظیمات اولیه و پیش‌فرض هر بار که برنامه‌ای را باز می‌کنند و با هوش مصنوعی صحبت می‌کنند، باشد."

یکی از اشکالات قابل توجه این است که دستیار اسپچیفای در حال حاضر با مرورگرهایی که دستیارهای داخلی نوار کناری مانند Atlas اوپن‌ای‌آی، Comet پرپلکسیتی و دیا دارند، کار نمی‌کند. این استارتاپ نگران این موضوع نیست زیرا این افزونه عمدتاً برای کروم و پایگاه کاربری عظیم آن در نظر گرفته شده است.

اسپچیفای اعلام کرد که قصد دارد به تدریج تایپ صوتی و دستیار صوتی را در تمام برنامه‌های خود در دسکتاپ و موبایل بگنجاند.

این استارتاپ همچنین می‌خواهد عواملی را توسعه دهد که وظایف را به نیابت از شما انجام دهند. این استارتاپ نقشه راه کامل خود را فاش نکرد، اما یک مثال ارائه داد: تماس گرفتن برای شما برای تعیین وقت یا منتظر ماندن در صف پشتیبانی مشتری یک شرکت. شرکت‌های دیگری مانند Truecaller و Cloacked اهداف مشابهی را دنبال کرده‌اند.

این مقاله توسط هوش مصنوعی ترجمه شده است و ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، می‌توانید منبع اصلی را مطالعه کنید.