X
   
 
    • تاریخ انتشار: ۱۴۰۰/۱۰/۱۴
      منبع خبر : پیوست
    • مدیرعامل ویرگول:

      سرویس تبدیل گفتار به نوشتار از ابتدای سال ۱۴۰۱ برای همه کاربران فعال می‌شود

      ویرگول با راه‌اندازی سرویس انتشار محتوای صوتی از سال ۹۹ و تمرکز بر ارتقای آن از ابتدای امسال سعی می‌کند با روند جهانی محتوا در جهان همگام شود. حالا مدیرعامل ویرگول می‌گوید از ابتدای سال آینده (۱۴۰۱) تمامی کاربران این پلتفرم می‌توانند علاوه بر انتشار محتوای صوتی از قابلیت تبدیل صوت به نوشتار نیز استفاده کنند؛ قابلیتی که اکنون برای برخی از کاربران در دسترس است.
       سرویس تبدیل گفتار به نوشتار از ابتدای سال ۱۴۰۱ برای همه کاربران فعال می‌شود

      علی آجودانیان، مدیرعامل و بنیان‌گذار ویرگول، در گفت‌وگو با ایمینو دلیل وارد شدن به حوزه صوت را رشد این حوزه در روندهای جهانی عنوان کرد از همین رو ویرگول نیز تصمیم گرفت تا علاوه بر نوشتار امکان ارسال پست به صورت صوتی را روی بستر خودش فراهم کند. با وجود سرویس گفتار به نوشتار به نظر می‌رسد ویرگول برای پادکسترها نیز به محلی جذاب تبدیل می‌شود.

      ویرگول به دنبال دسترس‌پذیر کردن محتوای صوتی در موتورهای جست‌وجو

      مدیرعامل ویرگول درباره امکان انتشار محتوای صوتی توضیح داد: سرویس صوتی ویرگول تا امروز چندین فاز داشته است و فازهای دیگری نیز دارد. با توجه به رشد حوزه صوتی روی روند جهانی مایل بودیم در این حوزه نیز فعالیت کنیم؛ برای همین امکان قرار دادن پست به صورت صوتی را هم روی ویرگول فراهم کردیم. می‌خواستیم از پتانسیل ویرگول که در حوزه متنی ما را به یکی از قوی‌ترین پلتفرم‌های اجتماعی داخلی تبدیل کرده است استفاده کنیم. این پتانسیل ریشه در سادگی انتشار محتوا و دسترس‌پذیری بالا به پست‌ها از طریق سایت ویرگول و موتورهای جست‌وجو دارد، پس از ابتدای فعالیت در حوزه صوتی در فکر دسترس‌پذیر کردن آن بودیم.

      او با توضیح مشکل اصلی محتواهای صوتی موجود در فضای وب گفت: یکی از مشکلات محتواهای صوتی که نشر و دسترسی به آنها را سخت می‌کند دسترسی‌پذیری سخت موتورهای جست‌وجو و ایندکس نشدن آنهاست. برای همین سراغ پیاده‌سازی یک مکانیسم ASR رفتیم که در این مکانیسم محتواهای صوتی تبدیل به متن می‌شوند و به وسیله الگوریتم‌های ماشینی از لحاظ سجاوندی و نگارشی ویرایش می‌شوند و روی ویرگول منتشر می‌شوند.

      به گفته او تقریباً محتوای ۱۰ پادکست به این صورت در اختیار کاربران قرار گرفته است.


      مزیت اصلی این اتفاق از دید آجودانیان، امکان دسترسی به این محتواهای صوتی از طریق موتورهای جست‌وجو است. البته آجودانیان از ادامه این مسیر و وقوع اتفاقات بزرگ‌تر در آینده نیز سخن به میان آورد.

      صحت ۶۰ درصدی مکانیسم تبدیل گفتار ویرگول

      بنیان‌گذار این پلتفرم در پاسخ به سوال خبرنگار ایمینو مبنی بر عملکرد مکانیسم تبدیل ویرگول نیز گفت: مطمئناً کیفیت ویراستاری هوش مصنوعی تبدیل گفتار به نوشتار ما در حد اید‌ه‌آل خبرنگاران و تیم تحریریه ویرگول نیست. تا به امروز داخل ایران و به زبان فارسی سرویس‌های تبدیل گفتار به متنی که در حد نمونه‌های خارجی باشند نداشته‌ایم. خیلی‌ها خواسته‌اند این کار را در داخل انجام دهند اما به دلیل نبود دیتاست مناسب از واژگان و ساختارهای سجاوندی چندان موفق نبوده‌اند. با توجه به فعالیت‌های کاربران ویرگول در پنج سال اخیر به صورت مستمر سعی می‌کنیم دیتاست‌های مناسب‌تری در اختیار هوش مصنوعی بگذاریم و کیفیت آن را ارتقا دهیم.

      او افزود: کیفیت مد نظر، صحت بالای ۸۵ یا ۹۰ درصد در تبدیل است. در حال حاضر به عدد ۶۰ رسیده‌ایم. البته ساختارهای محتوایی مختلف مانند محاوره‌ای و رسمی مکانیسم‌های جدایی را نیاز دارند. این ۶۰ درصد می‌تواند مسیر را راحت‌تر کند و برای ویرایش فقط باید ۴۰ درصد آن بررسی شود.


      آجودانیان در مورد سرعت تبدیل هوش مصنوعی نیز توضیح داد: سرعت فعلی ما 16xاست. مثلاً تبدیل یک پادکست ۱۶۰ دقیقه‌ای ۱۰ دقیقه به طول می‌انجامد. زمانی که سرویس به شکل همگانی ارائه شود هم سرعت زیاد می‌شود و هم فایل چندتکه می‌شود و تمام تکه‌ها با سرعت بالا تبدیل می‌شوند و فایل نهایی در کمتر از یک دقیقه روی ویرگول قرار می‌گیرد.

      او با بیان اینکه این سرویس اکنون فقط برای بعضی از پادکست‌های موجود در ویرگول و برخی کاربران loyal (وفادار) در دسترس است ابزار امیدواری کرد تا انتهای امسال یا ابتدای ۱۴۰۱ همه کاربران بتوانند روی ویرگول محتوای صوتی منتشر کنند.

      مدیرعامل ویرگول: تغییر استراتژی نداده‌ایم

      مدیرعامل و بنیان‌گذار ویرگول در مورد استراتژی ویرگول که بدون تغییر مانده است نیز توضیح داد: استراتژی ویرگول عوض نمی‌شود و همچنان توسعه محصول ویرگول متمرکز بر محتوای متنی است، اما برای عقب نماندن از رقبا و ترند فعالیت‌های کاربران نیاز داریم که بخش‌های جدیدی را پیاده‌سازی کنیم. از سویی باید به نگه داشتن کاربران‌ همیشگی ویرگول نیز فکر کنیم تا تعامل آنها را با محتواها و پلتفرم بالا ببریم. برای همین این بخش به وجود آمده است و بخش‌های دیگری نیز معرفی خواهند شد. اما به هر حال این بخش‌ها قابلیت‌هایی هستند که به عنوان افزونه‌ای در کنار محتوای متنی به کاربران خدمت‌رسانی می‌کنند.

      ارسال دیدگاه
      آدرس ایمیل شما منتشر نخواهد شد.