علی آجودانیان، مدیرعامل و بنیانگذار ویرگول، در گفتوگو با ایمینو دلیل وارد شدن به حوزه صوت را رشد این حوزه در روندهای جهانی عنوان کرد از همین رو ویرگول نیز تصمیم گرفت تا علاوه بر نوشتار امکان ارسال پست به صورت صوتی را روی بستر خودش فراهم کند. با وجود سرویس گفتار به نوشتار به نظر میرسد ویرگول برای پادکسترها نیز به محلی جذاب تبدیل میشود.
ویرگول به دنبال دسترسپذیر کردن محتوای صوتی در موتورهای جستوجو
مدیرعامل ویرگول درباره امکان انتشار محتوای صوتی توضیح داد: سرویس صوتی ویرگول تا امروز چندین فاز داشته است و فازهای دیگری نیز دارد. با توجه به رشد حوزه صوتی روی روند جهانی مایل بودیم در این حوزه نیز فعالیت کنیم؛ برای همین امکان قرار دادن پست به صورت صوتی را هم روی ویرگول فراهم کردیم. میخواستیم از پتانسیل ویرگول که در حوزه متنی ما را به یکی از قویترین پلتفرمهای اجتماعی داخلی تبدیل کرده است استفاده کنیم. این پتانسیل ریشه در سادگی انتشار محتوا و دسترسپذیری بالا به پستها از طریق سایت ویرگول و موتورهای جستوجو دارد، پس از ابتدای فعالیت در حوزه صوتی در فکر دسترسپذیر کردن آن بودیم.
او با توضیح مشکل اصلی محتواهای صوتی موجود در فضای وب گفت: یکی از مشکلات محتواهای صوتی که نشر و دسترسی به آنها را سخت میکند دسترسیپذیری سخت موتورهای جستوجو و ایندکس نشدن آنهاست. برای همین سراغ پیادهسازی یک مکانیسم ASR رفتیم که در این مکانیسم محتواهای صوتی تبدیل به متن میشوند و به وسیله الگوریتمهای ماشینی از لحاظ سجاوندی و نگارشی ویرایش میشوند و روی ویرگول منتشر میشوند.
به گفته او تقریباً محتوای ۱۰ پادکست به این صورت در اختیار کاربران قرار گرفته است.
مزیت اصلی این اتفاق از دید آجودانیان، امکان دسترسی به این محتواهای صوتی از طریق موتورهای جستوجو است. البته آجودانیان از ادامه این مسیر و وقوع اتفاقات بزرگتر در آینده نیز سخن به میان آورد.
صحت ۶۰ درصدی مکانیسم تبدیل گفتار ویرگول
بنیانگذار این پلتفرم در پاسخ به سوال خبرنگار ایمینو مبنی بر عملکرد مکانیسم تبدیل ویرگول نیز گفت: مطمئناً کیفیت ویراستاری هوش مصنوعی تبدیل گفتار به نوشتار ما در حد ایدهآل خبرنگاران و تیم تحریریه ویرگول نیست. تا به امروز داخل ایران و به زبان فارسی سرویسهای تبدیل گفتار به متنی که در حد نمونههای خارجی باشند نداشتهایم. خیلیها خواستهاند این کار را در داخل انجام دهند اما به دلیل نبود دیتاست مناسب از واژگان و ساختارهای سجاوندی چندان موفق نبودهاند. با توجه به فعالیتهای کاربران ویرگول در پنج سال اخیر به صورت مستمر سعی میکنیم دیتاستهای مناسبتری در اختیار هوش مصنوعی بگذاریم و کیفیت آن را ارتقا دهیم.
او افزود: کیفیت مد نظر، صحت بالای ۸۵ یا ۹۰ درصد در تبدیل است. در حال حاضر به عدد ۶۰ رسیدهایم. البته ساختارهای محتوایی مختلف مانند محاورهای و رسمی مکانیسمهای جدایی را نیاز دارند. این ۶۰ درصد میتواند مسیر را راحتتر کند و برای ویرایش فقط باید ۴۰ درصد آن بررسی شود.
آجودانیان در مورد سرعت تبدیل هوش مصنوعی نیز توضیح داد: سرعت فعلی ما 16xاست. مثلاً تبدیل یک پادکست ۱۶۰ دقیقهای ۱۰ دقیقه به طول میانجامد. زمانی که سرویس به شکل همگانی ارائه شود هم سرعت زیاد میشود و هم فایل چندتکه میشود و تمام تکهها با سرعت بالا تبدیل میشوند و فایل نهایی در کمتر از یک دقیقه روی ویرگول قرار میگیرد.
او با بیان اینکه این سرویس اکنون فقط برای بعضی از پادکستهای موجود در ویرگول و برخی کاربران loyal (وفادار) در دسترس است ابزار امیدواری کرد تا انتهای امسال یا ابتدای ۱۴۰۱ همه کاربران بتوانند روی ویرگول محتوای صوتی منتشر کنند.
مدیرعامل ویرگول: تغییر استراتژی ندادهایم
مدیرعامل و بنیانگذار ویرگول در مورد استراتژی ویرگول که بدون تغییر مانده است نیز توضیح داد: استراتژی ویرگول عوض نمیشود و همچنان توسعه محصول ویرگول متمرکز بر محتوای متنی است، اما برای عقب نماندن از رقبا و ترند فعالیتهای کاربران نیاز داریم که بخشهای جدیدی را پیادهسازی کنیم. از سویی باید به نگه داشتن کاربران همیشگی ویرگول نیز فکر کنیم تا تعامل آنها را با محتواها و پلتفرم بالا ببریم. برای همین این بخش به وجود آمده است و بخشهای دیگری نیز معرفی خواهند شد. اما به هر حال این بخشها قابلیتهایی هستند که به عنوان افزونهای در کنار محتوای متنی به کاربران خدمترسانی میکنند.