5 برنامه تبدیل گفتار به نوشتار (ترنسکریپشن)

موارد استفاده از خدمات ترنسکریپشن (Transcription) بسیار فراوان است و به همین دلیل اسامی زیادی نیز برای خطاب دادن آن توسط کاربران به کار برده می‌شود. نام‌هایی مثل رونویسی، نسخه برداری، فرآیند تبدیل گفتار به نوشتار و تبدیل صوت به متن همگی یک مفهوم مشخص دارند و در واقع همان ترنسکریپشن می‌باشند. ثبت مصاحبه پلیس برای پرونده حقوقی و یا نسخه برداری مصاحبه‌های تحقیقاتی برای اهداف دانشگاهی، تنها دو مورد از کاربردهای فراوان رونویسی به شمار می‌آیند.

سال‌های مدید کار نسخه برداری برعهده افراد واجد شرایطی بود که با مهارت‌های خاص خود آنچه که در جلسات مهم یا پرونده‌های قضایی رخ می‌‌داد را مکتوب می‌کردند. با این حال امروزه ظهور برنامه‌های (اپلیکیشن‌های) تبدیل گفتار به نوشتار خودکار باعث سرعت کار و کاهش هزینه‌ها شده است. شبکه مترجمین راستین در این گفتار قصد دارد تا نگاهی به سرویس‌های رونویسی خودکار (یعنی مبتنی بر نرم‌افزار) بیاندازد، موارد کاربرد آنها را بررسی کرده و 5 برنامه برتر را از دیدگاه متخصصین فن معرفی نماید.

 

دلیل استفاده از اپلیکیشن‌های تبدیل گفتار به نوشتار

هر چند که استفاده از یک برنامه رونویسی (اپلیکیشن تبدیل گفتار به نوشتار) خودکار وسوسه انگیز است؛ اما باید درک کرد که انجام این کار مستلزم شرایط خاص است (مثلا در صورتیکه وقت کافی در اختیار دارید؛ دیگر بهره‌گیری از این فناوری‌ها چندان منطقی به نظر نمی‌رسد). خدمات تبدیل صوت به متن که توسط انسان انجام می‌گیرند؛ بیش از 99% دقت دارند. در مقابل نرم افزار تشخیص صدای خودکار = Automated Sound Recognition (که معمولاً ASR نامیده می‌شود) در صورت وجود شرایط صوتی ایده‌آل (که شامل ضبط باکیفیت خوب، صدای پس زمینه بسیار کم و یک صدا در هر بار است) تقریباً دارای 80% دقت است. اگر چه همانگونه که در ادامه مقاله مشاهده خواهید کرد؛ دقت ارائه شده توسط برنامه های برتر تبدیل گفتار به نوشتار به مراتب بیشتر از این ارقام است.

 

بهترین برنامه‌های تبدیل گفتار به نوشتار

در هر صنعت یا حرفه‌ای که فعالیت می‌کنید؛ همیشه محدودیت‌های بودجه‌ای یک عامل مهم برای انتخاب خدمات محسوب می‌شوند. اگر تنها قصد جمع‌آوری مطالب گفته شده در یک شرایط خاص را دارید و به دنبال رونویسی کلمه به کلمه نیستید (چیزیکه در بسیاری از موارد از نظر قانونی لازم است)؛ احتمالاً این برنامه‌ها برایتان مناسب هستند. در ضمن اگر به صورت فردی کار می‌کنید (مثلاً یک روزنامه نگار مستقل یا یک دانشجو هستید که همواره به نسخه برداری از سخنان خود و دیگران نیاز دارید)؛ استفاده از خدمات ترنسکریپشن انسانی ممکن است برایتان بسیار گران تمام شود. حال که با مزایا و معایب یک سرویس مبتنی بر ASR آشنا شده‌اید؛ بیایید به بررسی 5 برنامه برتر تبدیل گفتار به نوشتار بپردازیم.

 

1. Otter.Ai

شرکت Otter در زمینه توسعه فناوری‌ خودکار تبدیل صوت به متن جلسات و مصاحبه‌ها، اعتباری برای خود دست و پا کرده است؛ چون اپلیکیشن ارائه شده توسط آن قادر است تا چندین صدا را ضبط کرده و رونویسی کند. برنامه Otter.Ai به صورت خارق‌العاده از هوش مصنوعی برای رونویسی آنی استفاده کرده، و به طور کلی صداهای مختلف را به زیبایی مدیریت و کنترل می‌کند. همچنین این برنامه یکی از معدود اپلیکیشن‌های ASR است که قابلیت شناسایی گوینده یک گفتگوی متقابل را دارد؛ از اینرو در ضبط جلساتی مانند مصاحبه‌های رسمی و سخنرانی‌های کنفرانسی دارای کاربرد زیادی است.

از لحاظ عملکردی نیز کار کردن با این اپلیکیشن آسان است. کاربران به راحتی می‌توانند نرم افزار را باز کرده و دکمه ضبط را فشار دهند؛ در این صورت بلافاصله برنامه شروع به کار می‌کند و به محض اینکه شروع به صحبت گردد، نسخه برداری و خود ویرایشی آغاز می‌شود. در ضمن می‌توان صداهای ضبط شده را نیز به نسخه برداری برنامه وارد کرد. تنها ایراد این اپلیکیشن تبدیل صوت به متن این است که اگر دوربین تلفن همراه روشن باشد؛ دیگر کار نمی‌کند.

یکی دیگر از نقاط قوت برنامه Otter این است که می‌توان در نسخه رایگان آن به بیشتر ویژگی‌هایش دسترسی پیدا کرد و حداقل 600 دقیقه در ماه (حداکثر 40 دقیقه برای هر ضبط) خدمات ترنسکریپشن رایگان دریافت نمود. این رقم بیش از نیاز بسیاری از کاربران عادی است. اما برای کسانیکه نیاز بیشتری دارند؛ قیمت‌گذاری آنها به تناسب ارائه خدمات برحسب دقیقه شروع می‌گردد.

 

اپلیکیشن تبدیل صدا به متن

اپلیکیشن تبدیل صدا به متن Otter

 

2. Dragon Anywhere

اپلیکیشن Dragon Anywhere همانند برنامه Otter، در دستگاه‌های اندروید و iOS در دسترس است، و توانسته به عنوان یکی از بهترین اپلیکیشن‌های تبدیل گفتار به نوشتار شهرت پیدا کند. این برنامه دارای دقت 99% است و توسعه دهندگان آن یعنی Nuance Communications ادعا می‌کنند که این درصد پس از سازگاری با صدای کاربر افزایش می‌یابد. در ضمن می‌توان اصطلاحات خاص صنعت را به صورت سفارشی به این آپ رونویسی اضافه نمود؛ به این صورت برنامه با تنظیمات خاص تجاری کاربردی‌تر می‌شود. علاوه بر این، امکان ویرایش صدا و فرمت‌بندی آن نیز وجود دارد.

یکی دیگر از ویژگی‌های خوب این برنامه امکان به اشتراک‌گذاری سریع و کارآمد نسخه‌های رونویسی شده با استفاده از گزینه‌های ذخیره‌سازی فضای ابری مانند دراپ باکس (Dropbox) و اورنوت (Evernote) است. همچنین در صورت نیاز به ذخیره کردن متن‌های صوتی سنگین بر روی رایانه شخصی، می‌توان با این نرم افزار بر روی صفحه نمایش خود کار کرد.

با این حال این نرم افزار تبدیل گفتار به متن تایپ شده دارای چندین ایراد است. اولاً هزینه‌های آن بالاست که استفاده از آن را برای کاربران ایرانی سخت می‌کند. ثانیاً Dragon Anywhere به طور خاص برای دیکته کردن طراحی شده است؛ لذا برای ضبط مکالمه جلسات مناسب نیست. در ضمن نمی‌توان صداهای ضبط شده را وارد آن کرده و نسخه متنی آنها را دریافت نمود؛ این اپلیکیشن تنها نسخه متنی صداهایی که توسط خودش ضبط گردیده را به متن تبدیل می‌نماید.

 

3. Transcribe - Speech to Text

این نرم افزار نیز از فناوری هوش مصنوعی بهره می‌برد و یکی دیگر از اپلیکیشن‌های تبدیل گفتار به نوشتار است که برای روزنامه نگاران، دانشجویان و تمام کسانیکه کار آنها ضبط چند دقیقه از جلسات است، مناسب می‌باشد. این برنامه می‌تواند هر یادداشت صوتی یا فایل ویدئویی را به متن تبدیل کند، و در حال حاضر از 120 زبان و گویش پشتیبانی می‌نماید. کاربران می‌توانند فایل‌ها را از سایر برنامه‌های ذخیره‌سازی مانند Dropbox به این برنامه وارد کنند که ویژگی کاربردی و مفیدی برای افراد حرفه‌ای محسوب می‌شود.

نرم افزار Transcribe - Speech to Text نیز خالی از اشکال نیست. در وهله نخست این فناوری انجام دهنده ترنسکریپشن فقط در دستگاه‌های iOS در دسترس است؛ بنابراین عموم مردم نمی‌توانند از آن استفاده کنند. همچنین این برنامه پس از نسخه برداری تنها یک متن خام و ساده را ایجاد می‌نماید؛ از اینرو برای مرتب کردن متن و ویرایش آن باید فایل را به یک نرم افزار واژه پرداز انتقال دهید. مسئله دیگر، دقت 90% این برنامه است که از برخی نرم افزارهای تبدیل صوت به متن ذکر شده در این مطلب کمتر است. در ضمن این آپ تنها 15 دقیقه خدمات رایگان ارائه می‌دهد و برای استفاده بیشتر بایستی هزینه بالایی پرداخت نمود.

 

4. Braina

یک نرم افزار خودکار تشخیص گفتار است که دامنه کارآیی آن تنها به رونویسی صرف محدود نمی‌شود. در واقع این برنامه به کاربران اجازه می‌دهد تا از طریق ابزارهای اندروید یا iOS خود با رایانه ارتباط برقرار کنند. مجموعه ویژگی‌های Braina از لحاظ ترنسکریپشن بسیار جالب است، و در اصل می‌تواند صدا را به متون مناسب برای وب‌سایت‌ها و برنامه‌های نرم افزاری مثل پردازنده‌های متنی تبدیل کند.

شاید بی‌نظیرترین نقطه قوت این نرم افزار تبدیل گفتار به نوشتار این است که به صورت پیش فرض اصطلاحات خاص حوزه‌های پزشکی، حقوقی و علمی را تشخیص می‌دهد. اگر در هر یک از این حوزه‌های خاص مشغول فعالیت هستید؛ این اپلیکیشن یک راهکار عالی برای رفع مشکل نسخه برداری شماست. حتی اگر این برنامه اصطلاح خاصی را تشخیص ندهد؛ باز می‌توانید آن را به فهرست واژگان Braina اضافه نمایید.

این برنامه نسخه برداری از بیش از 100 زبان مختلف پشتیبانی می‌کند و شامل گزینه‌هایی برای دستورات تایپ نیز است. متأسفانه نسخه رایگان آن فاقد این ویژگی‌هاست؛ بنابراین باید آن را به نسخه Pro ارتقا دهید که سالانه هزینه‌های بالایی برایتان آب می‌خورد. با این حال اگر فقط به دنبال جزء رونویسی خودکار این برنامه باشید؛ ممکن است نخواهید هزینه زیادی را متحمل شوید.

 

اپلیکیشن رونویسی

نرم افزار تبدیل گفتار به نوشتار Google Gboard

 

5. Google Gboard

اگر واقعاً از نظر بودجه مالی در مضیقه هستید و به دنبال اپلیکیشنی می‌گردید که بدون دریافت هزینه آنچه که نیاز دارید را انجام دهد؛ ابزار ساده Google Gboard ممکن است بهترین انتخاب برایتان باشد. این برنامه یک ابزار نسخه برداری ASR ساده به حساب می‌آید که نسخه رایگان اندروید آن به صورت پیش فرض در بسیاری از دستگاه‌های تلفن همراه وجود دارد. اگر در تلفن همراه شما وجود ندارد؛ امکان دانلود آن از طریق Google Play Store مهیاست.

این نرم افزار در اصل یک اپلیکیشن کیبورد (Keyboard Application) است؛ اما به عنوان یک برنامه تبدیل گفتار به متن نیز کار می‌کند. از آنجاییکه تمام قابلیت‌های توسعه نرم افزاری گوگل در آن به کار رفته؛ بسیار عالی و کارآمد است. همچنین امکان ادغام برنامه Google Gboard با Google Translate = گوگل ترنسلیت (یکی از بهترین اپلیکیشن‌های مترجم موبایل) نیز وجود دارد.

البته این فناوری نیز ایرادات آشکاری دارد. مثلاً این برنامه فقط برای دستگاه‌های اندروید قابلیت استفاده را دارد. اما یک راهکار جایگزین نیز وجود دارد؛ در دستگاه های اپل یا رایانه‌های شخصی (ویندوز) از طریق برنامه Google Docs می‌توان به خدمات مشابه تبدیل گفتار به متن دسترسی پیدا کرد.

این اپلیکیشن نیز همانند برنامه Transcribe هیچگونه ابزار ویرایش صوتی ندارد؛ بنابراین یک نسخه خام را ارائه می دهد که بدون شک پس از اتمام تایپ به مرتب‌سازی و ویرایش نیازمند است. با این حال این ابزار رونویسی رایگان که تبلیغات آزاردهنده‌ای ندارد؛ حجم بالایی از خدمات ترنسکریپشن را انجام می‌دهد.

 

کلام پایانی

اگر بودجه محدودی دارید و یا به دنبال نرم افزاری خودکار برای رونویسی یادداشت‌های صوتی خود می‌گردید، این برنامه‌ها به واسطه افزایش سرعت و کاهش هزینه‌ها یک راهکار عالی به حساب می‌آیند. با این حال هیچ کدام از اپلیکیشن‌های تبدیل گفتار به نوشتار هنوز به پای دقت، انعطاف پذیری و امنیت انسان نمی‌رسند؛ چرا که متخصصین این حوزه هرگونه جزئیات ظریف و پیچیده‌ای را گلچین کرده و یادداشت می‌نمایند. در هر صورت امیدواریم مباحث مطرح شده در این گفتار توانسته باشد تا شما را برای انتخاب بهترین نرم افزار ترنسکریپشن یاری نماید.

 

در ادامه حتما بخوانيد: معرفی 8 اپلیکیشن مترجم موبایل