5 برنامه تبدیل گفتار به نوشتار (ترنسکریپشن)
- 17 خرداد 1400
- هوش مصنوعی
موارد استفاده از خدمات ترنسکریپشن (Transcription) بسیار فراوان است و به همین دلیل اسامی زیادی نیز برای خطاب دادن آن توسط کاربران به کار برده میشود. نامهایی مثل رونویسی، نسخه برداری، فرآیند تبدیل گفتار به نوشتار و تبدیل صوت به متن همگی یک مفهوم مشخص دارند و در واقع همان ترنسکریپشن میباشند. ثبت مصاحبه پلیس برای پرونده حقوقی و یا نسخه برداری مصاحبههای تحقیقاتی برای اهداف دانشگاهی، تنها دو مورد از کاربردهای فراوان رونویسی به شمار میآیند.
سالهای مدید کار نسخه برداری برعهده افراد واجد شرایطی بود که با مهارتهای خاص خود آنچه که در جلسات مهم یا پروندههای قضایی رخ میداد را مکتوب میکردند. با این حال امروزه ظهور برنامههای (اپلیکیشنهای) تبدیل گفتار به نوشتار خودکار باعث سرعت کار و کاهش هزینهها شده است. شبکه مترجمین راستین در این گفتار قصد دارد تا نگاهی به سرویسهای رونویسی خودکار (یعنی مبتنی بر نرمافزار) بیاندازد، موارد کاربرد آنها را بررسی کرده و 5 برنامه برتر را از دیدگاه متخصصین فن معرفی نماید.
دلیل استفاده از اپلیکیشنهای تبدیل گفتار به نوشتار
هر چند که استفاده از یک برنامه رونویسی (اپلیکیشن تبدیل گفتار به نوشتار) خودکار وسوسه انگیز است؛ اما باید درک کرد که انجام این کار مستلزم شرایط خاص است (مثلا در صورتیکه وقت کافی در اختیار دارید؛ دیگر بهرهگیری از این فناوریها چندان منطقی به نظر نمیرسد). خدمات تبدیل صوت به متن که توسط انسان انجام میگیرند؛ بیش از 99% دقت دارند. در مقابل نرم افزار تشخیص صدای خودکار = Automated Sound Recognition (که معمولاً ASR نامیده میشود) در صورت وجود شرایط صوتی ایدهآل (که شامل ضبط باکیفیت خوب، صدای پس زمینه بسیار کم و یک صدا در هر بار است) تقریباً دارای 80% دقت است. اگر چه همانگونه که در ادامه مقاله مشاهده خواهید کرد؛ دقت ارائه شده توسط برنامه های برتر تبدیل گفتار به نوشتار به مراتب بیشتر از این ارقام است.
بهترین برنامههای تبدیل گفتار به نوشتار
در هر صنعت یا حرفهای که فعالیت میکنید؛ همیشه محدودیتهای بودجهای یک عامل مهم برای انتخاب خدمات محسوب میشوند. اگر تنها قصد جمعآوری مطالب گفته شده در یک شرایط خاص را دارید و به دنبال رونویسی کلمه به کلمه نیستید (چیزیکه در بسیاری از موارد از نظر قانونی لازم است)؛ احتمالاً این برنامهها برایتان مناسب هستند. در ضمن اگر به صورت فردی کار میکنید (مثلاً یک روزنامه نگار مستقل یا یک دانشجو هستید که همواره به نسخه برداری از سخنان خود و دیگران نیاز دارید)؛ استفاده از خدمات ترنسکریپشن انسانی ممکن است برایتان بسیار گران تمام شود. حال که با مزایا و معایب یک سرویس مبتنی بر ASR آشنا شدهاید؛ بیایید به بررسی 5 برنامه برتر تبدیل گفتار به نوشتار بپردازیم.
1. Otter.Ai
شرکت Otter در زمینه توسعه فناوری خودکار تبدیل صوت به متن جلسات و مصاحبهها، اعتباری برای خود دست و پا کرده است؛ چون اپلیکیشن ارائه شده توسط آن قادر است تا چندین صدا را ضبط کرده و رونویسی کند. برنامه Otter.Ai به صورت خارقالعاده از هوش مصنوعی برای رونویسی آنی استفاده کرده، و به طور کلی صداهای مختلف را به زیبایی مدیریت و کنترل میکند. همچنین این برنامه یکی از معدود اپلیکیشنهای ASR است که قابلیت شناسایی گوینده یک گفتگوی متقابل را دارد؛ از اینرو در ضبط جلساتی مانند مصاحبههای رسمی و سخنرانیهای کنفرانسی دارای کاربرد زیادی است.
از لحاظ عملکردی نیز کار کردن با این اپلیکیشن آسان است. کاربران به راحتی میتوانند نرم افزار را باز کرده و دکمه ضبط را فشار دهند؛ در این صورت بلافاصله برنامه شروع به کار میکند و به محض اینکه شروع به صحبت گردد، نسخه برداری و خود ویرایشی آغاز میشود. در ضمن میتوان صداهای ضبط شده را نیز به نسخه برداری برنامه وارد کرد. تنها ایراد این اپلیکیشن تبدیل صوت به متن این است که اگر دوربین تلفن همراه روشن باشد؛ دیگر کار نمیکند.
یکی دیگر از نقاط قوت برنامه Otter این است که میتوان در نسخه رایگان آن به بیشتر ویژگیهایش دسترسی پیدا کرد و حداقل 600 دقیقه در ماه (حداکثر 40 دقیقه برای هر ضبط) خدمات ترنسکریپشن رایگان دریافت نمود. این رقم بیش از نیاز بسیاری از کاربران عادی است. اما برای کسانیکه نیاز بیشتری دارند؛ قیمتگذاری آنها به تناسب ارائه خدمات برحسب دقیقه شروع میگردد.
اپلیکیشن تبدیل صدا به متن Otter
2. Dragon Anywhere
اپلیکیشن Dragon Anywhere همانند برنامه Otter، در دستگاههای اندروید و iOS در دسترس است، و توانسته به عنوان یکی از بهترین اپلیکیشنهای تبدیل گفتار به نوشتار شهرت پیدا کند. این برنامه دارای دقت 99% است و توسعه دهندگان آن یعنی Nuance Communications ادعا میکنند که این درصد پس از سازگاری با صدای کاربر افزایش مییابد. در ضمن میتوان اصطلاحات خاص صنعت را به صورت سفارشی به این آپ رونویسی اضافه نمود؛ به این صورت برنامه با تنظیمات خاص تجاری کاربردیتر میشود. علاوه بر این، امکان ویرایش صدا و فرمتبندی آن نیز وجود دارد.
یکی دیگر از ویژگیهای خوب این برنامه امکان به اشتراکگذاری سریع و کارآمد نسخههای رونویسی شده با استفاده از گزینههای ذخیرهسازی فضای ابری مانند دراپ باکس (Dropbox) و اورنوت (Evernote) است. همچنین در صورت نیاز به ذخیره کردن متنهای صوتی سنگین بر روی رایانه شخصی، میتوان با این نرم افزار بر روی صفحه نمایش خود کار کرد.
با این حال این نرم افزار تبدیل گفتار به متن تایپ شده دارای چندین ایراد است. اولاً هزینههای آن بالاست که استفاده از آن را برای کاربران ایرانی سخت میکند. ثانیاً Dragon Anywhere به طور خاص برای دیکته کردن طراحی شده است؛ لذا برای ضبط مکالمه جلسات مناسب نیست. در ضمن نمیتوان صداهای ضبط شده را وارد آن کرده و نسخه متنی آنها را دریافت نمود؛ این اپلیکیشن تنها نسخه متنی صداهایی که توسط خودش ضبط گردیده را به متن تبدیل مینماید.
3. Transcribe - Speech to Text
این نرم افزار نیز از فناوری هوش مصنوعی بهره میبرد و یکی دیگر از اپلیکیشنهای تبدیل گفتار به نوشتار است که برای روزنامه نگاران، دانشجویان و تمام کسانیکه کار آنها ضبط چند دقیقه از جلسات است، مناسب میباشد. این برنامه میتواند هر یادداشت صوتی یا فایل ویدئویی را به متن تبدیل کند، و در حال حاضر از 120 زبان و گویش پشتیبانی مینماید. کاربران میتوانند فایلها را از سایر برنامههای ذخیرهسازی مانند Dropbox به این برنامه وارد کنند که ویژگی کاربردی و مفیدی برای افراد حرفهای محسوب میشود.
نرم افزار Transcribe - Speech to Text نیز خالی از اشکال نیست. در وهله نخست این فناوری انجام دهنده ترنسکریپشن فقط در دستگاههای iOS در دسترس است؛ بنابراین عموم مردم نمیتوانند از آن استفاده کنند. همچنین این برنامه پس از نسخه برداری تنها یک متن خام و ساده را ایجاد مینماید؛ از اینرو برای مرتب کردن متن و ویرایش آن باید فایل را به یک نرم افزار واژه پرداز انتقال دهید. مسئله دیگر، دقت 90% این برنامه است که از برخی نرم افزارهای تبدیل صوت به متن ذکر شده در این مطلب کمتر است. در ضمن این آپ تنها 15 دقیقه خدمات رایگان ارائه میدهد و برای استفاده بیشتر بایستی هزینه بالایی پرداخت نمود.
4. Braina
یک نرم افزار خودکار تشخیص گفتار است که دامنه کارآیی آن تنها به رونویسی صرف محدود نمیشود. در واقع این برنامه به کاربران اجازه میدهد تا از طریق ابزارهای اندروید یا iOS خود با رایانه ارتباط برقرار کنند. مجموعه ویژگیهای Braina از لحاظ ترنسکریپشن بسیار جالب است، و در اصل میتواند صدا را به متون مناسب برای وبسایتها و برنامههای نرم افزاری مثل پردازندههای متنی تبدیل کند.
شاید بینظیرترین نقطه قوت این نرم افزار تبدیل گفتار به نوشتار این است که به صورت پیش فرض اصطلاحات خاص حوزههای پزشکی، حقوقی و علمی را تشخیص میدهد. اگر در هر یک از این حوزههای خاص مشغول فعالیت هستید؛ این اپلیکیشن یک راهکار عالی برای رفع مشکل نسخه برداری شماست. حتی اگر این برنامه اصطلاح خاصی را تشخیص ندهد؛ باز میتوانید آن را به فهرست واژگان Braina اضافه نمایید.
این برنامه نسخه برداری از بیش از 100 زبان مختلف پشتیبانی میکند و شامل گزینههایی برای دستورات تایپ نیز است. متأسفانه نسخه رایگان آن فاقد این ویژگیهاست؛ بنابراین باید آن را به نسخه Pro ارتقا دهید که سالانه هزینههای بالایی برایتان آب میخورد. با این حال اگر فقط به دنبال جزء رونویسی خودکار این برنامه باشید؛ ممکن است نخواهید هزینه زیادی را متحمل شوید.
نرم افزار تبدیل گفتار به نوشتار Google Gboard
5. Google Gboard
اگر واقعاً از نظر بودجه مالی در مضیقه هستید و به دنبال اپلیکیشنی میگردید که بدون دریافت هزینه آنچه که نیاز دارید را انجام دهد؛ ابزار ساده Google Gboard ممکن است بهترین انتخاب برایتان باشد. این برنامه یک ابزار نسخه برداری ASR ساده به حساب میآید که نسخه رایگان اندروید آن به صورت پیش فرض در بسیاری از دستگاههای تلفن همراه وجود دارد. اگر در تلفن همراه شما وجود ندارد؛ امکان دانلود آن از طریق Google Play Store مهیاست.
این نرم افزار در اصل یک اپلیکیشن کیبورد (Keyboard Application) است؛ اما به عنوان یک برنامه تبدیل گفتار به متن نیز کار میکند. از آنجاییکه تمام قابلیتهای توسعه نرم افزاری گوگل در آن به کار رفته؛ بسیار عالی و کارآمد است. همچنین امکان ادغام برنامه Google Gboard با Google Translate = گوگل ترنسلیت (یکی از بهترین اپلیکیشنهای مترجم موبایل) نیز وجود دارد.
البته این فناوری نیز ایرادات آشکاری دارد. مثلاً این برنامه فقط برای دستگاههای اندروید قابلیت استفاده را دارد. اما یک راهکار جایگزین نیز وجود دارد؛ در دستگاه های اپل یا رایانههای شخصی (ویندوز) از طریق برنامه Google Docs میتوان به خدمات مشابه تبدیل گفتار به متن دسترسی پیدا کرد.
این اپلیکیشن نیز همانند برنامه Transcribe هیچگونه ابزار ویرایش صوتی ندارد؛ بنابراین یک نسخه خام را ارائه می دهد که بدون شک پس از اتمام تایپ به مرتبسازی و ویرایش نیازمند است. با این حال این ابزار رونویسی رایگان که تبلیغات آزاردهندهای ندارد؛ حجم بالایی از خدمات ترنسکریپشن را انجام میدهد.
کلام پایانی
اگر بودجه محدودی دارید و یا به دنبال نرم افزاری خودکار برای رونویسی یادداشتهای صوتی خود میگردید، این برنامهها به واسطه افزایش سرعت و کاهش هزینهها یک راهکار عالی به حساب میآیند. با این حال هیچ کدام از اپلیکیشنهای تبدیل گفتار به نوشتار هنوز به پای دقت، انعطاف پذیری و امنیت انسان نمیرسند؛ چرا که متخصصین این حوزه هرگونه جزئیات ظریف و پیچیدهای را گلچین کرده و یادداشت مینمایند. در هر صورت امیدواریم مباحث مطرح شده در این گفتار توانسته باشد تا شما را برای انتخاب بهترین نرم افزار ترنسکریپشن یاری نماید.
در ادامه حتما بخوانيد: معرفی 8 اپلیکیشن مترجم موبایل