بهترین روشهای پسا ویرایش ترجمه ماشینی
- 11 آبان 1399
- ترجمه ماشینی
ترجمه ماشینی (MT) روز به روز در حال پیشرفت است و همواره به سمت ارزانتر، سریعتر و دقیقتر شدن گام بر میدارد. با این حال این نوع ترجمه برای رسیدن به کیفیت ترجمه انسانی هنوز باید راه طولانی را طی نماید. سرویسهای پسا ویرایش ترجمه ماشینی (PEMT) به ترکیب بهترینهای هر دو نوع ترجمه کمک میکنند: آنها سرعت و توانایی موتورهای ترجمه ماشینی که قادرند سریعاً حجم بالایی از متون را مدیریت کنند با حساسیت و مهارت زبانشناسان آموزش دیده ترکیب مینمایند. اگر قصد دارید تا روشهای پسا ویرایش را در جریان کار ترجمه به کار بگیرید، در ادامه با شبکه مترجمین راستین همراه باشید.
مراحل آمادهسازی برای استفاده از پسا ویرایش ترجمه ماشینی
شاید مهمترین چیزی که باید از همان ابتدا مد نظر داشته باشید، مطمئن شدن از خروجی مرحله ترجمه ماشینی است. هر چه خروجی مرحله ترجمه ماشینی بهتر باشد، مرحله پسا ویرایش به کار کمتری احتیاج دارد و همین خود منجر به سریعتر شدن روند کار و کاهش هزینه ترجمه میگردد. در این مرحله باید به دو نکته مهم توجه داشته باشید:
1. کار خود را با متن اصلی شروع کنید:
در این روش ترجمه همانند هر روش ترجمه دیگری ابتدا باید متن اصلی با دقت آماده شده و یا پیش ویرایش گردد؛ در این صورت میتوان مطمئن شد که ویرایشگران و موتورهای ترجمه کار خود را به نحو احسن انجام میدهند. خطاهای اولیه ممکن است بسیار پیچیده باشند و باعث به وجود آمدن مشکلاتی گردند. به همین دلیل در ابتدای کار تا جاییکه ممکن است باید مطمئن شوید که متن اصلی فاقد اشتباهات املایی و نگارشی است. واژههای متن و فرمت آن باید با هم متناسب باشند. متن باید به گونهای باشد که گویا قرار است کاملاً توسط مترجم انسانی مدیریت شود.
اگر قصد دارید به بهترین نتیجه دست پیدا کنید باید متن خود را مخصوص ترجمه ماشینی آماده نمایید. هر چند که روند ترجمه ماشینی سریعاً در حال بهبود است؛ اما میتوانید با برداشتن گام هایی به افزایش کیفیت خروجی کمک نمایید. به طور کلی هر چه متن ورودی در ترجمه ماشینی مختصرتر و شفافتر باشد، عملکرد آن بهتر خواهد بود. یک جمله ایدهآل باید کمتر از 20 کلمه و حاوی دستور زبانی سادهای باشد. جملات پیچیده و یا تکه جملات تیتروار برای ترجمه ماشینی مناسب نیستند.
رویکرد ترجمه ماشینی به گونهای است که بیشتر به اختلافات جزئی توجه دارد و تا حد ممکن به سمت ترجمه تحتاللفظی متمایل است. در هنگام آمادهسازی متن از نوشتن جملات کنایهآمیز اجتناب کنید (موتورهای ترجمه ماشینی قادر به تعبیر آنها نیستند). از جملاتی که در قالب نفی اندر نفی نوشته شدهاند، خودداری نمایید (نرمافزارهای ترجمه قادر نیستند آنها را به درستی ترجمه کنند) و در صورت امکان تاریخها را در فرمتهای غیر عددی آماده کنید. مثلا تاریخ 1399/08/11 ممکن است برای ماشین مبهم باشد: بهتر است بنویسید یازدهم آبان سال 1399.
حتما بخوانيد: پروکسی ترجمه
2. بهترین موتور ترجمه را انتخاب نمایید:
موتورهای ترجمه ماشینی زیادی وجود دارند که به طور پیوسته به تعداد و کیفیت آنها افزوده میشود. همه موتورها با هم برابر نیستند، عملکرد برخی از آنها نسبت به سایرین بسیار برتر است. چالشهای ترجمه هوش مصنوعی باعث گردیده تا برخی از آنها برای معدودی از جفتهای زبانی مناسب نباشند، با این حال بعضی فقط برای موضوعات خاصی عملکرد خوبی دارند. شما میتوانید با انتخاب مناسبترین موتور برای پروژهتان در وقت و تلاش خود صرفه جویی کنید.
طیفی از موتورهای عمومی ترجمه ماشینی را در نظر بگیرید و آنها را با استفاده از نمونه متنها یا تجربیات گذشتهتان ارزیابی نمایید. هر چند که تدوین یک روش تحلیل سفارشی ممکن است گزینهای زمانبر باشد؛ اما میتواند در بلند مدت به راهحلهای مقرون به صرفهای بیانجامد. گزینه دیگری که بهتر است گوشه چشمی به آن داشته باشید، در نظر گرفتن یک موتور ترجمه سفارشی است که با استفاده از دادههای خودتان آن را آموزش داده اید. این مسئله در کل باعث میشود تا بتوانید به نتایج مناسبتری در زمینه مطالبی که عادتاً با آنها کار میکنید، دست بیابید.
ابزار Memsource Translate به شما کمک میکند تا بهترین موتور ترجمه ماشینی را انتخاب کنید. این ابزار توسط گروه هوش مصنوعی (AI) شرکت Memsource ارائه شده است و به صورت پویا بهترین موتور نوع ترجمه ماشینی را برای ترجمه محتوای سایت و متون مشابه انتخاب میکند. این ابزار دامنه منبع متن و زبان مقصد را در نظر میگیرد و براساس عملکرد قبلی به دنبال بهترین موتور ترجمه ماشینی میگردد.
پسا ویرایش ترجمه ماشینی (post editing machine translation)
استراتژیهای پسا ویرایش ترجمه ماشینی
بعد از اینکه موتور به ترجمه متن اقدام نمود، مرحله پسا ویرایش متن آغاز میشود. این که روند پسا ویرایش چقدر طول میکشد از پروژهای به پروژه دیگر متفاوت است؛ بنابراین باید از همان اول انتظارات خود را مشخص کنید. سه عامل اصلی در این زمینه، زمان، کیفیت و هزینه هستند. با اتخاذ یک رویکرد مناسب میتوانید استراتژی پسا ویرایش خود را تدوین نمایید.
روش پسا ویرایش جزئی (LPE)
در روش پسا ویرایش جزئی (Light Post-editing)، خروجی موتور ترجمه ماشینی تنها در صورت لزوم اصلاح میگردد. هدف از این کار مطمئن شدن از خوانایی متن خروجی است و اینکه متن ترجمه شده معنی دقیق سند منبع را به ذهن متبادر کند. در این روش، ویرایشگر متن به دنبال خطاهایی میگردد که مانعی بر سر درک مقصود متن اصلی هستند و یا اینکه کاملاً بلعکس ترجمه شدهاند. اگر نتایج خام یک موتور جستجو مورد بازبینی قرار نگیرد، نتایج شرمآوری به بار میآید. در این روش ویراستار میخواهد تا متن ترجمه شده را در حد نیاز و بسیار کم ویرایش نماید؛ بنابراین نتایج این روش اغلب سریع و مقرون به صرفه هستند.
روش پسا ویرایش کامل (FPE)
در روش پسا ویرایش کامل (Full Post-editing)، خروجی موتور ترجمه ماشینی به صورت کامل بررسی میگردد تا از عدم وجود هیچگونه خطایی اطمینان حاصل شود. روش LPE بر ضروریات یک متن مثل دقت و خوانایی آن متمرکز میشود، در حالیکه روش FPE چندین عامل را در نظر میگیرد که تعدادی از آنها عبارتند از:
- تناسب سبک و لحن در متن (و با سایر اسناد مرتبط)
- عدم وجود هرگونه خطای دستوری
- متناسب کردن متن با فرهنگ زبان مقصد (مانند اصطلاحات کنایهای)
بنابراین بعد از اعمال روش پسا ویرایش کامل، متن باید به گونهای باشد که بتواند خواننده را متقاعد کرده و به وی بفهماند که متن از همان ابتدا به زبان مقصد نوشته شده است. این روش کندتر و گرانتر از روش LPE است؛ اما خروجی آن قطعاً کیفیت بسیار بالاتری دارد.
استراتژی مختص پروژه
پیشنیازها همیشه باید متناسب با یک پروژه ترجمه خاص تعریف گردند. با این طرز تفکر به روشهای پسا ویرایش جزئی و کامل به جای انتخابهای باینری توجه کنید؛ قطعاً این نوع دیدگاه بسیار مفید خواهد بود. اولویتهای پسا ویرایش را براساس عواملی مانند زمان، هزینه و کیفیت مطلوب، گلچین و انتخاب نمایید. این کار میتواند در زمینه اولویتبندی و انتخاب برخی از بخشها که ارزش تجاری بالاتری نسبت به بقیه دارند، بسیار موثر باشد.
گزینه دیگری که باید در نظر گرفت کنار گذاشتن پسا ویرایش به صورت کامل است. در برخی از پروژهها این امکان وجود دارد؛ مثلا در زمینه ترجمه اسناد داخل سازمانی به نظر میرسد که ترجمه ماشینی کفایت میکند و عواقب ترجمه نامناسب نیز قابل اغماض است.
حتما بخوانيد: چرا از مترجم گوگل نباید استفاده کرد؟ (ذکر 5 دلیل)
ابزارهای پسا ویرایش
ویراستاران و مدیران باید نسبت به ابزارهای مختلفی که میتوانند در روند پسا ویرایش به آنها کمک نمایند، شناخت کافی داشته باشند. تقریباً همه پلتفرمهای ترجمه به کمک رایانه (CAT) از پسا ویرایش پشتیبانی میکنند. در اینجا چند ابزار به صورت مختصر معرفی میگردد.
1. با استفاده از ابزار سیستمهای مدیریت ترمینولوژی (terminology management systems) میتوانید به ویراستاران اطمینان دهید که کار آنها از انسجام کافی برخوردار است. این سیستمها شامل حافظه ترجمه (translation memories)، پایگاه اصطلاحات (term bases) و اسناد مرجع مفید است. تمامی این موارد باید برای استفاده در پروژههای بعدی به روز شوند.
2. از ابزار برآورد کیفی ترجمه ماشینی (Machine Translation Quality Estimation) کمک بگیرید. این ابزار مجهز به هوش مصنوعی است که در ویرایشگر Memsource Editor وجود دارد و میتواند تمامی خروجیهای ترجمه ماشینی را از نظر کیفی امتیازبندی نماید، و به سردبیران نشان دهد که هر بخش به چه میزان کار نیاز دارد. این ابزار میتواند در زمینه شناسایی بخشهایی که برای ویرایش باید در اولویت قرار گیرند به زبانشناسان و مدیران پروژهها کمک نماید.
3. از یک ابزار QA جامع یا مستقل استفاده کنید. این ابزارها به شما کمک مینمایند تا هر مسئلهای که در خروجی اصلی نادیده گرفته میشود یا خطاهای جدیدی که مرتبط با مرحله پسا ویرایش هستند را به شکلی فعالانه شناسایی کنید.
شیوه کاری سرویس پسا ویرایش ترجمه ماشینی
آموزشها و قابلیتهای فرآیند پسا ویرایش
یکی از اولین مواردیکه باید مد نظر قرار گیرد، پرداختن به تصورات غلط درباره سرویسهای پسا ویرایش ترجمه ماشینی است: ویراستار پسا ویرایش، مترجم نیست. هر چند ماهیت کاری که انجام میدهد به گونهای با ترجمه همپوشانی دارد؛ اما مهارتهای دقیق مورد نیاز یک ویراستار از چند جهت با مترجم متفاوت است.
همیشه بهترین نتایج زمانی به دست میآیند که از وجود ویراستاران باتجربه و واجد شرایط در فرآیند پسا ویرایش بهره گرفته شود. ویراستار پسا ویرایش ایدهآل باید تجربه کار عملی در جفتهای زبانی مشخص با مطالب خاص و ابزارهای مربوطه را داشته باشد. از اینرو آموزش ویرایشگران برای انجام کارهای خاص قبل از شروع پروژهها میتواند بسیار کمککننده تلقی گردد.
حتما بخوانيد: تفاوت میان ترجمه ماشینی و ترجمه انسانی
شیوههای ارتقاء پسا ویرایش ترجمه ماشینی
به منظور ارتقاء نتایج روش پسا ویرایش ترجمه ماشینی میبایست روند کار و نتایج با استفاده از دادهها و بازخوردها به صورت مستمر ارزیابی شوند. فرآیند پسا ویرایش را یک فرآیند تکراری در نظر بگیرید که با گذشت زمان و کسب تجربه بهبود پیدا می کند.
ابزارهای زیادی برای کمک به تحلیل پسا ویرایش در دسترس هستند. مثلا ابزار ویرایشگر Memsource، کار لازم بعد از فرآیند پسا ویرایش را محاسبه میکند؛ از اینرو به زبانشناسان نشان میدهد که برای نهایی کردن متن ترجمه به چه مقدار کار نیاز دارند. این اطلاعات میتوانند جزئیات لازم را به تفصیل شرح دهند. دانستن اینکه چه بخشهای خاصی به میزان نامتوازنی از پسا ویرایش نیازمند هستند، میتواند به روند پروژههای بعدی بسیار کمک کند: شاید لازم باشد تا متن اصلی را به گونهای با روند کار مطابقت داد و یا اینکه اسناد مرجع مفید در اختیار ویراستاران پسا ویرایش قرار گیرد.
در کنار جمعآوری اطلاعات، جستجوی فعالانه بازخورد از همه ذینفعان نیز بسیار ارزشمند است. ذینفعان شامل تولید کنندگان محتوا، ویرایشگران پستا ویرایش، مشتریها و مدیران پروژهها هستند. درباره تجربیاتشان در خلال کار با پروژه از آنها سئوال کنید، مشخص نمایید که چه عواملی در روند کار موثر بودهاند و چه مواردی نیاز به اصلاح دارند.
چشمانداز استفاده از سیستمهای پسا ویرایش ترجمه ماشینی
چشمانداز خدمات ترجمه ماشینی تا سال 2050 نشان میدهد که سرویسهای پسا ویرایش ترجمه ماشینی در سالهای آینده به یک گرایش برتر تبدیل میگردند. ترجمه ماشینی نه تنها برای بسیاری از کسب و کارها (به دلیل سرعت و هزینه آن) جذاب است؛ بلکه شواهد زیادی وجود دارد که نشان میدهد استفاده از این نوع ترجمه و اصلاح آن با سرویس PEMT، سریعتر (و در نتیجه مقرون به صرفهتر) از ترجمه متن از همان ابتداست.
دانشگاههای گرونینگن (Groningen) هلند و دوبلین سیتی (Dublin City) ایرلند بر روی یک فصل از رمان جنگشکن (Warbreaker)، نوشته براندون ساندرسون تحقیق انجام دادهاند. آنها سه روش ترجمه، یعنی ترجمه از ابتدا، پسا ویرایش آماری مبتنی بر عبارت ترجمه ماشینی و پسا ویرایش ترجمه ماشینی عصبی را با هم مقایسه نمودهاند.
نتایج این مطالعه نشان میدهد که استفاده از روش پسا ویرایش آماری مبتنی بر عبارت ترجمه ماشینی باعث افزایش بهرهوری ترجمه به میزان 18% میشود؛ در حالیکه کارآیی روش پسا ویرایش ترجمه ماشینی عصبی 36% بالاتر از روش ترجمه از ابتدا است.
علاوه بر این، استفاده از هر دو روش ترجمه ماشینی باعث شده است تا مترجمان در طول کار خود کمتر نیاز به زمان استراحت داشته باشند (29% در روش پسا ویرایش آماری مبتنی بر عبارت و 42% در روش پسا ویرایش ترجمه ماشینی عصبی). اما زمان این استراحتها طولانیتر از زمان استراحت بین ترجمه از ابتدا بود؛ زمان استراحت روش مبتنی بر عبارت و ترجمه ماشینی به ترتیب 14% و 25% از ترجمه از ابتدا طولانیتر اندازهگیری شده است.
این ارقام باعث میشوند تا این رویه ارزش بیشتری پیدا کند؛ بنابراین کسب و کارها بیشتر تمایل دارند تا ترجمه ماشینی را با سرویسهای پسا ویرایش ترکیب کنند. درست است که ترجمههای تولید شده توسط ماشین کامل و بی عیب نیستند؛ اما باید قبول کرد که فناوری به اندازهای پیشرفت کرده که باعث شده استفاده از ماشین و انسان در روند ترجمه غالباً سریعتر از اتکا به ترجمه صرفاً انسانی باشد.
در ادامه حتما بخوانيد: معرفی 4 سیستم ترجمه ماشینی