بهترین روش‌های پسا ویرایش ترجمه ماشینی

ترجمه ماشینی (MT) روز به روز در حال پیشرفت است و همواره به سمت ارزان‌تر، سریع‌تر و دقیق‌تر شدن گام بر می‌دارد. با این حال این نوع ترجمه برای رسیدن به کیفیت ترجمه انسانی هنوز باید راه طولانی را طی نماید. سرویس‌های پسا ویرایش ترجمه ماشینی (PEMT) به ترکیب بهترین‌های هر دو نوع ترجمه کمک می‌کنند: آنها سرعت و توانایی موتورهای ترجمه ماشینی که قادرند سریعاً حجم بالایی از متون را مدیریت کنند با حساسیت و مهارت زبان‌شناسان آموزش دیده ترکیب می‌نمایند. اگر قصد دارید تا روش‌های پسا ویرایش را در جریان کار ترجمه به‌ کار بگیرید، در ادامه با شبکه مترجمین راستین همراه باشید.

 

مراحل آماده‌سازی برای استفاده از پسا ویرایش ترجمه ماشینی

شاید مهمترین چیزی که باید از همان ابتدا مد نظر داشته باشید، مطمئن شدن از خروجی مرحله ترجمه ماشینی است. هر چه خروجی مرحله ترجمه ماشینی بهتر باشد، مرحله پسا ویرایش به کار کمتری احتیاج دارد و همین خود منجر به سریعتر شدن روند کار و کاهش هزینه ترجمه می‌‌گردد. در این مرحله باید به دو نکته مهم توجه داشته باشید:

 

1. کار خود را با متن اصلی شروع کنید:

در این روش ترجمه همانند هر روش ترجمه دیگری ابتدا باید متن اصلی با دقت آماده شده و یا پیش ویرایش گردد؛ در این صورت می‌توان مطمئن شد که ویرایشگران و موتورهای ترجمه کار خود را به نحو احسن انجام می‌دهند. خطاهای اولیه ممکن است بسیار پیچیده باشند و باعث به وجود آمدن مشکلاتی گردند. به همین دلیل در ابتدای کار تا جاییکه ممکن است باید مطمئن شوید که متن اصلی فاقد اشتباهات املایی و نگارشی است. واژه‌های متن و فرمت آن باید با هم متناسب باشند. متن باید به گونه‌ای باشد که گویا قرار است کاملاً توسط مترجم انسانی مدیریت شود.

اگر قصد دارید به بهترین نتیجه دست پیدا کنید باید متن خود را مخصوص ترجمه ماشینی آماده نمایید. هر چند که روند ترجمه ماشینی سریعاً در حال بهبود است؛ اما می‌توانید با برداشتن گام هایی به افزایش کیفیت خروجی کمک نمایید. به طور کلی هر چه متن ورودی در ترجمه ماشینی مختصرتر و شفاف‌تر باشد، عملکرد آن بهتر خواهد بود. یک جمله ایده‌آل باید کمتر از 20 کلمه و حاوی دستور زبانی ساده‌ای باشد. جملات پیچیده و یا تکه جملات تیتر‌وار برای ترجمه ماشینی مناسب نیستند.

رویکرد ترجمه ماشینی به گونه‌ای است که بیشتر به اختلافات جزئی توجه دارد و تا حد ممکن به سمت ترجمه تحت‌اللفظی متمایل است. در هنگام آماده‌سازی متن از نوشتن جملات کنایه‌آمیز اجتناب کنید (موتورهای ترجمه ماشینی قادر به تعبیر آنها نیستند). از جملاتی که در قالب نفی اندر نفی نوشته شده‌اند، خودداری نمایید (نرم‌افزارهای ترجمه قادر نیستند آنها را به درستی ترجمه کنند) و در صورت امکان تاریخ‌ها را در فرمت‌های غیر عددی آماده کنید. مثلا تاریخ 1399/08/11 ممکن است برای ماشین مبهم باشد: بهتر است بنویسید یازدهم آبان سال 1399.

 

حتما بخوانيد: پروکسی ترجمه

 

2. بهترین موتور ترجمه را انتخاب نمایید:

موتورهای ترجمه ماشینی زیادی وجود دارند که به طور پیوسته به تعداد و کیفیت آنها افزوده می‌شود. همه موتورها با هم برابر نیستند، عملکرد برخی از آنها نسبت به سایرین بسیار برتر است. چالش‌های ترجمه هوش مصنوعی باعث گردیده تا برخی از آنها برای معدودی از جفت‌های زبانی مناسب نباشند، با این حال بعضی فقط برای موضوعات خاصی عملکرد خوبی دارند. شما می‌توانید با انتخاب مناسب‌ترین موتور برای پروژه‌‌تان در وقت و تلاش خود صرفه جویی کنید.

طیفی از موتورهای عمومی ترجمه ماشینی را در نظر بگیرید و آنها را با استفاده از نمونه متن‌ها یا تجربیات گذشته‌تان ارزیابی نمایید. هر چند که تدوین یک روش تحلیل سفارشی ممکن است گزینه‌ای زمان‌بر باشد؛ اما می‌تواند در بلند مدت به راه‌حل‌های مقرون به صرفه‌ای بیانجامد. گزینه دیگری که بهتر است گوشه چشمی به آن داشته باشید، در نظر گرفتن یک موتور ترجمه سفارشی است که با استفاده از داده‌های خودتان آن را آموزش داده اید. این مسئله در کل باعث می‌شود تا بتوانید به نتایج مناسب‌تری در زمینه مطالبی که عادتاً با آنها کار می‌کنید، دست بیابید.

ابزار Memsource Translate به شما کمک می‌کند تا بهترین موتور ترجمه ماشینی را انتخاب کنید. این ابزار توسط گروه هوش مصنوعی (AI) شرکت Memsource ارائه شده است و به صورت پویا بهترین موتور نوع ترجمه ماشینی را برای ترجمه محتوای سایت و متون مشابه انتخاب می‌کند. این ابزار دامنه منبع متن و زبان مقصد را در نظر می‌گیرد و براساس عملکرد قبلی به دنبال بهترین موتور ترجمه ماشینی می‌گردد.

 

پسا ویرایش ترجمه ماشینی

  پسا ویرایش ترجمه ماشینی (post editing machine translation)  

 

استراتژی‌های پسا ویرایش ترجمه ماشینی

بعد از اینکه موتور به ترجمه متن اقدام نمود، مرحله پسا ویرایش متن آغاز می‌شود. این که روند پسا ویرایش چقدر طول می‌کشد از پروژه‌ای به پروژه دیگر متفاوت است؛ بنابراین باید از همان اول انتظارات خود را مشخص کنید. سه عامل اصلی در این زمینه، زمان، کیفیت و هزینه هستند. با اتخاذ یک رویکرد مناسب می‌توانید استراتژی پسا ویرایش خود را تدوین نمایید.

 

روش پسا ویرایش جزئی (LPE)

در روش پسا ویرایش جزئی (Light Post-editing)، خروجی موتور ترجمه ماشینی تنها در صورت لزوم اصلاح می‌گردد. هدف از این کار مطمئن شدن از خوانایی متن خروجی است و اینکه متن ترجمه شده معنی دقیق سند منبع را به ذهن متبادر کند. در این روش، ویرایشگر متن به دنبال خطاهایی می‌گردد که مانعی بر سر درک مقصود متن اصلی هستند و یا اینکه کاملاً بلعکس ترجمه شده‌اند. اگر نتایج خام یک موتور جستجو مورد بازبینی قرار نگیرد، نتایج شرم‌آوری به بار می‌آید. در این روش ویراستار می‌خواهد تا متن ترجمه شده را در حد نیاز و بسیار کم ویرایش نماید؛ بنابراین نتایج این روش اغلب سریع و مقرون به صرفه هستند.

 

روش پسا ویرایش کامل (FPE)

در روش پسا ویرایش کامل (Full Post-editing)، خروجی موتور ترجمه ماشینی به صورت کامل بررسی می‌گردد تا از عدم وجود هیچگونه خطایی اطمینان حاصل شود. روش LPE بر ضروریات یک متن مثل دقت و خوانایی آن متمرکز می‌شود، در حالیکه روش FPE چندین عامل را در نظر می‌گیرد که تعدادی از آنها عبارتند از:

  • تناسب سبک و لحن در متن (و با سایر اسناد مرتبط)
  • عدم وجود هرگونه خطای دستوری
  • متناسب کردن متن با فرهنگ زبان مقصد (مانند اصطلاحات کنایه‌ای)

بنابراین بعد از اعمال روش پسا ویرایش کامل، متن باید به گونه‌ای باشد که بتواند خواننده را متقاعد کرده و به وی بفهماند که متن از همان ابتدا به زبان مقصد نوشته شده است. این روش کندتر و گران‌تر از روش LPE است؛ اما خروجی آن قطعاً کیفیت بسیار بالاتری دارد.

 

استراتژی مختص پروژه

پیش‌نیازها همیشه باید متناسب با یک پروژه ترجمه خاص تعریف گردند. با این طرز تفکر به روش‌های پسا ویرایش جزئی و کامل به جای انتخاب‌های باینری توجه کنید؛ قطعاً این نوع دیدگاه بسیار مفید خواهد بود. اولویت‌های پسا ویرایش را براساس عواملی مانند زمان، هزینه و کیفیت مطلوب، گلچین و انتخاب نمایید. این کار می‌تواند در زمینه اولویت‌بندی و انتخاب برخی از بخش‌ها که ارزش تجاری بالاتری نسبت به بقیه دارند، بسیار موثر باشد.

گزینه دیگری که باید در نظر گرفت کنار گذاشتن پسا ویرایش به صورت کامل است. در برخی از پروژه‌ها این امکان وجود دارد؛ مثلا در زمینه ترجمه اسناد داخل سازمانی به نظر می‌رسد که ترجمه ماشینی کفایت می‌کند و عواقب ترجمه نامناسب نیز قابل اغماض است.

 

 

ابزارهای پسا ویرایش

ویراستاران و مدیران باید نسبت به ابزارهای مختلفی که می‌توانند در روند پسا ویرایش به آنها کمک نمایند، شناخت کافی داشته باشند. تقریباً همه پلتفرم‌های ترجمه به کمک رایانه (CAT) از پسا ویرایش پشتیبانی می‌کنند. در اینجا چند ابزار به صورت مختصر معرفی می‌گردد.

1. با استفاده از ابزار سیستم‌های مدیریت ترمینولوژی (terminology management systems) می‌توانید به ویراستاران اطمینان دهید که کار آنها از انسجام کافی برخوردار است. این سیستم‌ها شامل حافظه ترجمه (translation memories)، پایگاه اصطلاحات (term bases) و اسناد مرجع مفید است. تمامی این موارد باید برای استفاده در پروژه‌های بعدی به روز شوند.

2. از ابزار برآورد کیفی ترجمه ماشینی (Machine Translation Quality Estimation) کمک بگیرید. این ابزار مجهز به هوش مصنوعی است که در ویرایشگر Memsource Editor وجود دارد و می‌تواند تمامی خروجی‌های ترجمه ماشینی را از نظر کیفی امتیازبندی نماید، و به سردبیران نشان دهد که هر بخش به چه میزان کار نیاز دارد. این ابزار می‌تواند در زمینه شناسایی بخش‌هایی که برای ویرایش باید در اولویت قرار گیرند به زبان‌شناسان و مدیران پروژه‌ها کمک نماید.

3. از یک ابزار QA جامع یا مستقل استفاده کنید. این ابزارها به شما کمک می‌نمایند تا هر مسئله‌ای که در خروجی اصلی نادیده گرفته می‌شود یا خطاهای جدیدی که مرتبط با مرحله پسا ویرایش هستند را به شکلی فعالانه شناسایی کنید.

 

ترجمه ماشینی | ترجمه انسانی

  شیوه کاری سرویس پسا ویرایش ترجمه ماشینی  

 

آموزش‌ها و قابلیت‌های فرآیند پسا ویرایش

یکی از اولین مواردیکه باید مد نظر قرار گیرد، پرداختن به تصورات غلط درباره سرویس‌های پسا ویرایش ترجمه ماشینی است: ویراستار پسا ویرایش، مترجم نیست. هر چند ماهیت کاری که انجام می‌دهد به گونه‌ای با ترجمه همپوشانی دارد؛ اما مهارت‌های دقیق مورد نیاز یک ویراستار از چند جهت با مترجم متفاوت است.

همیشه بهترین نتایج زمانی به دست می‌آیند که از وجود ویراستاران باتجربه و واجد شرایط در فرآیند پسا ویرایش بهره گرفته شود. ویراستار پسا ویرایش ایده‌آل باید تجربه کار عملی در جفت‌های زبانی مشخص با مطالب خاص و ابزارهای مربوطه را داشته باشد. از این‌رو آموزش ویرایشگران برای انجام کارهای خاص قبل از شروع پروژه‌ها می‌تواند بسیار کمک‌کننده تلقی گردد.

 

 

شیوه‌های ارتقاء پسا ویرایش ترجمه ماشینی

به منظور ارتقاء نتایج روش پسا ویرایش ترجمه ماشینی می‌بایست روند کار و نتایج با استفاده از داده‌ها و بازخوردها به صورت مستمر ارزیابی شوند. فرآیند پسا ویرایش را یک فرآیند تکراری در نظر بگیرید که با گذشت زمان و کسب تجربه بهبود پیدا می کند.

ابزارهای زیادی برای کمک به تحلیل پسا ویرایش در دسترس هستند. مثلا ابزار ویرایشگر Memsource، کار لازم بعد از فرآیند پسا ویرایش را محاسبه می‌کند؛ از این‌رو به زبان‌شناسان نشان می‌دهد که برای نهایی کردن متن ترجمه به چه مقدار کار نیاز دارند. این اطلاعات می‌توانند جزئیات لازم را به تفصیل شرح دهند. دانستن اینکه چه بخش‌های خاصی به میزان نامتوازنی از پسا ویرایش نیازمند هستند، می‌تواند به روند پروژه‌های بعدی بسیار کمک کند: شاید لازم باشد تا متن اصلی را به گونه‌ای با روند کار مطابقت داد و یا اینکه اسناد مرجع مفید در اختیار ویراستاران پسا ویرایش قرار گیرد.

در کنار جمع‌آوری اطلاعات، جستجوی فعالانه بازخورد از همه ذینفعان نیز بسیار ارزشمند است. ذینفعان شامل تولید کنندگان محتوا، ویرایشگران پستا ویرایش، مشتری‌ها و مدیران پروژه‌ها هستند. درباره تجربیات‌شان در خلال کار با پروژه از آنها سئوال کنید، مشخص نمایید که چه عواملی در روند کار موثر بوده‌اند و چه مواردی نیاز به اصلاح دارند.

 

چشم‌انداز استفاده از سیستم‌های پسا ویرایش ترجمه ماشینی

چشم‌انداز خدمات ترجمه ماشینی تا سال 2050 نشان می‌دهد که سرویس‌های پسا ویرایش ترجمه ماشینی در سال‌های آینده به یک گرایش برتر تبدیل می‌گردند. ترجمه ماشینی نه تنها برای بسیاری از کسب و کارها (به دلیل سرعت و هزینه آن) جذاب است؛ بلکه شواهد زیادی وجود دارد که نشان می‌دهد استفاده از این نوع ترجمه و اصلاح آن با سرویس PEMT، سریعتر (و در نتیجه مقرون به صرفه‌تر) از ترجمه متن از همان ابتداست.

دانشگاه‌های گرونینگن (Groningen) هلند و دوبلین سیتی (Dublin City) ایرلند بر روی یک فصل از رمان جنگ‌شکن (Warbreaker)، نوشته براندون ساندرسون تحقیق انجام داده‌اند. آنها سه روش ترجمه، یعنی ترجمه از ابتدا، پسا ویرایش آماری مبتنی بر عبارت ترجمه ماشینی و پسا ویرایش ترجمه ماشینی عصبی را با هم مقایسه نموده‌اند.

نتایج این مطالعه نشان می‌دهد که استفاده از روش پسا ویرایش آماری مبتنی بر عبارت ترجمه ماشینی باعث افزایش بهره‌وری ترجمه به میزان 18% می‌شود؛ در حالیکه کارآیی روش پسا ویرایش ترجمه ماشینی عصبی 36% بالاتر از روش ترجمه از ابتدا است.

علاوه بر این، استفاده از هر دو روش ترجمه ماشینی باعث شده است تا مترجمان در طول کار خود کمتر نیاز به زمان استراحت داشته باشند (29% در روش پسا ویرایش آماری مبتنی بر عبارت و 42% در روش پسا ویرایش ترجمه ماشینی عصبی). اما زمان این استراحت‌ها طولانی‌تر از زمان استراحت بین ترجمه از ابتدا بود؛ زمان استراحت روش مبتنی بر عبارت و ترجمه ماشینی به ترتیب 14% و 25% از ترجمه از ابتدا طولانی‌تر اندازه‌گیری شده است.

این ارقام باعث می‌شوند تا این رویه ارزش بیشتری پیدا کند؛ بنابراین کسب و کارها بیشتر تمایل دارند تا ترجمه ماشینی را با سرویس‌های پسا ویرایش ترکیب کنند. درست است که ترجمه‌های تولید شده توسط ماشین کامل و بی عیب نیستند؛ اما باید قبول کرد که فناوری به اندازه‌ای پیشرفت کرده که باعث شده استفاده از ماشین و انسان در روند ترجمه غالباً سریع‌تر از اتکا به ترجمه صرفاً انسانی باشد.

 

در ادامه حتما بخوانيد: معرفی 4 سیستم ترجمه ماشینی