بهترین روش‌ های پسا ویرایش ترجمه ماشینی

ترجمه ماشینی (MT) روز به روز در حال پیشرفت است و همواره به سمت ارزان‌تر، سریع‌تر و دقیق‌تر شدن گام بر می‌دارد. با این حال این نوع برگردان برای رسیدن به کیفیت مترجمین انسانی هنوز باید راه طولانی را طی نماید. سرویس‌ های پسا ویرایش ترجمه ماشینی (PEMT) به ترکیب بهترین‌های هر دو نوع خدمات زبانی کمک می‌کنند: آنها سرعت و توانایی موتورهای هوش مصنوعی که قادرند سریعاً حجم بالایی از متون را مدیریت کنند، با حساسیت و مهارت زبان‌ شناسان آموزش دیده ترکیب می‌نمایند. اگر قصد دارید تا روش‌ های پسا ویرایش را در جریان کار ترجمه به‌ کار بگیرید؛ در ادامه با شبکه مترجمین راستین همراه باشید.

 

مراحل آماده‌ سازی استفاده از پسا ویرایش ترجمه ماشینی

شاید مهمترین چیزیکه باید از همان ابتدا مد نظر داشته باشید؛ مطمئن شدن از خروجی MT است. هر چه خروجی بهتر باشد؛ مرحله پسا ویرایش به کار کمتری احتیاج دارد و همین خود منجر به سریعتر شدن روند کار و کاهش هزینه می‌‌گردد. در این مرحله باید به دو نکته مهم توجه داشته باشید:

 

1. کار خود را با متن اصلی شروع کنید

همانند هر روش ترجمه دیگری باید ابتدا متن اصلی با دقت آماده شده و یا پیش ویرایش گردد؛ در این صورت می‌توان مطمئن شد که ویرایشگران و موتورهای هوش مصنوعی به نحو احسن کار خود را انجام می‌دهند. خطاهای اولیه ممکن است بسیار پیچیده باشند و باعث به وجود آمدن مشکلاتی گردند. به همین دلیل در ابتدای کار تا جاییکه ممکن است باید مطمئن شوید که متن اصلی فاقد اشتباهات املایی و نگارشی است. واژه‌های متن و فرمت آن باید با هم متناسب باشند. متن باید به گونه‌ای باشد که گویا قرار است کاملاً توسط مترجم انسانی مدیریت شود.

اگر قصد دارید به بهترین نتیجه دست پیدا کنید؛ باید متن خود را مخصوص MT آماده نمایید. هر چند که روند ترجمه ماشینی سریعاً در حال بهبود است؛ اما می‌توانید با برداشتن گام هایی به افزایش کیفیت خروجی کمک نمایید. به طور کلی هر چه متن ورودی مختصرتر و شفاف‌تر باشد؛ عملکرد آن بهتر خواهد بود. یک جمله ایده‌آل باید کمتر از 20 کلمه و حاوی دستور زبانی ساده‌ای باشد. جملات پیچیده و یا تکه جملات تیتر‌وار برای این ابزار مناسب نیستند.

رویکرد ترجمه ماشینی به گونه‌ای است که بیشتر به اختلافات جزئی توجه دارد و تا حد ممکن به سمت برگردان تحت‌اللفظی متمایل است. در هنگام آماده‌سازی متن از نوشتن جملات کنایه‌آمیز اجتناب کنید (موتورهای MT قادر به تعبیر آنها نیستند). از جملاتی که در قالب نفی اندر نفی نوشته شده‌اند، خودداری نمایید (نرم‌افزارها قادر نیستند آنها را به درستی معنی کنند) و در صورت امکان تاریخ‌ها را در فرمت‌های غیر عددی آماده کنید. مثلا تاریخ 1399/08/11 ممکن است برای ماشین مبهم باشد: بهتر است بنویسید یازدهم آبان سال 1399.

 

 

2. بهترین ابزار ترجمه را انتخاب نمایید

ابزارهای MT زیادی وجود دارند که به طور پیوسته به تعداد و کیفیت آنها افزوده می‌شود. همه آنها مثل هم نیستند؛ عملکرد برخی نسبت به سایرین بسیار برتر است. چالش‌های مترجم هوش مصنوعی باعث گردیده تا برخی از آنها برای معدودی از جفت‌ های زبانی مناسب نباشند؛ با این حال بعضی فقط برای موضوعات خاصی عملکرد خوبی دارند. با انتخاب مناسب‌ترین ابزار برای پروژه‌‌تان میتوانید در وقت و تلاش خود صرفه جویی کنید.

طیفی از موتورهای عمومی ترجمه ماشینی را در نظر بگیرید و آنها را با استفاده از نمونه متن‌ها یا تجربیات گذشته‌تان ارزیابی نمایید. هر چند که تدوین یک روش تحلیل سفارشی ممکن است گزینه‌ای زمان‌بر باشد؛ اما می‌تواند در بلند مدت به راه‌حل‌های مقرون به صرفه‌ای بیانجامد. گزینه دیگری که بهتر است گوشه چشمی به آن داشته باشید؛ در نظر گرفتن یک ابزار ترجمه سفارشی است که با استفاده از داده‌های خودتان آن را آموزش داده اید. این مسئله در کل باعث می‌شود تا بتوانید به نتایج مناسب‌تری در زمینه مطالبی که عادتاً با آنها کار می‌کنید، دست بیابید.

ابزار Memsource Translate به شما کمک می‌کند تا بهترین نوع MT را انتخاب کنید. این ابزار توسط گروه هوش مصنوعی (AI) شرکت Memsource ارائه شده و به صورت پویا بهترین نوع موتور را برای ترجمه محتوای سایت و متون مشابه انتخاب می‌کند. این ابزار دامنه منبع متن و زبان مقصد را در نظر می‌گیرد، و براساس عملکرد قبلی به دنبال مناسبترین راهکار زبانی می‌گردد.

 

پسا ویرایش ترجمه ماشینی

  پسا ویرایش ترجمه ماشینی (Post Editing Machine Translation)  

 

استراتژی‌ های پسا ویرایش ترجمه ماشینی

بعد از اینکه موتور به ترجمه متن اقدام نمود؛ مرحله پسا ویرایش آغاز می‌شود. اینکه این روند چقدر طول می‌کشد، از پروژه‌ای به پروژه دیگر متفاوت است؛ بنابراین باید از همان اول انتظارات تان را مشخص کنید. سه عامل اصلی در این زمینه؛ زمان، کیفیت و هزینه هستند. با اتخاذ یک رویکرد مناسب می‌توانید استراتژی پسا ویرایش خود را تدوین نمایید.

 

روش پسا ویرایش جزئی (LPE)

در پسا ویرایش جزئی (Light Post-editing)، خروجی موتور MT تنها در صورت لزوم اصلاح می‌گردد. هدف از این کار مطمئن شدن از خوانایی متن خروجی است و اینکه متن برگردان شده، معنی دقیق سند منبع را به ذهن متبادر کند. ویرایشگر متن در LPE به دنبال خطاهایی می‌گردد که مانعی بر سر درک مقصود متن اصلی هستند و یا اینکه کاملاً بالعکس ترجمه شده‌اند. اگر نتایج خام یک موتور جستجو مورد بازبینی قرار نگیرد؛ نتایج شرم‌آوری به بار می‌آید. در این روش ویراستار می‌خواهد تا متن معنی شده را در حد نیاز و بسیار کم ویرایش نماید؛ بنابراین نتایج اغلب سریع و مقرون به صرفه هستند.

 

روش پسا ویرایش کامل (FPE)

خروجی موتور MT به صورت جامع در پسا ویرایش کامل (Full Post-editing) مورد بررسی قرار می‌گیرد تا از عدم وجود هیچگونه خطایی اطمینان حاصل شود. روش LPE بر ضروریات یک متن مثل دقت و خوانایی آن متمرکز می‌شود؛ در حالیکه FPE چندین عامل را در نظر می‌گیرد که تعدادی از آنها عبارتند از:

  • تناسب سبک و لحن در متن (و با سایر اسناد مرتبط)
  • عدم وجود هرگونه خطای دستوری
  • متناسب کردن متن با فرهنگ زبان مقصد (مانند اصطلاحات کنایه‌ای).

بنابراین بعد از اعمال پسا ویرایش کامل، متن باید به گونه‌ای باشد که بتواند خواننده را متقاعد کرده و به وی بفهماند که از همان ابتدا به زبان مقصد نوشته شده است. این روش کندتر و گران‌تر از LPE است؛ اما خروجی آن قطعاً کیفیت بسیار بالاتری دارد.

 

استراتژی مختص پروژه

پیش‌نیازها همیشه باید متناسب با یک پروژه خاص تعریف گردند. با این طرز تفکر به روش‌های پسا ویرایش جزئی و کامل به جای انتخاب‌های باینری توجه کنید؛ قطعاً این نوع دیدگاه بسیار مفید خواهد بود. اولویت‌های پسا ویرایش را براساس عواملی مانند زمان، هزینه و کیفیت مطلوب، گلچین و انتخاب نمایید. این کار می‌تواند در زمینه اولویت‌بندی و انتخاب برخی از بخش‌ها که ارزش تجاری بالاتری نسبت به بقیه دارند، بسیار موثر باشد.

گزینه دیگری که باید در نظر گرفت؛ کنار گذاشتن پسا ویرایش به صورت کامل است. در برخی از پروژه‌ها این امکان وجود دارد؛ مثلا در زمینه ترجمه اسناد داخل سازمانی به نظر می‌رسد که MT کفایت می‌کند و عواقب برگردان نامناسب نیز قابل اغماض است.

 

 

ابزارهای پسا ویرایش

ویراستاران و مدیران باید نسبت به ابزارهای مختلفی که می‌توانند در روند پسا ویرایش به آنها کمک نمایند، شناخت کافی داشته باشند. تقریباً همه پلتفرم‌های ترجمه به کمک رایانه (CAT) از این فرآیند پشتیبانی می‌کنند. در اینجا چند ابزار به صورت مختصر معرفی می‌گردد.

1. با استفاده از ابزار سیستم‌های مدیریت ترمینولوژی می‌توانید به ویراستاران اطمینان دهید که کار آنها از انسجام کافی برخوردار است. این سیستم‌ها شامل حافظه ترجمه (Translation Memories)، پایگاه اصطلاحات (Term Bases) و اسناد مرجع مفید است. تمامی این موارد باید برای استفاده در پروژه‌های بعدی به روز شوند.

2. از ابزار برآورد کیفی ترجمه ماشینی (Machine Translation Quality Estimation) کمک بگیرید. این ابزار مجهز به هوش مصنوعی است که در ویرایشگر Memsource Editor وجود دارد و می‌تواند تمامی خروجی‌های MT را از نظر کیفی امتیازبندی نماید، و به سردبیران نشان دهد که هر بخش به چه میزان کار نیاز دارد. این ابزار می‌تواند در زمینه شناسایی بخش‌هایی که برای ویرایش باید در اولویت قرار گیرند به زبان‌شناسان و مدیران پروژه‌ها کمک نماید.

3. از یک ابزار QA جامع یا مستقل استفاده کنید. آنها به شما کمک می‌نمایند تا هر مسئله‌ای که در خروجی اصلی نادیده گرفته می‌شود یا خطاهای جدیدی که مرتبط با مرحله پسا ویرایش هستند را به شکلی فعالانه شناسایی کنید.

 

ترجمه ماشینی | ترجمه انسانی

سرویس پسا ویرایش ترجمه ماشینی  

 

آموزش‌ ها و قابلیت‌ های فرآیند پسا ویرایش

یکی از اولین مواردیکه باید مد نظر قرار گیرد، پرداختن به تصورات غلط درباره سرویس‌های پسا ویرایش ترجمه ماشینی است: ویراستار این فرآیند، مترجم نیست. هر چند ماهیت کاری که انجام می‌دهد به گونه‌ای با ترجمه همپوشانی دارد؛ اما مهارت‌های دقیق مورد نیاز یک ویراستار از چند جهت با متخصص خدمات زبانی متفاوت است.

همیشه بهترین نتایج زمانی به دست می‌آیند که از وجود ویراستاران باتجربه و واجد شرایط در فرآیند پسا ویرایش بهره گرفته شود. ویراستار ایده‌آل باید تجربه کار عملی در جفت‌های زبانی مشخص با مطالب خاص و ابزارهای مربوطه را داشته باشد. از این‌رو آموزش ویرایشگران برای انجام کارهای خاص قبل از شروع پروژه‌ها می‌تواند بسیار کمک‌ کننده تلقی گردد.

 

 

شیوه‌ های ارتقاء پسا ویرایش ترجمه ماشینی

به منظور ارتقاء نتایج روش پسا ویرایش ترجمه ماشینی می‌بایست روند کار و نتایج با استفاده از داده‌ها و بازخوردها به صورت مستمر ارزیابی شوند. فرآیند پسا ویرایش را یک فرآیند تکراری در نظر بگیرید که با گذشت زمان و کسب تجربه بهبود پیدا می کند.

ابزارهای زیادی برای کمک به تحلیل پسا ویرایش در دسترس هستند. مثلا ابزار ویرایشگر Memsource، کار لازم بعد از فرآیند پسا ویرایش را محاسبه می‌کند؛ از اینرو به زبان‌شناسان نشان می‌دهد که برای نهایی کردن متن ترجمه به چه مقدار کار نیاز دارند. این اطلاعات می‌توانند جزئیات لازم را به تفصیل شرح دهند. دانستن اینکه چه بخش‌های خاصی به میزان نامتوازنی از پسا ویرایش نیازمند هستند، می‌تواند به روند پروژه‌های بعدی بسیار کمک کند: شاید لازم باشد تا متن اصلی را به گونه‌ای با روند کار مطابقت داد و یا اینکه اسناد مرجع مفید در اختیار ویراستاران پسا ویرایش قرار گیرد.

در کنار جمع‌آوری اطلاعات، جستجوی فعالانه بازخورد از همه ذینفعان نیز بسیار ارزشمند است. ذینفعان شامل تولید کنندگان محتوا، ویرایشگران پستا ویرایش، مشتری‌ها و مدیران پروژه‌ها هستند. درباره تجربیات‌شان در خلال کار با پروژه از آنها سئوال کنید، مشخص نمایید که چه عواملی در روند کار موثر بوده‌اند و چه مواردی نیاز به اصلاح دارند.

 

چشم‌ انداز استفاده از سیستم‌ های پسا ویرایش ترجمه ماشینی

چشم‌انداز خدمات ترجمه تا سال 2050 نشان می‌دهد که سرویس‌های مذکور در سال‌های آینده به یک گرایش برتر تبدیل می‌گردند. MT نه تنها برای بسیاری از کسب و کارها (به دلیل سرعت و هزینه آن) جذاب است؛ بلکه شواهد زیادی وجود دارد که نشان می‌دهد استفاده از آن و اصلاح با سرویس PEMT، سریعتر (و در نتیجه مقرون به صرفه‌تر) از برگردان متن از همان ابتداست.

دانشگاه‌های گرونینگن (Groningen) هلند و دوبلین سیتی (Dublin City) ایرلند بر روی یک فصل از رمان جنگ‌ شکن (Warbreaker)، نوشته براندون ساندرسون تحقیق انجام داده‌اند. آنها سه روش؛ یعنی ترجمه از ابتدا، پسا ویرایش آماری مبتنی بر عبارت ترجمه ماشینی و پسا ویرایش ترجمه ماشینی عصبی (PENMT) را با هم مقایسه نموده‌اند. نتایج این مطالعه نشان می‌دهد که استفاده از روش پسا ویرایش آماری مبتنی بر عبارت ترجمه ماشینی باعث افزایش بهره‌وری به میزان 18% می‌شود؛ در حالیکه کارآیی PENMT در حدود 36% بالاتر از روش نخست است.

علاوه بر این، استفاده از هر دو روش MT باعث شده تا مترجمان در طول کار خود کمتر نیاز به زمان استراحت داشته باشند (29% در پسا ویرایش آماری مبتنی بر عبارت و 42% در PENMT). اما زمان این استراحت‌ها طولانی‌تر از زمان استراحت بین ترجمه از ابتدا بود؛ زمان استراحت روش مبتنی بر عبارت ترجمه ماشینی و PENMT به ترتیب 14% و 25% طولانی تر از ترجمه از ابتدا اندازه‌گیری شده است.

 

کلام پایانی

ارقام مذکور باعث می‌شوند تا این رویه ارزش بیشتری پیدا کند؛ بنابراین کسب و کارها بیشتر تمایل دارند تا ترجمه ماشینی را با سرویس‌ های پسا ویرایش ترکیب کنند. درست است که ترجمه‌های تولید شده توسط ماشین کامل و بی عیب نیستند؛ اما باید قبول کرد که فناوری به اندازه‌ای پیشرفت کرده که باعث شده تا استفاده از ماشین و انسان در روند خدمات زبانی غالباً سریع‌تر از اتکا به ترجمه صرفاً انسانی باشد.