بهترین روش های پسا ویرایش ترجمه ماشینی
- 11 آبان 1399
- هوش مصنوعی
ترجمه ماشینی (MT) روز به روز در حال پیشرفت است و همواره به سمت ارزانتر، سریعتر و دقیقتر شدن گام بر میدارد. با این حال این نوع برگردان برای رسیدن به کیفیت مترجمین انسانی هنوز باید راه طولانی را طی نماید. سرویس های پسا ویرایش ترجمه ماشینی (PEMT) به ترکیب بهترینهای هر دو نوع خدمات زبانی کمک میکنند: آنها سرعت و توانایی موتورهای هوش مصنوعی که قادرند سریعاً حجم بالایی از متون را مدیریت کنند، با حساسیت و مهارت زبان شناسان آموزش دیده ترکیب مینمایند. اگر قصد دارید تا روش های پسا ویرایش را در جریان کار ترجمه به کار بگیرید؛ در ادامه با شبکه مترجمین راستین همراه باشید.
مراحل آماده سازی استفاده از پسا ویرایش ترجمه ماشینی
شاید مهمترین چیزیکه باید از همان ابتدا مد نظر داشته باشید؛ مطمئن شدن از خروجی MT است. هر چه خروجی بهتر باشد؛ مرحله پسا ویرایش به کار کمتری احتیاج دارد و همین خود منجر به سریعتر شدن روند کار و کاهش هزینه میگردد. در این مرحله باید به دو نکته مهم توجه داشته باشید:
1. کار خود را با متن اصلی شروع کنید
همانند هر روش ترجمه دیگری باید ابتدا متن اصلی با دقت آماده شده و یا پیش ویرایش گردد؛ در این صورت میتوان مطمئن شد که ویرایشگران و موتورهای هوش مصنوعی به نحو احسن کار خود را انجام میدهند. خطاهای اولیه ممکن است بسیار پیچیده باشند و باعث به وجود آمدن مشکلاتی گردند. به همین دلیل در ابتدای کار تا جاییکه ممکن است باید مطمئن شوید که متن اصلی فاقد اشتباهات املایی و نگارشی است. واژههای متن و فرمت آن باید با هم متناسب باشند. متن باید به گونهای باشد که گویا قرار است کاملاً توسط مترجم انسانی مدیریت شود.
اگر قصد دارید به بهترین نتیجه دست پیدا کنید؛ باید متن خود را مخصوص MT آماده نمایید. هر چند که روند ترجمه ماشینی سریعاً در حال بهبود است؛ اما میتوانید با برداشتن گام هایی به افزایش کیفیت خروجی کمک نمایید. به طور کلی هر چه متن ورودی مختصرتر و شفافتر باشد؛ عملکرد آن بهتر خواهد بود. یک جمله ایدهآل باید کمتر از 20 کلمه و حاوی دستور زبانی سادهای باشد. جملات پیچیده و یا تکه جملات تیتروار برای این ابزار مناسب نیستند.
رویکرد ترجمه ماشینی به گونهای است که بیشتر به اختلافات جزئی توجه دارد و تا حد ممکن به سمت برگردان تحتاللفظی متمایل است. در هنگام آمادهسازی متن از نوشتن جملات کنایهآمیز اجتناب کنید (موتورهای MT قادر به تعبیر آنها نیستند). از جملاتی که در قالب نفی اندر نفی نوشته شدهاند، خودداری نمایید (نرمافزارها قادر نیستند آنها را به درستی معنی کنند) و در صورت امکان تاریخها را در فرمتهای غیر عددی آماده کنید. مثلا تاریخ 1399/08/11 ممکن است برای ماشین مبهم باشد: بهتر است بنویسید یازدهم آبان سال 1399.
حتما بخوانيد: پیچیدگی ترجمه علائم، نمادها و اندازه ها
2. بهترین ابزار ترجمه را انتخاب نمایید
ابزارهای MT زیادی وجود دارند که به طور پیوسته به تعداد و کیفیت آنها افزوده میشود. همه آنها مثل هم نیستند؛ عملکرد برخی نسبت به سایرین بسیار برتر است. چالشهای مترجم هوش مصنوعی باعث گردیده تا برخی از آنها برای معدودی از جفت های زبانی مناسب نباشند؛ با این حال بعضی فقط برای موضوعات خاصی عملکرد خوبی دارند. با انتخاب مناسبترین ابزار برای پروژهتان میتوانید در وقت و تلاش خود صرفه جویی کنید.
طیفی از موتورهای عمومی ترجمه ماشینی را در نظر بگیرید و آنها را با استفاده از نمونه متنها یا تجربیات گذشتهتان ارزیابی نمایید. هر چند که تدوین یک روش تحلیل سفارشی ممکن است گزینهای زمانبر باشد؛ اما میتواند در بلند مدت به راهحلهای مقرون به صرفهای بیانجامد. گزینه دیگری که بهتر است گوشه چشمی به آن داشته باشید؛ در نظر گرفتن یک ابزار ترجمه سفارشی است که با استفاده از دادههای خودتان آن را آموزش داده اید. این مسئله در کل باعث میشود تا بتوانید به نتایج مناسبتری در زمینه مطالبی که عادتاً با آنها کار میکنید، دست بیابید.
ابزار Memsource Translate به شما کمک میکند تا بهترین نوع MT را انتخاب کنید. این ابزار توسط گروه هوش مصنوعی (AI) شرکت Memsource ارائه شده و به صورت پویا بهترین نوع موتور را برای ترجمه محتوای سایت و متون مشابه انتخاب میکند. این ابزار دامنه منبع متن و زبان مقصد را در نظر میگیرد، و براساس عملکرد قبلی به دنبال مناسبترین راهکار زبانی میگردد.
پسا ویرایش ترجمه ماشینی (Post Editing Machine Translation)
استراتژی های پسا ویرایش ترجمه ماشینی
بعد از اینکه موتور به ترجمه متن اقدام نمود؛ مرحله پسا ویرایش آغاز میشود. اینکه این روند چقدر طول میکشد، از پروژهای به پروژه دیگر متفاوت است؛ بنابراین باید از همان اول انتظارات تان را مشخص کنید. سه عامل اصلی در این زمینه؛ زمان، کیفیت و هزینه هستند. با اتخاذ یک رویکرد مناسب میتوانید استراتژی پسا ویرایش خود را تدوین نمایید.
روش پسا ویرایش جزئی (LPE)
در پسا ویرایش جزئی (Light Post-editing)، خروجی موتور MT تنها در صورت لزوم اصلاح میگردد. هدف از این کار مطمئن شدن از خوانایی متن خروجی است و اینکه متن برگردان شده، معنی دقیق سند منبع را به ذهن متبادر کند. ویرایشگر متن در LPE به دنبال خطاهایی میگردد که مانعی بر سر درک مقصود متن اصلی هستند و یا اینکه کاملاً بالعکس ترجمه شدهاند. اگر نتایج خام یک موتور جستجو مورد بازبینی قرار نگیرد؛ نتایج شرمآوری به بار میآید. در این روش ویراستار میخواهد تا متن معنی شده را در حد نیاز و بسیار کم ویرایش نماید؛ بنابراین نتایج اغلب سریع و مقرون به صرفه هستند.
روش پسا ویرایش کامل (FPE)
خروجی موتور MT به صورت جامع در پسا ویرایش کامل (Full Post-editing) مورد بررسی قرار میگیرد تا از عدم وجود هیچگونه خطایی اطمینان حاصل شود. روش LPE بر ضروریات یک متن مثل دقت و خوانایی آن متمرکز میشود؛ در حالیکه FPE چندین عامل را در نظر میگیرد که تعدادی از آنها عبارتند از:
- تناسب سبک و لحن در متن (و با سایر اسناد مرتبط)
- عدم وجود هرگونه خطای دستوری
- متناسب کردن متن با فرهنگ زبان مقصد (مانند اصطلاحات کنایهای).
بنابراین بعد از اعمال پسا ویرایش کامل، متن باید به گونهای باشد که بتواند خواننده را متقاعد کرده و به وی بفهماند که از همان ابتدا به زبان مقصد نوشته شده است. این روش کندتر و گرانتر از LPE است؛ اما خروجی آن قطعاً کیفیت بسیار بالاتری دارد.
استراتژی مختص پروژه
پیشنیازها همیشه باید متناسب با یک پروژه خاص تعریف گردند. با این طرز تفکر به روشهای پسا ویرایش جزئی و کامل به جای انتخابهای باینری توجه کنید؛ قطعاً این نوع دیدگاه بسیار مفید خواهد بود. اولویتهای پسا ویرایش را براساس عواملی مانند زمان، هزینه و کیفیت مطلوب، گلچین و انتخاب نمایید. این کار میتواند در زمینه اولویتبندی و انتخاب برخی از بخشها که ارزش تجاری بالاتری نسبت به بقیه دارند، بسیار موثر باشد.
گزینه دیگری که باید در نظر گرفت؛ کنار گذاشتن پسا ویرایش به صورت کامل است. در برخی از پروژهها این امکان وجود دارد؛ مثلا در زمینه ترجمه اسناد داخل سازمانی به نظر میرسد که MT کفایت میکند و عواقب برگردان نامناسب نیز قابل اغماض است.
حتما بخوانيد: ترجمه و فناوری: دوست یا دشمن؟
ابزارهای پسا ویرایش
ویراستاران و مدیران باید نسبت به ابزارهای مختلفی که میتوانند در روند پسا ویرایش به آنها کمک نمایند، شناخت کافی داشته باشند. تقریباً همه پلتفرمهای ترجمه به کمک رایانه (CAT) از این فرآیند پشتیبانی میکنند. در اینجا چند ابزار به صورت مختصر معرفی میگردد.
1. با استفاده از ابزار سیستمهای مدیریت ترمینولوژی میتوانید به ویراستاران اطمینان دهید که کار آنها از انسجام کافی برخوردار است. این سیستمها شامل حافظه ترجمه (Translation Memories)، پایگاه اصطلاحات (Term Bases) و اسناد مرجع مفید است. تمامی این موارد باید برای استفاده در پروژههای بعدی به روز شوند.
2. از ابزار برآورد کیفی ترجمه ماشینی (Machine Translation Quality Estimation) کمک بگیرید. این ابزار مجهز به هوش مصنوعی است که در ویرایشگر Memsource Editor وجود دارد و میتواند تمامی خروجیهای MT را از نظر کیفی امتیازبندی نماید، و به سردبیران نشان دهد که هر بخش به چه میزان کار نیاز دارد. این ابزار میتواند در زمینه شناسایی بخشهایی که برای ویرایش باید در اولویت قرار گیرند به زبانشناسان و مدیران پروژهها کمک نماید.
3. از یک ابزار QA جامع یا مستقل استفاده کنید. آنها به شما کمک مینمایند تا هر مسئلهای که در خروجی اصلی نادیده گرفته میشود یا خطاهای جدیدی که مرتبط با مرحله پسا ویرایش هستند را به شکلی فعالانه شناسایی کنید.
سرویس پسا ویرایش ترجمه ماشینی
آموزش ها و قابلیت های فرآیند پسا ویرایش
یکی از اولین مواردیکه باید مد نظر قرار گیرد، پرداختن به تصورات غلط درباره سرویسهای پسا ویرایش ترجمه ماشینی است: ویراستار این فرآیند، مترجم نیست. هر چند ماهیت کاری که انجام میدهد به گونهای با ترجمه همپوشانی دارد؛ اما مهارتهای دقیق مورد نیاز یک ویراستار از چند جهت با متخصص خدمات زبانی متفاوت است.
همیشه بهترین نتایج زمانی به دست میآیند که از وجود ویراستاران باتجربه و واجد شرایط در فرآیند پسا ویرایش بهره گرفته شود. ویراستار ایدهآل باید تجربه کار عملی در جفتهای زبانی مشخص با مطالب خاص و ابزارهای مربوطه را داشته باشد. از اینرو آموزش ویرایشگران برای انجام کارهای خاص قبل از شروع پروژهها میتواند بسیار کمک کننده تلقی گردد.
حتما بخوانيد: تفاوت میان ترجمه ماشینی و انسانی
شیوه های ارتقاء پسا ویرایش ترجمه ماشینی
به منظور ارتقاء نتایج روش پسا ویرایش ترجمه ماشینی میبایست روند کار و نتایج با استفاده از دادهها و بازخوردها به صورت مستمر ارزیابی شوند. فرآیند پسا ویرایش را یک فرآیند تکراری در نظر بگیرید که با گذشت زمان و کسب تجربه بهبود پیدا می کند.
ابزارهای زیادی برای کمک به تحلیل پسا ویرایش در دسترس هستند. مثلا ابزار ویرایشگر Memsource، کار لازم بعد از فرآیند پسا ویرایش را محاسبه میکند؛ از اینرو به زبانشناسان نشان میدهد که برای نهایی کردن متن ترجمه به چه مقدار کار نیاز دارند. این اطلاعات میتوانند جزئیات لازم را به تفصیل شرح دهند. دانستن اینکه چه بخشهای خاصی به میزان نامتوازنی از پسا ویرایش نیازمند هستند، میتواند به روند پروژههای بعدی بسیار کمک کند: شاید لازم باشد تا متن اصلی را به گونهای با روند کار مطابقت داد و یا اینکه اسناد مرجع مفید در اختیار ویراستاران پسا ویرایش قرار گیرد.
در کنار جمعآوری اطلاعات، جستجوی فعالانه بازخورد از همه ذینفعان نیز بسیار ارزشمند است. ذینفعان شامل تولید کنندگان محتوا، ویرایشگران پستا ویرایش، مشتریها و مدیران پروژهها هستند. درباره تجربیاتشان در خلال کار با پروژه از آنها سئوال کنید، مشخص نمایید که چه عواملی در روند کار موثر بودهاند و چه مواردی نیاز به اصلاح دارند.
چشم انداز استفاده از سیستم های پسا ویرایش ترجمه ماشینی
چشمانداز خدمات ترجمه تا سال 2050 نشان میدهد که سرویسهای مذکور در سالهای آینده به یک گرایش برتر تبدیل میگردند. MT نه تنها برای بسیاری از کسب و کارها (به دلیل سرعت و هزینه آن) جذاب است؛ بلکه شواهد زیادی وجود دارد که نشان میدهد استفاده از آن و اصلاح با سرویس PEMT، سریعتر (و در نتیجه مقرون به صرفهتر) از برگردان متن از همان ابتداست.
دانشگاههای گرونینگن (Groningen) هلند و دوبلین سیتی (Dublin City) ایرلند بر روی یک فصل از رمان جنگ شکن (Warbreaker)، نوشته براندون ساندرسون تحقیق انجام دادهاند. آنها سه روش؛ یعنی ترجمه از ابتدا، پسا ویرایش آماری مبتنی بر عبارت ترجمه ماشینی و پسا ویرایش ترجمه ماشینی عصبی (PENMT) را با هم مقایسه نمودهاند. نتایج این مطالعه نشان میدهد که استفاده از روش پسا ویرایش آماری مبتنی بر عبارت ترجمه ماشینی باعث افزایش بهرهوری به میزان 18% میشود؛ در حالیکه کارآیی PENMT در حدود 36% بالاتر از روش نخست است.
علاوه بر این، استفاده از هر دو روش MT باعث شده تا مترجمان در طول کار خود کمتر نیاز به زمان استراحت داشته باشند (29% در پسا ویرایش آماری مبتنی بر عبارت و 42% در PENMT). اما زمان این استراحتها طولانیتر از زمان استراحت بین ترجمه از ابتدا بود؛ زمان استراحت روش مبتنی بر عبارت ترجمه ماشینی و PENMT به ترتیب 14% و 25% طولانی تر از ترجمه از ابتدا اندازهگیری شده است.
کلام پایانی
ارقام مذکور باعث میشوند تا این رویه ارزش بیشتری پیدا کند؛ بنابراین کسب و کارها بیشتر تمایل دارند تا ترجمه ماشینی را با سرویس های پسا ویرایش ترکیب کنند. درست است که ترجمههای تولید شده توسط ماشین کامل و بی عیب نیستند؛ اما باید قبول کرد که فناوری به اندازهای پیشرفت کرده که باعث شده تا استفاده از ماشین و انسان در روند خدمات زبانی غالباً سریعتر از اتکا به ترجمه صرفاً انسانی باشد.
در ادامه حتما بخوانيد: سهولت ترجمه به زبان های کمتر شناخته شده از طریق یک طرح جدید