بررسی شیوه کاری ترجمه ماشینی عصبی (NMT)
- 09 اسفند 1399
- هوش مصنوعی
قرن بیست و یکم با فناوری عجین شده است. در این قرن مباحثی چون هوش مصنوعی (AI) و ترجمه ماشینی (MT) همچنان در برخی از حوزهها جذاب بوده و مورد استفاده قرار میگیرند؛ زیرا صنایع بیشتری پذیرای تحول دیجیتال و پیشرفتهای خلاقانه فناوری شدهاند.
به دلیل جهانی شدن تجارت و نیاز روزافزون به ارتباطات بینالمللی بین بازارها و فرهنگها، شرکتها به منظور کاهش هزینهها و افزایش سریع بهرهوری، هر چه بیشتر به دنبال تلفیق راهکارهای ساده برگردان متون هستند. در این راستا راهکارهای قدرت گرفته از AI و MT گزینه بدی برای آنها به حساب نمیآید. با این حال در این زمینه باید بسیار محتاط عمل کرد.
ترجمه ماشینی عصبی
اخیراً شرکتهای بزرگ فناوری (گوگل، فیسبوک و دیگر غولهای تکنولوژی) علاقه شدیدی به استفاده از شبکههای عصبی و یادگیری عمیق برای تکمیل MT پیدا کردهاند. در این فرآیند شبکههای عصبی براساس شیوه فعالیت مغز انسان در ابتدا مدل سازی میگردند و سپس نورونهای مصنوعی با فرستادن سیگنال برای یکدیگر فعال میشوند. ماحصل این فناوری، پیشرفت قابل توجه "تشخیص گفتار" و "بینایی رایانهای" (Computer Vision) بوده است.
ترجمه ماشینی نیز از این فناوری بیبهره نمانده، و رویکردی یکنواخت برای برگردان خودکار متون به نام ترجمه ماشینی عصبی (Neural Machine Translation) به وجود آمده است. مزایای این روش باعث شده تا بتوان دادهها را در قالب گروهها و لایههای مختلف دستهبندی نمود. عملکرد اصلی NMT شامل پایگاه دادههای دو زبانه موجود، و فرآیندهای خودکار یادگیری و بروز رسانی است.
استفاده گوگل از شبکه های عصبی
گوگل در سال 2016 گزارش داد که در زمینه ترجمه ماشینی، گام مهمی به جلو برداشته است. مترجم گوگل (Google Translate) یک دهه بود که فعالیت میکرد؛ اما حرکت به سمت شبکههای عصبی باعث شد تا برگردانهای غالباً ناشیانه آن بسیار بهتر از قبل شود. این تغییرات مثبت به لطف بهرهگیری از سیستم ترجمه ماشینی عصبی به وقوع پیوست.
به طور خلاصه سیستم NMT گوگل به جای لغات مجزا یا گروههای کوچک کلمات، جملات کامل را معنی میکند. این سیستم از رمزگذار برای تجزیه ساختار جملات بهره میگیرد. سپس سیستم، معنای اجزای سازنده جملات را به عنوان یک بردار نشان میدهد. وبگاه رجیستر (The Register) در خصوص شیوه کاری سیستم مذکور میگوید: "سیستم کل جمله را تفسیر مینماید، و رمزگشا کار برگردان هر کلمه را با مشاهده توزیع وزنی بر روی بردارهای رمزگذاری شده و مطابقت آنها با کلمات مرتبط در زبان مقصد شروع میکند".
جالب اینجاست که سیستم NMT گوگل، با شروع به ترجمه بین جفت زبانهایی که قبلاً آموزش ندیده بود، در یادگیری یک قدم به جلو گذاشت. برنامه نویسان به سیستم آموزش داده بودند تا بین زبانهای انگلیسی و پرتغالی، و انگلیسی و اسپانیایی به کار تبدیل جملات بپردازد. با این حال خود سیستم توانست ترجمه باکیفیت قابل قبولی بین زبانهای اسپانیایی و پرتغالی ارائه دهد؛ هر چند برنامه نویسان آن زوج زبانی را وارد نکرده بودند.
فیسبوک و شبکه های عصبی
فیسبوک در اکتبر سال 2020 رویداد مهم دیگری را اعلام کرد: "اولین مدل NMT چند زبانه که قادر است بین هر جفت زبان از یک مجموعه 100 زبانی ترجمه کند؛ بدون اینکه به دادههای انگلیسی متکی باشد". این رویکرد نوید بخش ارتقای کیفیت MT است؛ زیرا فرصت کمتری برای از دست دادن معنی وجود دارد.
حتما بخوانيد: تفاوت میان ترجمه ماشینی و انسانی
ترجمه انسانی
مترجمان متخصص در این نوع برگردان از ابزارهای ترجمه به کمک رایانه (CAT)، واژهنامهها و حافظه ترجمه (TM) برای تبدیل و تطبیق فرهنگی بین متون منبع و هدف استفاده میکنند؛ هدف آنها تمرکز بر استفاده صحیح از اصطلاحات و دستور زبان، جمله بندی دقیق، انسجام متن، رعایت عرفها و سبکهای زبانی خاص آن کشور است. این متخصصان سعی میکنند تا دستورالعملهای خاص یک پروژه یا مشتری و یا الزامات نظارتی را در حد اعلی رعایت نمایند.
ترجمه ماشینی عصبی
تفاوت بین ترجمه انسانی و ترجمه ماشینی عصبی
ترجمه ماشینی عصبی در مقایسه با دیگر روشهای مرسوم یک گوی جادویی نیست. دامنه وسیع محدودیتهای آن در مقابل فرآیندهای استاندارد زبان شناسی مبتنی بر ترجمه، ویرایش و نمونه خوانی غیر قابل انکار است، و همواره در معرض ارزیابیهای مجدد قرار دارد. مزیت غالب HT در مقایسه با NMT، تفسیر متن در طیف گستردهای از فرمتهاست. ارائه دهندگان خدمات تخصصی زبانی از سیستمهای امنیتی پیشرفته، متخصصان ماهر و فناوریهای به روز استفاده میکنند تا بتوانند گردش کار انتقال مفاهیم را به شیوهای صحیح مدیریت نمایند.
ترجمه ماشینی عصبی از لحاظ درک متن و واژه جزء پیشرفتهترین اشکال هوش مصنوعی است؛ اما همچنان در مقایسه با کار مترجمین از تنوع و تراکم واژگانی بسیار محدودی بهره میبرد. این عدم قوام واژگان به محدودیت اجرایی کاربر NMT در بسیاری از حوزهها یا بخشهای تجاری که به اصطلاحات خاص نیاز دارند، منتج میشود (مثل ترجمه تخصصی متون پزشکی یا مطالب سنگینی که حاوی اصطلاحات خاص هستند)؛ بنابراین بیثباتی از نظر عدم صحت واژگان و فقدان تنوع کلامی در این سیستم اجتنابناپذیر خواهد بود.
علاوه بر این، بهرهگیری از هر نوع شبکه عصبی با خود مسئولیتهای بزرگی به همراه میآورد که اغلب اوقات NMT نمیتواند از عهده آن برآید؛ زیرا سیناپسهای این سیستم بدون تخصص و قدرت تصمیمگیری مهندسان و معماران انسانی نمیتوانند عملکرد مناسبی داشته باشند. این نوع ترجمه به ویرایش حداقل یک زبانشناس نیازمند است و باید با حجم زیادی از دادههای زبانی مرتبسازی شود. در کل تفاوتهای بین این دو سیستم انتقال زبانی در جدول زیر خلاصه شده است:
ترجمه انسانی | ترجمه ماشینی عصبی |
قوام واژهای | تنوع و تراکم محدود واژگان |
معنی کردن و تفسیر انواع متون | تفسیر قالبهای محدود متون |
ثبات اصطلاحات | بیثباتی واژگان و وجود مکرر بیدقتی در برگردان متون |
سادهسازی جریان کاری برگردان متون | نیاز به حداقل یک بار ویرایش توسط مترجم |
حال چه باید کرد؟
با توجه به جهشهای اخیر در فناوری MT، میتوان پیش بینی کرد که طی سالهای آینده تغییراتی در صنعت ترجمه به وقوع خواهد پیوست. با این حال اینگونه پیش بینیها در دهه 1950 نیز صورت گرفته بود؛ اما هنوز محقق نشده است. تاریخ گواه این است که علیرغم قابلیتهای باورنکردنی سیستمهای محاسباتی مدرن، در هنگام ترجمه لاجرم به توانایی ماشینها شک کنیم. روشی مانند NMT میتواند یک ابزار مفید باشد؛ اما باید با ویرایش دقیق زبان شناس انسانی به عنوان بخشی از فرآیند کنترل کیفیت ترکیب شود.
بنابراین تا زمانیکه اینگونه فناوریها به کیفیت قابل قبولی دست یابند؛ به خدمات ترجمه تخصصی نیازمند خواهیم بود. در این راستا ما به سبد خدمات خود افتخار میکنیم، چرا که توانستهایم تا بهترین مترجمان را برای مشتریان خود به کار بگیریم و آنها را از شر پروژههای بدون کیفیت خلاص کنیم. شبکه مترجمین راستین دائما در تلاش است تا ضمن تقویت رویههای کاری خود، در طیف گستردهای از حوزهها به ارائه خدمات زبانی به کاربران خود بپردازد.
در ادامه حتما بخوانيد: ترجمه متون ادبی با نرخ صحت 25% توسط NMT