چالش‌های ترجمه هوش مصنوعی

هوش مصنوعی (Artificial Intelligence) به لطف توسعه یادگیری ماشین، شبکه‌های عصبی و مهارت فهم اطلاعات در سال‌های اخیر با رشد چشمگیری همراه بوده است. در حال حاضر به نظر می‌رسد که هر نرم‌افزار قابل تصوری دارای هوش مصنوعی (AI) باشد که فکر کردن و تصمیم‌گیری آدمی را در تمام رخدادهای زندگی به صورت خودکار نوید می‌دهد. تکنولوژی ترجمه نیز با این نرم‌افزارها تفاوتی ندارد و در واقع یکی از زمینه‌های قدرتمند برای توسعه AI به شمار می‌آید.

غول‌های عرصه تکنولوژی مانند گوگل و مایکروسافت برای ارتقاء سیستم‌های ترجمه خود، میلیون‌ها دلار سرمایه‌گذاری کرده‌اند و به عنوان پیشگامان عرصه ترجمه ماشینی شناخته می‌شوند. با این حال این عرصه همواره با چالش‌هایی مواجه بوده که آن را از مسیر پیشرفت بازداشته است. در این مطلب با شبکه مترجمین راستین همواره باشید تا بیشتر در مورد چالش‌های ترجمه هوش مصنوعی به اطلاعات دست یابید.

 

غلبه بر سوگیری الگوریتم در ترجمه هوش مصنوعی مشکل است:

سوگیری الگوریتم (Algorithmic bias) یکی سخت‌ترین و پیچیده‌ترین مشکلات مرتبط با تکنولوژی هوش مصنوعی به شمار می‌آید که غلبه بر آن با چالش‌های فراوانی همراه است. در واقع سوگیری الگوریتم از انسان‌هایی که آنها را به وجود آورده‌اند و در محیطی که مورد آموزش قرار گرفته‌اند به ارث رسیده است. تصور کنید یک نوع الگوریتم به گونه‌ای طراحی شده است که برای پیش‌بینی کار فقط از تصویر صورت استفاده می‌کند. همانطور که می‌دانید مشاغل به طور نامتناسب توسط جنسیت، نژاد، سن و سایر گروه‌های مردم تحت تأثیر قرار می‌گیرند، بنابراین استفاده از این نوع الگوریتم نمی‌تواند تمام اهداف برنامه‌نویسان را به درستی منعکس نماید.

در ترجمه هوش مصنوعی (Artificial Intelligence Translation)، رایج‌ترین شکل سوگیری به جنسیت مربوط می‌شود که در اغلب موارد شخصیت‌های مرد و زن به درستی توسط نرم‌افزار ترجمه نمی‌گردند. این مسئله از آنجا ناشی می‌شود که بیشتر زبان‌ها بر روی ضمایر جنسیتی کمتر از زبان انگلیسی تکیه می‌کنند. در این حالت بعضی نرم‌افزارها مانند گوگل ترنسلیت (Google Translate) با فراهم کردن ترجمه هر دو جنسیت سعی کرده‌اند تا حدودی این مشکل را حل نمایند (هر چند این مشکل توسط گوگل ترنسلیت حل شده، اما این نرم‌افزار با مشکلات دیگری برای ترجمه دست به گریبان است که می‌توانید در مطلب "چرا از مترجم گوگل نباید استفاده کرد؟"، بیشتر در مورد آنها بخوانید).

شکل‌های دیگری از سوگیری وجود دارد که ترجمه‌های ماشینی مستعد ابتلا به آنها نیز هستند. الگوریتم‌ها اغلب نسبت به طول سوگیری دارند. در نتیجه وقتی از الگوریتم‌های ترجمه ماشینی استفاده می‌گردد، متوجه می‌شویم که ترجمه نسبت به حالت واقعیش کوتاه‌تر است و جملات شکسته هستند. این چیزی نیست که کاربران و مشتریان انتظار دریافت آن را در هنگام ترجمه کتاب داشته باشند، بنابراین نسبت به این نوع ترجمه معترض می‌شوند و خواهان اصلاح آن توسط مترجمین حرفه‌ای خواهند بود. تا زمانیکه انسان بتواند تکنولوژی را بدون سوگیری توسعه دهد، باید به دیده تردید نسبت به استفاده از این فناوری‌ها نگریست.

 

 

ترجمه هوش مصنوعی

  بررسی چالش های ترجمه هوش مصنوعی  

 

دقت ترجمه کلمات توسط هوش مصنوعی افزایش پیدا کرده، اما زیاد نبوده است:

مهارت فهم اطلاعات در سال‌های گذشته بسیار پیشرفت داشته است، اما مهم‌ترین این پیشرفت‌ها ماحصل تکنولوژی محاسباتی سریعتر و قدرتمندتر بوده است که می‌تواند اعداد بیشتری (برای محاسبات) را در یک بازه زمانی کوتاه‌تر متراکم نماید. تمام توسعه‌های انجام گرفته پیرامون هوش مصنوعی بر روی سریع‌تر و بیشتر شدن تعداد محاسبات متمرکز بوده است. این موضوع الگوریتم‌ها را قادر ساخته تا از پایگاه داده وسیع‌تری استفاده کنند و الگوهای بیشتری را اتخاذ نمایند.

این اتفاق به نوبه خود منجر به افزایش دقت ترجمه کلمات در ترجمه‌های ماشینی گردیده است، چون تعداد بیشتری از کلمات توانسته‌اند تا وارد حافظه اینگونه نرم‌افزارها شوند و اصطلاحات تخصصی‌تری در آنها جای گرفته است. اگر همین روند ادامه پیدا کند، پیش‌بینی می‌شود که در آینده سطح دقت ترجمه کلمات بتواند برای افراد حرفه‌ای و مترجمین متخصص نیز کارآمد باشد. امروزه مشکلی که بیشتر مترجمین در زمان ترجمه تخصصی مقاله با آن روبه‌رو هستند به وجود نداشتن یک پایگاه داده جامع و غنی برای ترجمه کلمات همه زمینه‌های علمی مربوط می‌شود، بنابراین می‌توان امیدوار بود که ترجمه هوش مصنوعی بتواند این خلاء را برای متخصصان زبان پر نماید.

 

هوش مصنوعی در ترجمه عبارت‌های پیچیده با مشکل مواجه است:

انسان‌ها تنها با استفاده از کلمات جدا از هم با یکدیگر ارتباط برقرار نمی‌کنند. آنها کلمات را در قالب ساختارهایی مثل جملات، پاراگراف‌ها و شکل‌های نوشتاری یا گفتاری مورد استفاده قرار می‌دهند. برای به کار بردن کلمات در ابتدا زمینه مورد نیاز فراهم می‌شود، سپس منظور آنها معنی می‌گردد، و از لحن و بیان‌های متعدد برای تأکید به آنها استفاده می‌شود. بسیاری از ویژگی‌های زبانی مثل کنایه، استعاره، هجو و ضرب‌المثل‌ها به این نوع کلمات اضافه می‌گردند که غالبا توسط قوانین قابل تعریف نیستند. بنابراین نمی‌توان انتظار داشت که الگوریتم‌ها و پروکسی ترجمه به راحتی بتوانند این نوع تفاوت‌های ساختاری را تشخیص دهند.

بهتر است در ابتدا مفهوم اینگونه جملات و کلمات را توضیح دهید، و تفاوت‌ها و شباهت‌های آنها را مشخص نمایید. در ادامه آنها را به صورت یک مجموعه داده در آورید تا سیستم‌های ترجمه ماشینی بتوانند آنها را به زبان انسانی اعمال کنند. اگر این کار را هم انجام دهید، باز هم هوش مصنوعی قادر به تشخیص اینگونه مشخصات زبانی نخواهد بود. اگر زمانی ترجمه هوش مصنوعی به هوشمندی بیشتری دست پیدا کند، و بتواند سخن و گفتار انسان (مثل زبان‌ها، لهجه‌ها، گویش‌ها و سایر خصوصیات مغز انسان که به صورت طبیعی تراوش می‌شود) را با دقت کامل ترجمه نماید، ممکن است چالش‌های بیشتری از ترجمه AI توسط متخصصین معرفی گردد.

 

در ادامه حتما بخوانيد: چشم انداز خدمات ترجمه تا سال 2050