دسترسی به زبان‌های نادر از طریق ترجمه ماشینی

علی‌رغم جهانی شدن و افزایش نرخ نفوذ اینترنت در سراسر جهان، هنوز هم مردم بسیاری از کشورها مجبورند تا برای برقراری ارتباط از موانع زبانی عبور کنند. اطلاعات مندرج در اینترنت برای کسانی قابل استفاده است که به زبان‌های رایج و شناخته شده در اینترنت صحبت می‌کنند. افرادیکه زبان آنها توسط نرم‌افزارهای ترجمه به رسمیت نرسیده است، نمی‌توانند از طریق زبان مادری خود به مطلب یا محتوای خاصی دست پیدا کنند. اما همه چیز در حال تغییر است.

سازمان مترجمان بدون مرز (TWB) با پشتیبانی بنیاد سیسکو (Cisco) در تلاشند تا با فراهم نمودن امکاناتی، انسان های بیشتری را قادر به رساندن صدای خود به گوش دیگران نمایند. این سازمان در حال برنامه‌ریزی برای توسعه ترجمه ماشینی و بهره‌برداری از پروژه جدیدی به نام "گامایون (Gamayun)" است. این پروژه به افرادیکه از طریق زبان‌های نادر و حاشیه‌ای صحبت می‌کنند، امکان می‌دهد تا از اطلاعات اینترنتی استفاده نمایند. گامایون یک ابتکار عمل برابری زبانی است که هدف آن سهولت ترجمه به زبان‌های کمتر شناخته شده در اینترنت یا ترجمه از این زبان‌ها به زبان‌های رایج در اینترنت است. در این مطلب با شبکه مترجمین راستین همراه باشید تا ببینید که چگونه سازمان مترجمان بدون مرز (Translators without Borders) و بنیاد سیسکو با تدوین برنامه‌ای به توسعه ترجمه ماشینی و ارتقاء ارتباطات دو طرفه در سطح جهانی پرداخته‌اند.

 

عدم وجود ابزارهای ترجمه آنلاین برای بسیاری از زبان‌ها

امروزه بالغ بر 7 هزار زبان گفتاری در سراسر دنیا وجود دارد؛ اما متأسفانه تعداد زبان‌هایی که با محدودیت مواجه‌اند یا به صورت آنلاین پشتیبانی نمی‌شوند، بسیار زیاد هستند. برخلاف تصور، بسیاری از اینگونه زبان‌ها جزء زبان‌های نادر و کمیابی نیستند که فقط توسط تعداد معدودی از افراد مورد استفاده قرار می‌گیرند، بلکه گویش‌ها و لهجه‌هایی هستند که میلیون ها نفر با آنها صحبت می‌کنند.

مثلا گوگل ترنسلیت (Google Translate)، تعداد معدودی از زبان‌های دنیا (کمتر از 100 زبان) را پشتیبانی می‌کند. این میزان یعنی کمتر از 15% همه زبان‌ها. همچنین زبان اودیه یا اوریه (Odia) در هند یک زبان رسمی است و 40 تا 50 میلیون نفر در ایالت‌های اودیسا (Odisha) و جارخند (Jharkhand) از طریق آن با هم گفتگو می‌کنند. با این حال هیچ نرم‌افزاری برای تسهیل ترجمه به این زبان و یا ترجمه از این زبان به زبان‌های دیگر وجود ندارد. تنها کشور هند دارای بیش از 20 زبان رسمی است که بسیاری از آنها به صورت آنلاین در دسترس نیستند. صدها میلیون نفر برای کسب اطلاعات از اینترنت مجبورند تا به زبان دوم یا سوم خود متوسل شوند یا اینکه قادر نیستند که هیچ اطلاعاتی را از اینترنت دریافت نمایند.

گریس تانگ (Grace Tang)، مدیر برنامه‌ریزی پروژه گامایون سازمان مترجمان بدون مرز در مصاحبه خود با سازمان گالا (GALA) عنوان کرده است: "افرادیکه به زبان‌های نادر و حاشیه‌ای صحبت می کنند امکان دستیابی به اطلاعات مهم و نجات‌بخش را ندارند. به علاوه اغلب سازمان‌ها نمی‌توانند بازخورد افرادی را که به این زبان ها صحبت می‌نمایند به صورت کامل بررسی کرده و به آنها پاسخی مقتضی دهند".

سازمان مترجمان بدون مرز به دنبال این است تا امکان دسترسی بیشتر به زبان‌های حاشیه‌ای را با کمک فناوری فراهم کند. این سازمان قصد دارد تا از طریق برنامه گامایون، ترجمه ماشینی را برای زبان‌هایی که در حال حاضر به صورت مناسب در اینترنت پشتیبانی نمی‌شوند، توسعه دهد. هدف از راه‌اندازی این نرم‌افزار جدید، ادغام چندین ابزار توسعه‌ای دیگر است که به گویشوران زبان‌های حاشیه‌ای توانایی دستیابی آزادانه به اطلاعات را می‌دهد. سازمان مترجمان بدون مرز و بنیاد سیسکو به دنبال فراهم کردن امکان دسترسی صوتی و متنی به اطلاعات نیز هستند. در ضمن این ابتکار عمل به افرادیکه به زبان‌های نادر صحبت می‌‌کنند، امکان می‌دهد تا نیازها و ایده‌های خودشان را به زبان مادری مطرح نمایند.

 

ترجمه ماشینی

  استفاده از ترجمه ماشینی برای زبان های نادر  

 

چالش امکان برقراری ارتباط بهتر

برای کارآمد نمودن ترجمه‌های ماشینی به داده‌های عظیمی نیاز است. نرم‌افزار باید همزمان تعداد زیادی از محتواهای زبانی معادل را مورد تجزیه و تحلیل قرار دهد تا بدین‌گونه بتواند ترجمه بین دو زبان را به شکل صحیحی ارائه دهد. در حالت ایده‌آل این محتواها دربرگیرنده طیف گسترده‌ای از اسناد در همه زمینه‌ها هستند. به همه انواع محتواها از گزارش‌های خبری و ترجمه تخصصی مقاله گرفته تا رمان‌ها و فیلم‌ها برای ساخت حافظه ترجمه نیاز خواهد بود.

در صورت نادیده گرفتن هر کدام از این بخش‌ها، نرم‌افزار قادر نیست تا ارتباطات را به شکلی کارآمد ترجمه نماید. زمانیکه ترجمه ماشینی فقط از پست‌های شبکه‌های اجتماعی برای ارتقاء حافظه ترجمه استفاده کند، کاربران نمی‌توانند برای ترجمه یک سند قانونی به آن اعتماد نمایند. این موضوع کار را سخت می کند، زیرا برای ساخت این پایگاه داده به همکاری مترجمان، زبان‌شناسان، برنامه‌نویسان و توسعه دهندگان نیاز است.

البته گامایون از قبل در پروژه آزمایشی خود به موفقیت‌هایی دست پیدا کرده است. سازمان مترجمان بدون مرز در مرحله نخست، ابزار ترجمه ماشینی را برای زبان عربی شامی (Levantine Arabic) توسعه دادند. این نرم‌افزار توسط برنامه جهانی غذا (World Food Programme) مورد استفاده قرار می‌گیرد. سازمان مترجمان بدون مرز برای اینکه این برنامه را در مقیاسی کوچک و آزمایشی اجرا کنند با سازمان‌های PNGK و Prompsit همکاری کردند، و در کمتر از دو ماه توانستند تا یک ابزار ترجمه ماشینی سفارشی بسازند. این نرم‌افزار در مرحله اول پروژه به حوزه اصطلاحات خاص و تخصصی در رسانه‌های اجتماعی می‌پرداخت. به گفته توسعه‌دهندگان این نرم‌افزار، نتایج امیدوار‌‌کننده بود و این بدان معنی است که چنین ابزارهایی می‌توانند به افراد کمک کنند تا بدون در نظر گرفتن زبانی که به آن صحبت می‌نمایند، ارتباط موثرتری برقرار کنند.

 

 

مجهز شدن ترجمه ماشینی به استانداردهای جدید

ترجمه ماشینی به ابزاری حیاتی برای ارائه‌دهندگان خدمات زبانی تبدیل شده است. مزایای استفاده از نرم‌افزار برای ترجمه کاملاً محرز است. نرخ ترجمه ماشینی به شکل قابل ملاحظه‌ای سریع‌تر از ترجمه انسانی است. با کمک ترجمه ماشینی، مترجمان می‌توانند در هر دقیقه به هزاران کلمه ترجمه شده دست پیدا کنند. هر چند که محتوای ترجمه شده به صورت آنی دارای کیفیت بالایی نیست، اما باعث تسریع روند ترجمه و دستیابی به ترجمه فوری می‌شود. حتی اگر زمان مورد نیاز برای ویرایش دقیق پس از ترجمه ماشینی را نیز در نظر بگیریم، باز هم زمان لازم برای ترجمه به کمک رایانه (CAT) تنها کسری از زمان مورد نیاز برای ترجمه 100% انسانی است.

یکی دیگر از مزایای استفاده از ترجمه ماشینی کاهش هزینه‌هاست. این روند سریع کار، باعث صرفه‌جویی ده‌ها و حتی صدها ساعتی کار می‌شود. هر چند که روند ویرایش پس از ترجمه ممکن است طولانی باشد، اما هنگامیکه از ترجمه ماشینی به عنوان اولین مرحله ترجمه به زبان هدف استفاده می‌شود، باز هم به صورت قابل‌توجهی در وقت و انرژی صرفه‌جویی می‌گردد، و شاید بتوان شرایط محقق شدن ترجمه ارزان را فراهم نمود.

مهمترین مزیت استفاده از ترجمه ماشینی، توانایی آن در به خاطر سپردن کامل فهرست معانی لغات و استفاده مجدد از آنها در پروژه‌های بعدی است. اصطلاحات کلیدی و فنی خاص یک صنعت حتی برای زبان‌شناسان نیز یک چالش محسوب می‌شوند. زمانیکه شما پایگاه داده‌ای دارید که می‌توانید همیشه به اصطلاحات آن دسترسی داشته باشید؛ قادر خواهید بود هم روند کاری خود را ارتقا دهید، و هم دقت و همخوانی ترجمه‌هایتان را بالا ببرید.

 

آینده پروژه گامایون

بنیاد سیسکو به سازمان مترجمان بدون مرز این امکان را داده است که فاز دوم ابتکار عمل برابری زبانی گامایون را شروع کنند. سازمان TWB با حمایت بنیاد سیسکو می‌تواند کار بر روی دو پروژه آزمایشی و محدود خود را از سال 2020 شروع نماید. هر یک از این پروژه‌ها، مورد و زبان دیگری را جهت توسعه پایگاه داده متنی و صوتی برای دو زبان حاشیه‌ای دیگر پوشش می‌دهند. سازمان مترجمان بدون مرز با تکیه بر این دو طرح جدید می‌تواند مبنایی برای یک مدل قابل ارتقا ایجاد کند که توسعه ترجمه ماشینی را برای 10 زبان نادر دیگر در پنج سال آینده امکان‌پذیر می‌کند.

ارین کانر (Erin Connor) از بنیاد سیسکو عنوان می‌کند: "ما معتقدیم که ابتکار عمل گامایون TWB، فرصتی مهیج را برای به کارگیری فناوری ترجمه یادگیری ماشین در زبان‌های حاشیه‌ای و نادر فراهم می‌کند؛ فرصتی که در نهایت امکان ارتباطات بهتر و ارائه خدمات بشر دوستانه را برای جوامع بحران زده فراهم می‌نماید".

به گفته GALA، سازمان مترجمان بدون مرز به دنبال افرادی است که مایل به شناسایی موارد مورد استفاده، توسعه فناوری‌های جدید، مشارکت در جمع‌آوری داده‌های زبانی و تأمین بودجه برای مراحل بعدی این ابتکار عمل هستند. ما بهترین آرزو‌ها را برای این دست از افراد داریم و امیدواریم این توسعه‌ها به پیشرفت دانش ترجمه کمک نماید.

 

در ادامه حتما بخوانيد: چالشهای ترجمه هوش مصنوعی