سهولت ترجمه به زبان‌ های کمتر شناخته شده از طریق یک طرح جدید

علیرغم جهانی شدن و افزایش نرخ نفوذ اینترنت در سراسر جهان، هنوز هم مردم بسیاری از کشورها مجبورند تا برای برقراری ارتباط از موانع زبانی عبور کنند. اطلاعات مندرج در اینترنت برای کسانی قابل استفاده است که به زبان‌های رایج و شناخته شده در اینترنت صحبت می‌کنند. افرادیکه سیستم کلامی آنها توسط نرم افزارهای ترجمه به رسمیت نرسیده است؛ نمی‌توانند از طریق زبان مادری خود به مطلب یا محتوای خاصی دست پیدا کنند. با این حال همه چیز در حال تغییر است.

سازمان مترجمان بدون مرز (TWB) با پشتیبانی بنیاد سیسکو (Cisco) در تلاشند تا با فراهم نمودن امکاناتی، انسان‌های بیشتری را قادر به رساندن صدای خود به گوش دیگران نمایند. این سازمان در حال برنامه ‌ریزی برای توسعه ترجمه ماشینی و بهره‌ برداری از پروژه جدیدی به نام "گامایون (Gamayun)" است. اگر می‌خواهید بیشتر در مورد این برنامه جدید، و همکاری TWB و شرکای آن به اطلاعات دست یابید؛ در این مطلب با شبکه مترجمین راستین همراه باشید.

 

برنامه گامایون

سازمان مترجمان بدون مرز (Translators without Borders) به دنبال این است تا امکان دسترسی بیشتر به زبان ‌های اقلیت شده را با کمک فناوری فراهم کند. این سازمان قصد دارد تا از طریق برنامه گامایون، ترجمه ماشینی (MT) را برای شیوه‌های کلامی که در حال حاضر به صورت مناسب در اینترنت پشتیبانی نمی‌شوند، توسعه دهد. توسعه فناوری تشخیص گفتار و ابتکار عمل TICO-19 دو رکن مهم از این طرح محسوب می‌‌گردند که در ادامه بیشتر به آنها پرداخته می‌شود؛ اما فعلاً بهتر است به چرایی وجود این برنامه بپردازیم.

 

عدم وجود ابزارهای ترجمه آنلاین

امروزه بالغ بر 7 هزار سیستم گفتاری در سراسر دنیا وجود دارد؛ اما متأسفانه تعداد زبان‌هایی که با محدودیت مواجه‌اند یا به صورت آنلاین پشتیبانی نمی‌شوند، بسیار زیاد هستند. برخلاف تصور بسیاری از آنها جزء زبان ‌های نادر نیستند؛ بلکه گویش‌ها و لهجه‌هایی هستند که میلیون ها نفر با آنها صحبت می‌کنند. برنامه پرکاربردی مثل گوگل ترنسلیت (Google Translate)، تعداد معدودی از زبان‌های دنیا (کمتر از 100 مورد) را پشتیبانی می‌کند؛ این میزان یعنی کمتر از 15% همه شیوه‌های کلامی.

زبان اودیه یا اوریه (Odia) در هند یک زبان رسمی است و 40 تا 50 میلیون نفر در ایالت‌های اودیسا (Odisha) و جارخند (Jharkhand) از طریق آن با هم گفتگو می‌کنند. با این حال هیچ نرم ‌افزاری برای تسهیل ترجمه به آن وجود ندارد. تنها کشور هند دارای بیش از 20 زبان رسمی است که بسیاری از آنها به صورت آنلاین در دسترس نیستند. صدها میلیون نفر برای کسب اطلاعات از اینترنت مجبورند تا به زبان دوم یا سوم خود متوسل شوند یا اینکه قادر نیستند که هیچ اطلاعاتی را از اینترنت دریافت نمایند.

 

نسخه اولیه

البته برنامه گامایون از قبل در پروژه آزمایشی خود به موفقیت‌هایی دست پیدا کرده است. سازمان مترجمان بدون مرز در مرحله نخست، ابزار ترجمه ماشینی را برای زبان عربی شامی (Levantine Arabic) توسعه دادند. این نرم ‌افزار توسط برنامه جهانی غذا (World Food Programme) مورد استفاده قرار می‌گیرد. TWB برای اینکه این برنامه را در مقیاسی کوچک و آزمایشی اجرا کند؛ با سازمان‌های PNGK و Prompsit همکاری نموده، و آنها در کمتر از دو ماه توانستند تا یک ابزار MT سفارشی بسازند.

این نرم‌ افزار در مرحله اول پروژه به حوزه اصطلاحات خاص و تخصصی در رسانه‌های اجتماعی می‌پرداخت. به گفته توسعه‌ دهندگان، نتایج امیدوار‌‌ کننده بود و این بدان معنی است که چنین ابزارهایی می‌توانند به افراد کمک کنند تا بدون در نظر گرفتن زبانی که به آن صحبت می‌نمایند، ارتباط موثرتری برقرار کنند.

 

گامایون

 

توسعه فناوری‌ تشخیص گفتار

سازمان مترجمان بدون مرز و شرکت کوبو (KoBo) از طریق یک ابتکار عمل مشترک، فناوری تشخیص گفتار و شیوه تبدیل گفتار به متن را به منظور ادغام با ابزارهای جمع‌آوری و مدیریت داده‌ها توسعه می‌دهند. اقدامات بشر دوستانه قادر خواهند بود تا از این ابزار یکپارچه برای جلب مشارکت مردم و ارزیابی راهبردها در موضوعات مختلف استفاده کنند. موضوعاتی مانند دیدگاه مردم درباره ویروس کرونا، میزان دسترسی آنها به آب و غذا، و اینکه به چه زبانی صحبت می کنند و یا با چه زبان هایی آشنایی دارند در این حوزه جای می‌گیرد.

 

علت راه اندازی فناوری

پشتیبانی خودکار از زبان‌ها به افراد امکان می‌دهد تا به شکلی ایمن‌تر، کارآمدتر و دقیق‌تر با کمک‌های بشر دوستانه ارتباط برقرار نمایند. دسترسی به زبان های کمتر شناخته شده از طریق ترجمه ماشینی، امکان ارتباط بهتر را مهیا می‌کند. با شیوع بیماری همه‌گیر کووید - 19 (COVID-19)، اقدامات بشر دوستانه در تلاشند تا توجه افرادیکه در شرایط نامناسب زندگی می‌کنند را جلب نمایند؛ چرا که میزان دسترسی به آنها کاهش پیدا کرده و درصد فعالیت‌ها هم بسیار محدود گردیده است. این ابزار تضمین می‌کند صدای کسانیکه در موقعیت‌های بحرانی زندگی می‌کنند و نیاز به کمک‌های بشر دوستانه دارند، حتی در هنگام شیوع یک بیماری همه‌گیر نیز شنیده شود.

گریس تانگ (Grace Tang)، مدیر برنامه گامایون در سازمان مترجمان بدون مرز می‌گوید: "ما باید به صدای افرادی گوش فرا دهیم که همواره در طول تاریخ به دلیل زبانی که به آن صحبت می‌کنند، در حاشیه قرار گرفته‌اند. همکاری با شرکت کوبو و بنیاد سیسکو واقعاً ضروری است؛ چون فناوری تشخیص صدا بخشی کلیدی از برقراری ارتباط با گویشوران زبان‌ های اقلیت شده و به خصوص کسانی است که از سطح سواد پایینی برخوردار هستند؛ به ویژه در زمان شیوع بیماری همه‌گیر ویروس کرونا".

 

شیوه اجرایی کردن طرح

سازمان مترجمان بدون مرز در ابتدا زبان‌هایی مانند سواحیلی کنگویی (Congolese Swahili) و فرانسوی را برای تشخیص گفتار در جمهوری دموکراتیک کنگو مدل‌سازی خواهد کرد. این نهاد با همکاری محققان محلی، طیف گسترده‌ای از اصوات مرتبط با مجموعه‌ای کوچک از کلمات پایه را جمع‌آوری می‌کند.

سپس شرکت کوبو این مجموعه اصوات را در فناوری KoboToolbox که ابزاری محبوب بین اقدامات بشر دوستانه برای جمع‌آوری داده‌های میدانی است، ادغام می‌نماید. این کار براساس یک پروژه آزمایشی موفق که توسط بنیاد سیسکو تأمین مالی گردیده و توانسته تا شش زبان دیگر را به ترجمه ماشینی و پایگاه داده‌های زبانی متن باز اضافه کند، ساخته شده است.

ارین کانر (Erin Connor)، مدیر پرتفوی نیازمندی‌های حیاتی انسان (Critical Human Needs Portfolio Manager) در بنیاد سیسکو می‌گوید: "بنیاد سیسکو از حمایت مالی این طرح قابل توسعه و مبتنی بر فناوری که اطمینان می‌دهد حتی صدای آسیب‌پذیرترین افراد نیز در بحران کووید - 19 شنیده می‌شود، بسیار هیجان‌زده است. این همکاری جدید بین TWB و فناوری KoboToolbox شرکت کوبو که باعث متحد شدن این دو تکنولوژی با هم شده است؛ به اقدامات بشر دوستانه کمک می‌کند تا بهتر نیازهای افرادیکه به زبان‌ های اقلیت صحبت می‌کنند، درک شود".

 

پروژه گامایون

 

ابتکار عمل TICO-19

سازمان مترجمان بدون مرز در برنامه گامایون به نیازهای گویشوران زبان‌های اقلیت در طی شیوع بیماری همه‌گیر کرونا نیز توجه کرده است. همگان از تأثیر ویروس کرونا بر روی صنعت ترجمه آگاهی دارند و می‌دانند که چه صدماتی این بیماری بر روی بخش‌های مختلف آموزشی و علمی به وجود آورده است. این سازمان از زمان اعلام شیوع همه‌گیری جهانی در مارس 2020 توسط سازمان بهداشت جهانی، تاکنون با ترجمه بیش از 4 میلیون کلمه اطلاعات درباره بیماری کووید- 19 و ساخت واژه‌ نامه در مورد اصطلاحات ویروس کرونا، از گویشوران زبان ‌های اقلیت شده حمایت کرده است.

در ضمن سازمان مترجمان بدون مرز، فناوری‌های زبانی را از طریق ابتکار عمل TICO-19 که کنسرسیومی از صنایع و همکاران دانشگاهی آنهاست، توسعه داده است. ابتکار عمل TICO-19 دسترسی به اطلاعات پیرامون بیماری کووید- 19 و بحران‌های مرتبط با آن را به اکثر زبان‌ها امکان‌پذیر نموده است. این پروژه از تکنولوژی‌های پیشرفته برای افزایش برابری زبانی و بهبود ارتباطات دو طرفه با گویشوران زبان ‌های حاشیه ‌ای استفاده می‌کند. هدف نهایی این است که بده بستان اطلاعات در هر سیستم گفتاری و قالبی برای همگان ممکن باشد.

 

آینده ابتکارات جدید زبانی

ارین کانر عنوان می‌کند: "ما معتقدیم که ابتکار عمل گامایون TWB، فرصتی مهیج را برای بکارگیری فناوری ترجمه یادگیری ماشین در زبان ‌های اقلیت شده فراهم می‌کند؛ فرصتی که در نهایت امکان ارتباطات بهتر و ارائه خدمات بشر دوستانه را برای جوامع بحران زده به وجود می‌آورد".

به گفته GALA، سازمان مترجمان بدون مرز به دنبال افرادی است که مایل به شناسایی موارد مورد استفاده، توسعه فناوری‌های جدید، مشارکت در جمع‌آوری داده‌های زبانی و تأمین بودجه برای مراحل بعدی این ابتکار عمل هستند.

ضمناً این اقدام یک گام مهم در جهت ارتقاء کیفیت اطلاعات و در دسترس بودن آنها در حوزه‌های بشر ‌دوستانه نیز است. شرکت کوبو همچنان در طول این همه‌گیری با ارائه ابزارهای رایگان و منبع باز خود به خدمت به اقدامات بشر دوستانه که از این ابزارها برای ارزیابی‌های حضوری و از راه دور استفاده می‌کنند، ادامه می‌دهد.