سهولت ترجمه به زبان های کمتر شناخته شده از طریق یک طرح جدید
- 02 آبان 1399
- هوش مصنوعی
علیرغم جهانی شدن و افزایش نرخ نفوذ اینترنت در سراسر جهان، هنوز هم مردم بسیاری از کشورها مجبورند تا برای برقراری ارتباط از موانع زبانی عبور کنند. اطلاعات مندرج در اینترنت برای کسانی قابل استفاده است که به زبانهای رایج و شناخته شده در اینترنت صحبت میکنند. افرادیکه سیستم کلامی آنها توسط نرم افزارهای ترجمه به رسمیت نرسیده است؛ نمیتوانند از طریق زبان مادری خود به مطلب یا محتوای خاصی دست پیدا کنند. با این حال همه چیز در حال تغییر است.
سازمان مترجمان بدون مرز (TWB) با پشتیبانی بنیاد سیسکو (Cisco) در تلاشند تا با فراهم نمودن امکاناتی، انسانهای بیشتری را قادر به رساندن صدای خود به گوش دیگران نمایند. این سازمان در حال برنامه ریزی برای توسعه ترجمه ماشینی و بهره برداری از پروژه جدیدی به نام "گامایون (Gamayun)" است. اگر میخواهید بیشتر در مورد این برنامه جدید، و همکاری TWB و شرکای آن به اطلاعات دست یابید؛ در این مطلب با شبکه مترجمین راستین همراه باشید.
برنامه گامایون
سازمان مترجمان بدون مرز (Translators without Borders) به دنبال این است تا امکان دسترسی بیشتر به زبان های اقلیت شده را با کمک فناوری فراهم کند. این سازمان قصد دارد تا از طریق برنامه گامایون، ترجمه ماشینی (MT) را برای شیوههای کلامی که در حال حاضر به صورت مناسب در اینترنت پشتیبانی نمیشوند، توسعه دهد. توسعه فناوری تشخیص گفتار و ابتکار عمل TICO-19 دو رکن مهم از این طرح محسوب میگردند که در ادامه بیشتر به آنها پرداخته میشود؛ اما فعلاً بهتر است به چرایی وجود این برنامه بپردازیم.
عدم وجود ابزارهای ترجمه آنلاین
امروزه بالغ بر 7 هزار سیستم گفتاری در سراسر دنیا وجود دارد؛ اما متأسفانه تعداد زبانهایی که با محدودیت مواجهاند یا به صورت آنلاین پشتیبانی نمیشوند، بسیار زیاد هستند. برخلاف تصور بسیاری از آنها جزء زبان های نادر نیستند؛ بلکه گویشها و لهجههایی هستند که میلیون ها نفر با آنها صحبت میکنند. برنامه پرکاربردی مثل گوگل ترنسلیت (Google Translate)، تعداد معدودی از زبانهای دنیا (کمتر از 100 مورد) را پشتیبانی میکند؛ این میزان یعنی کمتر از 15% همه شیوههای کلامی.
زبان اودیه یا اوریه (Odia) در هند یک زبان رسمی است و 40 تا 50 میلیون نفر در ایالتهای اودیسا (Odisha) و جارخند (Jharkhand) از طریق آن با هم گفتگو میکنند. با این حال هیچ نرم افزاری برای تسهیل ترجمه به آن وجود ندارد. تنها کشور هند دارای بیش از 20 زبان رسمی است که بسیاری از آنها به صورت آنلاین در دسترس نیستند. صدها میلیون نفر برای کسب اطلاعات از اینترنت مجبورند تا به زبان دوم یا سوم خود متوسل شوند یا اینکه قادر نیستند که هیچ اطلاعاتی را از اینترنت دریافت نمایند.
نسخه اولیه
البته برنامه گامایون از قبل در پروژه آزمایشی خود به موفقیتهایی دست پیدا کرده است. سازمان مترجمان بدون مرز در مرحله نخست، ابزار ترجمه ماشینی را برای زبان عربی شامی (Levantine Arabic) توسعه دادند. این نرم افزار توسط برنامه جهانی غذا (World Food Programme) مورد استفاده قرار میگیرد. TWB برای اینکه این برنامه را در مقیاسی کوچک و آزمایشی اجرا کند؛ با سازمانهای PNGK و Prompsit همکاری نموده، و آنها در کمتر از دو ماه توانستند تا یک ابزار MT سفارشی بسازند.
این نرم افزار در مرحله اول پروژه به حوزه اصطلاحات خاص و تخصصی در رسانههای اجتماعی میپرداخت. به گفته توسعه دهندگان، نتایج امیدوار کننده بود و این بدان معنی است که چنین ابزارهایی میتوانند به افراد کمک کنند تا بدون در نظر گرفتن زبانی که به آن صحبت مینمایند، ارتباط موثرتری برقرار کنند.
توسعه فناوری تشخیص گفتار
سازمان مترجمان بدون مرز و شرکت کوبو (KoBo) از طریق یک ابتکار عمل مشترک، فناوری تشخیص گفتار و شیوه تبدیل گفتار به متن را به منظور ادغام با ابزارهای جمعآوری و مدیریت دادهها توسعه میدهند. اقدامات بشر دوستانه قادر خواهند بود تا از این ابزار یکپارچه برای جلب مشارکت مردم و ارزیابی راهبردها در موضوعات مختلف استفاده کنند. موضوعاتی مانند دیدگاه مردم درباره ویروس کرونا، میزان دسترسی آنها به آب و غذا، و اینکه به چه زبانی صحبت می کنند و یا با چه زبان هایی آشنایی دارند در این حوزه جای میگیرد.
علت راه اندازی فناوری
پشتیبانی خودکار از زبانها به افراد امکان میدهد تا به شکلی ایمنتر، کارآمدتر و دقیقتر با کمکهای بشر دوستانه ارتباط برقرار نمایند. دسترسی به زبان های کمتر شناخته شده از طریق ترجمه ماشینی، امکان ارتباط بهتر را مهیا میکند. با شیوع بیماری همهگیر کووید - 19 (COVID-19)، اقدامات بشر دوستانه در تلاشند تا توجه افرادیکه در شرایط نامناسب زندگی میکنند را جلب نمایند؛ چرا که میزان دسترسی به آنها کاهش پیدا کرده و درصد فعالیتها هم بسیار محدود گردیده است. این ابزار تضمین میکند صدای کسانیکه در موقعیتهای بحرانی زندگی میکنند و نیاز به کمکهای بشر دوستانه دارند، حتی در هنگام شیوع یک بیماری همهگیر نیز شنیده شود.
گریس تانگ (Grace Tang)، مدیر برنامه گامایون در سازمان مترجمان بدون مرز میگوید: "ما باید به صدای افرادی گوش فرا دهیم که همواره در طول تاریخ به دلیل زبانی که به آن صحبت میکنند، در حاشیه قرار گرفتهاند. همکاری با شرکت کوبو و بنیاد سیسکو واقعاً ضروری است؛ چون فناوری تشخیص صدا بخشی کلیدی از برقراری ارتباط با گویشوران زبان های اقلیت شده و به خصوص کسانی است که از سطح سواد پایینی برخوردار هستند؛ به ویژه در زمان شیوع بیماری همهگیر ویروس کرونا".
شیوه اجرایی کردن طرح
سازمان مترجمان بدون مرز در ابتدا زبانهایی مانند سواحیلی کنگویی (Congolese Swahili) و فرانسوی را برای تشخیص گفتار در جمهوری دموکراتیک کنگو مدلسازی خواهد کرد. این نهاد با همکاری محققان محلی، طیف گستردهای از اصوات مرتبط با مجموعهای کوچک از کلمات پایه را جمعآوری میکند.
سپس شرکت کوبو این مجموعه اصوات را در فناوری KoboToolbox که ابزاری محبوب بین اقدامات بشر دوستانه برای جمعآوری دادههای میدانی است، ادغام مینماید. این کار براساس یک پروژه آزمایشی موفق که توسط بنیاد سیسکو تأمین مالی گردیده و توانسته تا شش زبان دیگر را به ترجمه ماشینی و پایگاه دادههای زبانی متن باز اضافه کند، ساخته شده است.
ارین کانر (Erin Connor)، مدیر پرتفوی نیازمندیهای حیاتی انسان (Critical Human Needs Portfolio Manager) در بنیاد سیسکو میگوید: "بنیاد سیسکو از حمایت مالی این طرح قابل توسعه و مبتنی بر فناوری که اطمینان میدهد حتی صدای آسیبپذیرترین افراد نیز در بحران کووید - 19 شنیده میشود، بسیار هیجانزده است. این همکاری جدید بین TWB و فناوری KoboToolbox شرکت کوبو که باعث متحد شدن این دو تکنولوژی با هم شده است؛ به اقدامات بشر دوستانه کمک میکند تا بهتر نیازهای افرادیکه به زبان های اقلیت صحبت میکنند، درک شود".
ابتکار عمل TICO-19
سازمان مترجمان بدون مرز در برنامه گامایون به نیازهای گویشوران زبانهای اقلیت در طی شیوع بیماری همهگیر کرونا نیز توجه کرده است. همگان از تأثیر ویروس کرونا بر روی صنعت ترجمه آگاهی دارند و میدانند که چه صدماتی این بیماری بر روی بخشهای مختلف آموزشی و علمی به وجود آورده است. این سازمان از زمان اعلام شیوع همهگیری جهانی در مارس 2020 توسط سازمان بهداشت جهانی، تاکنون با ترجمه بیش از 4 میلیون کلمه اطلاعات درباره بیماری کووید- 19 و ساخت واژه نامه در مورد اصطلاحات ویروس کرونا، از گویشوران زبان های اقلیت شده حمایت کرده است.
در ضمن سازمان مترجمان بدون مرز، فناوریهای زبانی را از طریق ابتکار عمل TICO-19 که کنسرسیومی از صنایع و همکاران دانشگاهی آنهاست، توسعه داده است. ابتکار عمل TICO-19 دسترسی به اطلاعات پیرامون بیماری کووید- 19 و بحرانهای مرتبط با آن را به اکثر زبانها امکانپذیر نموده است. این پروژه از تکنولوژیهای پیشرفته برای افزایش برابری زبانی و بهبود ارتباطات دو طرفه با گویشوران زبان های حاشیه ای استفاده میکند. هدف نهایی این است که بده بستان اطلاعات در هر سیستم گفتاری و قالبی برای همگان ممکن باشد.
آینده ابتکارات جدید زبانی
ارین کانر عنوان میکند: "ما معتقدیم که ابتکار عمل گامایون TWB، فرصتی مهیج را برای بکارگیری فناوری ترجمه یادگیری ماشین در زبان های اقلیت شده فراهم میکند؛ فرصتی که در نهایت امکان ارتباطات بهتر و ارائه خدمات بشر دوستانه را برای جوامع بحران زده به وجود میآورد".
به گفته GALA، سازمان مترجمان بدون مرز به دنبال افرادی است که مایل به شناسایی موارد مورد استفاده، توسعه فناوریهای جدید، مشارکت در جمعآوری دادههای زبانی و تأمین بودجه برای مراحل بعدی این ابتکار عمل هستند.
ضمناً این اقدام یک گام مهم در جهت ارتقاء کیفیت اطلاعات و در دسترس بودن آنها در حوزههای بشر دوستانه نیز است. شرکت کوبو همچنان در طول این همهگیری با ارائه ابزارهای رایگان و منبع باز خود به خدمت به اقدامات بشر دوستانه که از این ابزارها برای ارزیابیهای حضوری و از راه دور استفاده میکنند، ادامه میدهد.
در ادامه حتما بخوانيد: استفاده ماسک های هوشمند از بلوتوث برای ترجمه گفتار