همکاری بین گوگل ترنسلیت و ویکی پدیا

ویکی پدیا یکی از جامع‌ترین سامانه‌های منتشرکننده مقالات به شمار می‌آید که مطالب را به صورت رایگان و به زبان‌های مختلف در دسترس کاربران قرار می‌دهد. با این حال این دانشمنانه در همه زبان‌ها به یک مقدار توسعه پیدا نکرده و اغلب مطالب انگلیسی آن از دیگر حوزه‌های کلامی، کامل‌تر است. بنابراین بنیاد Wikipedia به دنبال راهکارهایی برای کامل نمودن دیگر نسخه‌ها افتاده و سعی کرده تا مشکل راه‌اندازی نسخه‌های چند زبانه مقالات را از طریق هوش مصنوعی برطرف نماید. شبکه مترجمین راستین در این مطلب به این موضوع می‌پردازد که ویکی پدیا تا چه اندازه توانسته از این طریق به اهداف خود برسد و چه مشکلاتی در این مسیر وجود دارد.

 

اهداف ویکی پدیا

ویکی پدیا (Wikipedia) با این هدف راه‌اندازی شده تا اطلاعات را به صورت آزادانه در هر نقطه از جهان در اختیار کاربران قرار دهد؛ با این حال در حال حاضر بیشتر اطلاعات تنها به زبان انگلیسی در دسترس هستند. حدود پنج و نیم میلیون مقاله در نسخه اصلی ویکی پدیا وجود دارد و همین شاخصه آن را به بزرگترین ناشر جهان تبدیل کرده است (چون ناشرین دیگر چیزی پیش از 1 میلیون مقاله در سامانه‌شان موجود است). کیفیت این مقالات به طرز حیرت‌آوری متفاوت است؛ بعضی از آنها مسائل را بسیار خوب بیان می‌کنند و در برخی دیگر حتی مخلص کلام هم جا می‌ماند.

 

راهکار ویکی پدیا برای ایجاد نسخه‌های چند زبانه مقالات

ویکی‌پدیا با مترجم گوگل (Google Translate) در طول این سال‌ها همکاری نزدیکی داشته و ترجمه مقالات مختلف به زبان‌های متفاوت نتیجه بخشی از این فعالیت بوده است. این کار قرار بود ضمن انتشار هر چه بیشتر مقالات در همه نسخه‌ها، به حل چالش‌های ترجمه هوش مصنوعی نیز کمک کند. بدین منظور بنیاد ویکی پدیا، گوگل ترنسلیت را در ابزار ترنسلیشن محتوای خود که در آن زمان یک نرم‌افزار ترجمه متن باز بود ادغام کرد. متأسفانه نتیجه کار برای ویراستارانی که بر روی نسخه‌های غیر انگلیسی کار می‌کردند، خوب نبود. محتواهای برگردانده شده به جای اینکه مشکلات را حل کنند، خود مسبب ایجاد مسائل بیشتری شدند و بحث در مورد اینکه آیا ویکی پدیا باید از ترجمه ماشینی استفاده کند یا خیر، هنوز هم ادامه دارد.

اکنون این ابزار به عنوان یک ویژگی ثانویه در دسترس است؛ لذا به ویراستاران اجازه می‌دهد تا پیش از نمایش مقالات جدید براساس ترجمه خودکار، ابتدا آن را بررسی کنند و مشکلاتش را برطرف نمایند (دقیقا حالت پسا ویرایش ترجمه ماشینی پیاده‌سازی می‌گردد). اگر این کار به درستی به کار گرفته شود؛ می‌تواند به ویراستاران کمک کند تا ضمن صرفه‌جویی در زمان از نیروی کاری کمتری هم برای تولید نسخه‌های جدید استفاده نمایند. با این حال اگر همه چیز خوب پیش نرود؛ قطعاً یک فاجعه رخ خواهد داد. مدیران جهانی در این زمینه به ترجمه‌های وحشتناک اشاره کرده‌اند و عنوان نموده‌اند که هدف این نیست گوگل ترنسلیت به جایگزینی برای دانستن زبان تبدیل گردد.

 

ترجمه ماشینی | ترجمه انسانی

ویکی پدیا و گوگل ترنسلیت

 

ضعف هوش مصنوعی در ترجمه مقالات ویکی پدیا

چنانچه کسی بگوید هوش مصنوعی (AI) به این درجه از توانایی رسیده که بتواند کارهایی مثل مترجمین متخصص تولید کند؛ باید به عقل او شک کنیم. اینگونه روایت‌ها غالباً ناشی از انجام آزمون‌های محدود است، و وقتی نرم‌افزار در یک شرایط واقعی به کار گرفته ‌شود؛ محدودیت‌های AI خود را نشان می‌دهند. بدون شک خروجی حاصل از نرم‌افزارهای مشتق شده از‌ AI، کیفیتی سطحی دارند. این مترجم متنی را تولید می‌کند که دارای سلاست و روانی سطحی است؛ اما معنای عمیق کلمات و جملات را نمی‌رساند؛ در نتیجه باعث می‌شود که متون اصالت و کارآیی خود را از دست دهند. سیستم‌های هوش مصنوعی با مطالعه الگوهای منتج شده از داده‌های آموزشی، یاد می‌گیرند که چگونه ترجمه کنند؛ بنابراین آنها نسبت به درک تفاوت‌های ظریف زبانی که به ندرت مورد استفاده قرار می‌گیرند عاجزند، و فاقد عقل و درایت مترجمان انسانی هستند.

ترجمه ماشینی ممکن است هرگز به راه مناسبی برای تهیه مقاله در ویکی پدیا تبدیل نشود؛ چرا که قادر به درک عبارات پیچیده انسانی که بین زبان‌ها ترجمه می‌شوند، نیست. پروژه‌های کوچکتر در مقایسه با ویکی پدیا انگلیسی همیشه از کیفیت پایین‌تری برخوردارند. کیفیت نسبی است، و با نوشتن مقالات ناقص و ضعیف هرگز نمی‌توان به اعتبار بالایی دست پیدا کرد. ویکی‌پدیا در برخی از نقاط جهان قابل اعتماد نیست؛ لذا با ترجمه‌های بی‌کیفیت مقالات انگلیسی نمی‌توان کمکی به ترمیم آن نمود. گوگل ترنسلیت به احتمال زیاد (99 درصد) هرگز راه مناسبی برای نشر مقاله در Wikipedia نخواهد بود؛ بنابراین استفاده از آن را نادیده بگیرید و به مهارت‌های خود برای تبدیل کلمات اضافه کنید یا از متخصصین زبانی کمک بگیرید.

 

در ادامه حتما بخوانيد: 5 ذهنیت نادرست در مورد ترجمه ماشینی