تاریخچه ی ترجمه ی ماشینی
دوشنبه 5 مرداد 1394 4:37 PM
امروزه شاهد آن هستیم که بسیاری افراد برای ترجمه متون و درک مطالبی که به زبانهای دیگر منتشر میشوند از ابزارهایی چون Google Translate یا ابزار ترجمه Bing استفاده میکنند. ترجمه ماشینی از مدتهای پیش دغدغه بشر بوده و به مرور با گذشت سالیان متمادی توانسته به نقطهای برسد که امروز شاهد آن هستیم. در ادامه نگاهی اجمالی به تاریخچه ترجمه ماشینی خواهیم انداخت.
می توان ایده های راجع به مکانیکی کردن فرایند ترجمه را به قرن ۱۷ ربط داد، ولی این امکان به صورت واقعی در قرن ۲۰ نمایان شد. در اواسط دهه ی ۱۹۳۰، آرتسرونی فرانسوی-ارمنی و ترویانسکی روسی تقاضای ثبت «ترجمه ماشینی» را دادند. از این دو، ترویانسکی چشمگیرتر ظاهر شد، و نه تنها روشی را برای فرهنگ دو سویه خودکار ارائه کرد، بلکه طرحی را برای کد گذاری قواعد بین زبانی (مبتنی بر اسپرانتو) و خلاصه ای از چگونگی احتمالی کارکرد تحلیل و ترکیب ارائه نمود. با این حال، ایده های ترویانسکی تا پایان دهه ی ۱۹۵۰ شناخته نشد. قبل از آن، رایانه متولد شده بود.
به سرعت بعد از اولین ظهور «ماشین حساب های الکترونیکی» تحقیقاتی بر روی استفاده از رایانه ها به عنوان کمک کننده هایی برای ترجمه زبان طبیعی شروع شد. شروع آن ممکن است برگردد به نامه ای در مارس ۱۹۴۷ از طرف وارن ویور که پایهگذار راکفلر بود. دو سال بعد، ویور خلاصه ای از یادداشت ها را نوشت (در جولای ۱۹۴۹)، و پیشنهادهای مختلف را که مبتنی بر موفقیت های زمان جنگ در شکستن کد، و پیشرفت هایی توسط کلاد شانون در تئوری اطلاعات و فرضیات راجع به قواعد جهانی را که در زیر زبان طبیعی داشت را مطرح کرد. در حین چند سال تحقیق که در بسیاری از دانشگاههای ایالات متحده آمریکا شروع شده بود و در سال ۱۹۵۴ اولین اثبات تحقق ترجمه ماشینی آورده شد (همکاری با آی بی ام و دانشگاه جورج تاون). این دستگاه با اینکه از واژگان و گرامر خیلی محدودی بهره می برد ولی به قدر کافی چشم گیر بود تا بودجه کلانی برای این پروژه ترجمه ماشینی در ایالات متحده اختصاص داده شود و بتواند الهامدهنده ی پروژههای ترجمه ماشینی در سراسر دنیا باشد.
اولین سیستمها اساسا شامل فرهنگهای دو زبانهی وسیع بودند که در آنها مدخلهای واژههای متن مبدا در زبان مقصد، یک یا چندین معادل داشت، و برخی قوانین برای تولید ترتیب کلمات در خروجی استفاده میشد. زمان زیادی نگذشت که پژوهشگران فهمیدند قوانین مبتنی بر فرهنگ خاص نحوی خیلی پیچیده و به طور فزایندهای موقتی بود، و نیاز به روشهای نظاممند نحوی پدید آمد. چندین پروژه از پیشرفتهای جدید در زبانشناسی خصوصا در مدلهای قواعد رسمی الهام گرفته شد، و به نظر می رسید چشم انداز ترجمه ماشینی روشن است.
خوش بینی ها در ابتدای دهه ی تحقیق، با پیشرفتهای بسیاری همراه شد. با این حال، ناامیدی هایی نیز هنگامی که محققان با «موانع معنایی» مواجه شدند، به وجود آمد که راه حلهایی ساده را برای آن نیافتند. چندین سیستم آماده بهرهبرداری وجود داشت -سیستم Mark II (توسعه داده شده توسط آیبیام و دانشگاه واشنگتن) در USAF بخش فناوری خارجی، و سیستم دانشگاه جورج واشینگتن در انرژی اتمی آمریکا و یوروتم در ایتالیا نصب شد- اما کیفیت خروجی ناامید کننده بود (با اینکه راضی کننده بود ولی بسیاری از نیازهای کاربران برای اطلاعات به سرعت تولید شده را بر طرف نمیکرد). تا سال ۱۹۶۴، حامیان دولت آمریکا به طور روز افزونی نگران فقدان پیشرفت شدند؛ آنها کمیته ی نظارت بر زبان خودکار را راه اندازی کردند، که در گزارش مشهور ۱۹۶۶ نتیجه گرفتند ترجمه ماشینی کندتر و کم دقتتر بوده و هزینهای دوبرابری نسبت به ترجمه انسان داشته و نمیتوان به آینده آن امید زیادی داشت. بنابراین نیاز به سرمایهگذاری بیشتر در پژوهش در حوزه ترجمه ماشینی دیده نشد و به جای آن توسعه دستگاههای کمکی را برای مترجمان توصیه کردند؛ همانند فرهنگهای خودکار و پشتیبانی ادامهدار از پژوهشهای پایهای در زبانشناسی محاسبهای.
ALPAC اگرچه گزارشی بود که به طور گسترده به گونه ای متعصبانه و با دیدی کم محکوم شد، ولی هدفی بالقوه را برای تحقیق ترجمه ماشینی در ایالات متحده به مدت یک دهه ارائه کرد و تاثیر چشمگیری در شوروی و اروپا داشت. با این حال، تحقیقات در کانادا، فرانسه و آلمان ادامه نیافت. طی چند سال سیستم سیستران توسط USAF برای استفاده، و کمی بعد توسط کمیسیون بازار مشترک اروپا برای ترجمه سندسازی رو به رشد سریع نصب شد. در همان سال، سیستم عملیاتی موفق دیگری در کانادا ظاهر شد، سیستم میتیو برای ترجمه گزارش های هواشناسی، در دانشگاه مونترال توسعه داده شد.
در دهه ی ۱۹۶۰ در ایالات متحده و شوروی فعالیت ترجمه ماشینی بر روی اسناد فنی و علمی زبان روسی به انگلیسی و بر عکس با تعداد کاربران بسیار کم متمرکز بود، که به خاطر دسترسی سریع به اطلاعات، تن به خروجی بدون اصلاح می داد. از اواسط دهه ی ۱۹۷۰ به بعد تقاضا برای ترجمه ماشینی از منابع متفاوتی با نیازهای متفاوت و زبان های مختلف نشات گرفت. نیاز های اجرایی و بازرگانی گروههای چند زبانه و تجارتهای چند ملیتی این نیاز را برای ترجمه در قاره اروپا، کانادا و ژاپن فراتر از ظرفیت خدمات سنتی ترجمه بر انگیخت. تقاضا در این زمان برای سیستم های ترجمه ای با کمک ماشین مقرون به صرفه بود که می توانستند به ترجمه اسناد تجاری و فنی در زبان های اصلی بپردازند.
دهه ی ۱۹۸۰ شاهد ظهور انواع مختلف سیستم های ترجمه ماشینی از کشورهای متفاوت بود. در ابتدا سیستم های رایانه ای بزرگی بودند، که استفاده از آنها تا کنون نیز ادامه دارد. جدا از سیستران، که بر روی جفت های زبانی عمل می کرد، لوگوس (آلمانی به انگلیسی و انگلیسی به فرانسوی)، سیستم های توسعه داده شده در سازمان بهداشت آمریکا (اسپانیایی به انگلیسی و برعکس)، سیستم متال (آلمانی به انگلیسی)، و سیستم های ترجمه اصلی برای انگلیسی ژاپنی و برعکس از شرکت های رایانه ای ژاپنی نیز بود.
دسترسی زیاد به رایانه های کوچک و نرم افزارهای واژهپردازی، بازاری را برای سیستم های ترجمه ی ماشینی ایجاد کرد، و در آمریکای شمالی و اروپا توسط شرکت هایی همانند ALPS، ویدنر، لینگویستیک پراداکتس، و گلوبال لینک و توسط بسیاری از شرکت های ژاپنی برای مثال شارپ، ان ای سی، اوکی، میتسوبیشی، سانیو، و دیگر سیستم های مبتنی بر رایانه کوچک از چین، تایوان، کره، اروپای شرقی، اتحاد جماهیر شوروی و غیره وارد میدان شدند.
در طول کل دههی ۱۹۸۰ تحقیق بر روی روشها و تکنیکهای پیشرفته تر ادامه یافت. بیش از یک دهه، استراتژی غالب ترجمه «غیر مستقیم» از طریق نمایش بینابینی بود، که گاهی اوقات ذاتا میان زبانی بود و شامل تحلیلهای معنایی همچنین صرفی و نحوی و گاهی اوقات غیر زبانی «پایه های علمی» می شد. برجسته ترین پروژه های این دوره عبارتند از (GETA-Ariane (Grenoble)، SUSY (Saarbruken)، Mu (Kyoto)، DLT (Utrecht)، Rosetta (ٍEinhoven، پروژه دانشگاه کارنگی-ملون، و دو پروژه چند زبانی بین المللی: یوروترا پشتیبانی شده توسط بازار مشترک اروپا، و پروژه ی CICC ژاپن با شرکایی در چین، اندونزی و تایلند.
پایان این دهه نقطه ی عطف مهمی بود. اولا، گروهی از شرکت آی بی ام نتایج آزمایشات روی یک سیستم (Candide) که منحصرا مبتنی بر روش های آماری بود منتشر کرد. دوم، گروه های خاصی از ژاپن شروع به استفاده از روش هایی مبتنی بر پیکره ی نمونههای ترجمه کردند، یعنی استفاده از رویکردی که اکنون آن را ترجمه ی "مبتنی بر مثال" نامیده اند. در هر دو رویکرد مشخصه تمایز دهنده عدم استفاده از قواعد نحوی و صرفی در تحلیل متون یا در انتخاب واژگان معنایی بود، که هر دو از روش های «مبتنی بر قاعده» قبلی در به کارگیری پیکره های زیاد متنی متمایز بودند.
نوآوری سوم شروع تحقیق بر روی ترجمه کلامی بود، که شامل یکپارچه سازی تشخیص صدا، گفتارسازی، و واحد های ترجمه بود. با این حال، پروژه های مبتنی بر قانون قدیمی ادامه یافتند، برای مثال، پروژه ی کاتالیست در دانشگاه کارنگی- ملون، پروژه ی دانشگاه ماری لند، و تحقیقات که بودجه ی آن را آرپا (پانگلوس) در سه دانشگاه ایالات متحده پرداخت کرد.
مشخصه ی دیگر اوایل دهه ی ۱۹۹۰ تغییر تمرکز فعالیت ترجمه ماشینی از تحقیق «صرف» به کاربردهای عملی، پیشرفت کارگاه های ترجمه برای مترجمان حرفه ای، کار بر روی زبان کنترل شده و سیستم های محدود دامنه ای، کاربرد اجزا ترجمه در سیستم های اطلاعاتی چند زبانه بود.
این سبک ها تا بعد از دهه ی ۱۹۹۰ ادامه یافت؛ به خصوص، استفاده از ترجمه ماشینی و ترجمه های کمکی توسط شرکت های زیادی که به سرعت رشد کرده بودند مورد استفاده قرار گرفت. رشد فروش زیادی در نرم افزارهای ترجمه ماشینی برای رایانه های شخصی و حتی به طرز قابل توجهی، رشد دسترسی به ماشین ترجمه از سرویس های شبکه ای آنلاین (برای مثال آلتا ویستا و خیلی موارد دیگر) رقم خورد. با ورود سیستمهای جدید، کاهش ابعاد سیستمهای ترجمه و بهینهسازی آنها تقاضای بازار برآورده شد. با این پیشرفت ها، نرم افزار ترجمه ماشینی به محصولی با بازار انبوه تبدیل شد.
امروزه ابزارهای ترجمه ماشینی بسیار پیشرفت کردهاند که از بین آنها میتوان به گوگل ترنسلیت و بینگ اشاره کرد. برای رسیدن به این نقطه راه درازی پیموده شده و هنوز شاهد پیشرفتهای روزافزونی در این حوزه هستیم.