تاریخچه ی ترجمه ی ماشینی

samsam

کاربر طلایی1

تاریخ عضویت : بهمن 1387

تعداد پست ها : 50672

محل سکونت : یزد

تاریخچه ی ترجمه ی ماشینی
دوشنبه 5 مرداد 1394 4:37 PM

امروزه شاهد آن هستیم که بسیاری افراد برای ترجمه متون و درک مطالبی که به زبان‌های دیگر منتشر می‌شوند از ابزارهایی چون Google Translate یا ابزار ترجمه Bing استفاده می‌کنند. ترجمه ماشینی از مدت‌های پیش دغدغه بشر بوده و به مرور با گذشت سالیان متمادی توانسته به نقطه‌ای برسد که امروز شاهد آن هستیم. در ادامه نگاهی اجمالی به تاریخچه ترجمه ماشینی خواهیم انداخت.

۱. قبل از رایانه

می توان ایده های راجع به مکانیکی کردن فرایند ترجمه را به قرن ۱۷ ربط داد، ولی این امکان به صورت واقعی در قرن ۲۰ نمایان شد. در اواسط دهه ی ۱۹۳۰، آرتسرونی فرانسوی-ارمنی و ترویانسکی روسی تقاضای ثبت «ترجمه ماشینی» را دادند. از این دو، ترویانسکی چشمگیرتر ظاهر شد، و نه تنها روشی را برای فرهنگ دو سویه خودکار ارائه کرد، بلکه طرحی را برای کد گذاری قواعد بین زبانی (مبتنی بر اسپرانتو) و خلاصه ای از چگونگی احتمالی کارکرد تحلیل و ترکیب ارائه نمود. با این حال، ایده های ترویانسکی تا پایان دهه ی ۱۹۵۰ شناخته نشد. قبل از آن، رایانه متولد شده بود.

۲. پیشگامان، ۱۹۴۷ تا ۱۹۵۴

به سرعت بعد از اولین ظهور «ماشین حساب های الکترونیکی» تحقیقاتی بر روی استفاده از رایانه ها به عنوان کمک کننده هایی برای ترجمه زبان طبیعی شروع شد. شروع آن ممکن است برگردد به نامه ای در مارس ۱۹۴۷ از طرف وارن ویور که پایه‌گذار راکفلر بود. دو سال بعد، ویور خلاصه ای از یادداشت ها را نوشت (در جولای ۱۹۴۹)، و پیشنهادهای مختلف را که مبتنی بر موفقیت های زمان جنگ در شکستن کد، و پیشرفت هایی توسط کلاد شانون در تئوری اطلاعات و فرضیات راجع به قواعد جهانی را که در زیر زبان طبیعی داشت را مطرح کرد. در حین چند سال تحقیق که در بسیاری از دانشگاه‌های ایالات متحده آمریکا شروع شده بود و در سال ۱۹۵۴ اولین اثبات تحقق ترجمه ماشینی آورده شد (همکاری با آی بی ام و دانشگاه جورج تاون). این دستگاه با اینکه از واژگان و گرامر خیلی محدودی بهره می برد ولی به قدر کافی چشم گیر بود تا بودجه کلانی برای این پروژه ترجمه ماشینی در ایالات متحده اختصاص داده شود و بتواند الهام‌دهنده ی پروژه‌های ترجمه ماشینی در سراسر دنیا باشد.

۳. دهه ی خوش‌بینی ۱۹۵۴- ۱۹۶۶

اولین سیستم‌ها اساسا شامل فرهنگ‌های دو زبانه‌ی وسیع بودند که در آنها مدخل‌های واژه‌های متن مبدا در زبان مقصد، یک یا چندین معادل داشت، و برخی قوانین برای تولید ترتیب کلمات در خروجی استفاده می‌شد. زمان زیادی نگذشت که پژوهشگران فهمیدند قوانین مبتنی بر فرهنگ خاص نحوی خیلی پیچیده و به طور فزاینده‌ای موقتی بود، و نیاز به روش‌های نظام‌مند نحوی پدید آمد. چندین پروژه از پیشرفت‌های جدید در زبان‌شناسی خصوصا در مدل‌های قواعد رسمی الهام گرفته شد، و به نظر می رسید چشم انداز ترجمه ماشینی روشن است.

در گزارش مشهور ۱۹۶۶ نتیجه گرفتند ترجمه ماشینی کندتر و کم دقت‌تر بوده و هزینه‌ای دوبرابری نسبت به ترجمه انسان داشته و نمی‌توان به آینده آن امید زیادی داشت

خوش بینی ها در ابتدای دهه ی تحقیق، با پیشرفت‌های بسیاری همراه شد. با این حال، ناامیدی هایی نیز هنگامی که محققان با «موانع معنایی» مواجه شدند، به وجود آمد که راه حل‌هایی ساده را برای آن نیافتند. چندین سیستم آماده بهره‌برداری وجود داشت -سیستم Mark II (توسعه داده شده توسط آی‌بی‌ام و دانشگاه واشنگتن) در USAF بخش فناوری خارجی، و سیستم دانشگاه جورج واشینگتن در انرژی اتمی آمریکا و یوروتم در ایتالیا نصب شد- اما کیفیت خروجی ناامید کننده بود (با اینکه راضی کننده بود ولی بسیاری از نیازهای کاربران برای اطلاعات به سرعت تولید شده را بر طرف نمی‌کرد). تا سال ۱۹۶۴، حامیان دولت آمریکا به طور روز افزونی نگران فقدان پیشرفت شدند؛ آنها کمیته ی نظارت بر زبان خودکار را راه اندازی کردند، که در گزارش مشهور ۱۹۶۶ نتیجه گرفتند ترجمه ماشینی کندتر و کم دقت‌تر بوده و هزینه‌ای دوبرابری نسبت به ترجمه انسان داشته و نمی‌توان به آینده آن امید زیادی داشت. بنابراین نیاز به سرمایه‌گذاری بیشتر در پژوهش در حوزه ترجمه ماشینی دیده نشد و به جای آن توسعه دستگاه‌های کمکی را برای مترجمان توصیه کردند؛ همانند فرهنگ‌های خودکار و پشتیبانی ادامه‌دار از پژوهش‌های پایه‌ای در زبان‌شناسی محاسبه‌ای.

۴. نتیجه ی گزارش ALPAC ،۱۹۶۶ تا ۱۹۸۰

ALPAC اگرچه گزارشی بود که به طور گسترده به گونه ای متعصبانه و با دیدی کم محکوم شد، ولی هدفی بالقوه را برای تحقیق ترجمه ماشینی در ایالات متحده به مدت یک دهه ارائه کرد و تاثیر چشمگیری در شوروی و اروپا داشت. با این حال، تحقیقات در کانادا، فرانسه و آلمان ادامه نیافت. طی چند سال سیستم سیستران توسط USAF برای استفاده، و کمی بعد توسط کمیسیون بازار مشترک اروپا برای ترجمه سندسازی رو به رشد سریع نصب شد. در همان سال، سیستم عملیاتی موفق دیگری در کانادا ظاهر شد، سیستم میتیو برای ترجمه گزارش های هواشناسی، در دانشگاه مونترال توسعه داده شد.

machine translation

در دهه ی ۱۹۶۰ در ایالات متحده و شوروی فعالیت ترجمه ماشینی بر روی اسناد فنی و علمی زبان روسی به انگلیسی و بر عکس با تعداد کاربران بسیار کم متمرکز بود، که به خاطر دسترسی سریع به اطلاعات، تن به خروجی بدون اصلاح می داد. از اواسط دهه ی ۱۹۷۰ به بعد تقاضا برای ترجمه ماشینی از منابع متفاوتی با نیازهای متفاوت و زبان های مختلف نشات گرفت. نیاز های اجرایی و بازرگانی گروه‌های چند زبانه و تجارت‌های چند ملیتی این نیاز را برای ترجمه در قاره اروپا، کانادا و ژاپن فراتر از ظرفیت خدمات سنتی ترجمه بر انگیخت. تقاضا در این زمان برای سیستم های ترجمه ای با کمک ماشین مقرون به صرفه بود که می توانستند به ترجمه اسناد تجاری و فنی در زبان های اصلی بپردازند.

۵. دهه ی ۱۹۸۰

دهه ی ۱۹۸۰ شاهد ظهور انواع مختلف سیستم های ترجمه ماشینی از کشورهای متفاوت بود. در ابتدا سیستم های رایانه ای بزرگی بودند، که استفاده از آنها تا کنون نیز ادامه دارد. جدا از سیستران، که بر روی جفت های زبانی عمل می کرد، لوگوس (آلمانی به انگلیسی و انگلیسی به فرانسوی)، سیستم های توسعه داده شده در سازمان بهداشت آمریکا (اسپانیایی به انگلیسی و برعکس)، سیستم متال (آلمانی به انگلیسی)، و سیستم های ترجمه اصلی برای انگلیسی ژاپنی و برعکس از شرکت های رایانه ای ژاپنی نیز بود.

دسترسی زیاد به رایانه های کوچک و نرم افزارهای واژه‌پردازی، بازاری را برای سیستم های ترجمه ی ماشینی ایجاد کرد

دسترسی زیاد به رایانه های کوچک و نرم افزارهای واژه‌پردازی، بازاری را برای سیستم های ترجمه ی ماشینی ایجاد کرد، و در آمریکای شمالی و اروپا توسط شرکت هایی همانند ALPS، ویدنر، لینگویستیک پراداکتس، و گلوبال لینک و توسط بسیاری از شرکت های ژاپنی برای مثال شارپ، ان ای سی، اوکی، میتسوبیشی، سانیو، و دیگر سیستم های مبتنی بر رایانه کوچک از چین، تایوان، کره، اروپای شرقی، اتحاد جماهیر شوروی و غیره وارد میدان شدند.

در طول کل دهه‌ی ۱۹۸۰ تحقیق بر روی روش‌ها و تکنیک‌های پیشرفته تر ادامه یافت. بیش از یک دهه، استراتژی غالب ترجمه «غیر مستقیم» از طریق نمایش بینابینی بود، که گاهی اوقات ذاتا میان زبانی بود و شامل تحلیل‌های معنایی همچنین صرفی و نحوی و گاهی اوقات غیر زبانی «پایه های علمی» می شد. برجسته ترین پروژه های این دوره عبارتند از (GETA-Ariane (Grenoble)، SUSY (Saarbruken)، Mu (Kyoto)، DLT (Utrecht)، Rosetta (ٍEinhoven، پروژه دانشگاه کارنگی-ملون، و دو پروژه چند زبانی بین المللی: یوروترا پشتیبانی شده توسط بازار مشترک اروپا، و پروژه ی CICC ژاپن با شرکایی در چین، اندونزی و تایلند.

۶. اوایل دهه ۱۹۹۰

پایان این دهه نقطه ی عطف مهمی بود. اولا، گروهی از شرکت آی بی ام نتایج آزمایشات روی یک سیستم (Candide) که منحصرا مبتنی بر روش های آماری بود منتشر کرد. دوم، گروه های خاصی از ژاپن شروع به استفاده از روش هایی مبتنی بر پیکره ی نمونه‌های ترجمه کردند، یعنی استفاده از رویکردی که اکنون آن را ترجمه ی "مبتنی بر مثال" نامیده اند. در هر دو رویکرد مشخصه تمایز دهنده عدم استفاده از قواعد نحوی و صرفی در تحلیل متون یا در انتخاب واژگان معنایی بود، که هر دو از روش های «مبتنی بر قاعده» قبلی در به کارگیری پیکره های زیاد متنی متمایز بودند.

نوآوری سوم شروع تحقیق بر روی ترجمه کلامی بود، که شامل یکپارچه سازی تشخیص صدا، گفتارسازی، و واحد های ترجمه بود. با این حال، پروژه های مبتنی بر قانون قدیمی ادامه یافتند، برای مثال، پروژه ی کاتالیست در دانشگاه کارنگی- ملون، پروژه ی دانشگاه ماری لند، و تحقیقات که بودجه ی آن را آرپا (پانگلوس) در سه دانشگاه ایالات متحده پرداخت کرد.

مشخصه ی دیگر اوایل دهه ی ۱۹۹۰ تغییر تمرکز فعالیت ترجمه ماشینی از تحقیق «صرف» به کاربردهای عملی، پیشرفت کارگاه های ترجمه برای مترجمان حرفه ای، کار بر روی زبان کنترل شده و سیستم های محدود دامنه ای، کاربرد اجزا ترجمه در سیستم های اطلاعاتی چند زبانه بود.

۷. اواخر دهه ی ۱۹۹۰ و اوایل دهه ۲۰۰۰

امروزه ابزارهای ترجمه ماشینی بسیار پیشرفت کرده‌اند که از بین آنها می‌توان به گوگل ترنسلیت و بینگ اشاره کرد

این سبک ها تا بعد از دهه ی ۱۹۹۰ ادامه یافت؛ به خصوص، استفاده از ترجمه ماشینی و ترجمه های کمکی توسط شرکت های زیادی که به سرعت رشد کرده بودند مورد استفاده قرار گرفت. رشد فروش زیادی در نرم افزارهای ترجمه ماشینی برای رایانه های شخصی و حتی به طرز قابل توجهی، رشد دسترسی به ماشین ترجمه از سرویس های شبکه ای آنلاین (برای مثال آلتا ویستا و خیلی موارد دیگر) رقم خورد. با ورود سیستم‌های جدید، کاهش ابعاد سیستم‌های ترجمه و بهینه‌سازی آنها تقاضای بازار برآورده شد. با این پیشرفت ها، نرم افزار ترجمه ماشینی به محصولی با بازار انبوه تبدیل شد.

امروزه ابزارهای ترجمه ماشینی بسیار پیشرفت کرده‌اند که از بین آنها می‌توان به گوگل ترنسلیت و بینگ اشاره کرد. برای رسیدن به این نقطه راه درازی پیموده شده و هنوز شاهد پیشرفت‌های روزافزونی در این حوزه هستیم.