پاسخ به:بانک مقالات زبان و ادبیات فارسی
12 : نامه فرهنگستان بهار 1386; 9(1 (پياپي 33)):186-205. |
|
واژه شكن فارسي |
|
سمايي سيدمهدي* |
|
* پژوهشگاه اطلاعات و مدارك علمي ايران |
|
مهم ترين بخش پردازش زبان شامل درك متن و تشخيص گفتار است. درك متن گاهي در سطح نحو است. رايانه، در اين حالت، متن را در سطح جمله و بند و كل متن تحليل مي كند. از درك مفهوم متن در ترجمه ماشيني نيز استفاده مي شود. تحقيق در اين بخش از پردازش زبان از اواخر دهه هشتاد ميلادي آغاز شد.
متن معني گسترده اي دارد. در مقياسي عام، حتي علايم راهنمايي و رانندگي را مي توان متن خواند (CRYSTAL 1992, p.387). به اين اعتبار هر لفظ را مي توان متن شمرد و درك مفهوم متن را به حوزه كلمه نيز تعميم دارد. واژه ها يا بسيط اند يا تركيبي يعني يا ساده اند و از چند جز معني دار (تكواژ) ساخته نشده اند يا پيچيده اند و از چند تكواژ ساخته شده اند. تحليل متن در سطح واژه مربوط به حوزه صرف است. واژه هاي تركيبي را بر حسب آنكه با اشتقاق يا با تركيب ساخته شده باشند مي توان به دو دسته اصلي تقسيم كرد: مشتق و مركب. واژه هاي مشتق از يك پايه به اضافه وند ساخته مي شوند؛ مانند دانشمند، بي باك. واژه هاي مركب از اجتماع چند تكواژ مستقل از مقوله هاي اسم و صفت و قيد و بن فعل ساخته مي شوند؛ مانند كتابخانه، عقب گرد، خانه نشين.
واژه شكن فارسي براي تحليل واژه هاي تركيبي اين زبان ساخته شده است. اين نرم افزار واژه هاي مشتق و مركب را تجزيه و مقوله آنها را مشخص مي سازد و آن نخستين برنامه رايانه اي است كه با اين درجه از هوشمندي در حوزه صرف زبان فارسي عمل مي كند.
بخش هاي سه گانه اين مقاله به ترتيب درباره «ساختمان واژه شكن»، «شيوه استخراج قواعد»، «ويژگي هاي واژه شكن» است.
|
|
كليد واژه: |
|
 |
نسخه قابل چاپ
|
چهارشنبه 27 اردیبهشت 1391 12:57 PM
تشکرات از این پست