تبدیل متن فارسی اسکن شده به متن تایپی
چهارشنبه 4 شهریور 1394 6:37 PM
کی از نرمافزارهایی که همواره کاربران ایرانی حسرت داشتن آن را میخوردند، اسکن صفحات متنی و تبدیل آن به متن تایپ شده بوده است. فناوری OCR مخفف عبارت Optical Character Recognition تکنیکی است که در آن یک نرمافزار رایانهای، متون موجود در تصاویر دیجیتال را تشخیص میدهد و آنها را به فایلهای متنی قابل ویرایش تبدیل میکند.
این تکنیک در موارد بسیاری کاربرد دارد. بهعنوان مثال فرض کنید مقالهای 100 صفحهای یا یک پایاننامه دانشگاهی چاپ شده را در اختیار دارید و قصد دارید بخشی از آن را ویرایش کنید. مطمئنا تایپ مجدد تمام محتوا نیازمند صرف وقت و هزینه بسیار است، اما در صورتیکه بتوانید با اسکن صفحات موردنظر، متون موجود را به متنهای تایپ شده تبدیل کنید، عملیات ویرایش بسیار سهل و آسان خواهد شد.
فناوری OCR در بیشتر زبانهای دنیا بخصوص زبان انگلیسی با دقت بسیاری قابل استفاده است ولی استفاده از این فناوری برای تبدیل متون زبان فارسی مشکلات بسیاری داشت. این مشکلات به حدی بود که تقریبا انجام این کار در زبان فارسی به امری غیرممکن تبدیل شده بود، اما خوشبختانه گوگل به منظور ارائه خدمات رایگان خود به کاربران، این مشکل بزرگ را نیز رفع کرده است.
پس چنانچه قصد دارید OCR فارسی را آزمایش کنید یا کتاب، مقاله، پایاننامه و هرگونه محتوای دیگر را به متن تایپ شده تبدیل کنید، میتوانید از روش زیر کمک بگیرید:
آموزش کار با سرویس گوگل درایو
1- ورود به گوگل درایو
برای تبدیل متون موجود در تصاویر اسکن شده به متون تایپ شده باید از سرویس گوگل درایو کمک بگیرید. همانطور که میدانید برای استفاده از همه سرویسهای گوگلی نیازمند عضویت در این سایت و داشتن یک کاربری گوگل هستید.
چنانچه قبلا در یکی از سرویسهای گوگل (همچون جیمیل) عضو شدهاید و کاربری در این سایت دارید، با مراجعه به لینک drive.google.com به محوطه کاربری خود وارد شوید. در غیر اینصورت ضمن ورود به این لینک، روی Create account کلیک کرده و یک کاربری جدید در سایت گوگل برای خودتان ایجاد کنید.
2- آپلود فایل
پس از ورود به محوطه کاربری خود در سرویس گوگل درایو، از بالا سمت چپ روی my drive کلیک کرده و در پنجره بهنمایش درآمده گزینه File Upload را کلیک کنید.
در این مرحله باید فایل اسکن شده (فایل شما میتواند در یکی از فرمتهای استاندارد عکس یا PDF باشد) را از روی هارددیسک رایانه انتخاب کرده و با کلیک روی گزینه Open عملیات آپلود در سرویس گوگل درایو را آغاز کنید.
فناوری OCR تکنیکی است که در آن متون تصاویر دیجیتال را به فایلهای متنی تبدیل می کند.
3- تبدیل به متن تایپ شده
اکنون فایل شما در سرویس گوگل درایو ذخیره شده و با یک ترفند ساده میتوانید آن را به متن تایپ شده تبدیل کنید. برای اجرای این ترفند کافی است روی فایل موردنظر با کلیک راست پس از انتخاب گزینه Open With روی Google Docs کلیک کنید.
سرویس گوگل درایو فایل اسکن شده را به یک فایل متنی تبدیل می کند.
فایل شما در ویرایشگر متنی آنلاین گوگل باز شده و میتوانید متن قابل ویرایش را کپی و به هریک از نرمافزارهای موردنظر خود انتقال دهید.