چگونه یک سند اسکن شده را به فرمت Microsoft Word تبدیل کنیم؟ متن را در یک فایل PDF به صورت آنلاین تشخیص دهید

سلام. امروز به شما خواهم گفت که چگونه متن را اسکن کنید سند ورد . چرا این کار را انجام دهید؟ پاسخ واضح است، برای ویرایش متن بیشتر. پس از همه، ویرایش تصویر چندان آسان نخواهد بود. چه چیزی بهتر است استفاده کنید، برنامه ها یا سرویس آنلاینبرای ترجمه متن اسکن شده به یک سند Word؟ در ادامه مقاله در مورد این موضوع صحبت خواهم کرد.

به منظور. واسه اینکه. برای اینکه کار را تا حد امکان سرعت بخشیده و ساده کنید، من به دنبال سایت هایی بودم که بتوانید یک سند اسکن شده را به صورت آنلاین به فرمت Word تبدیل کنید. برای این کار ابتدا باید اسکن می کردم و سپس تبدیل می کردم. فوراً می گویم که بسیاری از سایت ها تعداد ترجمه ها را در Word محدود می کنند و برای تبدیل نامحدود باید هزینه پرداخت کنید. من موفق شدم چند سایت پیدا کنم که این مشکل را به صورت نامحدود حل می کنند، اما آن را به اشتراک نمی گذارم زیرا تبدیل متن اسکن شده به Word به صورت آنلاینمعلوم شد وقت تلف کردن است درصد تشخیص متن بسیار پایین است، تایپ مجدد سند از ابتدا آسان تر خواهد بود.

در آن صورت، اگر ابزار آنلاین در این لحظهترجمه یک سند اسکن شده به Word ضعیف است، پس چگونه می توان این کار را تا حد امکان کارآمد انجام داد؟ در مورد این بیشتر در مقاله بخوانید، من دستورالعمل های واضحی را ارائه خواهم داد.

بعد از چند دقیقه قدم زدن در اطراف، برنامه ای به نام ABBYY FineReader Professional پیدا کردم. مطمئناً قبلاً در مورد او شنیده اید. آن را از اینجا دانلود کرد http://nnm-club.me/forum/viewtopic.php?t=851116، نصب آسان و عالی کار می کند.

ABBYY FineReader می تواند اسناد اسکن شده را نه تنها به Word، بلکه به PDF و بسیاری از فرمت های متن و مجله دیگر تبدیل کند.

استفاده از آن بسیار آسان است. نصب و راه اندازی کنید. در مانیتور باید پنجره ای مانند تصویر زیر را در تصویر مشاهده کنید.

در اینجا هیچ چیز پیچیده ای وجود ندارد، به طور مستقیم واضح است که در مورد ما باید روی آن کلیک کنید "اسکن به مایکروسافت ورد". سپس پنجره تنظیمات اسکن را می بینیم که در آن نمی توانید چیزی را تغییر دهید.

بیایید به برنامه شماره بدهیم کار سادهیک صفحه کتاب را اسکن و تشخیص دهید. یک کتاب یا هر سند دیگری را روی اسکنر قرار دهید و روی اسکن کلیک کنید. برنامه شروع به اسکن می کند و سپس باید به طور خودکار سند را تشخیص دهد. اگر تشخیص خودکار رخ ندهد، سپس روی سند اسکن شده کلیک راست کرده و روی "تشخیص" کلیک کنید. در زیر در اسکرین شات می توانید نتیجه ای که گرفتم را مشاهده کنید.

به علاوه روی نماد Word در بالا کلیک کنیدو سند در آن ذخیره می شود قالب متنسند مایکروسافت ورد. البته باید در نظر داشته باشید که متن شناسایی شده باید دوباره خوانده شود، زیرا در هر صورت امکان خطا وجود دارد.

سوال بپرسید، نظر بنویسید. با تشکر از توجه شما.

اگر به یک کپی الکترونیکی از یک سند چاپی نیاز دارید، یک اسکنر کمک ضروری است. با این حال، اغلب لازم است که یک سند اسکن شده نه تنها در قالب گرافیکی، بلکه در قالب متن نیز وجود داشته باشد.

شما نیاز خواهید داشت

  • FineReader یا برنامه مشابه

دستورالعمل ها

1. برای ترجمه یک سند اسکن شده به Word، باید متن روی آن را تشخیص دهید. برای این کار از برنامه ای مانند ABBYY FineReader که برای حل مشکلات مشابه آماده شده است استفاده کنید. علاوه بر این با استفاده از رابط کاربری این برنامه می توانید اسناد را نیز اسکن کنید. به عنوان آنالوگ برنامه FineReader می توانید از برنامه هایی مانند CuneiForm، Readiris Pro، Free OCR، SimpleOCR و غیره استفاده کنید.

2. برای شروع تشخیص متن در یک سند اسکن شده، سند را در برنامه انتخاب شده باز کنید. اگر سند چند صفحه ای است، محدوده صفحاتی را که می خواهید تشخیص دهید مشخص کنید. همچنین می توانید یک منطقه را در صفحه ای که برای شناسایی آماده شده است مشخص کنید. علاوه بر این، می توانید زبان متن را در سند شناسایی شده، مقادیر فیلد و سایر پارامترها انتخاب کنید. بر روی دکمه "تشخیص" کلیک کنید.

3. پس از اتمام مراحل شناسایی، متن به دست آمده در یک پنجره اضافی باز می شود. می توانید آن را بررسی کنید و به صورت دستی تغییراتی را ایجاد کنید و در صورت وجود، خطاهای ایجاد شده توسط برنامه را اصلاح کنید. می توانید این مرحله را رد کرده و پس از ذخیره سند به راحتی به ویرایش متن بازگردید. بعد، روی دکمه "ذخیره" کلیک کنید.

4. از شما خواسته می شود که متن ویرایش شده خود را در یکی از چندین فرمت ذخیره کنید. ما نگران قالب Microsoft Word هستیم. قالب .doc را انتخاب کنید، سندی را که می خواهید ذخیره کنید نام ببرید و آن را ذخیره کنید. کار تکمیل شد - سند اسکن شده به Word منتقل شد.

هنگام کار با اسناد، اغلب برای ویرایش بیشتر و افزایش سهولت استفاده، نیاز دارید که آنها را به یک برگه چاپی در قالب سند MS Word تبدیل کنید. برای انجام این کار بعداً اسکن کنید متنشما باید آن را تشخیص دهید برنامه های شناسایی زیادی وجود دارد. برای دستیابی به حداکثر نتیجه، اجرای یک مدرک شناسایی و ذخیره فایل حاصل کار چندان آسانی نیست.

دستورالعمل ها

1. اول از همه، مطمئن شوید که نسخه اسکن شده سند تا حد امکان واضح است، بدون لکه های غیر ضروری، تاری و مناطق روشن. متن. در صورت لزوم، متن را دوباره اسکن کنید.

2. برنامه شناسایی را اجرا کنید متن. برنامه ای که بهترین نتایج را در این زمینه ارائه می دهد ABBYY FineReader است. آخرین نسخه این شناساگر را دانلود و نصب کنید و سپس آن را اجرا کنید.

3. با استفاده از منوی "فایل"، برگه های اسکن شده را به لیست تشخیص اضافه کنید. برای ساده کردن کار، توصیه می شود آنها را یک به یک تشخیص ندهید، بلکه همه آنها را به یکباره راه اندازی کنید. به خاطر داشته باشید که برنامه های تشخیص می توانند تا ده هزار صفحه را در یک زمان شناسایی کنند و نه بیشتر. منتظر نتیجه بررسی و شناسایی باشید متن .

4. پس از اینکه برنامه فایل های شما را دانلود کرد، زبان تشخیص را تنظیم کنید. بلافاصله پس از این، به انتخاب مناطق برای شناسایی اقدام کنید. برای انجام این کار، تمام مناطقی که به صورت مکانیکی توسط برنامه انتخاب شده اند را حذف کرده و به صورت دستی انتخاب کنید. بسته به نوع فیلد، کیفیت «متن» یا «تصویر» را به آن اختصاص دهید.

5. فرآیند شناسایی را شروع کنید. پس از آن، قالبی را که در آن ذخیره خواهید کرد و نوع قالب بندی را که می خواهید هنگام ذخیره سازی دنبال کنید، انتخاب کنید.

اغلب اتفاق می افتد که شما نیاز به ویرایش متنی دارید که فقط به صورت کاغذی است. در حال حاضر برنامه های زیادی برای تشخیص و ویرایش وجود دارد که نه تنها در کیفیت نتایج، بلکه در عملکرد پیشرفته آنها نیز متفاوت است. Fine Reader یکی از بهترین اپلیکیشن های موجود برای دستیابی به این اهداف است.

شما نیاز خواهید داشت

  • - ویرایشگر متن؛
  • – برنامه Fine Reader.

دستورالعمل ها

1. مثلاً Fine Reader یک برنامه تشخیص متن اسکن شده را دانلود و نصب کنید. با عملکرد برنامه آشنا شوید - بسیاری از نسخه های مدرن از ادغام متن اسکن شده به طور مستقیم در Word پشتیبانی می کنند؛ اگر چنین عملکردی در نسخه شما از برنامه موجود است، عملیات را با رد کردن نکات زیر انجام دهید.

2. اگر نسخه‌های قدیمی برنامه را دارید، سندی را که باید ویرایش کنید، اسکن کنید برنامه استاندارددستگاه کپی سنتی خود را با فرمت jpg در رایانه خود ذخیره کنید.

3. یکبار روی تصویر ذخیره شده کلیک راست کنید، "Open with..." را انتخاب کنید و در لیست برنامه هایی که ظاهر می شود، Fine Reader را که اخیراً نصب کرده اید انتخاب کنید. در صورت لزوم، کادر انتخاب «اعمال همه داده‌ها برای فایل‌هایی از این نوع» را انتخاب کنید. همچنین می توانید به سادگی یک تصویر را با استفاده از آن اسکن کنید برنامه باز، مورد "اسکن و خواندن" را ترجیح می دهند و تصویر از دستگاه مستقیماً به منطقه کار وارد می شود. برای انجام این کار، پارامترهای عملکرد اسکنر را در حالت برنامه Fine Reader از قبل در تنظیمات مشخص کنید.

4. در پنجره برنامه باز شده، "Recognize text" را انتخاب کنید. صبر کنید تا برنامه سند را بخواند. اگر نتایج عملیات مطابق با نیاز شما نیست، تنظیمات اسکن و تشخیص را تغییر دهید و دوباره این روش را تکرار کنید.

5. شما سند حاصل را در هر قالبی که توسط Microsoft Office Word پشتیبانی می شود ذخیره خواهید کرد. Fine Reader را ببندید، به پوشه ای که سند شما در آن ذخیره شده است بروید.

6. فایل را با استفاده از MS Office Word یا هر ویرایشگر متن دیگری که در آن راحت کار می کنید باز کنید. دگرگونی های لازم را در فایل انجام دهید و نتایج را ذخیره کنید.

توجه داشته باشید!
به تنظیمات اسکن توجه ویژه ای داشته باشید؛ بهتر است پارامترهای لازم را از قبل تنظیم کنید.

مشاوره مفید
برنامه را فقط از وب سایت رسمی Abbyy دانلود کنید.

اسکنرها و دستگاه های چند منظوره (MFP) عمیقاً در زندگی کاربران رایانه جا افتاده اند. برای کار موفقیت آمیز با این دستگاه ها، باید قوانین خاصی را رعایت کنید.

شما نیاز خواهید داشت

  • - اسکنر؛
  • - Adobe Reader.

دستورالعمل ها

1. مطمئن شوید که اسکنر به رایانه شما متصل است و تمام درایورهای لازم برای این دستگاه نصب شده است. پوشش اسکنر یا MFP را باز کرده و قرار دهید سند مورد نیازبه گونه ای که سمت اسکن شده به سمت پایین هدایت شود. روی دکمه ای که فرآیند اسکن را شروع می کند کلیک کنید و منتظر بمانید تا عملیات کامل شود.

2. برخی از MFP ها به شما امکان می دهند تجهیزات را با استفاده از برنامه های خاص مدیریت کنید. این ابزار را راه اندازی کنید و روی دکمه "اسکن" کلیک کنید. پس از تکمیل این فرآیند، پوشه ای که سند اسکن شده در آن ذخیره شده است به صورت مکانیکی باز می شود.

3. برخی از نرم افزارها داده های اسکن شده را به صورت مکانیکی ذخیره نمی کنند. به طور سنتی، در چنین مواردی، برنامه ای که برای خواندن اسناد آماده شده است، باز می شود. اگر با این نوع MFP مواجه هستید، پس از باز کردن سند اسکن شده، کلیدهای ترکیبی Ctrl و S را فشار دهید، پوشه ای را که می خواهید تصویر را در آن ذخیره کنید انتخاب کنید و نام فایل را وارد کنید.

4. انتخاب نرم افزارکاملاً روی شانه های شما قرار می گیرد به طور معمول، برنامه های DjvuReaser یا Adobe Reader برای کار با اسناد اسکن شده استفاده می شوند. هنگام تنظیم گزینه های اسکن خود، مطمئن شوید که فرمت مناسب خود را انتخاب کنید.

5. بلافاصله پس از تکمیل فرآیند اسکن، سند را ویرایش کنید. فقط قسمت مورد نیاز را برش دهید. با استفاده از برنامه های خاص، تصویر را تنظیم کنید. اگر نوارهای سیاه بعد از اسکن ظاهر شدند را بردارید. فراهم كردن کیفیت بالااسناد اسکن شده، تنظیمات مناسب برای MFP را انتخاب کنید. بهتر است از رنگ تصویر 8 بیتی استفاده کنید و تعداد نقاط در اینچ - کمتر از 150 باشد.

مشاوره مفید
هنگام اسکن عکس ها، بهتر است از تنظیماتی استفاده کنید که به شما امکان اطمینان از آن را می دهد بهترین کیفیتتصویر دریافتی

این اسکنر برای ایجاد کپی دیجیتالی از تصاویر طراحی شده است. سند اسکن شده را می توان به عنوان نقاشی ذخیره کرد یا به آن تبدیل کرد متنقالب همه چیز بستگی به این دارد که کاربر می خواهد چه نتیجه نهایی بگیرد و از چه برنامه هایی برای کار استفاده می کند.

دستورالعمل ها

1. به طور پیش فرض، اسکنر تصاویر گرفته شده را به صورت فایل های jpg، bmp. یا .tiff ذخیره می کند - این یک فرمت گرافیکی است. می توانید با فایل هایی از این نوع در ویرایشگرهای گرافیکی کار کنید: وضوح، کنتراست، روشنایی سند را تغییر دهید یا از سایر نتایج بصری استفاده کنید. فرمت cross-platform .pdf امکانات کمی متفاوت برای پردازش تصویر می دهد، اما همچنان، برای کار با یک سند اسکن شده در قالب متن، باید از یک تابع جداگانه استفاده کنید. اسکنر، یا یک برنامه ویژه برای تشخیص متن.

2. احتمالات خود را مطالعه کنید اسکنر. برای بسیاری از مدل‌ها، توسعه‌دهندگان ابزاری را برای تبدیل تصویر اسکن شده به متن ارائه می‌کنند؛ این تصویر به همراه دستگاه عرضه می‌شود و روی دیسک نصب قرار دارد. در منو اسکنراین گزینه به عنوان "شناسایی متن" یا OCR (تشخیص کاراکتر نوری) تعیین شده است. اگر این گزینه در دسترس نیست، یک برنامه شخص ثالث مانند Fine Rider نصب کنید.

3. از منو انتخاب کنید اسکنریا دکمه مربوطه را برنامه ریزی کنید و منتظر بمانید تا اسکن کامل شود. بعداً، اطلاعات سند را می توان به صورت مکانیکی به آن ترجمه کرد متنفرمت کنید و در Notepad باز کنید، در غیر این صورت باید چندین مرحله اضافی را انجام دهید.

4. اگر متن به فایلی با فرمت txt صادر شده است، سند را با استفاده از روش معمول ذخیره کنید، یا محتویات آن را کپی کنید و آن را در سندی با فرمت متفاوت، مثلاً doc. (docx.) جایگذاری کنید. اگر همچنان متن را به‌عنوان تصویر می‌بینید، مرحله «تشخیص» را انتخاب کنید و منتظر بمانید تا فرآیند تکمیل شود. بعداً، دستور "Export" را انتخاب کنید یا متن شناسایی شده را کپی کنید و آن را در قالبی مناسب برای شما در یک سند قرار دهید.

5. کیفیت "ترجمه" متن از اسکنرتا حد زیادی به تنظیمات وضوح انتخاب شده بستگی دارد. هرچه رزولوشن بالاتر باشد، اسکنر کپی دقیق تری خواهد ساخت. وقتی می خواهید یک نقاشی را به متن تبدیل کنید، بهترین گزینهتنظیمات با وضوح متوسط ​​وجود خواهد داشت. اگر وضوح خیلی کم باشد، کپی خیلی واضح نخواهد بود و تشخیص متن را دشوارتر می کند. اگر رزولوشن به شدت بالا باشد، نویز اضافی نیز ترجمه گرافیکی به متن را دشوار می کند.

مایکروسافت ورد گزینه بسیار مناسبی را به کاربران خود ارائه می دهد که به شما امکان می دهد متن تایپ شده را ترجمه کنید. متن. نیازی به جستجو در فرهنگ لغات به دنبال ترجمه لغات یا استفاده از برنامه های مترجم نیست. راه اندازی Word بسیار ساده است.

شما نیاز خواهید داشت

  • - کامپیوتر؛
  • - اینترنت

دستورالعمل ها

1. Microsoft Word را روی رایانه خود راه اندازی کنید. نسخه این برنامه باید حداقل 2003 باشد.

2. متنی را که نیاز به ترجمه دارد تایپ کنید و آن را برای اشتباهات املایی بررسی کنید. هر گونه نادرستی می تواند ترجمه متن را برای برنامه دشوار کند یا معنای آن را تحریف کند. متن تایپ شده را انتخاب کرده و در منوی اصلی روی تب "Review" کلیک کنید. در منوی باز شده، "Translation" را انتخاب کنید. بعداً، پنجره "مواد مرجع" در سمت چپ صفحه ظاهر می شود.

3. می توانید این پنجره و موارد دیگر را باز کنید روش ساده. متن یا قطعه مورد نظر را انتخاب کنید، روی آن کلیک راست کرده و از منوی زمینه ظاهر شده، «Translation» را انتخاب کنید.

4. در پنجره باز شده مشخص کنید زبان ابتداییو زبان مقصد پس از این، برنامه متن ترجمه شده را در زیر نمایش می دهد. همچنین می توانید با کلیک بر روی کتیبه ای به همین نام در " پارامترهای ترجمه خاصی را تنظیم کنید. منابع مرجع" در پنجره ای که ظاهر می شود، کادر کنار «استفاده از فرهنگ لغت در اینترنت» را علامت بزنید. این به ترجمه کامل تر کمک می کند.

5. پس از ترجمه متن مورد نیاز، روی دکمه "درج" در زیر آن کلیک کنید. و در سند شما، متنی به زبان دیگر به جای آزمون اولیه ظاهر می شود.

6. اگر چنین دکمه ای وجود ندارد، ترجمه را به راحتی انتخاب کنید، روی آن کلیک راست کرده و "Copy" را انتخاب کنید. و سپس آن را به جای متن اولیه قرار دهید. ترجمه تکمیل خواهد شد.

7. ترجمه نه هر متن به عنوان یک کل، بلکه یک قطعه یا کلمه خاص مجاز است. برای انجام این کار، عنصری را انتخاب کنید که نیاز به ترجمه دارد و تمام اقدامات توضیح داده شده در بالا را روی آن اعمال کنید.

8. به یاد داشته باشید که در هنگام ترجمه، کامپیوتر فقط مفهوم کلی جملات را منتقل می کند. بنابراین، نباید از متن ترجمه شده در اسناد تجاری یا مکاتبات استفاده کنید.

توجه داشته باشید!
برای ترجمه متن به Word، کامپیوتر شما باید به اینترنت متصل باشد. این جایی است که داده های ترجمه از آن گرفته شده است.

کتاب همواره موضوع حکمت انسان بوده است. برای مدت طولانی، کتاب ها ابزاری برای پشت سر گذاشتن حداقل تاریخ یا اطلاعات بوده اند. هر کتابی که بود، همه چیز با لوح های گلی شروع شد که یکی پس از دیگری با پوست، پاپیروس، پوست درخت غان و کاغذ جایگزین شدند. و توسعه کتاب در اینجا متوقف نشد. امروزه بسیاری از افراد از کتاب های به اصطلاح الکترونیکی برای مطالعه استفاده می کنند.

شما نیاز خواهید داشت

  • - کامپیوتر
  • – دوربین یا اسکنر
  • - برنامه ویژه

دستورالعمل ها

1. همه مجازند معشوق خود را در چند مرحله منتقل کنند کتاباز "کاغذ صحافی" گرفته تا متن چاپ شده روی کامپیوتر. به منظور. واسه اینکه. برای اینکه کتابتبدیل آن به متن الکترونیکی آسان نبود، اما باز کردن آن در هر رایانه ای نیز راحت بود؛ فرمت Doc، فرمتی که با بسیاری از ویرایشگرهای متن، از جمله Word مورد علاقه همه باز می شود، بهترین گزینه است.

2. ابتدا باید صفحات را با اسکن یا عکاسی کپی کنید. در این حالت، نسخه های الکترونیکی صفحات بلافاصله به دست می آید، اما در حال حاضر در قالب تصاویر فشرده شده Jpg. مطمئناً می توانید آن را به این ترتیب رها کنید؛ "ورق زدن" آنها کاملاً راحت خواهد بود ، اما خواندن متن برای مدت طولانی در این مورد چندان خوب و مناسب برای چشم نخواهد بود.

3. برای ایجاد متن معمولی از یک عکس، باید آن را تشخیص داد. این به طرز شگفت انگیزی با کمک برنامه های خاصی انجام می شود که باید یکی از آنها را روی رایانه خود داشته باشید یا آن را نصب کنید. برخی از معروف ترین آنها Fine Reader و CuneiForm هستند.

5. به محض اینکه برنامه متنی را از یک فایل Jpg می سازد، می توان آن را در قالب های متنی مختلف از جمله فرمت Doc ذخیره کرد. بنابراین دریافت فایل همراه با کتاب به صورت الکترونیکی آسان است.

مشاوره مفید
پس از این، در صورت تمایل، می توانید این فرمت را به هر فرمت مناسب برای ایجاد تبدیل کنید کتاب الکترونیکیبه طور کامل، خواه Pdf، DjVu، Rtf، Fb2 و دیگران باشد. برای این کار به هر مبدل مناسبی برای این نوع فرمت ها نیاز دارید. قبل از تبدیل، متن را بررسی کنید، در صورت لزوم، آن و تصاویر را مطابق با کتاب مرتب کنید و از کتاب الکترونیکی خود کپی کنید. همچنین امکان تبدیل به جهت عکساز فرمت های بالا در Doc برای خواندن در Word.

توجه داشته باشید!
بسته به برنامه انتخاب شده برای تشخیص اسناد اسکن شده، نام عناصر برنامه و همچنین پارامترهای مشخص شده اضافی ممکن است کمی متفاوت باشد. با این حال، الگوریتم کلی برای کار با برنامه صرف نظر از اینکه چه محصول نرم افزاری را انتخاب کرده اید، ثابت می ماند.

OCR آنلاین روش استخراج کاراکترها از یک سند یا تصویر اسکن شده با استفاده از برنامه های مبتنی بر وب است.

تشخیص کلمات به کاربر این امکان را می دهد که به میزان قابل توجهی در زمان صرفه جویی کند، زیرا نیازی به تایپ کردن آنها ندارد.

امروزه، با کمک فناوری تشخیص متن نوری OCR، تعداد زیادی از کتاب‌های مجله اسکن شده به طور انبوه تبدیل می‌شوند که سپس می‌توان آن‌ها را در رایانه خواند.

تشخیص نوری محبوب شده است، زیرا پس از مراحل شناسایی کاراکترها، متن نه تنها قابل خواندن است، بلکه با استفاده از مترجم خودکار ترجمه می شود، ویرایش هایی انجام می شود و با استفاده از سبک های مختلف قالب بندی می شود.

متأسفانه این فناوری نمی تواند اطلاعات را صد در صد دقیق تشخیص دهد.

بنابراین، پس از تکمیل پردازش فایل، دو سند منبع با هم مقایسه می‌شوند (اگر سند یا کتاب بزرگی قالب‌بندی شده باشد) و تصحیح‌کننده در متن حاصل اصلاحاتی انجام می‌دهد.

1. فرهنگ لغت آنلاین برای تشخیص متن ABBYY

2. خدمات آنلاین Ocr

این سرویس به شما امکان می دهد بدون ثبت نام، یک سند متنی از یک فایل اسکن شده یا از یک تصویر معمولی ایجاد کنید.

این سرویس اولین سرویسی بود که از فناوری تشخیص نوری متن ماشین استفاده کرد.

در اینجا نمونه ای از تشخیص از PDF در Word آورده شده است:

  • به وب سایت خدمات بروید: http://www.onlineocr.net/
  • روی دکمه "انتخاب فایل" کلیک کنید و در رایانه خود سند PDF مورد نیاز را پیدا کنید که متن از آن مشخص می شود. حداکثر اندازه یک سند دریافتی پنج مگابایت است.

  • زبان سند دریافتی و فرمت فایل نهایی را از لیست پیشنهادی فرمت های پشتیبانی شده انتخاب کنید. روی دکمه "تبدیل" کلیک کنید؛

فرآیند تبدیل حداکثر 5 دقیقه طول می کشد، این شاخص به اندازه فایل ورودی، رمزگذاری آن و پیچیدگی طراحی بصری آن بستگی دارد.

3. Free-OCR Web App

مزیت اصلی این سرویس قابلیت کار تقریباً با تمام فرمت ها است.

به عنوان مثال، اکثر سرویس های OCR از فرمت هایی مانند gif، bmp یا tif پشتیبانی نمی کنند.

ظاهرسایت بسیار ساده است، بنابراین هر کاربر می تواند با این کار کنار بیاید.

ترجمه متن به راحت‌تر است، زیرا این برنامهقادر به نمایش تعداد زیادی رمزگذاری متن مختلف و همچنین عناصر طراحی فایل ورودی است.

این سرویس کاملا رایگان است و نیازی به ثبت نام کاربر ندارد.

تنها محدودیت این است که حجم فایل ورودی باید کمتر از 6 مگابایت باشد، بنابراین تشخیص اسناد بزرگ با استفاده از این برنامه امکان پذیر نخواهد بود.

دقیق ترین جهت تشخیص از فرمت JPEG به Word است.

نرم افزار OCR به شما امکان می دهد اسناد عکس گرفته شده یا اسکن شده را مستقیماً به جملات تبدیل کنید.

واقعیت این است که متن در تصویر به صورت شطرنجی، مجموعه ای از نقاط ارائه شده است. نرم افزار ذکر شده مجموعه ای از نقاط را به متن کامل تبدیل می کند که برای ویرایش و ذخیره در دسترس است.

تشخیص حروف برای بهینه‌سازی فرآیند دیجیتالی کردن کتاب‌ها و اسناد چاپی یا دست‌نویس طراحی شده است.

این روش دیجیتالی کردن مرتبه‌ای سریع‌تر از سرعت تایپ دستی از یک تصویر است. به طور گسترده در دیجیتالی کردن کتابخانه ها و آرشیوها استفاده می شود. در ادامه، پنج نماینده برتر خانواده برنامه های مشابه را در نظر خواهیم گرفت.

ABBYY FineReader 10

FineReader رهبر بلامنازع در بین تمام برنامه هایی است که متن را در تصاویر تشخیص می دهد. به ویژه، هیچ نرم افزاری وجود ندارد که الفبای سیریلیک را با وضوح بیشتری پردازش کند. به طور کلی، FineReader دارای 179 زبان است که متن در آن بسیار موفق شناخته می شود.

تنها چیزی که ممکن است کاربران را ناامید کند این است که برنامه پولی است. فقط یک نسخه آزمایشی 15 روزه به صورت رایگان در دسترس است. در این مدت اسکن 50 صفحه مجاز است.

سپس برای استفاده از برنامه باید هزینه پرداخت کنید. FineReader به راحتی کم و بیش "می خورد". تصویر با کیفیت بالا. منبع کاملاً بی اهمیت است. عکس باشد، اسکن صفحه یا هر عکسی با حروف.

مزایای:

  • تشخیص دقیق؛
  • تعداد زیادی زبان خواندن؛
  • تحمل کیفیت تصویر منبع

نقص:

  • نسخه آزمایشی به مدت 15 روز.

OCR CuneiForm

برنامه رایگان برای خواندن اطلاعات متنی از تصاویر. دقت تشخیص مرتبه ای کمتر از برنامه قبلی مورد بررسی است. اما برای یک ابزار رایگان، عملکرد هنوز عالی است.

جالب هست! CuneiForm بلوک های متن، گرافیک و حتی جداول مختلف را تشخیص می دهد. علاوه بر این، حتی جداول بدون خط نیز قابل خواندن است.

برای اطمینان از دقت، فرهنگ لغت های ویژه به فرآیند شناسایی متصل می شوند که دوباره پر می شوند واژگاناز اسناد اسکن شده

مزایای:

  • توزیع رایگان؛
  • استفاده از فرهنگ لغت برای بررسی صحت متن؛
  • اسکن متن از فتوکپی های بی کیفیت.

ایرادات:

  • دقت نسبتا کم؛
  • تعداد کمی از زبان های پشتیبانی شده

WinScan2PDF

این حتی یک برنامه تمام عیار نیست، بلکه یک ابزار است. نیازی به نصب نیست و فایل اجرایی تنها چند کیلوبایت وزن دارد. فرآیند تشخیص بسیار سریع است، اگرچه اسناد حاصل منحصراً در قالب PDF ذخیره می شوند.

در واقع کل فرآیند با فشار دادن سه دکمه انجام می شود: انتخاب منبع، مقصد و در واقع راه اندازی برنامه.

این ابزار برای پردازش دسته ای سریع بسیاری از فایل ها طراحی شده است. برای راحتی کاربران، یک بسته بزرگ زبان رابط ارائه شده است.

مزایای:

  • قابل حمل بودن؛
  • کار سریع;
  • راحتی در استفاده.

ایرادات:

SimpleOCR

یک برنامه کوچک عالی برای تشخیص متون از تصاویر. حتی از خواندن نسخه های خطی نیز پشتیبانی می کند. مشکل این است که روسی نه در بسته زبان رابط و نه در لیست زبان های پشتیبانی شده برای شناسایی گنجانده شده است.

با این حال، اگر نیاز به اسکن انگلیسی، دانمارکی یا فرانسوی دارید، گزینه رایگان بهتری پیدا نخواهید کرد.

در زمینه خود، این برنامه رمزگشایی دقیق فونت، حذف نویز و استخراج را ارائه می دهد تصاویر گرافیکی. علاوه بر این، رابط برنامه دارای یک ویرایشگر متن داخلی است، تقریباً مشابه WordPad، که به طور قابل توجهی قابلیت استفاده برنامه را افزایش می دهد.

مزایای:

  • تشخیص دقیق متن؛
  • ویرایشگر متن مناسب؛
  • حذف نویز از یک تصویر

ایرادات:

  • فقدان کامل زبان روسی

Freemore OCR

این برنامه به شما امکان می دهد متن و گرافیک را به سرعت از تصاویر استخراج کنید. این نرم افزار از کار با چندین اسکنر بدون از دست دادن عملکرد پشتیبانی می کند. متن استخراج شده را می توان در یک سند متنی یا فرمت سند MS Office ذخیره کرد.

علاوه بر این، یک تابع تشخیص چند صفحه ارائه شده است.

Freemore OCR به صورت رایگان توزیع می شود، با این حال، رابط فقط به زبان انگلیسی است. اما این شرایط به هیچ وجه بر سهولت استفاده تأثیر نمی گذارد، زیرا کنترل ها به روشی بصری سازماندهی شده اند.

مزایای:

  • توزیع رایگان؛
  • توانایی کار با اسکنرهای متعدد؛
  • دقت تشخیص مناسب است.

ایرادات

  • عدم وجود زبان روسی در رابط؛
  • نیاز به دانلود بسته زبان روسی برای شناخت.

سوال یکی از کاربران

عصر بخیر.

لطفا به من بگو. من یک فایل PDF دارم و باید آن را ویرایش کنم (تغییر بخشی از متن، اضافه کردن عنوان و برجسته کردن). من فکر می کنم که بهتر است چنین عملیاتی را در WORD انجام دهیم.

چگونه می توانم این فایل را به فرمت DOCX (که WORD با آن کار می کند) تبدیل کنم؟ من چندین سرویس را امتحان کردم، اما برخی خطا می دهند، برخی دیگر متن را منتقل می کنند اما تصاویر را از دست می دهند. آیا می توانیم بهتر عمل کنیم؟

مارینا ایوانوا (نیژنی نووگورود)

روز خوب!

بله، در کارهای اداری هر از گاهی باید با چنین وظیفه ای روبرو شوید. در برخی موارد، به راحتی حل می شود، در برخی دیگر بسیار دشوار است ☺.

حقیقت این هست که فایل پی دی اف s ممکن است متفاوت باشد:

  1. در قالب تصاویر: وقتی هر صفحه یک عکس/تصویر است، یعنی. اساساً هیچ متنی وجود ندارد. سخت ترین گزینه برای کار، زیرا ... ترجمه همه اینها به متن مانند کار با یک برگه اسکن شده است (کسانی که اسکنر دارند متوجه می شوند ☺). در این مورد، توصیه می شود از ویژه استفاده کنید. برنامه ها؛
  2. به صورت متن: فایل دارای متنی است که در آن فشرده شده است فرمت PDFو از ویرایش محافظت می شود (محافظت نمی شود) (به طور کلی کار با این نوع آسان تر است). در این صورت، هم خدمات آنلاین و هم برنامه ها انجام خواهند داد.

در این مقاله چندین روش برای تبدیل PDF به WORD را بررسی خواهم کرد. من فکر می کنم که هر کسی بتواند مناسب ترین مورد را برای خود پیدا کند و این کار را انجام دهد ☺.

برنامه ها

مایکروسافت ورد

نسخه های جدید Word (حداقل در سال 2016) دارای ابزار ویژه ای برای تبدیل PDFفایل ها. علاوه بر این، هیچ چیزی از شما لازم نیست - کافی است مقداری "pdf" را باز کنید و با تحول موافقت کنید. در عرض چند دقیقه به نتیجه خواهید رسید.

و به هر حال، این عملکرد در Word به خوبی کار می کند (و با هر نوع فایل PDF). به همین دلیل است که توصیه می کنم ابتدا این روش را امتحان کنید.

نحوه استفاده: ابتدا Word را باز کنید، سپس روی "file/open" کلیک کنید و فایل مورد نیاز خود را انتخاب کنید.

وقتی در مورد تحول پرسیده شد، فقط موافقت کنید. پس از مدتی فایل خود را به صورت متنی مشاهده خواهید کرد.

مزایا: سریع؛ هیچ حرکت بدنی از کاربر لازم نیست. نتیجه قابل قبول

معایب: برنامه پرداخت می شود. ممکن است برخی از قالب بندی سند از بین برود. همه تصاویر منتقل نمی شوند. روند تبدیل را نمی توان به هیچ وجه تحت تأثیر قرار داد - همه چیز در حالت خودکار پیش می رود.

توجه داشته باشید!

به جای Word و Excel، می توانید از آنالوگ های رایگان دیگر با عملکرد مشابه استفاده کنید. من در این مقاله در مورد آنها صحبت کردم:

ABBY Fine Reader

محدودیت ها در نسخه آزمایشی : 100 صفحه برای تشخیص; این نرم افزار پس از نصب به مدت 30 روز کار می کند.

اما این برنامه یکی از جهانی ترین است - می تواند هر فایل PDF، تصویر، عکس، اسکن را "تغذیه" کند. طبق اصل زیر کار می کند: بلوک های متن، تصاویر، جداول انتخاب می شوند (حالت خودکار وجود دارد و حالت دستی وجود دارد) و سپس متن را از این بلوک ها تشخیص می دهد. خروجی یک سند Word معمولی است.

راستی، آخرین نسخه هاهدف برنامه ها برای کاربر تازه کار است - استفاده از برنامه بسیار ساده است. در اولین پنجره خوش آمد گویی را انتخاب کنید "تصویر یا PDF در Microsoft Word" (نگاه کنید به تصویر زیر).

Fine Reader - کارهای پرطرفدار موجود در پنجره خوش آمدگویی شروع

در مرحله بعد، برنامه به طور خودکار سند شما را به صفحات تقسیم می کند و در هر صفحه تمام بلوک ها را برجسته می کند و آنها را می شناسد. تنها کاری که باید انجام دهید این است که خطاها را تصحیح کرده و سند را با فرمت DOCX ذخیره کنید (به هر حال، Fine Reader می تواند در فرمت های دیگر ذخیره کند: HTML، TXT، DOC، و غیره).

Fine Reader - تشخیص متن و تصاویر در یک فایل PDF

جوانب مثبت: می توانید هر تصویر یا فایل PDF را به فرمت متن تبدیل کنید. بهترین الگوریتم های تشخیص؛ گزینه هایی برای بررسی متن شناخته شده وجود دارد. شما می توانید حتی با ناامید کننده ترین فایل ها که توسط همه سرویس ها و برنامه های دیگر رها شده اند کار کنید.

معایب: برنامه پرداخت می شود. شما باید به صورت دستی بلوک ها را در هر صفحه مشخص کنید.

Readiris Pro

محدودیت آزمایشی: 10 روز استفاده یا پردازش 100 صفحه.

این برنامه برخی از رقبای Fine Reader است. این به شما کمک می کند یک سند را از یک چاپگر اسکن کنید (حتی اگر درایور برای آن نداشته باشید!) و سپس اطلاعات را از اسکن تشخیص داده و در Word ذخیره کنید (در این مقاله ما به بخش دوم یعنی تشخیص علاقه مندیم. ☺).

به هر حال، به لطف یکپارچگی بسیار نزدیک با Word، این برنامه قادر به تشخیص است فرمول های ریاضی، نمادهای مختلف غیر استاندارد، هیروگلیف و غیره.

مزایا: شناخت زبانهای مختلف(انگلیسی، روسی و غیره)؛ بسیاری از فرمت ها برای ذخیره؛ الگوریتم های خوب؛ سیستم مورد نیاز کمتر از سایر برنامه های آنالوگ است.

معایب: پرداخت شده. خطاها رخ می دهد و پردازش دستی لازم است.

تبدیل رایگان PDF به Word

خیلی برنامه سادهبرای تبدیل سریع فایل های PDF به DOC. این برنامه کاملا رایگان است و هنگام تبدیل، سعی می کند قالب بندی اصلی را حفظ کند (که بسیاری از آنالوگ ها فاقد آن هستند).

با وجود این واقعیت که هیچ زبان روسی در برنامه وجود ندارد، فهمیدن همه چیز بسیار ساده است: در اولین پنجره فایل های PDF را مشخص می کنید ( فایل را انتخاب کنید- یعنی انتخاب فایل ها)؛ در دوم - فرمت ذخیره (به عنوان مثال، DOC)؛ در سوم - پوشه ای که اسناد تبدیل شده در آن ذخیره می شود (به طور پیش فرض از "اسناد من" استفاده می شود).

به طور کلی، یک ابزار خوب و مناسب برای تبدیل فایل های نسبتا ساده است.

خدمات آنلاین

پی دی اف کوچک

رایگان

Smallpdf.com - راه حل رایگان برای تمام مشکلات PDF

یک سرویس عالی و رایگان برای تبدیل و کار با فایل های PDF. هر چیزی که ممکن است نیاز داشته باشید اینجا است: فشرده سازی، تبدیل بین JPG، Word، PPT، ادغام PDF، چرخش، ویرایش و غیره!

مزایای:

  1. تبدیل و ویرایش با کیفیت بالا و سریع؛
  2. رابط کاربری ساده و کاربر پسند: حتی یک کاربر تازه کار کامل می تواند آن را درک کند.
  3. در همه سیستم عامل ها: ویندوز، اندروید، لینوکس و غیره موجود است.
  4. کار با این سرویس رایگان است.

ایرادات:

  1. با برخی از انواع فایل های PDF (جایی که به تشخیص تصویر نیاز است) کار نمی کند.

مبدل PDF

هزینه: حدود 9 دلار در ماه

این سرویس به شما امکان می دهد فقط دو صفحه را به صورت رایگان پردازش کنید (برای بقیه باید هزینه اضافی بپردازید). اما این سرویس به شما امکان می دهد یک فایل PDF را به فرمت های مختلف تبدیل کنید: Word، Excel، Power Point، تصاویر و غیره. همچنین از الگوریتم‌هایی استفاده می‌کند که با آنالوگ‌های آن متفاوت هستند (آنها اجازه می‌دهند کیفیت پردازش فایل مرتبه‌ای بالاتر از آنالوگ‌های آن باشد). در واقع، به لطف این عملکرد و الگوریتم ها، آن را به بررسی اضافه کردم ...

به هر حال، از دو صفحه اول می توانید نتیجه گیری کنید که آیا ارزش خرید اشتراک سرویس را دارد (هزینه حدود 9 دلار در ماه کارکرد).

زمزار

رایگان

مبدل آنلاین چند منظوره، با دسته ای از فرمت ها کار می کند: MP4، MP3، PDF، DOC، MKV، WAV و بسیاری دیگر. با وجود این واقعیت که این سرویس تا حدودی عجیب به نظر می رسد، استفاده از آن بسیار ساده است: زیرا... تمام اقدامات گام به گام انجام می شوند (نگاه کنید به تصویر بالا: مرحله 1، 2، 3، 4 (مرحله 1، 2، 3، 4)).

  1. مرحله 1 (STEP 1) - یک فایل را انتخاب کنید.
  2. مرحله 2 (STEP 2) - به چه فرمتی تبدیل شود.
  3. مرحله 3 (گام 3) - شما باید ایمیل خود را نشان دهید (به هر حال، شاید مقاله ای در مورد آن داشته باشید).
  4. مرحله 4 (STEP 4) - دکمه برای شروع تبدیل.

ویژگی ها:

  1. دسته ای از قالب ها برای پاکت نامه ها از یکی به دیگری (از جمله PDF).
  2. امکان پردازش دسته ای؛
  3. الگوریتم بسیار سریع؛
  4. خدمات رایگان است؛
  5. محدودیتی در اندازه فایل وجود دارد - بیش از 50 مگابایت.
  6. نتیجه پاکت نامه از طریق پست می رسد.

تبدیل

رایگان

سرویسی قدرتمند و رایگان برای کار آنلاین با فرمت های مختلف. در مورد فایل های PDF، این سرویس می تواند آنها را به فرمت DOC تبدیل کند (به هر حال، این سرویس حتی با "PDF" های پیچیده ای کار می کند که دیگران قادر به مقابله با آن نیستند)، فشرده سازی، ادغام و غیره.

هیچ محدودیتی در اندازه فایل ها و ساختار آنها وجود ندارد. برای افزودن یک فایل، حتی نیازی به داشتن آن روی دیسک ندارید - فقط آدرس URL را مشخص کنید و سند نهایی را با فرمت DOC از سرویس دانلود کنید. بسیار راحت است، من آن را توصیه می کنم!

iLOVEPDF

رایگان

مشابه سایت قبلی: همچنین تمام قابلیت های کار با PDF - فشرده سازی، ادغام، تقسیم، تبدیل (به فرمت های مختلف) را دارد. به شما امکان می دهد فایل های PDF کوچک مختلف را به سرعت تبدیل کنید.

از معایب: این سرویس نمی تواند فایل هایی را که شامل تصاویر هستند پردازش کند (به عنوان مثال "PDF" در جایی که متنی وجود ندارد ، در اینجا چیزی از آنها دریافت نمی کنید - این سرویس به شما خطا می دهد که متنی در فایل وجود ندارد).

PDF.io

رایگان

یک سرویس آنلاین بسیار جالب و چند منظوره. به شما امکان می دهد PDF را به: Excel، Word، JPG، HTML، PNG (و عملیات مشابه در جهت مخالف) تبدیل کنید. علاوه بر این، این سرویس به شما اجازه می دهد تا فایل هایی از این نوع را فشرده کنید، صفحات را ادغام و تقسیم کنید. به طور کلی یک دستیار راحت در کارهای اداری ☺.

از معایب: این سرویس با انواع فایل ها مقابله نمی کند (به ویژه در مورد برخی می گوید که حاوی متن نیستند).

اضافه شده استقبال می شود ...