פורמט pdf מכיל בדרך כלל ספרים אלקטרוניים, הוראות ומסמכים אחרים. חלקם מוגנים מפני העתקה, כלומר המידע בהם כלול בצורה של תמונה וניתן "לשלוף" את הטקסט ממנו רק על ידי זיהוי.
נחוץ
- - אבי רוזן;
- - קורא תמונות מסך אבי.
הוראות
שלב 1
הורד והתקן את תוכנית Abbyy FineReader במחשב שלך, לשם כך עבור לאתר הרשמי של היישום https://www.abbyy.ua/download/, בחר את המוצר הרצוי ולחץ על קישור ההורדה. תוכנית זו נועדה לסרוק מסמכי נייר, אך ניתן להשתמש בה לזיהוי קובץ בפורמט pdf. לשם כך, הפעל את התוכנית ובחר בתפריט "קובץ" - "פתח". בחר את הקובץ שברצונך לזהות מהמחשב שלך.
שלב 2
הגדר את הגדרות הזיהוי: שפה (תוכל לבחור מספר שפות, למשל, כאשר הטקסט ברוסית, אך הוא מכיל מילים באנגלית); חלוקת טקסט לבלוקים (גושי טקסט, תמונות), רזולוציה. בחר את פיסת הטקסט הנדרשת, לחץ באמצעות לחצן העכבר הימני ובחר את סוג החסימה (טקסט, תמונה או טבלה).
שלב 3
לאחר מכן לחץ על "זיהוי". לאחר מכן, תוכל לשמור את הטקסט המתקבל על ידי העתקתו למסמך Word. ניתן לבצע זיהוי של קובץ pdf הן דף אחר דף והן עבור המסמך כולו בבת אחת.
שלב 4
התקן את קורא צילומי המסך של אבי. לאחר מכן, סמל התוכנית יופיע במגש. יישום זה מאפשר לך לזהות טקסט ממסמך pdf שנפתח על המסך. זה חל גם על כל תמונות, וכל מה שמוצג בדרך כלל על הצג.
שלב 5
פתח מסמך, לחץ על סמל התוכנית, בחר את סוג המקור (תמונה, טקסט) וסוג הנתונים שברצונך לקבל. אתה יכול לבחור טקסט, טבלה או תמונה. לדוגמה, אם אתה צריך לזהות נתונים בטבלאות, בחר בכיוון "טקסט" - "טבלה".
שלב 6
לאחר מכן, סמן בצורת צלב יופיע על המסך, הדגיש את המידע הנדרש. לאחר ההכרה תופיע טבלת MS Excel עם המידע שהוכנס מהמסמך. כדי לפצל את הטקסט שהתקבל לעמודות טבלה השתמש בתפריט "כלים" - "פצל לפי עמודות", בחר מפריד (רווח או כרטיסייה) ולחץ על "אישור".