ОТ PDF КЪМ DOC

Понякога ми се налага да работя с документи във формат PDF и да ги конвертирам в DOC. При това обаче възниква нещо ужасно досадно: краят на всеки ред от оригиналния текст се превръща в нов ред. Тоест един по-дълъг документ се напълва с хиляди нови редове на местата, където би трябвало да има само интервал.
Премахването на тези нови редове на ръка е досадна и бавна работа, отнемаща часове и дори дни. Опитах се да потърся съвет за това в интернет, но срещнах предимно обяснения на програмисти, които предлагат сложни и твърде дълбоки решения.
В крайна сметка открих за себе си следния начин на работа:
1. Конвертиране на документа от PDF в TXT. Опцията съществува в самия документ и не е необходимо да се използват програми за конвертиране от мрежата.
2. Прехвърляне на текста в предварително подготвен файл DOC.
3. Чрез find and replace маркираме всички ненужни нови редове, отбелязани със скрития знак „долна стрелка”.
Забележка: Долната стрелка се маркира чрез ^l (в режим „латиница”).
4. Заменяме тези излишни нови редове с нормални нови редове – техният скрит знак е ¶, а във find and replace се маркират с ^p (пак в режим „латиница”).
5. На пръв поглед нищо не се е променило. Тук обаче идва главната операция. Истинските нови редове са се удвоили, а излишните са останали непроменени.
6. Заместваме двойните нови редове – ¶¶ – със знак, който не се използва в текста, например #.
7. Заместваме всички останали нови редове ¶ (те са ненужни) с обикновен интервал.
8. Сега в документа няма нито един нов ред. Заменяме знака # с ¶ и задачата е изпълнена.
9. Възможно е да има дублирани интервали. Издирваме ги и ги заменяме с единични. Ако се наложи – повече от веднъж. Премахваме също така ненужните интервали пред препинателните знаци – . , ? !
10. Задачата е изпълнена. Евентуални дребни корекции могат да се извършат на ръка.
Повторение: Във find and replace ¶ се обозначава с ^p, а долната стрелка – с ^l.

About Lubo

Writer, translator etc.
This entry was posted in Uncategorized. Bookmark the permalink.

4 Responses to ОТ PDF КЪМ DOC

  1. Кирил says:

    И аз го правех заместването на ръка винаги. Следващият път когато ми се наложи ще го пробвам. Благодаря, че го сподели този начин.

  2. Григор says:

    Любо, ще стане хакер от теб! Може ли да пусна това указание и в моя блог? :-)

  3. Lubo says:

    На драго сърце!
    (Ако не виждаш някакви неточности.)

  4. harikrishna says:

    Това и аз съм го правил многократно. За удобство, даже си записах макрос. С едно натискане на бутонче всичко това се изпълнява за секунда :)

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>