ОТ PDF КЪМ DOC

Понякога ми се налага да работя с документи във формат PDF и да ги конвертирам в DOC. При това обаче възниква нещо ужасно досадно: краят на всеки ред от оригиналния текст се превръща в нов ред. Тоест един по-дълъг документ се напълва с хиляди нови редове на местата, където би трябвало да има само интервал.
Премахването на тези нови редове на ръка е досадна и бавна работа, отнемаща часове и дори дни. Опитах се да потърся съвет за това в интернет, но срещнах предимно обяснения на програмисти, които предлагат сложни и твърде дълбоки решения.
В крайна сметка открих за себе си следния начин на работа:
1. Конвертиране на документа от PDF в TXT. Опцията съществува в самия документ и не е необходимо да се използват програми за конвертиране от мрежата.
2. Прехвърляне на текста в предварително подготвен файл DOC.
3. Чрез find and replace маркираме всички ненужни нови редове, отбелязани със скрития знак „долна стрелка”.
Забележка: Долната стрелка се маркира чрез ^l (в режим „латиница”).
4. Заменяме тези излишни нови редове с нормални нови редове – техният скрит знак е ¶, а във find and replace се маркират с ^p (пак в режим „латиница”).
5. На пръв поглед нищо не се е променило. Тук обаче идва главната операция. Истинските нови редове са се удвоили, а излишните са останали непроменени.
6. Заместваме двойните нови редове – ¶¶ – със знак, който не се използва в текста, например #.
7. Заместваме всички останали нови редове ¶ (те са ненужни) с обикновен интервал.
8. Сега в документа няма нито един нов ред. Заменяме знака # с ¶ и задачата е изпълнена.
9. Възможно е да има дублирани интервали. Издирваме ги и ги заменяме с единични. Ако се наложи – повече от веднъж. Премахваме също така ненужните интервали пред препинателните знаци – . , ? !
10. Задачата е изпълнена. Евентуални дребни корекции могат да се извършат на ръка.
Повторение: Във find and replace ¶ се обозначава с ^p, а долната стрелка – с ^l.

About Lubo

Writer, translator etc.
This entry was posted in Uncategorized. Bookmark the permalink.

4 Responses to ОТ PDF КЪМ DOC

Leave a Reply

Your email address will not be published. Required fields are marked *