Понякога ми се налага да работя с документи във формат PDF и да ги конвертирам в DOC. При това обаче възниква нещо ужасно досадно: краят на всеки ред от оригиналния текст се превръща в нов ред. Тоест един по-дълъг документ се напълва с хиляди нови редове на местата, където би трябвало да има само интервал.
Премахването на тези нови редове на ръка е досадна и бавна работа, отнемаща часове и дори дни. Опитах се да потърся съвет за това в интернет, но срещнах предимно обяснения на програмисти, които предлагат сложни и твърде дълбоки решения.
В крайна сметка открих за себе си следния начин на работа:
1. Конвертиране на документа от PDF в TXT. Опцията съществува в самия документ и не е необходимо да се използват програми за конвертиране от мрежата.
2. Прехвърляне на текста в предварително подготвен файл DOC.
3. Чрез find and replace маркираме всички ненужни нови редове, отбелязани със скрития знак „долна стрелка”.
Забележка: Долната стрелка се маркира чрез ^l (в режим „латиница”).
4. Заменяме тези излишни нови редове с нормални нови редове – техният скрит знак е ¶, а във find and replace се маркират с ^p (пак в режим „латиница”).
5. На пръв поглед нищо не се е променило. Тук обаче идва главната операция. Истинските нови редове са се удвоили, а излишните са останали непроменени.
6. Заместваме двойните нови редове – ¶¶ – със знак, който не се използва в текста, например #.
7. Заместваме всички останали нови редове ¶ (те са ненужни) с обикновен интервал.
8. Сега в документа няма нито един нов ред. Заменяме знака # с ¶ и задачата е изпълнена.
9. Възможно е да има дублирани интервали. Издирваме ги и ги заменяме с единични. Ако се наложи – повече от веднъж. Премахваме също така ненужните интервали пред препинателните знаци – . , ? !
10. Задачата е изпълнена. Евентуални дребни корекции могат да се извършат на ръка.
Повторение: Във find and replace ¶ се обозначава с ^p, а долната стрелка – с ^l.
Categories
- Uncategorized (142)
- Елесар (13)
- Комикси (219)
- Международна конференция (9)
- Приказки (16)
- Хаджи Филю (20)
-
Recent Posts
Recent Comments
- Алея на книгата | Блог на Zelenkroki on Спасяването на “Сивият път”
- Grigor Gatchev – A Weblog » Blog Archive » … И молба за помощ on Спасяването на “Сивият път”
- Любомир Николов: "Фантазията е един безценен дар" - Детски Книги on ХВОЙНОВИЯТ ХРАСТ
- Григор on МЕЖДУНАРОДНА КОНФЕРЕНЦИЯ – 9
- Кал on МЕЖДУНАРОДНА КОНФЕРЕНЦИЯ – 9
Archives
- August 2022
- April 2018
- July 2017
- October 2015
- September 2015
- July 2014
- May 2014
- April 2014
- March 2014
- February 2014
- January 2014
- December 2013
- November 2013
- October 2013
- September 2013
- August 2013
- July 2013
- June 2013
- May 2013
- April 2013
- March 2013
- February 2013
- January 2013
- December 2012
- November 2012
- October 2012
- September 2012
- August 2012
- July 2012
- June 2012
- May 2012
- April 2012
- March 2012
- February 2012
- January 2012
- December 2011
- November 2011
- October 2011
- September 2011
- August 2011
- July 2011
- June 2011
- April 2011
- March 2011
- February 2011
- January 2011
- October 2010
- September 2010
- August 2010
Meta
Blogroll
4 Responses to ОТ PDF КЪМ DOC