Van pár tapasztalatom a Pdf - epub vagy prc konvertálásban amit most leírok. Most inkább csak azzal foglalkoznék hogyan lehet pdf ből jól kinyerni a szöveget. Először is kell egy adobe acrobat, ebből mentek egy rtf-et, mert úgy vettem észre hogy ha simán doc-ba mentek akkor őű betűk nem igazán jelennek meg mindig. Rtf et utána elmentem docba. Ha megvan akkor még mindig nem hibátlan a szöveg. Ezeket MS Wordben javítom ki.
- a margókat beállítom egységesre
- kiveszem a többszörös space-t, 2 space csere egy space-re, kétszer megismételve
- kiveszem a sok entert, 2 enter csere 1 enter
- behúzást beállítom mondjuk 0,6 ra és én a sorközt és a térközt sem szoktam cifrázni.
- szakasztöréseket és a hasábtöréseket a csere funkcióval kicserélem semmire (üresen hagyom, a szakasztörés és hasábtörés jeleit a csere egyebek speciális részben találod, ^b és ^n)
- mondatközi ENTER-ekkel is a csere funkció bánik el két lépésben. Először a bármeny betű bekezdésjelet cserélem (^$^p) a keresett szöveg és egy választott jelölőre (^&#) majd a bekezdésjelet és kettőskeresztet (^p#) egy spacere. Ha ezt megértetted a többi is érthető lesz. A jelölővel elkerüljük hogy az összes entert kivegye. Itt persze lehetnek problémák a fejezetek címeinél mert egy sorba rakhatja őket az előzővel de nagyságrendileg kevesebb munkád lesz.
- akadnak még szóközi elválasztások, ha wordben van meg alapból a szöveged azt a bekezdés/szövegbeosztásnál esetleg ki lehet kapcsolni. Ha nem akkor ez előző technika alapján ^$-space (bármeny betű, kötőjel, space) csere ^&# (keresett szöveg, kettőskeresz) majd -space# csere semmire. Ha nincs space akkor sajnos nem lehet automatikusan kicserélni. előfordulhat hogy a kötőjel helyett hasonlóan kinéző más karakter van, ezt úgy tudod cserélni vagy bevinni a csere ablakba hogy a csere gomb megnyomása előtt kijelölöd
- word file előkészítés megosztásra fülben eltávolíthatod az élőfejet és élőlábat
- mostanra egész jól néz ki a szöveg, elkezdheted formázni a címet és esetleg fejezetenként rakhatsz be oldaltörést.
Így van egy jó doc fileod amit be tudsz tölteni valamelyik konvertáló programba