Šuplík Honzy Hučína

Skok na navigaci (menu)

Tento blog je v současné době uzavřen.
Pokračování blogu na bloguje.cz jsem zrušil. Pokud budu někdy pokračovat, bude to spíš tady.

Komentovaný článek

Internet a vše kolem
22. 10. 2004

Konverze Word – HTML: poslední verze makra

Po dlouhém boji s objektovým modelem MS Wordu jsem se dobral určitého cíle. Makro, které proběhne váš dokument ve Wordu a předělá ho do kódu HTML, je na světě. Můžete si stáhnout wordovskou šablonu (nastálo bude v pravém sloupci v sekci Ke stažení).

Instrukce jsou v připojeném souboru readme.txt. Makro umí spoustu věcí, tady uvádím jen některé:

  • konverzi konců řádků (lze volit, zda tag <p> odpovídá dvojímu či jednomu odřádkování)
  • konverzi formátování (tučné písmo, kurzíva – volitelně formátové nebo sémantické tagy, podtržené, horní a dolní index)
  • konverze odstavců ve stylu Nadpis x do tagů
  • volitelnou konverzi speciálních znaků (&, <, >, uvozovky) na HTML entity
  • volitelnou konverzi obrázků na tag , názvy souborů s obrázkem se vkládají interaktivně
  • konverzi tabulky, a to včetně sloučených buněk vodorovně i svisle
  • konverzi seznamů (rozlišuje číslované a nečíslované)
  • volit mezi ukončováním nepárových tagů ve stylu HTML a XTML
  • doplnit hlavičku HTML dokumentu a vytvořit tak validní dokument (pokud je ovšem validní konvertovaný obsah)
  • konvertovat znaky do kódování ISO-8859-2

Podotýkám, že jsem si makro tvořil především pro svou potřebu. I když mi s testováním vydatně pomohli Karel Křenek a Milan Kryl (díky moc!), mohla v něm zůstat chyba. A samozřejmě má svá omezení, například seznamy mohou být pouze jednoúrovňové (omezení jsou také popsaná v readme.txt).

Protože ve frontě už čekají další úkoly, nepočítám s dalším vývojem makra a nemůžu bohužel ani slíbit opravu případných nedostatků a chyb. Kdyby se toho někdo chtěl chopit, žádný problém – přiloženy jsou zdrojáky Visual Basicu.

Přeju vám dobrou zábavu a hlavně mnoho úspěšně zkonvertovaných dokumentů.

Vložit vlastní komentářNávrat k článkuRSS komentářů tohoto článku

Komentáře

[1] 22. 10. 2004, 10:35 – MK

Teď se teprve projevím jako úplný blbec :-) O čem to je? Word lze uložit jako html. V čem je pak rozdíl?

[2] 22. 10. 2004, 10:49 – Honza Hučín (Odkaz)

[1] Úplní blbci se neptají, ti si myslí, že všemu rozumějí :-)

Máš pravdu, Word lze uložit jako HTML stránku. Ale v té výsledné stránce bude ohromné množství balastu a Word do ní nastrká spoustu zbytečností, takže se to v praxi stejně nedá použít.

Například převod textu "Ahoj" do HTML dopadne v mém konvertoru "<p>Ahoj</p>" (pokud nechci připojit hlavičku HTML dokumentu). Schválně si napiš "Ahoj" ve Wordu, ulož jako HTML a výsledný soubor si otevři v Notepadu/Poznámkovém bloku.

[3] 22. 10. 2004, 11:16 – Jan Bien (Odkaz)

Na první pohled to vypadá jako výborná věc. Jedním slovem: Díky!!!

[4] 22. 10. 2004, 11:41 – Pavel Rada (Odkaz)

Honzo, používám bez problémů verzi, kterou jsi mi nahrál při našem setkání. je tahle jiná?
Jinak díky, pomáhá to víc, než jsem čekal.

[5] 22. 10. 2004, 11:52 – Honza Hučín (Odkaz)

[4] To byla betaverze, která byla na velkých dokumentech o něco pomalejší a měla ještě pár chyb, hlavně v některých tabulkách se sloučenými buňkami. Doufám, že jsem je všechny vychytal. Pokud nebudeš používat tabulky, neměl by to být žádný významný rozdíl.
[3][4] To mě moc těší.

[6] 22. 10. 2004, 12:47 – rony (Odkaz)

videl si uz linuxovy softik WordView? balik sa vola wv a dokaze sam od seba (bez toho ze musis mat Word nainstalovany) vyrobit z DOC pekny HTML a to vratane toho, ze vyexportuje aj obrazky, urobi z nich jpg a sposobne ich vkomponuje do textu.

navyse ma sablony ako co konkretne nahradzovat, takze mozes trebars tucne pismo nahradzat na STRONG ale kludn eaj na tag tucne-pismo
resp. akykolvek format.

vyhodou je ze nedostanes ako vystup napriklad kompletne html aj s hlavickami ale dajme tomu len kus kodu, ktory mozes nasledne kamsi vkladat...

viac o wv na spravodaji..

[7] 22. 10. 2004, 13:02 – Honza Hučín (Odkaz)

[6] Díky za info, o tomhle jsem nevěděl. Opravdu schopná a výkonná věc. Ale jestli je to linuxové, asi bych s tím ve Woknech neuspěl, že?
A jinak (obecně), co už jsem psal v komentářích k minulým článkům na toto téma: je hezké, že totéž a mnohem lépe umí některý soft, ale co uživatel, který má zákaz cokoliv instalovat? A to je můj případ :-(( Zato šablonu s makrem vložíš hladce ;-)

[8] 23. 10. 2004, 00:23 – Jakub

Ahoj, jak to makro zprovozním? Díky

[9] 23. 10. 2004, 23:34 – Honza Hučín (Odkaz)

Ad [8] Přečti si readme.txt, který je v tom zipu. (Šablona word2html.dot se připojí přes Nástroje | Šablony a doplňky | Připojit atd.) Pokud by ti to nefungovalo nebo ses v tom nevyznal, pošli mi mail na suplik@petnik.cz.

[10] 24. 10. 2004, 23:45 – Martin W

proc na cisteni dolumenty nepouzivate program tidy.

http://tidy.sourceforge.net/

[11] 25. 10. 2004, 08:06 – Honza Hučín (Odkaz)

[10] Martine, tohle makro není na čištění dokumentu, ale na převod z Wordu do HTML. Já nepoužívám Tidy ani nic jiného, protože nemůžu - viz [7].

[12] 21. 1. 2005, 09:14 – Milhaus (Odkaz)

Makro jsem sice ještě netestoval, ale všiml jsem si poznámky, že to nepodporuje víceúrovňové seznamy, které já prostě miluju a často je proto používám. nechystá se někdy v budoucnu nějaká verze, která by to podporovala?

[13] 21. 1. 2005, 09:30 – Honza Hučín (Odkaz)

Ad [12] V tuto chvíli nechystá. Možná by to šlo nějak jednoduše, ale musel bych se do toho zanořit, a na to teď nemám čas.

[14] 20. 7. 2005, 15:11 – Radek

Je to super, díky.

[15] 26. 4. 2006, 21:09 – vtL

..skoda ze jsem toto makro neobjevil driv :) ...takoveho casu jsem si mohl usetrit...

ale i tak, dik

[16] 5. 8. 2009, 13:11 – szs

Po 10 minutách hledání na webu je to suverene nejlepsi prevod do html. diky za nej!

[17] 5. 8. 2009, 13:17 – Honza Hučín

Díky za pozitivní odezvu. Jenom upozorňuju, že to už nebudu vyvíjet dál, ani opravovat případné chyby.

[18] 24. 11. 2009, 16:47 – Rigi

Stažené vylepšení Wordu nefunguje. "Makro nelze najít", toto je hláška, která se neustále objevuje. Bohužel. Zrovna zápasím s dokumentem, do kterého autor narval spoustu formátování a tabulek, a můj redakční systém to nebere. Myslela jsem, žeby tento prográmek pomohl, ale bohužel.

[19] 24. 11. 2009, 17:02 – Honza Hučín

[18] Mrzí mě, jestli to nefunguje, ale bohužel s tím nic nenadělám, už se tomu dávno nevěnuju.

[20] 27. 11. 2011, 19:28 – Luboš (Odkaz)

Automatické zavedení makra:
Makro word2html.dot nahrát do adresáře STARTUP (cestu najdete v nástroje-možnosti-umístění souborů-spouštění) např. "c:\Program Files\Microsoft Office\OFFICE11\STARTUP\word2html.dot"

K tomuto článku není možné vkládat komentáře.

© Honza Hučín 2004–6

Šuplík běží na PIPNI.CZ. Díky!

sber.cermat.cz

RSS Šuplíku

RSS komentářů – souhrnně

U každého článku je samostatný RSS kanál pro komentáře.

Výběr článků

Posledních 10 článků

nebo podle data:

nebo hledání fulltextem:

Archiv všech článků

Poslední komentáře

Zabili mě, parchanti [2]

8. 8. 16:48 | Pepa

Cestou kolem blogu [2]

7. 8. 21:26 | Honza Hučín

Cestou kolem blogu [1]

7. 8. 21:02 | Honza

Vrtulník nad hlavou [3]

6. 8. 14:29 | Pepa

Taková hra na volby [1]

3. 8. 18:29 | Honza

Nejčtenější

Žádné údaje nejsou k dispozici.

O mně

*1967, absolvent MFF UK v Praze (1991)

statistik, analytik, programátor, učitel, hudebník

nyní Ústav pro informace ve vzdělávání

Životopis (RTF)

Napište mi