Da Word ad HTML: un percorso difficle
Capita spesso, nella fase di sviluppo di un sito web, che il committente invii allo sviluppatore i contenuti da inserire nelle varie pagine in formato Microsoft Word (file .doc o .docx) o creati con altri word processor come OpenOffice, LibreOffice o Apple Pages.
In tutti questi casi, ovviamente, il buon sviluppatore dovrà premurarsi di convertire correttamente i contenuti in HTML prima di poterli incollare all'interno delle pagine web del sito, cosa che, purtroppo, non si presenta sempre come un'attività indolore.
Se il contenuto da inserire in una pagina web è un semplice testo, lo sviluppatore non avrà grandi problemi a convertire da Word ad HTML, viceversa se si tratta di un documento più articolato e complesso (con parole in grassetto, link, tabelle, elenchi o immagini) il processo di conversione si presenterà come più articolato, in quanto lo sviluppatore dovrà ricreare, all'interno del codice HTML della pagina web, la formattazione del documento impostando il giusto markup.
Word Processor, XML e codice HTML
I programmi di word processing come Microsoft Word formattano il codice attraverso un markup XML per certi versi molto simile al linguaggio HTML. Questo markup, quindi, si presta a poter essere convertito in HTML in modo piuttosto agevole.
Salvare un documento come "pagina Web"
Gli stessi programmi di videoscrittura, molto spesso, integrano al loro interno la possibilità di salvare i documenti "come pagina Web" o come "file HTML".
Così facendo è lo stesso programma di videoscrittura a convertire il contenuto del documento in HTML, preservando gli stili e le formattazioni del documento.
Se si provasse ad aprire il sorgente di uno di questi file, tuttavia, ci si accorgerebbe che al suo interno sono presenti una serie di tag e di attributi assolutamente superflui e/o ridondanti, quindi, ancora una volta, lo sviluppatore non potrà limitarsi a fare copia e incolla, ma dovrà intervenire manualmente sul codice rimuovendo tutte le porzioni inutili o che, addirittura, potrebbero compromettere l'aspetto finale del documento una volta inserito all'interno del layout del sito web.
Copiare il contenuto del documento in un editor WYSIWYG
Un'altra tecnica per convertire automaticamente un documento Word in HTML, consiste nel copiare il contenuto del documento e poi incollarlo all'interno di un editor HTML di tipo visuale (WYSIWYG) come, ad esempio, gli editor integrati nei più popolari CMS come WordPress o Joomla.
Così facendo lo sviluppatore potrebbe pensare di bypassare ogni problema delegando all'editor il compito di effettuare la conversione e la "pulizia" del codice da eventuali tag o attributi inutili o dannosi.
Anche in questo caso, però, il processo non è così semplice: molto spesso, infatti, gli editor HTML non riescono a convertire correttamente il contenuto di un file Word oppure, ancora una volta, producono un codice HTML "sporco" che dovrà essere necessariamente revisionato e pulito "a mano" dallo sviluppatore onde evitare spiacevoli sorprese all'atto del rendering della pagina web.
Il modo corretto per convertire un documento Word in HTML
Se non volete perdere tempo ad effetuare la converisone del documento in modo manuale e/o a correggere la miriade di tag ed attributi inutili prodotti dalle tecniche di converisone automatica fin qui descritte, è necessario utilizzare strumenti ad hoc come quello presente in cima a questa pagina.
I sistemi di conversione appositamente pensati per trasformare un documento Word in HTML, infatti, sono in grado di accogliere il contenuto del documento, di eseguire la conversione in HTML effettuando, allo stesso tempo, la pulizia completa del codice.
In questo modo lo sviluppatore avrà la possibilità di convertire automaticamente il documento Word, preservandone la formattazione attraverso un markup HTML essenziale e pulito, pronto per essere incollato nella pagina web di destinazione.
Perché utilizzare lo strumento di conversione da Word a HTML presente in questa pagina?
Il nostro strumento di conversione è stato realizzato al fine di effettuare una pulizia profonda del codice HTML estrapolato da un file .doc o .docx, eliminando tutti i tag e gli attributi non strettamente necessari come, ad esempio, paragrafi vuoti, ritorni a capo non necessari, classi e ID.
L'obiettivo di questo tool è quello di restituire allo sviluppatore un codice HTML pulito e pronto all'uso, fermo restando che il livello di "pulizia" dipende anche dal settaggio delle impostazioni disponibili: se si desidera mantenere stili e colori, ad esempio, il sistema, pur cercando di ottimizzare il codice, non potrà eliminare alcuni attributi di stile restituendo, di fatto, un codice HTML più corposo.
Come convertire un file Word in HTML
Il funzionamento del nostro convertitore on-line è estremamente semplice:
- Aprite il documento Word (o di altro Word Processor) che desiderate convertire in HTML;
- selezionate il contenuto che desiderate convertire e copiatelo;
- incollate il contenuto copiato all'interno dell'apposita area bianca presente in questa pagina;
- impostate le varie configurazioni in base alle vostre esigenze;
- cliccate sul pulsante "Converti in HTML".
Dopo pochi istanti il sistema restituirà il codice HTML pronto all'uso. Per copiare il contenuto del sorgente è sufficiente cliccare sull'apposito pulsante "Copia".