Normalmente os editores WYSIWYG (um exemplo é o Dreamweaver) inserem “sujeiras” no código HTML. Para resolver esse tipo de problema Tom Dyson desenvolveu o Wordoff, que é um aplicativo web escrito em Python e que funciona em Django no Google App Engine. Ele faz uma verdadeira limpeza no código HTML, eu testei e recomendo!
O Wordoff aplica as seguintes regras para tirar a sujeira que é colada automaticamente por editores WYSIWYG a partir do Word:
- Os atributos são removidos para todos os elementos exceto para <a>;
- Os elementos <span> e <div> são removidos;
- Os elementos vazios são removidos;
- As quebras de linha consecutivas são reduzidas para dois.
Tom Dyson é fundador e diretor do Torchbox, uma agência web focada em clientes sem fins lucrativos, e a ideia para o aplicativo surgiu numa conversa no Oxford Geek Night. Você também pode contribuir para o aperfeiçoamento do Wordoff:
Dúvidas – Wordoff @Lighthouse