ePUB3: a evolução das publicações digitais

Márcio Duarte, em 15/06/2012. Categoria: Laboratório do eBook, Resenhas 9

A sigla do momento em termos de produção de eBooks é ePUB3, a nova versão do padrão aberto de publicações digitais que promete romper diversas limitações da implementação atual: maiores recursos para layout e estruturação do conteúdo, interatividade, animações, áudio, vídeo, tipografia avançada, suporte a fórmulas matemáticas, narração de texto em voz alta, acessibilidade, entre outros goodies, abraçando uma maior diversidade de publicações, para múltiplas plataformas, em qualquer idioma, não só para livros de texto plano como esse formato tem sido geralmente aplicado.

Apesar da novidade, o fato é que ainda estamos em um estágio muito preliminar da adoção desse novo padrão (ok, estamos em um estágio preliminar em relação a eBooks de forma geral, mas essa é outra história). No momento em que escrevo este artigo, nenhum programa disponível é capaz de gerar um ePUB3 válido automaticamente (o Indesign CS6 oferece uma exportação nativa, que, apesar de experimental, pode gerar um ePUB3 válido para livros mais simples). Mas esse problema deve ser resolvido em breve. Alguns desenvolvedores anunciaram suporte nativo para criação de ePUB3, temos um leitor (Readium) e um validador (ePUBCheck) oficiais, uma utilíssima tabela de suporte aos novos recursos entre os principais dispositivos do mercado, além de dois outros programas de leitura que já suportam o formato (iBooks e AZARDI) e um bonus: a Apple anunciou aos desenvolvedores que começará a aceitá-los na sua iBookstore. Estes são sinais de que o mercado está mesmo adotando o novo padrão.

Do ponto de vista prático, as mudanças no arquivo do livro em si não são tão radicais como parecem, como veremos nesse artigo. A complexidade aparece quando os novos recursos disponibilizados pela especificação são considerados no código própriamente dito. Aí o desenvolvimento de um ePUB3 pode realmente ser visto como produção de software, e não somente produção editorial.

Vamos revisar em linhas gerais algumas das principais dúvidas sobre a nova versão, com respostas às perguntas mais óbvias – lembrando que as respostas consideram algum nível de intimidade com o código:

O que difere um ePUB2 de um ePUB3?

Apesar de oferecer uma série de novos recursos, um ePUB3 se assemelha bastante ao velho conhecido ePUB2: um arquivo compactado com a mesma extensão .epub, e a mesma estrutura básica de pastas, com eventuais imagens, fontes, vídeos e arquivos de texto. É relativamente simples transformar um ePUB2 comum em ePUB3 com poucas mudanças em partes do código – desde que não sejam adicionados novos recursos “pirotécnicos”, claro. Há um bom grau de interoperabilidade entre as versões, que “conversam” relativamente bem. A vantagem principal do ePUB3 é oferecer novas soluções padronizadas para os recursos avançados que citamos no início do artigo, baseados em padrões abertos.

Um epub3 descompactado e seus arquivos

Figura 1: um ePUB3 por dentro. Mais do mesmo, não?

Então um ePUB2 vai ser lido em um leitor ePUB3?

Sim, já que a nova especificação orienta que os novos programas de leitura ofereçam suporte retroativo à versão 2.

E um ePUB3, pode ser aberto nos eReaders atuais, que só suportam ePUB2?

Até pode, mas os eReaders do momento não foram pensados para os recursos do ePUB3. O livro provavelmente apresentará problemas de toda espécie, que vão variar de acordo com o eReader e o conteúdo da publicação. A especificação anterior, (ePUB 2.0.1) não previu compatibilidade com versões futuras, embora exista alguma flexibilidade nesse aspecto. Se deseja mesmo manter uma compatibilidade cruzada entre as versões, é necessário planejá-la de antemão e testá-la intensamente, ainda que isso seja válido para publicações sem muitos recursos de interatividade ou layout. Uma lista de melhores práticas nesse quesito pode ser vista no fórum do IDPF.

O que posso fazer de interessante em um ePUB3?

A lista de possibilidades é imensa, mas isso vai realmente depender do sistema de leitura, já que uma parte das funcionalidades não é obrigatória, como o suporte a Javascript, por exemplo. De forma geral, você pode implementar idéias interessantes como:

  • Um livro ilustrado com animações e narração em áudio que acompanha o texto;
  • Livros com texto em diversos idiomas, com caracteres especiais e até com ordem de leitura invertida – de trás para frente, como em um mangá;
  • Híbridos (app/livro) como, por exemplo, um material promocional para músicos, simulando um disco de vinil animado (single).
  • Mini-jogos, enquetes e simulações junto ao texto, muito úteis em conteúdos educacionais;
  • Publicações com streaming de vídeo e áudio, baixados on demand.
  • Um romance onde partes do conteúdo é alterado de acordo com a localização do dispositivo.

Figura 2. Vídeo com um exemplo das potencialidades do formato

Quanto à compactação/descompactação do arquivo?

Não muda. Podem ser utilizadas as mesmas ferramentas e processos de antes.

O que acontece com o sumário (arquivo NCX)?

No ePUB3, o sumário deve ser criado em um arquivo XHMTL comum, que pode ser estilizado assim como o texto. Este arquivo pode ou não ser inserido no fluxo do texto, via tag <spine> do arquivo .opf. Para compatibildade com o ePUB2, recomenda-se manter também o sumário no formato NCX, já que os futuros eReaders de ePUB3 devem ignorá-lo por padrão, mas ele não é mais obrigatório. A criação do novo documento de navegação pode até ser automatizado por scripts, com base no NCX do ePUB2.

Quanto ao arquivo .opf (package document)?

É mantido no ePUB3 e a estrutura é a mesma do ePUB2, com modificações. Algumas propriedades se tornaram obsoletas, mas podem ser mantidas para efeito de compatibilidade, pois não interferem no funcionamento do ePUB3, sendo um exemplo a seção <guide>. Já outros elementos precisam ser atualizados, como a propriedade “version”, na qual é especificada a versão do ePUB. É ela que efetivamente ativa o suporte às novas funcionalidades.

O que acontece com os demais arquivos obrigatórios (mimetype, conteiner.xml)

Permanecem intocados, nos mesmos locais de sempre.

Os arquivos HTML do conteúdo de um livro na versão 2 precisam mudar para se adaptar ao ePUB3?

De forma geral, o conteúdo dentro das tags <head> e <body> de uma publicação de texto puro, em ePUB2, pode ser mantido, mas a seção inicial dos documentos deve ser obrigatoriamente alterada para se adeaquar ao ePUB3. Como a mudança é padrão para todos eles, pode ser automatizada com a ajuda de expressões regulares, via GREP. É recomendável também usar sempre a extensão .xhtml para todos os arquivos do conteúdo.

Confira um exemplo de código recomendado para o início dos documentos .xhtml, para livros em português brasileiro:

ePUB2

<?xml version="1.0" encoding="utf-8" standalone="no"?>
<!DOCTYPE html PUBLIC “-//W3C//DTD XHTML 1.1//EN"
“http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
 

ePUB3

<?xml version="1.0" encoding="utf-8"?>
<html xmlns="http://www.w3.org/1999/xhtml"
xmlns:epub="http://www.idpf.org/2007/ops"
xml:lang="pt-BR" lang="pt-BR">

Acessibilidade

Ainda que o mesmo conteúdo de um ePUB2 possa ser interpretado corretamente pelos programas leitores de ePUB3 sem muitas alterações, ao adaptá-lo para a nova versão, é importante repensá-lo à luz da acessibilidade promovida pelas novas tags disponíveis no HTML5, como <section>, ou pela propriedade epub:type, que descrevem semanticamente a função do conteúdo que enclausuram e oferecem métodos alternativos para a interpretação do código pelos sistemas de leitura. Pessoas com deficiência visual agradecem, pois a otimização da estrutura do conteúdo vai facilitar a interpretação audível e a navegação em dispositivos com tecnologia assistiva como o iPad e seu Voice Over. Sem falar que um conteúdo bem estruturado facilita a estilização e a adaptação do livro para outros formatos. Um guia bem interessante de acessibilidade no ePUB pode ser visto aqui. Vale a leitura.

O futuro das publicações digitais? Mesmo?

Tudo isso é muito bonito, mas não seria contraprodutivo investir em uma tecnologia que se baseia em arquivo, diante da promessa do conteúdo na nuvem, acessível em qualquer lugar, apontando para o futuro? Talvez, mas no momento, nenhuma outra solução apresenta o mesmo conjunto de qualidades oferecidas pelo ePUB quando se fala de leitura digital com portabilidade e adaptação automática do conteúdo à múltiplos dispositivos, ou seja, sem necessidade de conexão, considerando diferenciais importantes como padrões abertos, acessibilidade, estruturação e navegação de conteúdo, além dos imprescindíveis metadados. Portabilidade ainda é – e talvez sempre seja – fundamental quando consideramos os altos custos e cobertura das conexões móveis. Mas esta é uma questão que permanece em aberto e só teremos uma boa resposta para essa pergunta nos próximos capítulos desse livro.

Para saber mais