Outils pour utilisateurs

Outils du site


articles:demos:bumblebee_book_reader_1

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
articles:demos:bumblebee_book_reader_1 [17/12/2012 22:46]
bumblebee [Exemples :]
articles:demos:bumblebee_book_reader_1 [17/12/2012 23:45] (Version actuelle)
bumblebee [Quelques liens]
Ligne 9: Ligne 9:
 Après quelques réflexions et tests j'ai fini par choisir de tout simplement exporter chaque page du pdf a afficher au format jpg et svg a l'aide des outils GNU/linux ''pdftoppm'' et ''pdf2svg''. Pourquoi ne pas uniquement utiliser le format svg ? Simplement parce-que certains navigateurs supportent encore mal le svg et que pour par exemple afficher une miniature, le svg n'est pas très performant. Après quelques réflexions et tests j'ai fini par choisir de tout simplement exporter chaque page du pdf a afficher au format jpg et svg a l'aide des outils GNU/linux ''pdftoppm'' et ''pdf2svg''. Pourquoi ne pas uniquement utiliser le format svg ? Simplement parce-que certains navigateurs supportent encore mal le svg et que pour par exemple afficher une miniature, le svg n'est pas très performant.
  
-Pour mon proto. j'ai choisi de de pré-extraire les données du pdf sur mon serveur, pour n'avoir ensuite plus qu'a développer à l'aide de javasript(jQuery) et HTML5 un viewer mimant le comportement d'une liseuse de pdf "traditionnelle" (Dans un projet réel il pourrait être intéressant de les extraire à la volée.) J'ai pour cela développe un petit script python  chargé d'extraire des images de toutes les pages mais aussi d'extraire la table des matière du pdf à l'aide de la librairie [[http://www.unixuser.org/~euske/python/pdfminer/index.html|pdfminer]].+Pour mon proto. j'ai choisi de de pré-extraire les données du pdf sur mon serveur, pour n'avoir ensuite plus qu'a développer à l'aide de javasript(jQuery) et HTML5 un viewer mimant le comportement d'une liseuse de pdf "traditionnelle" (Dans un projet réel il pourrait être intéressant de les extraire à la volée.) J'ai pour cela développe [[https://github.com/bumblebeefr/pdf-data-extractor|un petit script python]]  chargé d'extraire des images de toutes les pages mais aussi d'extraire la table des matière du pdf à l'aide de la librairie [[http://www.unixuser.org/~euske/python/pdfminer/index.html|pdfminer]].
  
  
Ligne 91: Ligne 91:
     * [[http://code.google.com/p/epub-samples/wiki/FeatureMatrix#Fixed_Layout|Exemples de d'epub en particulier pour le fixeds layout]]     * [[http://code.google.com/p/epub-samples/wiki/FeatureMatrix#Fixed_Layout|Exemples de d'epub en particulier pour le fixeds layout]]
  
 +~~DISCUSSION~~
articles/demos/bumblebee_book_reader_1.1355780801.txt.gz · Dernière modification: 17/12/2012 22:46 de bumblebee