https://www.epo.org/fr/node/requetes-de-recherche-conseils-6

Comment puis-je trouver un seul fichier PDF correspondant à une publication donnée ?

Les images ne sont pas sauvegardées dans des fichiers PDF, ceux-ci n’étant pas faciles d’accès pour OPS et exigeant un traitement supplémentaire avant de les fournir aux utilisateurs. OPS pourrait y remédier en convertissant les images en un unique fichier PDF répondant à votre demande mais cela encombrerait le serveur au détriment d’autres utilisateurs.

Pour récupérer les données à l’aide du nouveau service RESTful OPS, il faut suivre les étapes suivantes :

Etape 1 - Demander des informations concernant la disponibilité des documents :

A cette étape, vous pouvez voir que le document complet a 12 pages, que l’abrégé et les données bibliographiques commencent à la page 1, la description à la page 2, les revendications à la page 3, les dessins à la page 5 et le rapport de recherche à la page 11.

L’identifiant à utiliser est également indiqué :

published-data/images/EP/1000000/A1/fullimage

Il est aussi précisé que les pages sont disponibles soit au format TIFF, soit en PDF.

Etape 2 - Répéter la requête page après page :

Vous pouvez répéter votre requête page après page (dans cet exemple, de la page 1 à 12) en changeant au fur et à mesure le numéro de page comme suit :

Une autre solution consiste à demander chaque page sous forme de fichier PDF en utilisant :

Etape 3 - Assembler les pages :

Plusieurs outils open source sont disponibles pour vous aider à assembler facilement les pages en un seul fichier PDF :