Ne laissez plus le processus prépresse ralentir ! Nos outils-auto-développés ont multiplié par près de 10 l'efficacité
Contexte du développement : issu des besoins réels de production
Le traitement des documents prépresse en impression numérique prend trop de temps. Après communication avec les opérateurs de première ligne, trois besoins fondamentaux ont été identifiés et clarifiés.
(1) Nombre de pages du document de vérification par lots : lors de l'impression et de la mise en page, il est souvent nécessaire de s'assurer que le document comporte un nombre pair de pages ; sinon, cela peut facilement entraîner un gaspillage de matériel d’impression ou des erreurs de reliure.
(2) Gestion automatique des documents à pages impaires : pour les documents comportant des pages impaires, des pages vierges doivent être ajoutées à la fin, tandis que les pages paires restent inchangées.
(3) Vérification par lots si le texte est courbé : pour éviter les erreurs d'impression causées par des polices manquantes, confirmez que le texte du document a été converti en courbes (c'est-à-dire « courbé »).
Grâce à des recherches sur Adobe Acrobat et divers plugins de traitement PDF disponibles sur le marché, il a été constaté que les outils existants sont soit fonctionnellement redondants et complexes, soit ne correspondent pas aux processus de production réels de l'entreprise, en particulier avec des risques cachés dans la sécurité du traitement d'inversion. Plus important encore, des outils nationaux similaires nécessitent souvent un paiement, ce qui entraîne des coûts d'utilisation à long terme-plus élevés. Sur la base de ces problématiques pratiques, l'entreprise a décidé de développer un outil spécialisé léger, précis et adapté en interne.
Outil de vérification et de traitement du nombre de pages PDF
01
Fonctions de base et logique de jugement
L'objectif principal de cet outil est de garantir que tous les documents à imprimer comportent un nombre pair de pages. L’approche de jugement et d’exécution est la suivante.
(1) Mécanisme de détection de page : lit les métadonnées des documents PDF via la bibliothèque PyMuPDF pour obtenir directement les informations totales de la page.
(2) Jugement logique de parité : utilisez l'opération de module (numéro de page %2) pour déterminer la parité. Si le résultat est 1, il s’agit de pages impaires ; s'il vaut 0, il est considéré comme pair.
(3) Stratégie de traitement différenciée : pour les pages impaires-, ajoutez automatiquement une page vierge à la fin du document qui correspond à la taille du document d'origine ; Pour les documents de -pages paires, conservez le contenu inchangé et copiez-le directement dans le répertoire de sortie.
(4) Principe de gestion de la sécurité : tous les documents traités sont enregistrés dans le répertoire désigné "Fichiers traités", les fichiers originaux étant conservés pour éviter tout dommage aux fichiers causé par une mauvaise opération, comme le montre la figure 1.
Figure 1 Interface de l'outil de vérification et de traitement du nombre de pages PDF
02
Points de mise en œuvre technique
L'outil utilise Tkinter pour construire l'interface graphique et comprend principalement trois modules fonctionnels.
(1) Module de sélection de répertoire : prend en charge la sélection visuelle du répertoire du fichier source et du répertoire de sortie, le répertoire de sortie par défaut étant un sous-dossier sous le répertoire source.
(2) Module de traitement par lots : utilise la technologie multithreading pour effectuer un traitement en arrière-plan, évitant ainsi le gel de l'interface, et affiche simultanément la progression du traitement en temps réel via une barre de progression.
(3) Module d'affichage des résultats : présente les résultats du traitement de chaque fichier sous forme de tableau, y compris le nombre de pages d'origine, l'action de traitement et les informations d'état, en distinguant les états réussis et échoués par couleur.
Outil de vérification de la conversion de courbe PDF
01
Fonctions de base et logique de jugement
L'outil de vérification de la conversion des courbes se concentre sur la détermination si le texte d'un document a été converti en courbes. Sa logique de jugement fondamentale est basée sur l’analyse des informations sur les polices dans le document PDF.
(1) Détection de l'existence du texte : détermine si le document contient du texte modifiable en extrayant le texte des pages.
(2) Analyse des informations sur les polices : analyse la liste des polices intégrées dans le document. Si des informations sur la police existent, cela indique que le texte n'a pas été converti en courbes.
(3) Règles de jugement complètes : s'il y a du contenu textuel et aucune information sur la police, cela indique que le texte a été converti en courbes (marque verte) ; s'il n'y a pas de contenu textuel, aucune conversion n'est requise (marque verte) ; s'il existe du contenu textuel et des informations sur la police, le texte n'a pas été converti en courbes (marque rouge), comme le montre la figure 2.
Cet outil est spécialement conçu en mode « vérifier uniquement, ne pas convertir ». La raison principale est que, selon les retours des opérateurs, effectuer une conversion de courbe sur des fichiers contenant des sceaux officiels peut facilement entraîner la perte des sceaux ou d'autres graphiques, de sorte que l'outil ne conserve que la fonction de vérification.

Figure 2 Outil de vérification de courbe PDF
02
Points clés de mise en œuvre technique
Cet outil utilise également Tkiner pour construire l'interface, avec trois points techniques clés.
(1) Extraction des informations sur les polices : à l'aide de la fonction d'analyse des blocs de texte de PyMuPDF, obtenez tous les noms de polices et leur nombre d'occurrences dans le document.
(2) Visualisation des résultats : utilisez des arborescences pour afficher les résultats de l'inspection, en distinguant intuitivement les différents états grâce à des couleurs et des icônes.
(3) Fonction de statistiques d'état : calcule automatiquement le nombre de documents qui répondent aux exigences, aidant ainsi les opérateurs à comprendre rapidement l'état global de l'inspection.
Défis et solutions pendant le processus de développement
En tant que développeur non-professionnel, j'ai rencontré de nombreux défis techniques lors du développement d'outils. Les problèmes spécifiques et les solutions sont les suivants.
(1) Problème de profondeur d'analyse PDF : la bibliothèque PDF initiale n'a pas pu extraire avec précision les informations sur la police, mais après la suggestion de l'IA, le passage à la bibliothèque PDF PyMu a résolu le problème.
(2) Problème de décalage d'interface : lors du traitement d'un grand nombre de fichiers par lots, l'interface ne répond souvent plus. Sous la direction de l’IA, une solution de traitement multithread a été mise en œuvre, résolvant efficacement ce problème.
(3) Texte chinois tronqué : en configurant les paramètres de police et les paramètres d'encodage, le problème des caractères chinois tronqués affichés dans les interfaces et les fichiers exportés est résolu.
(4) Mécanisme de gestion des exceptions : pour résoudre le problème des plantages de programme causés par des fichiers PDF corrompus, le mécanisme de capture des exceptions a été amélioré pour garantir qu'une seule défaillance de fichier n'affecte pas l'ensemble du processus.
Tout au long du processus de développement, les outils d'IA ont joué un rôle important en tant que consultants techniques, fournissant non seulement des exemples de code clés, mais expliquant également les principes d'analyse du format de fichier PDF, aidant ainsi les développeurs à acquérir rapidement des connaissances spécialisées.
La valeur et les perspectives des applications d’outils
L'application de ces deux outils a apporté des améliorations significatives de l'efficacité du travail de production, reflétées spécifiquement dans les deux aspects suivants.
(1) Gains de temps : les inspections manuelles qui prenaient auparavant 1 heure peuvent désormais être effectuées en 5 minutes, augmentant ainsi l'efficacité de près de 10 fois.
(2) Stabilité de la qualité améliorée : évite efficacement les oublis dus à l'inspection manuelle, garantissant ainsi une qualité d'impression constante.
Documenter le processus de développement de ces deux gadgets vise à transmettre la philosophie de travail « d'exploration et d'innovation », en se concentrant sur la résolution de problèmes spécifiques dans la production réelle, en optimisant les flux de travail traditionnels par des moyens techniques et, en fin de compte, en réduisant les coûts et en améliorant l'efficacité.

