OCR

OCR (Reconnaissance optique de caractères)

Une technologie qui analyse les images de texte imprimé ou manuscrit et les convertit en texte modifiable et interrogeable par un ordinateur.

Détail technique

Les pipelines OCR modernes comprennent le prétraitement de l'image (redressement, binarisation, suppression du bruit), la segmentation du texte (détection des blocs, lignes et mots), la reconnaissance de caractères (traditionnellement par mise en correspondance de modèles, aujourd'hui par réseaux neuronaux convolutifs ou Transformers) et le post-traitement (correction orthographique, analyse de mise en page). Tesseract 5 utilise un réseau LSTM, tandis que les systèmes basés sur les Transformers (TrOCR, PaddleOCR) obtiennent de meilleurs résultats sur l'écriture manuscrite.

Exemple

```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

Outils associés

M Merge PDF S Split PDF C Compress PDF R Rotate PDF A Add Page Numbers P PDF to JPG W Watermark PDF R Reorder PDF Pages F Flatten PDF E Edit PDF Metadata S Sign PDF J JPG to PDF E Extract Text from PDF D Delete PDF Pages R Reverse PDF E Extract PDF Pages E Extract Odd/Even Pages R Resize PDF Pages C Crop PDF I Insert Blank Pages D Duplicate PDF Pages P PDF to PNG A Add Header & Footer A Add Text to PDF A Add Image to PDF

Termes associés

Cross-Reference Table Digital Signature Annotation Bookmark Bates Numbering Content Stream AcroForm Color Management (PDF)