Découper des zones du PDF pour lancer l'OCR

Découper des zones du PDF pour lancer l'OCR

Ouvrez votre fichier PDF avec The Gimp et choisissez les paramètres suivants lors de l'import:

  • Résolution: 150 pixels/in (dpi)
Import PDF
Identification des coordonnées de la zone à extraire

Création du code

dol_include_once('/scanconnect/class/scanConnect.class.php');

$jsonRect = [
  'responsableRect' => '103:245:230:45',
  'dateVerificationRect' => '53:909:261:39'
];

$scanConnect = new scanConnect([
	'db' => $db,
	'srcFileName' => '/tmp/toto.pdf',
	'profile' => 'raw',
	'action' => 'forceocr',
	'lang' => 'fra',
	'pluginName' => 'SuperTest-1.0'
]);
// print $apiInfoFromServer = $scanConnect->getInfoAboutWebservice();


// exit;

// print "<p>File = " . $scanConnect->srcFileName . "</p>";
$res = $scanConnect->runAnalyze($jsonRect);
print $scanConnect->error;

if ($res) {
	// print "<p>retour positif = " . $res . "</p>";

	$json = $scanConnect->getResultData();

	print "<h3>Résultat de l'extraction de données : </h3>";
	print "<p> Le responsable est " . $json->responsable . "</p>";
	print "<p> La date est " . $json->dateVerification . "</p>";

	print "<hr />";
	print "<h3>Contenu du retour brut json</h3>";
	print "<pre>";
	print json_encode($scanConnect->getResult(), JSON_PRETTY_PRINT);
	print "<pre>";
} else {
	print "<p>ERREUR:</p>";
	print $scanConnect->error;
}
projet_docwizon/emplacements_a_faire_decouper_par_docwizon.txt · Dernière modification : 2023/12/25 10:42 de supadmin
CC Attribution-Share Alike 4.0 International Sauf mention contraire, le contenu de ce wiki est placé sous les termes de la licence suivante : CC Attribution-Share Alike 4.0 International