Découper des zones du PDF pour lancer l'OCR

Ouvrez votre fichier PDF avec The Gimp et choisissez les paramètres suivants lors de l'import:

Import PDF
Identification des coordonnées de la zone à extraire

Création du code

dol_include_once('/scanconnect/class/scanConnect.class.php');

$jsonRect = [
  'responsableRect' => '103:245:230:45',
  'dateVerificationRect' => '53:909:261:39'
];

$scanConnect = new scanConnect([
	'db' => $db,
	'srcFileName' => '/tmp/toto.pdf',
	'profile' => 'raw',
	'action' => 'forceocr',
	'lang' => 'fra',
	'pluginName' => 'SuperTest-1.0'
]);
// print $apiInfoFromServer = $scanConnect->getInfoAboutWebservice();


// exit;

// print "<p>File = " . $scanConnect->srcFileName . "</p>";
$res = $scanConnect->runAnalyze($jsonRect);
print $scanConnect->error;

if ($res) {
	// print "<p>retour positif = " . $res . "</p>";

	$json = $scanConnect->getResultData();

	print "<h3>Résultat de l'extraction de données : </h3>";
	print "<p> Le responsable est " . $json->responsable . "</p>";
	print "<p> La date est " . $json->dateVerification . "</p>";

	print "<hr />";
	print "<h3>Contenu du retour brut json</h3>";
	print "<pre>";
	print json_encode($scanConnect->getResult(), JSON_PRETTY_PRINT);
	print "<pre>";
} else {
	print "<p>ERREUR:</p>";
	print $scanConnect->error;
}