#! /usr/bin/perl
#############
# Desaccentue les entr�s du dictionnaire tri�
# et sort une table cvs contenant les entr�s d�accentu�s suivies des entr�s accentu�s
#############

open (SOURCE,"$ARGV[0]") || die ("Impossible d ouvrir $ARGV[0]");
open (CIBLE,">$ARGV[1]") || die ("Impossible d ouvrir $ARGV[1]");
open (CONVERT,"convaccents.txt") || die ("Impossible d ouvrir le fichier convaccents.txt");

#chargement dans une table des caracteres accentues et de leurs correspondants desaccentues
print ("Chargement de la table de desaccentuation - devoyellisation");
$infoconvert = <CONVERT>;
while ($infoconvert ne "") {
    chomp($infoconvert);
    @donneesconvert = split(/\t/,$infoconvert);
    $conversion{$donneesconvert[0]} = $donneesconvert[1];
    $infoconvert = <CONVERT>;
}
close (CONVERT);
#fin du chargement

############
# Programme de desaccentuation
############

$ligne=<SOURCE>;

while ($ligne ne "") {

	chomp($ligne);
	@data = split(/\t/,$ligne);
	$entree = $data[0];
	$entreeAConserver = $entree;
	$imprimerLaSortie = 0;
	while (($holder, $record) = each(%conversion)) {

		if ($entree=~ s/$holder/$record/g) {
			$imprimerLaSortie = 1;
		}
	}
	while (($holder, $record) = each(%conversion)) {
		$entree=~ s/$holder/$record/g;
	}
	if ($imprimerLaSortie == 1) {
		print CIBLE ("$entree\t2\t\t\t\t$entreeAConserver\n");
	}
	$ligne = <SOURCE>;
}
