Présentation du projet |
Oyez !
Vous utilisez Mozilla sous Windows 98 ? Votez pour le Bug 180112 !
AraMorph est un portage en Java du produit homonyme développé en Perl par Tim Buckwalter pour le compte du Linguistic Data Consortium (LDC) et accessible en ligne à l'adresse http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2002L49.
Le projet inclut des classes Java permettant l'analyse morphologique de fichiers textuels en arabe et ce, quel que soit leur encodage. A cet effet, il est proposé 3 fichiers de test dans les principaux encodages utilisés pour la langue arabe : UTF-8, ISO-8859-6 et CP1256.
Ce projet inclut également des classes compatibles avec l'architecture de Lucene, ce qui permet l'analyse, l'indexation et l'interrogation de documents en arabe.