2012年5月9日水曜日

PDFテキスト抽出の変換(cmaps)

PDFファイルからテキスト抽出する場合、adobeの変換テーブルを使用しないと
いけないらしい。

iTextには、 itext-asian.jar内に、cmapsがあるが、iTextharpの場合
iTextAsian-all-2.1.zipのdllに含まれているみたい。

sourceforgeから、downloadする必要がある。
ファイル名:iTextAsian-all-2.1.zip  2012年5月9日時点

0 件のコメント:

コメントを投稿