DocuWorksテキスト抽出ツールをバージョンアップしました。
新バージョンは 1.0.4 です。
<修正内容>
- 「空白だけの行を削除する」がエラーを起こしていたので修正
- 空白で改行する機能を追加
- 2つ以上の空白を1つにする機能を少し速度アップ
- 時間のかかる処理でダイアログを表示するようにした
最新版はこちらのページでダウンロードしてください。
DocuWorksテキスト抽出ツールをバージョンアップしました。
新バージョンは 1.0.4 です。
<修正内容>
最新版はこちらのページでダウンロードしてください。
ドキュワークスAPIにはすべてのテキストをメモリに読み込む命令はないようです。
ページごとのテキストを読み込む関数はあります。
(XDW_GetPageTextToMemory)
ですが、XDW_GetFullTextはすべてのテキストをいきなりテキストファイルにできます。
ToMemoryも作ってくれればいいのに・・・
ということでDocuWorksテキスト抽出ツールではXDW_GetPageTextToMemoryをページ数分繰り返して読み込んでいます。
で、XDW_GetPageTextToMemoryの欠点?仕様?なのですが、
この命令、アノテーションの文字は拾ってくれません・・・
まあ他のアプリからプリントしたデータをテキスト化できるという使い方だと思いますが、アノテーションから拾ってくれると便利だなと。