2008.3
26

DocuWorksテキスト抽出ツール バージョンアップ 1.0.4

DocuWorksテキスト抽出ツールをバージョンアップしました。

新バージョンは 1.0.4 です。

<修正内容>

  • 「空白だけの行を削除する」がエラーを起こしていたので修正
  • 空白で改行する機能を追加
  • 2つ以上の空白を1つにする機能を少し速度アップ
  • 時間のかかる処理でダイアログを表示するようにした

 

最新版はこちらのページでダウンロードしてください。

2008.3
7

テキストをすべてメモリに読み込む命令

ドキュワークスAPIにはすべてのテキストをメモリに読み込む命令はないようです。

 

ページごとのテキストを読み込む関数はあります。
(XDW_GetPageTextToMemory)

 

ですが、XDW_GetFullTextはすべてのテキストをいきなりテキストファイルにできます。
ToMemoryも作ってくれればいいのに・・・

 

ということでDocuWorksテキスト抽出ツールではXDW_GetPageTextToMemoryをページ数分繰り返して読み込んでいます。

 

で、XDW_GetPageTextToMemoryの欠点?仕様?なのですが、
この命令、アノテーションの文字は拾ってくれません・・・

まあ他のアプリからプリントしたデータをテキスト化できるという使い方だと思いますが、アノテーションから拾ってくれると便利だなと。