なぜ合格報告率が95%以上もあるのか!? 目次から各記事を5日間読めば、あなたも合格を体感できます♪   簿記2級独学合格の心配に終止符を打つための【簿記2級独学合格の秘訣を公開】しています☆

2017/07123456789101112131415161718192021222324252627282930312017/09

トップページスポンサー広告> 国立国会図書館の全文テキスト化システム
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

トップページPC プログラム 技術> 国立国会図書館の全文テキスト化システム
.日本アイ・ビー・エムは、国立国会図書館における蔵書の大規模デジタル化
作業の一環である全文テキスト化システムプロトタイプ構築事業において、
全文テキスト化システムのプロトタイプを開発しているとのことです。

同プロトタイプは、推論技術・時間・場所を問わず、インターネットを通じて多く
の人々が特定の目的達成支援を行うというアプローチを組み合わせることに
より、画像からのテキスト化にかかる作業効率を改善するものです。

【全文テキスト化システムのプロトタイプの仕組み】


主な機能は、「共同校正機能」及び「共同構造化機能」になります。共同校正
機能は、Webブラウザ経由により多数の文字校正者が同時に作業を行うこと
が可能となるとともに、OCRの精度向上を実現します。共同文字校正のインタ
フェースは、OCRで同じ文字として認識された文字群を一覧表示し、作業者は
一括して校正を行うことが可能となります。

【共同文字校正の画面】


共同構造化機能は、視覚障がい者等が読み上げソフトを使用し書籍を読む際
に重要となる構造化を実施するため、構造情報付加機能と読み上げ順序修正
機能を提供します。IBM東京基礎研究所において開発された、読み上げ順序を
一筆書きで表現してドラッグ・アンド・ドロップ操作のみで修正を可能とする技術
を採用し、全文テキスト化された書籍における構造の種類に応じた最適な構造
化インタフェースを用意することにより、HTML・XMLといった記述言語の知識が
なくても構造化が行えるようになっています。

OCRは、紙ベースのデータを電子化するのに有用ですが、「路」を「格」に変換
する等の誤認識を起こす場合があります。同システムにより精度向上が実現
すれば、校正作業の時間短縮につながり、電子化の早期完成となりますので、
利用者サービスの向上にもつながるものとなりますね♪

マイコミジャーナル:
IBM、国立国会図書館の全文テキスト化システム・プロトタイプを開発
関連記事

コメント
この記事へのコメント

国立国会図書館の全文テキスト化システム

  に関連した内容であれば、何でもたくさん書き込んで下さい!!
------------------------------------------------------------------
コメントを投稿する
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 

トラックバック
この記事のトラックバックURL
http://bokimaster.blog41.fc2.com/tb.php/2044-d7b35a23
この記事にトラックバックする(FC2ブログユーザー)

国立国会図書館の全文テキスト化システム

  記事へのトラックバックについて
  ・・・「国立国会図書館の全文テキスト化システム
     記事についてのトラックバックは、トラックバック先で、
     「国立国会図書館の全文テキスト化システム 」への
     URLを明記していただければ幸いです。
------------------------------------------------------------------

Before  | 簿記2級合格にまつわるエトセトラ |  Next

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。