conphic_logo_03
東京都立川市のシステム開発会社 株式会社コンフィック


当社ブログにアクセスいただき,
誠にありがとうございます。

株式会社コンフィックでは,様々な文書のデータベース化やデータ作成業務を行った経験があります。
日本語の場合,古い紙文書はほとんどが縦書きで書かれています。それらをデータ化する際には,日本語の認識が優れているOCRソフトを用いてテキスト化を行います。
縦書きには横書きには無い,全角2文字分の繰り返し記号や傍線があることもあり,テキスト化する際には注意が必要です。
また,古い書籍や人名地名が多く出てくるものをテキスト化する際には,文字種が無い場合もあり,どのような代換文字を用いるか,画像で表示するのかなどをルール化しておく必要があります。

スキャニングするだけではなく,テキスト化までを行うことで多くの用途に活用できるデータになります。
テキスト化されたデータを再度縦書きに組版することや,ブラウザにて縦書き表示することも可能です。
データベース構築,データ作成,活用方法などお気軽に株式会社コンフィックまでご相談ください。

【関連記事】株式会社コンフィックの「電子化」をテーマにしたブログ一覧


システム開発・運用に関してのご相談,ご用命は,
多くの開発経験がある株式会社コンフィックへ
e-portfolioeポートフォリオ),クラウドクラスサイトワンドe-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。


株式会社コンフィック http://www.conphic.co.jp 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。