国会図書館のフリーOCRソフトNDLOCR-Lite紹介

のぐさんのユーザアバター

NDLOCR-Lite
国立国会図書館が新しいOCRツール「NDLOCR-Lite」を公開しました。GPUを必要とせず、一般的なパソコンで図書・雑誌のデジタル化画像からテキストデータを作成できるというツールだそうです。

windows版をダウンしてみたのですが、すごいです。
子ども新聞の1頁を縦横指定もせず、領域も指定せずファイルを指定しただけなのですが、細かいコラムから読み取ってくれました。もちろんミスはありますがルビのゴミもありません。
普通の小説の数ページも人物紹介や目次もそのままもっときれいに読んでくれました。
以下に使い方の説明とダウンロードの案内があります。

https://lab.ndl.go.jp/data_set/ndlocrlite-usage/

Replied
悟空さんのユーザアバター

Re: 国会図書館のフリーOCRソフトNDLOCR-Lite紹介

のぐさん、こんにちは。
ndlocr_lite_v1.1.2_windows.zipをダウンロードして解凍を試みたのですが、「このフォルダーは空です」と表示されます。
どこか操作が間違っているのでしょうか?

                       悟空

コンテンツ配信 コンテンツ配信