エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
国立国会図書館、OCR処理プログラムと学習用データセットを公開
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
国立国会図書館、OCR処理プログラムと学習用データセットを公開
2022年4月25日に、国立国会図書館(NDL)が、OCR処理プログラムであるNDLOCRと、パブリックドメインOCR... 2022年4月25日に、国立国会図書館(NDL)が、OCR処理プログラムであるNDLOCRと、パブリックドメインOCR学習用データセットをNDLラボのGitHubで公開しました。 NDLOCRは、NDLが2021年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR処理プログラムです。 学習用データセットは、NDLが2021年度にLINE株式会社に委託して実施したデジタル化資料のOCRテキスト化事業において、OCRモデルの性能改善のために作成した機械学習用データセットのうち、著作権保護期間の満了した資料から作成されたデータセットです。2022年4月末時点で、2,713画像分を公開しています。 OCR処理プログラム及び学習用データセットの公開について(NDLラボ, 2022/4/25) https://lab.ndl.go.