タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

MLとLayerXに関するnekoruriのブックマーク (2)

  • Document AIを巡る技術とLayerXにおける可能性 - LayerX エンジニアブログ

    初めまして。機械学習エンジニアの島越@nt_4o54です。現在はMLチームで日々、バクラクシリーズで用いられているAI-OCR機能の改善や新規機能の開発などを行なっています。 7月はLayerXエンジニアブログを活発にしよう月間ということで、自分からは表題にもある通り、「Document AI」と呼ばれる技術についての紹介と、またLayerXにおいてどういう応用先があるのかというお話をさせていただこうと思います。 ※ 同名のDocument AIというGCPのサービスがありますが、今回は一般的なDocument AIの話になります。 Document AIとは Document AIに用いられる技術 Optical Character Recognition (OCR) Document Classification Layout Analysis Document Parsing Tab

    Document AIを巡る技術とLayerXにおける可能性 - LayerX エンジニアブログ
  • LayoutLMの特徴と事前学習タスクについて - LayerX エンジニアブログ

    LayerXで機械学習エンジニアを担当している @yoppiblog です。今回はOCRチームで検証したLayoutLMについて簡単に紹介します。 LayoutLMとは LayoutLMとは昨今注目されているマルチモーダルなDocument Understanding領域の1実装です。 様々な文書(LayerXだとバクラクではお客様の多種多様な請求書といった帳票を扱っています)から情報を抽出(支払金額、支払期日や取引先名など)するために考案されたものになります。 BERT(LayoutLMv3はRoBERTa)ベースのencoder層を用いレイアウト情報や、文書そのものを画像特徴量としてembedding層で扱っているところが既存のモデルより、より文書解析に特化している点です。 v1〜v3まで提唱されており、v3が一番精度が高いモデルです。 もともと、LayoutLMv2では多言語対応され

    LayoutLMの特徴と事前学習タスクについて - LayerX エンジニアブログ
    nekoruri
    nekoruri 2022/11/27
    “事前学習済みモデル自体は商用利用不可なため、自分たちで事前学習モデルから作り検証に至った”
  • 1