並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 1744件

新着順 人気順

OCRの検索結果281 - 320 件 / 1744件

  • 「Dropbox」と「Box」、老舗クラウドストレージを企業があえて使い続ける納得の理由

    クラウドコンピューティング(いわゆる「クラウド」)は、インターネットなどのネットワークを通じてシステムを利用する形態のことだ。SaaS(サース)やスマートフォンなどは全てこの「クラウド」という概念がなければ存在しなかったと言っても過言ではない。 20世紀後半には概念として提唱されていたクラウドを商業的に確立したのは、Google(現在はAlphabet)で当時のCEOであったエリック・シュミットだったといわれている。 私たちの生活や仕事を劇的に便利にしたクラウド。Gmailを使えばスマホでもPCでも同じメールを送受信できるし、YouTubeがあればダウンロードすることなく動画を見ることができる。あらゆるITサービスがクラウドありきで構築されているため、その恩恵を意識することはもはやなくなったが、多くの人が最初にクラウドの恩恵を感じたのはクラウドストレージだったのではないだろうか。 2000

      「Dropbox」と「Box」、老舗クラウドストレージを企業があえて使い続ける納得の理由
    • 「台帳」なくして文化なし!? マンガ・アニメ・ゲーム・メディアアート文化を次の1000年に残す「メディア芸術データベース」の意義を「電ファミニコゲーマー」が訊く - メディア芸術カレントコンテンツ

      メディア芸術領域の現状をより深く、広く伝えるため愛称を「MACC」とし、総合的な広報用ウェブサイト「メディア芸術カレントコンテンツ(MACC)」として令和5年2月13日リニューアルオープンしました。 (https://macc.bunka.go.jp/) 当サイトは、これまでの記事をアーカイブとして掲載しています。 トップページ  ≫ 記事一覧 ≫ 「台帳」なくして文化なし!? マンガ・アニメ・ゲーム・メディアアート文化を次の1000年に残す「メディア芸術データベース」の意義を「電ファミニコゲーマー」が訊く 現在も整備が進む「メディア芸術データベース」は、マンガ、アニメ、ゲーム、メディアアートの全4分野を総合的に検索できる、分野横断型のデータベースだ。2019年11月からはベータ版がリリースされ、誰でもアクセスし、活用できるサイトとして公開されている。本稿ではゲームメディアの「電ファミニコ

        「台帳」なくして文化なし!? マンガ・アニメ・ゲーム・メディアアート文化を次の1000年に残す「メディア芸術データベース」の意義を「電ファミニコゲーマー」が訊く - メディア芸術カレントコンテンツ
      • 「Firefox 106」正式版リリース、画像内のテキスト抽出機能が追加

        ウェブブラウザ「Firefox 106」の正式版が公開されました。記事作成時点ではmacOS限定ながら画像内のテキストを抽出する機能が追加されるなど、ユーザーが直接触れる機会が多くなりそうな数々の機能が導入されています。 Firefox 106.0, See All New Features, Updates and Fixes https://www.mozilla.org/en-US/firefox/106.0/releasenotes/ ◆画像内のテキスト抽出 macOS 10.15(Catalina)以降で、選択した画像からテキストを抽出できるようになります。テキストの抽出を行うには、テキストを含む画像を右クリックし、表示されるポップアップメニューから「Copy Text from Image」を選択します。 抽出されたテキストは共有・保存・検索するためにクリップボードにコピーされ

          「Firefox 106」正式版リリース、画像内のテキスト抽出機能が追加
        • 保存してあった書類を6年分ほどpdf化したが今回はブログのリライトには使えそうになかった - 🍉しいたげられたしいたけ

          書類をなんでもかんでもクリアファイルに保存して、何年かに一度ページスキャナ ScanSnap で電子化する習慣がある。 習慣があるってほどではないな。気がついたら何年分も溜めてしまっていた。 自ブログを検索すると、前回はこちら。「もっと小まめにやるべきだ」と書いてたじゃないか! www.watto.nagoya 先週の週末を中心に、それらをページスキャナで pdf 化した。中心にというのは、週末だけでは足りなかったからだ。2015(H27)年から2020(R2)年までの6年分、クリアブックで3冊分ほどを電子化し、紙は廃棄した。 何年もやっていると、パターンが見えてくる。車検や定期点検、それに任意保険の明細書といった自動車関係の書類、災害ボランティア保険の申込書、などなどは毎年または毎期保存している。こういったものを保管して、あとで使ったためしはない。 それから旅行や遠出をしたとき貰ったちら

            保存してあった書類を6年分ほどpdf化したが今回はブログのリライトには使えそうになかった - 🍉しいたげられたしいたけ
          • DXを阻む障害

            DXを阻む障害 2021.07.22 Updated by Ryo Shimizu on July 22, 2021, 09:12 am JST いわゆるDX、デジタルトランスフォーメーションする必要性を多くの企業が迫られている。 ところが、これがなかなか難しい。 たとえば、DXをコンサルティング会社に依頼するも、そもそもそのコンサルティング会社そのものがDXしてないので「DXのようなもの」しか提案できない。 とあるコンサルティング会社が顧客先にDXを提案する資料を見せてもらったことがあるが、一言で言えば、それはDXというよりも「OA化」と呼んだ方がいい段階の提案に留まっていた。 たとえば、「AIの活用」という項目では、「FAX書類に書かれた文字の自動読み取り(AI-OCR)」という項目があるだけで、そもそも我々のような生粋のIT企業では、仕事上の文章は全てE-mailやPDFでやり取りさ

              DXを阻む障害
            • ベゾスがAmazon創業前にメモ書きした「戦わなくても勝ち続けてしまうループ」の図

              株式会社シナモン 執行役員/フューチャリスト 1982年生まれ。学生時代より一貫して、ニューラルネットワークなどの人工知能研究に従事し、25歳で慶應義塾大学大学院理工学研究科後期博士課程修了(工学博士)。 2005・2006年、「IPA未踏ソフトウェア創造事業」に採択。2005年よりシリウステクノロジーズに参画し、位置連動型広告配信システムAdLocalの開発を担当。在学中にネイキッドテクノロジーを創業したのち、同社をmixiに売却。 さらに、AI-OCR・音声認識・自然言語処理(NLP)など、人工知能のビジネスソリューションを提供する最注目のAIスタートアップ「シナモンAI」を共同創業。現在は同社のフューチャリストとして活躍し、東南アジアの優秀なエンジニアたちをリードする立場にある。 「イノベーターの味方であり続けること」を信条に、経営者・リーダー層向けのアドバイザリーやコーチングセッシ

                ベゾスがAmazon創業前にメモ書きした「戦わなくても勝ち続けてしまうループ」の図
              • OCRは「マリオプラザーズ」の夢を見る | Colorful Pieces of Game

                『ちょっとは正しいゲームの歴史』…というか、ともかく「ゲームの歴史」を批判するシリーズで困らされたのがOCRだった。 Kindle本からテキストで全部コピー出来ればいいのだけど、Kindleは出版社それぞれがコピーできる量を規制していて(当たり前だ)、それを超える量はコピーのしようがない。 そしていうまでもなく、ゲームの歴史批判シリーズは、死ぬほど引用するので、当然のことながら出版社の制限を超えることになる。 なお、この膨大な引用を「これはいいのか?」と言っていた人がいたらしいが、全く問題ない。 引用は認められた権利で、引用した内容ではなく、それを引用する意味があった本文があれば、なんの問題もない。 そうじゃないと「引用して批判する」ことが出来ないことになってしまうでしょ? といって、画像引用にすると縦書きになってしまい、ウェブでは読みづらい事、この上ないので以下の方法でテキスト化した。

                • 次のパンデミックでも感染者情報の収集に失敗する見通し - 発声練習

                  以下の記事 xtech.nikkei.com 実は、厚労省は研究予算を投じてパンデミック(世界的大流行)を想定した別のシステムも約10年前から開発させていた。「症例情報迅速集積システム(FFHS)」と呼び、集める情報を必要最小限に絞り込んだものだ。2014年度には一通りの機能を完成させ、何度も演習を実施していた。だが厚労省はFFHSを採用せず、緊急事態の中でHER-SYSを急造する。新型コロナ禍が広がりつつあった2020年2月、FFHSを新型コロナ対応に改修する指示を出していたにもかかわらずである。新型コロナ対策のIT化を指揮した厚労省の副大臣らにはFFHSの存在が伝わっていなかったことも明らかとなった。 上の記事のはてなブックマークでしょうかいされていたNHK News Webの記事 www3.nhk.or.jp 国の研究班は新型インフルエンザなど過去の感染症の教訓を踏まえ、新型コロナが

                    次のパンデミックでも感染者情報の収集に失敗する見通し - 発声練習
                  • 【2020年】GCPのAI/ML系のサービスまとめてみた | DevelopersIO

                    こんにちは、Mr.Moです。 Google Cloud Platform(GCP)にはたくさんの優れたサービスがありますがAI/ML系のサービスも熱いですね!Updateもガンガン来ているようなので現時点で情報をまとめておきたいと思います。 GCPのAI/ML系のサービス GCPでは多くのAI/ML系のサービスがリリースされていますが、今は大きく下記の2つで区別されているようです。 AI Building Blocks AI Platform AI Building Blocks AI Building Blocksには、カスタムモデルと事前トレーニング済みモデルの 2 種類があり、開発者は視覚認識能力、言語能力、会話能力、構造化データをアプリケーションに簡単に組み込めます。 事前トレーニング済みモデル 事前トレーニング済みのモデルをAPI経由で利用できるサービス群です。汎用的な機能でも良

                      【2020年】GCPのAI/ML系のサービスまとめてみた | DevelopersIO
                    • NDLOCRのWebアプリを作ってみた【Gradio】 - Qiita

                      import os import torch print(torch.__version__) torch_ver, cuda_ver = torch.__version__.split('+') os.system(f'pip install mmcv-full==1.4.0 -f https://download.openmmlab.com/mmcv/dist/{cuda_ver}/torch{torch_ver}/index.html --no-cache-dir') os.system('cd src/ndl_layout/mmdetection && python setup.py bdist_wheel && pip install dist/*.whl') os.system('wget https://lab.ndl.go.jp/dataset/ndlocr/text_re

                        NDLOCRのWebアプリを作ってみた【Gradio】 - Qiita
                      • ワクチン接種券の読み取りトラブル多発 政府、撮影用スタンドを自治体に配布へ

                        「接種券のバーコードが読み取れない」「(カメラの)ピントが合わない」――新型コロナワクチンの接種を担う自治体からこうした声が出ている。タブレット端末を使った接種券の読み取り作業でトラブルが多発しているためだ。読み取り方法に問題があるとして、内閣官房IT総合戦略室(IT室)は5月11日、タブレット端末を固定し、スムーズに接種券を読み取るための専用スタンドを全国の自治体に配布すると発表した。 各自治体では現在、高齢者や医療従事者を対象に接種券を配布し、接種を順次始めている。接種会場では接種券に記載された18桁の数字「OCRライン」をタブレット端末のカメラと専用アプリで読み取り、接種した回数や場所を識別するスキームだが、正しく読み取れないケースが相次いでいた。

                          ワクチン接種券の読み取りトラブル多発 政府、撮影用スタンドを自治体に配布へ
                        • アノテーションにおけるUIの工夫 - CADDi Tech Blog

                          こんにちは、MLOpsチームです。先日OCRモデルを学習するためのアノテーションにおいて、作業効率を検証するためのPoCとしてアノテーションUIを開発しました。本記事ではこのアノテーションUIにおける工夫について、試用によって得られた知見をまじえつつ紹介します。 はじめに アノテーションUIを開発することとなった背景について説明します。 アノテーションUIとは アノテーションUIは機械学習の学習データを作成するためのUIです。アノテーションUIはアノテーション作業の効率に強く影響し、アノテーション作業によって得られる学習データの量は機械学習の精度に大きく寄与します。したがって、アノテーションUIは機械学習において最も重要なコンポーネントのひとつといえます。 UIを開発した背景 キャディではOSSツールなどのUIを用いてアノテーションが行われていましたが、ここに独自の工夫を導入すれば入力効率

                            アノテーションにおけるUIの工夫 - CADDi Tech Blog
                          • 【マンガ】仕事が速い人と遅い人「超ムダなエクセル入力作業」への対応の差

                            エクセルがめんどくさいのでラクするコツをまとめてみた 「エクセルを使えば、仕事はこんなにラクになる」。今までめんどくさいけど我慢してやっていた事務作業、ミスしがちなポイントを解決するちょっとしたコツを、マンガとイラストでわかりやすく紹介します。 バックナンバー一覧 「自分は仕事が遅い……」「よくミスをする……」そんな悩みを抱える人ほど、実は“自己流”の仕事のやり方で損をしていることがあります。なかでも、知識がシェアされづらくブラックボックス化しがちなのが「エクセル」の使い方。この連載では、事務の仕事をよりラクに、よりミスなく進めるためのエクセルのちょっとしたコツを、事務職一筋の著者が、マンガでわかりやすくお伝えします。 今回は、事務職あるあるの「アナログ作業」についての解決策。アプリを知っているか知らないかで、作業時間が大きく変わります。(マンガ:あきのあこ) 【エクセルでラクするコツ:明

                              【マンガ】仕事が速い人と遅い人「超ムダなエクセル入力作業」への対応の差
                            • 「ScanSnap Home」がライセンスフリー化、利用デバイスやユーザー数の上限を廃止

                                「ScanSnap Home」がライセンスフリー化、利用デバイスやユーザー数の上限を廃止 
                              • 国立国会図書館、「次世代デジタルライブラリー」の全文検索対象を著作権保護期間満了図書資料全件に拡大

                                2022年3月22日、国立国会図書館(NDL)のNDLラボが、「次世代デジタルライブラリー」の全文検索対象を著作権保護期間が満了した図書資料全件約28万点に拡大したと発表しました。 2022年度にNDLが実施しているデジタル化資料の光学文字認識(OCR)テキスト化事業の成果物の一部であり、技術的検証の実施や成果の迅速な提供のため、国立国会図書館デジタルコレクションの全文検索機能とは別に提供しているとあります。 「次世代デジタルライブラリー」の全文検索対象を著作権保護期間満了図書資料全件に拡大しました(NDL Lab, 2022/3/22) https://lab.ndl.go.jp/news/2021/2022-03-22/ 参考: 国立国会図書館、「次世代デジタルライブラリー」の全文検索対象拡大と画像検索機能改善を実施 Posted 2022年2月1日 https://current.n

                                  国立国会図書館、「次世代デジタルライブラリー」の全文検索対象を著作権保護期間満了図書資料全件に拡大
                                • AI学習済みモデルの開発に使える無償のフレームワーク「SmallTrain ver.0.2.0」商用利用可能 | Ledge.ai

                                  SmallTrainサイトのトップ画面 株式会社Geek Guild(ギークギルド)は11月9日、商用AI(人工知能)サービスのための、高精度なAI学習済みモデルの開発に使えるディープラーニング(深層学習)フレームワーク「SmallTrain(スモールトレイン)ver.0.2.0」のソースコードを公開したと発表。オープンソースなので、無償で誰でも利用できる。 SmallTrainは、ライブラリ機能とラッパー機能を兼ね備えたオープンソースフレームワーク。Kerasのように使えるという。多様なデータを学習済みのAIモデルを起点に、転移学習をするだけで、工数をかけずにAIを構築できるとのこと。 SmallTrainを使うと、精度を損なわず、大量のデータを取得する労力もいらず、ディープニューラルネットワークをすぐに開発できるという。MITライセンスに準拠しており、商用利用も可能だ。 需要と供給にあ

                                    AI学習済みモデルの開発に使える無償のフレームワーク「SmallTrain ver.0.2.0」商用利用可能 | Ledge.ai
                                  • Software engineering practices

                                    1st October 2022 Gergely Orosz started a Twitter conversation asking about recommended “software engineering practices” for development teams. (I really like his rejection of the term “best practices” here: I always feel it’s prescriptive and misguiding to announce something as “best”.) I decided to flesh some of my replies out into a longer post. Documentation in the same repo as the code Mechani

                                      Software engineering practices
                                    • Cloudflare、bot対策をGoogleのreCAPTCHAからhCaptchaに移行

                                      米CDN(Content Delivery Network)大手のCloudflareは4月8日(現地時間)、bot検出ツールをこれまで採用していた米Googleの「reCAPTCHA」から米新興企業Intuition Machinesの「hCaptcha」に移行すると発表した。Googleから課金すると通告されたため。 Googleは2009年にreCAPTCHAを買収して以来、このサービスを無償で提供しているが、FAQページによると、1秒当たり1000件あるいは1カ月当たり100万件以上アクセスがある場合は高機能で有料の「reCAPTCHA Enterprise」に移行する必要がある。 Cloudflareは(Googleが営利企業である以上)これは理にかなったことではあるが、サービス維持のために年間数百万ドルのコストが発生することになるため、より良い代替案を探したという。 Intui

                                        Cloudflare、bot対策をGoogleのreCAPTCHAからhCaptchaに移行
                                      • デザインチーム内でJavaScript勉強会を開催した話 - 弁護士ドットコム株式会社 Creators’ blog

                                        こんにちは。弁護士ドットコム デザイン部の林(@taka_piya )です。普段は弁護士向けの業務システムのデザインをしています。 10月から3月まで週1回、デザイン部内でJavaScript勉強会を開催しました。この記事ではその具体的な内容と成果、振り返り、頂いたフィードバックをご紹介します。ぜひ社内勉強会のネタに! JavaScript勉強会をはじめたきっかけ (1)作るプロトタイプの幅が広がる (2)漏れのないUI設計ができるようになる 勉強会の内容 基礎編 基本を一歩ずつ学ぶ 身近なお題を取り入れた演習をやる 周辺知識にも触れる 応用編 (1)Vue.jsの基本を学ぶ (2)作りたいミニアプリを構想から実装まで一人で作る 成果発表会 みんなのミニアプリを紹介 どのような成果が生まれたか 改善点 想定した期間より長くなってしまった 途中からレベル差が生まれてしまった 双方向のコミュニ

                                          デザインチーム内でJavaScript勉強会を開催した話 - 弁護士ドットコム株式会社 Creators’ blog
                                        • Engadget | Technology News & Reviews

                                          Apple's thinner new iPad Pros feature an M4 chip and "tandem" OLED displays

                                            Engadget | Technology News & Reviews
                                          • NDLデジタルコレクションについてのあれこれ

                                            国立国会図書館のデジタルコレクションが、昨年暮れから今年の初めにかけてさらにヴァージョンアップされました。それは全文テキスト検索とそれによるスニペット表示が可能になったこと、そして、50コマまでの複写が可能になったことです。全文テキストというのは、資料の版面からスキャンして得た画像からOCR技術を通じて文字を抽出して作成するものです。これによってテキストに含まれる文字列での検索が可能になります。従来、書誌事項(タイトルや著者名など)や目次(これが検索対象になったことも重要だが)からの文字列が対象だったのが、本文が検索対象になったことは革命的なものをもたらします。今まで見えなかったものが見えるようになったということです。ただし、検索結果の表示は1行程度の部分的なものです。これは、著作権法(47条の5)に基づく措置です。また、50コマまでの複写が可能になったことも特筆すべきことです。だいたい1

                                              NDLデジタルコレクションについてのあれこれ
                                            • 基本概念から理解するAzure AI Search - Azure OpenAI Serviceとの連携まで - 電通総研 テックブログ

                                              こんにちは。XI 本部AIトランスフォーメーションセンター所属の山田です。 先日、部内の勉強会でAzure AI Searchについて紹介したので、テックブログでもその内容を紹介したいと思います。 Azure AI Searchとは? Azure AI Searchに保存されるデータに関する用語と概念 Azure AI Searchのスケーラビリティに関する用語と概念 Azure AI Searchでサポートされる検索の仕組み 全文検索について Azure AI Searchのアナライザー ベクトル検索について ベクトルの近傍検索アルゴリズム ハイブリッド検索 検索インデックスのスキーマ設計 検索インデックスにドキュメントを追加する方法 Pushモデル Pushモデルを利用する場合のアーキテクチャの例 Pullモデル Pullモデルを利用する場合のアーキテクチャの例 インデクサーの計算リソ

                                                基本概念から理解するAzure AI Search - Azure OpenAI Serviceとの連携まで - 電通総研 テックブログ
                                              • 2023年の気になる図書館システム関係覚書 - BEAYS(新装版)

                                                2022年中に気になっていて、今後、個人的に注目している図書館システム関係(公共図書館中心)に関する覚書です。独断と偏見でとりとめなく書いています。(ここまでテンプレ) なんかもう2月になってしまったけど気にしない。 なお、昨年の覚書はこちら。 図書館システム関係 2022年で一番衝撃的だったのは、サイバー攻撃でシステムダウンした那覇市立図書館の事例*1。ランサムウェアによるものとされ、10月中旬の発生からから4ヶ月近く経った2月中旬現在、予約は近日稼働予定とのことだが、書誌データなどはまだ完全には復旧していない模様*2。書誌情報はともかく、利用者情報とか予約情報にアクセスできなくなるとか悪夢でしかない。関係者の方々の苦労が偲ばれる。最近のランサムウェアは、データの暗号化だけでなく窃取も行うらしいので、今後は下手したら個人情報流出案件になる場合もあるかも。くわばらくわばら。今回の事例、収ま

                                                  2023年の気になる図書館システム関係覚書 - BEAYS(新装版)
                                                • “イルカ”から始まったマイクロソフトのAIサービスの現在地 学習済みAIを使える「Azure Cognitive Services」でできること

                                                  “イルカ”から始まったマイクロソフトのAIサービスの現在地 学習済みAIを使える「Azure Cognitive Services」でできること Microsoft の AI 関連サービスと、コミュニケーション領域での活用事例の紹介 #1/2 2019年12月4日、DIGITAL Xが主催するイベント「DIGITAL X DAY 2019 コミュニケーションAIが実現する新しい接客のカタチ」が開催されました。インターネットの普及と発達により、顧客との対話方法が多様化している昨今。AIが顧客とのコミュニケーションにどのように生かされているのか、さまざまな企業が実際の活用事例を語ります。プレゼンテーション「Microsoft の AI 関連サービスと、コミュニケーション領域での活用事例の紹介」に登壇したのは、日本マイクロソフト株式会社 Azureビジネス本部 プロダクトマネージャーの竹

                                                    “イルカ”から始まったマイクロソフトのAIサービスの現在地 学習済みAIを使える「Azure Cognitive Services」でできること
                                                  • アナログとデジタルの境界を越えるドット書体-林隆男「The TYPEBANK」(1985年)|造字沼ブックス/文字の本を発掘して読みとく

                                                    今回ご紹介するのは「書体を創るー林隆男タイプフェイス論集」(ジャストシステム、1996年)と「TheTYPEBANK」(朗文堂、1985年)だ。この書籍は、デザイナーによる書体デザインという概念を広めた林隆男氏の書体論をまとめたものだ。林氏が手掛けた書体は多いが、その中からビットマップフォントにのみ焦点あててゆく。 ★追記あり(2020.10.13)※目次のリンクをご覧ください。 当連載では、これまでに漢字改良の本ばかり紹介してきた。今回にご紹介する林隆男氏が、漢字改良を目指していたわけではないこと誤解がないように記しておく。 本記事では、2種の書体を取り上げたい。 ・林隆男+日立製作所 デザイン研究所 16×16ドット明朝体 ・タイプバンクゴシックSL(以下、TBゴシック)の9、10、12、14ドット版 前半では、16ドット明朝体から林氏の書体制作の理念に触れる。 後半では、TBゴシック

                                                      アナログとデジタルの境界を越えるドット書体-林隆男「The TYPEBANK」(1985年)|造字沼ブックス/文字の本を発掘して読みとく
                                                    • 低リソースかつノイジーなテキストに対する固有表現認識 - Ahogrammer

                                                      ACL 2019より以下の論文を紹介。 Towards Robust Named Entity Recognition for Historic German この論文は、昔のドイツ語(1700年〜1900年くらい)に対する固有表現認識を行った論文。「昔のドイツ語の固有表現認識になんか興味ねーよ」と思うかもしれないが、要するに低リソースかつノイジーなテキストに対する固有表現認識を上手くやるための方法だと考えればいい。手法としては言語モデルを事前学習して、それを使って固有表現認識するというもの。時代の異なる2つのデータセットに対して検証したところ、従来手法より良い結果となった。 昔のドイツ語に対する固有表現認識には3つの課題がある。一つはリソースの量が少ない点。現在よく使われているCoNLL 2003のデータセットと比べると、タグの付いたデータ量が少なく、その分難しくなっている。2つ目はテキ

                                                        低リソースかつノイジーなテキストに対する固有表現認識 - Ahogrammer
                                                      • 機械学習チーム立ち上げ前夜とその後の話 #バクラク #LayerX|Shun Takagiwa

                                                        こんにちは!バクラクエンジニアの高際です! LayerXでは現在AI-OCRチームのマネージャーを担当しています。 このnoteでは、機械学習チーム立ち上げ前夜の意思決定プロセスと、その後の進捗について報告したいと思います。 いきなり昔話をしますが、LayerXは実は去年(2021年)までは機械学習に積極的に取り組んでいませんでした。 クラウドコンピューティングと同様当然に利用する技術ではあるものの、自社のコア技術として積極投資するというよりは、あくまでツールのひとつとして利用するというスタンスでした。 それが一転して2022年にはCEO福島から「機械学習を本気でやります。チームを10倍に拡大させる」という宣言を出しました。 ML本気でやります。MLチームを10倍に拡大させることを決めました。MLエンジニアの皆様ぜひLayerXをよろしくおねがいします。(私も5年のブランクを超え勉強し始め

                                                          機械学習チーム立ち上げ前夜とその後の話 #バクラク #LayerX|Shun Takagiwa
                                                        • テキストボックス完全マスター!練習問題で学ぶテキストボックス総まとめ - わえなび ワード&エクセル問題集 waenavi

                                                          ネット上にはテキストボックスを解説するサイトは多数ありますが、いずれも書式設定の基本的な方法を述べるにとどまっており、実用的な使い方を解説するものは皆無です。 ところで、テキストボックスは長方形を描いてその中に文字を入力するだけというイメージがありますが、それだけではテキストボックスを完全に理解したとは言えません。テキストボックス内部の文字列の行間や余白を自由に変えることが可能です。さらに、Office2010以降ではワードアートの機能がテキストボックスに統合され、テキストボックスを学ぶ重要性が増しています。 そこで、「テキストボックスの正しい使い方」というテーマで当ブログの記事を、作成例とともにまとめてご紹介します。 *補足* すべてWordの画面で説明していますが、ExcelやPowerPointもほぼ同じです。WordとExcelの違いは、行グリッド、インデント、改行記号の有無です。

                                                            テキストボックス完全マスター!練習問題で学ぶテキストボックス総まとめ - わえなび ワード&エクセル問題集 waenavi
                                                          • 「PDFとは何か」をざっくり説明してペーパーレス化するための初心者向け解説資料 - わえなび ワード&エクセル問題集 waenavi

                                                            紙の使用をなくすことをペーパーレスと言いますが、業務の効率化、生産性の向上などさまざまなメリットがあり、今では、ペーパーレス化するのは当たり前となっています。しかし、紙媒体に慣れている抵抗勢力のせいでなかなかペーパーレス化が進んでいないのが現状です。「PDF」すら分からない経営者や事務担当者もいるそうで、あきれて物も言えません。 しかし、本当にPDFが分からない人にPDFの歴史や仕様を長々と語るのはもってのほかです。紙を使うのに製紙工場の詳細を知る必要はないし、専門用語を知る必要もないのです。「PDFとは何か?」という質問は、PDFの性質を知りたいのではなく、紙でやっている業務をPDFに切り替える方法を知りたいだけなのです。 そこで、PDFを知らない人のためにPDFというものをざっくりと説明するための資料を作りました。いまどき事務職でPDFを知らないのは流石に遅れすぎているので、今すぐ読ん

                                                              「PDFとは何か」をざっくり説明してペーパーレス化するための初心者向け解説資料 - わえなび ワード&エクセル問題集 waenavi
                                                            • プロダクト拡大と開発生産性|Matsumoto Yuki

                                                              今年のLayerXの取り組みについて書こうとも思ったのですが先日下記の記事でまとめてしまったので、今回は開発生産性に大きな影響を与える不確実性についてのポエムを書いてみようと思います。 いうのも最近はプロダクト開発そのものよりも、複数の事業をより遠くからサポートしていく事が多くなりました。そのため具体的な取り組みよりも、その根底にある戦略が正しくあることをサポートすることが多くなりました。 この視点から開発生産性について書くことは多少普段と違う見方をEngineering ManagerやProduct managerの方へ提供できるのではないかと思っています。 特にプロダクト戦略面における不確実性は具体的な運用のHowより大きな影響を開発生産性に対して与える事が多いため、戦略と開発生産性ということについて触れていきます。 戦略と開発生産性我々が開発するソフトウェアは前提として顧客に価値を

                                                                プロダクト拡大と開発生産性|Matsumoto Yuki
                                                              • 急成長スタートアップはどのSaaSを使っている?:LegalForce編

                                                                急成長スタートアップはどのSaaSを使っている?:LegalForce編:あの企業が使うバックオフィスSaaS(1/3 ページ) 昨今、バックオフィスにおけるSaaSの導入が盛んだ。経理、人事、総務、法務などなどさまざまなSaaSが登場し、しのぎを削っている。こうしたSaaSを最も活用しているのは、既存のオペレーションに縛られないスタートアップ企業だろう。 急成長スタートアップは、どんなバックオフィスSaaSを導入し、どう活用しているのか。第1回は、自身も法務向けSaaSを提供するLegalForceに聞いた。 AI契約レビューとAI契約書管理を提供 LegalForceは2017年4月に創業した、レイターステージのスタートアップだ。これまで41.9億円の資金を調達しており、従業員数は277名。弁護士でもある角田望社長のもと、契約書関連のSaaSを提供している。 法務部門向けに、AIを使っ

                                                                  急成長スタートアップはどのSaaSを使っている?:LegalForce編
                                                                • 「机の上にたまった書類をスマホアプリでPDF化したい」――急遽テレワークを導入した中小企業の顛末記(94)【急遽テレワーク導入!の顛末記】

                                                                    「机の上にたまった書類をスマホアプリでPDF化したい」――急遽テレワークを導入した中小企業の顛末記(94)【急遽テレワーク導入!の顛末記】
                                                                  • 超軽量版Windows 10の最新版「Ttny10 23H2」がリリース | ソフトアンテナ

                                                                    Windows 10やWindows 11はあまりコンパクトなOSではなく、ハードウェアの最小要件として少なくとも20GBの空きディスク容量が必要だと定められています。安価なデバイスや仮想マシンでの実行は難しく、問題を解決するために公式OSを軽量化した「tiny10」や「tiny11」が開発されました。 今回、プロジェクトの作成者@NTDEV氏が、tiny10の最新版「tiny10 23H2」をリリースしています。 tiny10 23H2は旧バージョンに存在した複数の「厄介な問題」を解決していて、新しいツールでtiny10を再構築することによって、ほとんどのWindowsコンポーネントとの互換性が改善しています。Windows Media Playerなどの追加機能を必要なときにいつでもインストールできるようになり、.NET Framework 3.5が再び完全に機能するようになっています

                                                                      超軽量版Windows 10の最新版「Ttny10 23H2」がリリース | ソフトアンテナ
                                                                    • Azure OpenAI on your data でノーコードで ChatGPT 対応エンタープライズサーチを構築する - Qiita

                                                                      はじめに Microsoft Build 2023 で発表のあった Azure OpenAI on your data のパブリックプレビューが開始されました。「on your data」の名前の通り、Azure OpenAI Studio の Chat Playground 上で Azure Cognitive Search のデータを参照し、モデルが知らない内容を答えられるようにしてからノーコードでAzure AD 認証付きチャットアプリのデプロイまでやってしまうという機能です。 内部アーキテクチャ 「on your data」の仕組みは以下のようなアーキテクチャになっていると考えられます。考えられますというのは、Azure Cognitive Search からの Grounding の処理が on your data REST API 内部で行われるため、詳細が隠蔽されているためで

                                                                        Azure OpenAI on your data でノーコードで ChatGPT 対応エンタープライズサーチを構築する - Qiita
                                                                      • Google ドライブの OCR 機能を使い、画像や PDF 内の文字列を抽出する方法 - k本的に無料ソフト・フリーソフト

                                                                        このページでは、Google ドライブの OCR 機能を使い、画像や PDF 内の文字列を抽出する方法を紹介します。 PDF や写真のファイルをテキストに変換する - Google ドライブ ヘルプ 無料で使える OCR ソフト Google ドライブには、画像や PDF をテキストに変換する機能が付いています。 この機能を使うと、画像内に写っている文字列や、PDF 内の文字列を Google ドキュメントに抽出することができ、そのままコピーしたり編集したりすることが可能となります。 使用にあたり Google アカウントが必要になるものの、無料で使うことができ、操作も OCR 処理を行いたいファイルを、Google ドライブにアップロード アップロードしたファイルを、Google ドキュメントで開く だけなので超簡単。 画像や PDF 内のテキストを抜き出したい時にはもちろん、画像内に写

                                                                          Google ドライブの OCR 機能を使い、画像や PDF 内の文字列を抽出する方法 - k本的に無料ソフト・フリーソフト
                                                                        • ビジネスモデル研究:Sansan|トライのながえさん/ノーコード予測AI

                                                                          Executive summary Sansan事業は企業向けの名刺管理サービスSanSanと、そのシステムを一般ユーザー向けにリリースしたEightからなる。競合にWantedlyの名刺管理サービスなどがあるが、明確な差別化は「あえて人力で名刺を入力していること」である。これにより読み取り精度は99.9%(同社より)となり、言語によらず、OCRでの自動読み取りと比較して高い精度でデータ入力を行うことができる。なお人力読み取りサービスはSansanの有料版サービスのみの提供である。 Sansanのビジネスモデル設計の素晴らしさは、機械学習技術をはじめとするアルゴリズム(いわゆるAIの要素技術)の限界を知った上で、技術インパクトの最大化を行いながら、本業の利益を最大化するためのコスト削減施策を「占有技術」で実現している点だ。DXerの皆様におかれましては、教師データ入力のモチベーション設計や

                                                                            ビジネスモデル研究:Sansan|トライのながえさん/ノーコード予測AI
                                                                          • 「チームの半数は修士号を取得」「20カ国以上から採用」 世界のAI人材が日本のベンチャーに集まるワケ

                                                                            大手からスタートアップまで、AIやデータを活用できる人材の不足に悩む企業は多い。初任給が引き上げられたり高額の年収が約束されたりと好待遇の求人も増えてきたが、AI人材の獲得競争は激化しており、ただ待遇を良くするだけでは良い人材は集まらない。 こうした状況の中、日本のAIスタートアップCogent Labs(コージェントラボ)は、世界20カ国以上からの人材獲得に成功している。特にR&Dのチームメンバーは、約5割が修士号、約3割が博士号を取得済み。米Googleなど海外の大手IT企業から専門性の高い人材が集結しつつある。 なぜ、社員約70人という日本の小さなスタートアップに海外の人材が集まってくるのだろうか。人事採用マネージャーのマルコ・スリマさんと、2018年に英DeepMindからCogent Labsに転職したティアゴ・ラマルさん(リードリサーチサイエンティスト)への取材を基に、その理由

                                                                              「チームの半数は修士号を取得」「20カ国以上から採用」 世界のAI人材が日本のベンチャーに集まるワケ
                                                                            • Amazon Textract を使用したドキュメントからのテキストと構造化データの自動抽出 | Amazon Web Services

                                                                              Amazon Web Services ブログ Amazon Textract を使用したドキュメントからのテキストと構造化データの自動抽出 ドキュメントは、金融、医療、法律、および不動産などの数多くの業界全体における記録管理、コミュニケーション、コラボレーション、そして取引のための主な手段です。毎年処理される何百万もの住宅ローン申請、そして何億もの W2 納税申告書は、そのようなドキュメントの数例にすぎません。多くの情報は、非構造化ドキュメントに閉じ込められています。これらのドキュメントの検索と検出、ビジネスプロセスの自動化、およびコンプライアンス管理を可能にするには、時間がかかる複雑なプロセスが必要になるのが通常です。 この記事では、Amazon Textract を利用して、機械学習 (ML) の経験がなくてもスキャンされたドキュメントからテキストとデータを自動的に抽出することができ

                                                                                Amazon Textract を使用したドキュメントからのテキストと構造化データの自動抽出 | Amazon Web Services
                                                                              • アクセシビリティ情報を使った壊れにくいE2Eテスト | フューチャー技術ブログ

                                                                                2/25の東京Node学園で発表してきました。 E2Eテストはみんなしていますか?正直言うと、僕はあんまり好きじゃなかったです。お仕事では他の人が入れてくれたものが回っていたりしますが。前職で、SikuliXを使って社内向けのデスクトップアプリケーションのE2Eテストにトライしたことがあるんですが、すぐに壊れて動かなくなるので、費用対効果が出せなくてあきらめました(一人プロジェクトだったのもあります)。 絵でマッチングを行うのでボタン画像をいっぱいスクショをとっていく必要がある OCR機能はOSネイティブボタンの背景のグラデーションとかとの相性もあってあまりうまくいかず・・・自分で学習させるのも情報が少なかった。 ちょっとツールバーに新しいボタンを追加したりすると、絵が変わって動作しなくなる ボタンを画像で置くが、QtはOSごとにネイティブなルック&フィールで描画するので、macOS用に書

                                                                                  アクセシビリティ情報を使った壊れにくいE2Eテスト | フューチャー技術ブログ
                                                                                • Toru Aoike on Twitter: "次世代デジタルライブラリーの全文OCRテキスト検索対象に、著作権の切れた約7万資料分を追加して、検索ヒット箇所の元画像上でのピン表示機能と、テキストのダウンロード機能をつけて公開してあります。(PCでみてね) 全文検索… https://t.co/fkgdNi0v02"

                                                                                  次世代デジタルライブラリーの全文OCRテキスト検索対象に、著作権の切れた約7万資料分を追加して、検索ヒット箇所の元画像上でのピン表示機能と、テキストのダウンロード機能をつけて公開してあります。(PCでみてね) 全文検索… https://t.co/fkgdNi0v02

                                                                                    Toru Aoike on Twitter: "次世代デジタルライブラリーの全文OCRテキスト検索対象に、著作権の切れた約7万資料分を追加して、検索ヒット箇所の元画像上でのピン表示機能と、テキストのダウンロード機能をつけて公開してあります。(PCでみてね) 全文検索… https://t.co/fkgdNi0v02"