並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 1743件

新着順 人気順

OCRの検索結果41 - 80 件 / 1743件

  • 「校則データベース」を開発する現役高校生 理不尽な校則がない社会へ - #学校教育を考える - NHK みんなでプラス

    全国の高校の校則をデータベース化 “全国校則一覧”とは ( 神谷さんたちが制作したホームページ「全国校則一覧」 ) 神谷さんが代表を務める学生団体Change of Perspectiveが運営するホームページ「全国校則一覧」。2022年9月現在、1200校あまりの高校の校則を公開しています。 学校名などで検索すると、その学校の校則を誰でも自由に閲覧可能です。 「ツーブロック」などのキーワードで検索すれば、何校が校則として掲載しているのかも調べられます。 (「ツーブロック」で検索すると1215校中132校が表示された) 神谷さんは現在も各教育委員会へ情報公開請求を続けており、今年度中に約3500ある全国すべての公立高校の校則を集め、ホームページ上で公開することを目指しています。 現役高校生がなぜ校則のデータベース化に取り組む? (プロジェクトを立ち上げた群馬県の高校2年生 神谷航平さん)

      「校則データベース」を開発する現役高校生 理不尽な校則がない社会へ - #学校教育を考える - NHK みんなでプラス
    • 厚生労働省が10年備えた感染把握システムを採用せず、急造「HER-SYS」は機能不全

      医療現場の負荷軽減へ縮小運用を続ける感染者情報管理システム「HER-SYS」。実は、厚生労働省が約10年かけて開発を進めてきた別の感染把握システムがある。「症例情報迅速集積システム(FFHS)」と呼び、現場の負荷を極力抑えたものだ。だが厚労省はなぜかFFHSを採用せず、HER-SYSを急造する選択をした。累計50億円以上を投じたHER-SYSを含め、決定の経緯と結果の検証が必要だ。 新型コロナウイルス対策に活用する「新型コロナウイルス感染者等情報把握・管理支援システム(HER-SYS)」がたび重なる運用見直しに追われている。その大きな要因の1つが、国が医療機関や保健所に求める入力事務の負荷の高さだ。 当初は患者の個人情報や症例に加え、濃厚接触の追跡に使う関連情報など約120項目の入力が必要で、1件に20~30分を要したという。医療現場から改善要望が強く、厚生労働省は2020年末に発生届と同

        厚生労働省が10年備えた感染把握システムを採用せず、急造「HER-SYS」は機能不全
      • 書籍「ゲームの歴史」について(2) | Colorful Pieces of Game

        このテキストは岩崎夏海・稲田豊史両氏による『ゲームの歴史』の1、2、3の中で、ゲームの歴史的に見て問題があり、かつ僕が指摘できるところについて記述していくテキストだ。 該当の本は、ハッキング・箱庭・オープンワールド・疑似3D・2Dなどの通常のゲーム&コンピュータ用語に筆者の独自解釈が含まれていて、それを筆者の都合に応じて定義をいじりながら論を展開するために、極めて独特の内容になっている。 例えば3D描画で背景をテクスチャで埋めると3D+2Dの疑似3Dになると言われたら、普通のゲーム屋なら目を白黒させるだろう。ただ、それは筆者の主張なので「自分はそこは批判はしないが、筆者の見方には全く同意できない」とだけ書いておく。 なお、該当の本の引用部は読みやすさを考慮してスクリーンショットからonenoteのOCRで文字の書きだしをしたものを僕が修正したものになっている。なので校正ミスで本文と若干ずれ

        • 「スタバMac」がいよいよ危ない時代が到来? PC画面のテキストを簡単にコピーできる技術に戦慄する声

          usagimaru ⌘ @usagimaruma iOS 15のLive Text OCRを使って、他人のPC画面に映ったテキストを容易にコピーできてしまう時代。 twitter.com/juanbuis/statu… 2021-10-15 05:59:44 juan @juanbuis students are starting to steal each other's notes with iOS 15 and it's... kind of genius pic.twitter.com/klE992DuBn 2021-10-15 01:27:24

            「スタバMac」がいよいよ危ない時代が到来? PC画面のテキストを簡単にコピーできる技術に戦慄する声
          • Google、コーディング不要でアプリケーション開発ができる「AppSheet」買収。クラウドをベースにした業務アプリケーションのノーコード開発を強化

            Google、コーディング不要でアプリケーション開発ができる「AppSheet」買収。クラウドをベースにした業務アプリケーションのノーコード開発を強化 Googleは、コードを用いたプログラミングをせずにモバイルアプリケーションやWebアプリケーションを開発できる、いわゆるノーコードツールベンダの「AppSheet」を買収したと発表しました。 We’re excited to welcome @appsheet to Google Cloud! Together, we’ll help companies more easily create and extend applications without the need for professional coding skills. Learn more ↓https://t.co/0vk1NvBg9O — Google Cloud (

              Google、コーディング不要でアプリケーション開発ができる「AppSheet」買収。クラウドをベースにした業務アプリケーションのノーコード開発を強化
            • RAGの性能を改善するための8つの戦略 | Fintan

              近年、OpenAIのGPT-4やGoogleのGemini、MetaのLLaMAをはじめとする大規模言語モデル(Large Language Model:LLM)の能力が大幅に向上し、自然言語処理において優れた結果を収めています[1][2][3]。これらのLLMは、膨大な量のテキストデータで学習されており、さまざまな自然言語処理タスクにおいて、タスクに固有なデータを用いてモデルをファインチューニングすることなく、より正確で自然なテキスト生成や、複雑な質問への回答が可能となっています。 LLM-jp-eval[4]およびMT-bench-jp[5]を用いた日本語LLMの評価結果。Nejumi LLMリーダーボード Neoより取得。 大規模言語モデルは近年急速な進歩を遂げていますが、これらの進歩にもかかわらず、裏付けのない情報や矛盾した内容を生成する点においては依然として課題があります。たとえ

                RAGの性能を改善するための8つの戦略 | Fintan
              • Web口振受付と即時口振に頼らなければならない新型決済スキームの問題 - novtanの日常

                ドコモ口座の問題はシステム的な部分でいうと「本人確認と認証が甘い」に尽きるんですが、それ以前の問題として、このビジネススキームが何を根拠に成立していて、その根拠に基づいた対応が行われていたか、ということがありますね。なにぶん、それなりに新しいことをやろうとしている話なので必ずしも法整備は十分ではないし、抜け道というか、既存の制度だったらこうすれば使えるよね、というスキームをひねり出して実施していくわけです。なので、根本的な法律や制度の問題とは別に、2者間で成立させるための個別の契約が必ずあるわけです。それがどのくらい今回の事態を想定していたかは定かではないですけれども、少なくともここについて一般に開示されることはないでしょう。でも、そこがキモってのがこの話の難しいところ。 とはいえ、銀行との資金移動に持っていく部分については口振契約ということは明らかですので、そのへんをちょっと考察してみま

                  Web口振受付と即時口振に頼らなければならない新型決済スキームの問題 - novtanの日常
                • 「〇〇は戦前には存在しなかった」系のデマは今はコレのおかげで簡単に否定できるようになった、って話

                  リンク Wikipedia 乾杯 乾杯(かんぱい)は、盃を飲み干すこと //スペインが起源 家庭内から宴席に至るまで広く行われている。場の主催者、またはその指名者が音頭を取り、酒などを注いだ盃やコップを掲げ、「乾杯」と唱和したのち口にする。 晩餐会のように改まった会食から酒宴に至るまで、参加者全員が揃った事を契機に、食事や飲み物に手をつけるきっかけとして行われることが多い。遅れて来る者が居る場合、定刻に行ったうえで到着後も改めて行ったり、定刻前に練習と称して飲み始めることもある。基本的にしきたりなので、地域差(都道府県から社内部署に至るま 3 users 3

                    「〇〇は戦前には存在しなかった」系のデマは今はコレのおかげで簡単に否定できるようになった、って話
                  • 佐川急便、1日100万枚の伝票入力をAIで自動化 約8400時間分の人力作業を削減

                    佐川急便は8月2日、AI(人工知能)を活用し、配送伝票の手書き文字を読み取ってシステムに自動入力するシステムを7月から本格稼働させたと発表した。人間が読み取りづらい崩れた手書きの数字を高い精度で読み取れるという。 ディープラーニングを活用した文字認識技術をベースに、2018年12月から開発を進めていた。手書き数字の認識精度は99.995%に上り、「数字が丸で囲まれている」「取り消し線が引かれている」「伝票に傷がついている」など、目視で読み取りづらい数字もほぼ正確に読み取れるという。 配送伝票の情報入力を請け負うグループ会社のSGシステム(京都府京都市)は、繁忙期になると1日に約100万枚の配送伝票を手作業でシステムに入力していた。新システムを使うことで作業時間を月間で約8400時間ほど短縮できる見込み。 新システムの開発で得たノウハウはSGホールディングスのグループ各社に展開し、さまざまな

                      佐川急便、1日100万枚の伝票入力をAIで自動化 約8400時間分の人力作業を削減
                    • 若者のスクショ共有文化はもう戻せないのでカジュアルOCRを推進すべき - 太陽がまぶしかったから

                      若者のスクショ文化 若者のスクショ癖を腐すの嫌なんだけど、1万回注意してもアシスタント(25歳)が参考資料などをスクショで送って来るので1万1回目のキレをかましてしまった😢地図でもサイトでもスクショで送ってくる😭情報追えねぇからURL貼れっつってもURL写ってる状態のスクショ送ってくる😭若者のコピペ離れ😭つら— $tina$ (@tinasuke) 2020年6月22日 若者がスクショでシェアしがちという話をよく聞く。テキスト形式でないとURLや再利用ができないといった弊害があるからやるべきではないという話になりがちだけど、特にスマートフォンは文章を範囲選択しづらいし、フォントスタイルやイメージなども保存しておこうと思えば、スクリーンショットのが楽だ。 自分自身もスマートフォンにおいてはスクリーンショット画像をそのまま Evernote などに保存する事が多い。それでもあまり困らな

                        若者のスクショ共有文化はもう戻せないのでカジュアルOCRを推進すべき - 太陽がまぶしかったから
                      • 画像ファイルやデータベースの文字列を「grep」のように検索できる「ripgrep-all」

                        Linuxのコマンドラインで文字列を検索する際に必要不可欠なコマンドといえば「grep」です。しかし、grepは動画ファイルやPDFファイルの文字列を検索できないのが弱点。そんなgrepの弱点を克服し、動画ファイルのメタデータやデータベースのレコード、画像ファイル内の文字列まで検索可能なコマンドが「ripgrep-all(rga)」です。 GitHub - phiresky/ripgrep-all: rga: ripgrep, but also search in PDFs, E-Books, Office documents, zip, tar.gz, etc. https://github.com/phiresky/ripgrep-all rgaはLinuxに限らずWindowsやmacOSでも利用することが可能。今回はUbuntu 20.04でrgaを利用してみます。以下のコマンドを

                          画像ファイルやデータベースの文字列を「grep」のように検索できる「ripgrep-all」
                        • 古文書を解読できるスマホアプリ 凸版印刷が開発 くずし字対応AI-OCRを活用

                          凸版印刷ではこの課題を解決するため、2015年から国文学研究資料館と共同研究を開始。古文書対応のAI-OCRの開発に取り組んできた。その中で「手元の古文書を手軽に読みたい」という一般利用者向けのサービスに対する多数の要望があり、今回のアプリ開発に至ったとしている。 凸版印刷は今後、2025年度までにAPI提供や関連事業を含め、一般利用者や教育機関、博物館・資料館、地方自治体などのサービス提供を拡大し、約3億円の売り上げを目指す。 関連記事 ライトを当てると文字や絵が現れるホログラム 凸版が開発 スマホライトで真贋判定 強い光(点光源)を当てると、立体的な画像が現れる新たなホログラム「イルミグラム」を凸版が開発。スマートフォンのライトなどで誰でも簡単・正確に真贋判定できる。 メタバースでのなりすましを防ぐ 3Dアバターの本人証明ができるセキュリティ基盤 凸版印刷が開発 凸版印刷が、メタバース

                            古文書を解読できるスマホアプリ 凸版印刷が開発 くずし字対応AI-OCRを活用
                          • そあん(soan):古活字画像を用いて現代日本語テキストをくずし字画像に変換/共有するサービス

                            ライブラリのアプリ化 現代のニュースをくずし字で読んでみませんか?内容がわかるテキストをくずし字で読んでみると、くずし字に対する印象が変わるかもしれません。 edomi ニュース その他の事例については、活用事例を参照してください。 構成 古活字とくずし字 そあん(soan)で用いる「古活字」とは、今から400年ほど前に使われた印刷技術に由来する言葉です。一方「くずし字」とは、くずして書かれた文字を指す言葉です。くずし字は、印刷では古活字版だけでなく整版印刷にも使われましたし、写本などの手書きの文字(草書体)も、その多くはくずし字です。一方、古活字の中には、文字を崩していないものもあります。このように、古活字は印刷技術を指す言葉、くずし字は文字の形を指す言葉、という違いがあります。 そあん(soan)は、テキストをくずし字画像に変換する方法として、古活字画像を組み合わせる方法を用いるサービ

                              そあん(soan):古活字画像を用いて現代日本語テキストをくずし字画像に変換/共有するサービス
                            • WEB+DB PRESS総集編[Vol.1~136]

                              2024年4月18日紙版発売 WEB+DB PRESS編集部 編 B5判/128ページ 定価3,300円(本体3,000円+税10%) ISBN 978-4-297-14156-1 Gihyo Direct Amazon 楽天ブックス ヨドバシ.com 『WEB+DB PRESS』全号のバックナンバーを収録 Webアプリケーション開発のためのプログラミング技術情報誌「WEB+DB PRESS」は,2000年から2023年までの23年間という長きにわたり,現場で活躍するWeb開発者の方々に向けた技術情報を提供してまいりました。そして2023年8月発売のVol.136をもって,隔月刊誌としては休刊いたしました。 本総集編には,WEB+DB PRESSVol.1から隔月刊最終号となるVol.136までのバックナンバーと,今まで刊行した総集編7冊の書き下ろし記事を収録しています。1冊1ファイルの記

                                WEB+DB PRESS総集編[Vol.1~136]
                              • 【2022年】AWS全サービスまとめ | DevelopersIO

                                こんにちは。サービスグループの武田です。このエントリは、2018年から公開しているAWS全サービスまとめの2022年版です。 こんにちは。サービスグループの武田です。 このエントリは、2018年から毎年公開している AWS全サービスまとめの2022年版 です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの?」という疑問を自分なりに理解するためにまとめました。 今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2021年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 223個 です。 まとめるにあ

                                  【2022年】AWS全サービスまとめ | DevelopersIO
                                • 書籍「ゲームの歴史」について(3) | Colorful Pieces of Game

                                  このテキストは岩崎夏海・稲田豊史両氏による『ゲームの歴史』の1、2、3の中で、ゲームの歴史的に見て問題があり、かつ僕が指摘できるところについて記述していくテキストだ。 該当の本は、ハッキング・箱庭・オープンワールド・疑似3D・2Dなどの通常のゲーム&コンピュータ用語に筆者の独自解釈が含まれていて、それを筆者の都合に応じて定義をいじりながら論を展開するために、極めて独特の内容になっている。 例えば3D描画で背景をテクスチャで埋めると3D+2Dの疑似3Dになると言われたら、普通のゲーム屋なら目を白黒させるだろう。ただ、それは筆者の主張なので「自分はそこは批判はしないが、筆者の見方には全く同意できない」とだけ書いておく。 なお、該当の本の引用部は読みやすさを考慮してスクリーンショットからonenoteのOCRで文字の書きだしをしたものを僕が修正したものになっている。なので校正ミスで本文と若干ずれ

                                  • 書籍「ゲームの歴史」について(8) | Colorful Pieces of Game

                                    このテキストは岩崎夏海・稲田豊史両氏による『ゲームの歴史』の1、2、3の中で、ゲームの歴史的に見て問題があり、かつ僕が指摘できるところについて記述していくテキストだ。 (8)は2巻の第11-12章を扱ったものになる。 該当の本は、ハッキング・箱庭・オープンワールド・疑似3D・2Dなどの通常のゲーム&コンピュータ用語に筆者の独自解釈が含まれていて、それを筆者の都合に応じて定義をいじりながら論を展開するために、極めて独特の内容になっている。 例えば3D描画で背景をテクスチャで埋めると3D+2Dの疑似3Dになると言われたら、普通のゲーム屋なら目を白黒させるだろう。ただ、それは筆者の主張なので「自分はそこは批判はしないが、筆者の見方には全く同意できない」とだけ書いておく。 該当の本の引用部は読みやすさを考慮してスクリーンショットからonenoteのOCRで文字の書きだしをしたものを僕が修正したもの

                                    • ChatGPTに共通テストの英語を解かせてみたら77%取れた

                                      今日は 2023 年共通テスト 1 日目です。 ということで、ChatGPT に 2022 年および 2023 年(追記1)の共通テストの英語(リーディング)問題を解かせてみたところ、ともに100 点満点中 77 点を獲得したのでその結果をまとめます。 前提: ChatGPT とはChatGPT2 とは、2022 年の 11 月末 に OpenAI がリリースしたチャットボットです。従来の AI チャットボットに対する期待を大きく超える自然な会話や理解力の高さが世界中で話題となり、リリース以降話題に事欠かない存在になっています。 GPT-3.5 というモデルが基礎となっており、インターネット上の膨大なデータを学習した大規模言語モデルと呼ばれる技術がベースになっています。 本記事執筆時点で ChatGPT は Research Preview の段階で、制限はありながらも無料で利用することが

                                        ChatGPTに共通テストの英語を解かせてみたら77%取れた
                                      • 串カツ田中のテキーラ金魚騒動まとめ。 - 今夜、四谷の地下室で。

                                        もうこの話題は散々笑ったし、ま~いっか!!と思ってたけどコレを見て流石だな!もっと遊んでいいんだな!!と思ったので大いに遊んでみようと思います。 商願2019-90585 🇬テキーラ金魚 — 商標速報 OCR bot (@OCR_bot) 2019年7月18日 すげぇな!商標登録まで出すか!!!!!!!!!!! という訳でおさらいです。 2019年1月23日 四谷アウトブレイクにてテキーラフィッシュ誕生 大漁!! pic.twitter.com/huRyV1vy9U — 佐藤boone学@四谷アウトブレイク店長 (@boone4649) 2019年1月23日 2019年1月25日 「酒の詰め替え販売にあたるのでは?」という指摘を受け一時中止 【お詫びと訂正】噂のテキーラフィッシュですがご指摘頂き、まさかとは思い調べたら「量り売り」ではなく「詰め替え」に当たるっぽくてアウトでした!ごめんな

                                          串カツ田中のテキーラ金魚騒動まとめ。 - 今夜、四谷の地下室で。
                                        • 書籍「ゲームの歴史」について(4) | Colorful Pieces of Game

                                          このテキストは岩崎夏海・稲田豊史両氏による『ゲームの歴史』の1、2、3の中で、ゲームの歴史的に見て問題があり、かつ僕が指摘できるところについて記述していくテキストだ。 該当の本は、ハッキング・箱庭・オープンワールド・疑似3D・2Dなどの通常のゲーム&コンピュータ用語に筆者の独自解釈が含まれていて、それを筆者の都合に応じて定義をいじりながら論を展開するために、極めて独特の内容になっている。 例えば3D描画で背景をテクスチャで埋めると3D+2Dの疑似3Dになると言われたら、普通のゲーム屋なら目を白黒させるだろう。ただ、それは筆者の主張なので「自分はそこは批判はしないが、筆者の見方には全く同意できない」とだけ書いておく。 なお、該当の本の引用部は読みやすさを考慮してスクリーンショットからonenoteのOCRで文字の書きだしをしたものを僕が修正したものになっている。なので校正ミスで本文と若干ずれ

                                          • 書籍「ゲームの歴史」について(5) | Colorful Pieces of Game

                                            このテキストは岩崎夏海・稲田豊史両氏による『ゲームの歴史』の1、2、3の中で、ゲームの歴史的に見て問題があり、かつ僕が指摘できるところについて記述していくテキストだ。 該当の本は、ハッキング・箱庭・オープンワールド・疑似3D・2Dなどの通常のゲーム&コンピュータ用語に筆者の独自解釈が含まれていて、それを筆者の都合に応じて定義をいじりながら論を展開するために、極めて独特の内容になっている。 例えば3D描画で背景をテクスチャで埋めると3D+2Dの疑似3Dになると言われたら、普通のゲーム屋なら目を白黒させるだろう。ただ、それは筆者の主張なので「自分はそこは批判はしないが、筆者の見方には全く同意できない」とだけ書いておく。 なお、該当の本の引用部は読みやすさを考慮してスクリーンショットからonenoteのOCRで文字の書きだしをしたものを僕が修正したものになっている。なので校正ミスで本文と若干ずれ

                                            • WEB開発に役に立つAPI一覧+API毎に関連するQiita記事を分類 ! - Qiita

                                              前回: Qiita APIで記事からYoutube動画を集めてみた 🎬 、Qiita APIを使って、Qiita記事を取得してYoutube動画のURLを抽出することができました。 今回は、特定APIに関連したQiita記事を取得して、API毎に分類、タグを集計してドーナツグラフ化することでAPIの特徴を表してみました。 最新のAPI一覧はこちら API一覧 | DOGAKIITAA! ~ APIごとにQiita記事を分類 ~ Google系 Cloud Vision API https://cloud.google.com/vision/docs/quickstart 📝 機械学習を使用して画像を解析します。画像ラベリング、顔やランドマークの検出、光学式文字認識(OCR)、不適切なコンテンツへのタグ付けなどができます。 Cloud Vision APIの凄さを伝えるべくRasPi b

                                                WEB開発に役に立つAPI一覧+API毎に関連するQiita記事を分類 ! - Qiita
                                              • 【Power Automateの新しいRPA機能】Power Automate Desktopで出来ること(全33機能の紹介) - Qiita

                                                【Power Automateの新しいRPA機能】Power Automate Desktopで出来ること(全33機能の紹介)RPAPowerAutomateDesktop はじめに Microsoft Igniteの発表でPower Automateの「per user with attended RPA plan」で「Power Automate Desktop」が使用できるようになりました。2020年9月26日時点でPreview機能です。 この記事ではPower Automate Desktopの自動化機能(アクションと言います)を紹介します。 この紹介を通じPower Automate Desktopがどのような自動化を行えるかの参考になれば幸いです。 2020年9月26日時点のアクションとなります。 トライアル開始手順もまとめてみましたので併せてご覧ください。 【Power A

                                                  【Power Automateの新しいRPA機能】Power Automate Desktopで出来ること(全33機能の紹介) - Qiita
                                                • さようならElasticsearch、よろしくElastic Cloud - Nota TechConf

                                                  by yuiseki yuiseki.icon 2022/5/19 20:25 - 20:40 (明らかに15分で収まる内容の資料ではないですが、資料はモリモリで発表はスカスカでもScrapboxで盛り上がれるか、という仮説の検証を兼ねています) yuisekiですyuiseki.icon Gyazoのプロジェクトマネージャー兼ソフトウェアエンジニアです 本日お集まりいただいたみなさん、ありがとうございます 本日お集まりいただいたみなさん ノバウサギ…?nyanco.icon ユニコーンガンダム…?issac.icon タイマーちゃん!takker.icon 12年間運用を続けているB2C SaaSの検索インフラの実態(14分まで、1分間) Gyazoは2021年、「画像の瞬間発見」をテーマに、検索に力を入れていた Nota Tech Conf 2021 Springでのyuiseki.i

                                                    さようならElasticsearch、よろしくElastic Cloud - Nota TechConf
                                                  • OCR屋のAI inside、ストック型ビジネスどころか逆に大量解約(9284件中7636件)の憂き目に遭い売上の半分弱を失う : 市況かぶ全力2階建

                                                    日刊SPA!に登場の医学生投資家、儲け自慢に熱を入れるあまり「11歳から親の口座で投資を始めた」と借名取引をうっかり告白

                                                      OCR屋のAI inside、ストック型ビジネスどころか逆に大量解約(9284件中7636件)の憂き目に遭い売上の半分弱を失う : 市況かぶ全力2階建
                                                    • Google Colabで英語の論文を無料で翻訳する方法 - Qiita

                                                      こんにちは!逆瀬川 ( https://twitter.com/gyakuse ) です。 今日は英語論文をサクッと翻訳する方法を共有します。 素晴らしい事前学習済みモデルの恩恵で素人でも1時間程度で実装できてしまいます。 なお、実装めちゃ汚いのですが、そのあたりはご容赦ください。 論文以外の文字埋め込みのないpdfを翻訳したい場合はこちらを参考にしてください: 論文全体の自動要約についてはこちら: 概要 翻訳モデル、レイアウト検知ライブラリとpdfを操作するライブラリを用いて外国語で書かれたpdfファイルを翻訳します。 翻訳にはフリーのニューラル機械翻訳モデルFuguMTを使用します。 この手法の嬉しさ DeepLおよびDeepL APIではpdf翻訳がサポートされていますが、行の切り替わりで別の文章と認識されることが多く、途中までの文章で翻訳されるため精度が落ちてしまいます この手法で

                                                        Google Colabで英語の論文を無料で翻訳する方法 - Qiita
                                                      • [速報]マイクロソフト、手書きのスケッチをAIでアプリ画面に手軽に変換できる「Power Apps Express design」発表。Microsoft Build 2022

                                                        [速報]マイクロソフト、手書きのスケッチをAIでアプリ画面に手軽に変換できる「Power Apps Express design」発表。Microsoft Build 2022 マイクロソフトは現在開催中の開発者向けイベント「Microsoft Build 2022」で、ローコード/ノーコード開発ツール「Power Apps」の新機能として、手書きのスケッチやPDFのフォーム画面、Figmaのデザインファイルなどを元に、AIがアプリケーションの画面作成を支援してくれる「Power Apps Express design」を発表しました。 公開された動画を元に、Power Apps Express designの機能を見ていきましょう。 Power Apps Express designでは、画面スケッチをキャプチャするとAIがUIコンポーネントを認識します。

                                                          [速報]マイクロソフト、手書きのスケッチをAIでアプリ画面に手軽に変換できる「Power Apps Express design」発表。Microsoft Build 2022
                                                        • 【Obsidian】2023 年でオススメのプラグイン 66 選

                                                          この記事で使用している画像は、公式の github から引用したものです。今回、あまりにも数が多いため引用リンクは省略しています。一部、自身で撮影したものもあります。 ファイル Recent Files ★★★ 最近開いたファイルの一覧を表示してくれるプラグイン。何故これがデフォルトで無いのかがよくわからない。絶対に入れておきたい。 Auto Template Trigger ★★★ 新しいノートを作成する際にテンプレートを選択して挿入できるプラグイン。ノートを書く敷居を下げてくれるので重要。 Quick Explorer ★★★ エクスプローラー機能を強化するプラグイン。ノートが増えてくると非常に便利。 Tag Wrangler ★★★ Tag pane から rename や merge などができるようになるプラグイン。 Quick Switcher++ ★★ ファイル移動のプラグイ

                                                            【Obsidian】2023 年でオススメのプラグイン 66 選
                                                          • 直近一年ほどの国会案件に対して立憲民主党が賛成したか反対したかのまとめ

                                                            anond:20211101125244 い、言われたとおり、ソース(立憲民主党2021国会レポート.pdf)をGoogle DriveのOCR機能で読み取って、まだ結果が出ていない審議継続中のものなどを除外した上で、見やすいようにテーブルで整形しました。これで娘を解放してもらえるんですよね…!? 議員提出法案(衆法)提出案件名衆結果参結果審議時態度備考継続日本国憲法の改正手続に関する法律の一部を改正する法律案(逢沢一郎君外五名[自・公・維・希]提出第196回国会衆法第42号)※5/11修正6/11可決賛成衆反=共 参反=共沖れ継続労働者協同組合法案(後藤茂之君外十四名[自・立国社・公・共・維・希]提出第201回国会衆法第26号)11/24可決12/4可決賛成全会一致11/20特定非営利活動促進法の一部を改正する法律案(衆議院内閣委員長提出第203回国会衆法第4号)省11/24可決12/2

                                                              直近一年ほどの国会案件に対して立憲民主党が賛成したか反対したかのまとめ
                                                            • 画像からテキストを抽出、ファイル名を一括変更…Windowsを快適にする公式無料ツール「PowerToys」おすすめ機能7選 | 文春オンライン

                                                              「PowerToys」という無料ツールをご存知でしょうか。Windowsをさらに使いやすくする十数個の機能をまとめた、Microsoftの公式ツールです。カユイところに手が届く数々の機能はいちど使うと手が放せなくなるほどで、どうしてこれがWindowsに最初から組み込まれていないのだろうと首をひねってしまうほどです。 そんな「PowerToys」は、今年9月に入って登場した最新版の「0.62.0」で、これまでなかった新機能がいくつか追加され、より充実したツールへと生まれ変わりました。 今回は最新の「0.62.0」で追加された機能も含め、筆者が「これは特に便利」と感じたPowerToysの便利機能を厳選して紹介します。ピンと来る機能があれば、ぜひこの機会にインストールして試してみてください。ダウンロードはMicrosoftストア、もしくはこちらから行えます。

                                                                画像からテキストを抽出、ファイル名を一括変更…Windowsを快適にする公式無料ツール「PowerToys」おすすめ機能7選 | 文春オンライン
                                                              • 契約書の差分比較をGPT-3を使って自動化する - Qiita

                                                                こんにちは!逆瀬川 ( https://twitter.com/gyakuse ) です! 今日は契約書の更新差分の比較をGPT-3とGoogle Document AIを使ってやってみたいと思います。 概要 異なるバージョンの契約書をPDF解析システムとGPT-3を使って自動的に比較し、リスクなどの検討も自動で出力する仕組みを作る。 Colab 使い方 Document AIの準備 (作成方法など詳しくは後述) Google CloudのDocument AIでプロセッサを作成する プロセッサ一覧から作成したプロセッサを選び、予測エンドポイントをコピーする https://console.cloud.google.com/ai/document-ai/processors json形式のAPIキーファイルをダウンロードしておく OpenAI APIキーの準備 すべてのセルを実行 比較した

                                                                  契約書の差分比較をGPT-3を使って自動化する - Qiita
                                                                • 書籍「ゲームの歴史」について(6) | Colorful Pieces of Game

                                                                  このテキストは岩崎夏海・稲田豊史両氏による『ゲームの歴史』の1、2、3の中で、ゲームの歴史的に見て問題があり、かつ僕が指摘できるところについて記述していくテキストだ。 今回の(6)から2巻になる。 該当の本は、ハッキング・箱庭・オープンワールド・疑似3D・2Dなどの通常のゲーム&コンピュータ用語に筆者の独自解釈が含まれていて、それを筆者の都合に応じて定義をいじりながら論を展開するために、極めて独特の内容になっている。 例えば3D描画で背景をテクスチャで埋めると3D+2Dの疑似3Dになると言われたら、普通のゲーム屋なら目を白黒させるだろう。ただ、それは筆者の主張なので「自分はそこは批判はしないが、筆者の見方には全く同意できない」とだけ書いておく。 なお、該当の本の引用部は読みやすさを考慮してスクリーンショットからonenoteのOCRで文字の書きだしをしたものを僕が修正したものになっている。

                                                                  • GPT-4oを使って2Dの図面から3DのCADモデルを作る

                                                                    はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 先日、 OpenAIからGPT-4oがリリース されました。 いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が向上している ようです。 製造業という観点からすると、これは 設計図面などに活かせるようになるのでは? と思いました。 機械部品などの設計図面は以下のように、特定の方向から部品を2次元上に落とし込んだ形で書かれるのですが、部品本体を描いている図以外に、寸法や名称といった文字も含まれた画像になっています。 このような 図と文字の複合データにおいて、GPT-4oの進化は有効なのではないか と考えました。 ※画像元URL: http://cad.wp.xdoma

                                                                      GPT-4oを使って2Dの図面から3DのCADモデルを作る
                                                                    • 崩し字を訳してくれる「miwo」というスマホアプリで鐔に書かれた文字を読み取ったら解読できてしまった「技術の進歩がすごい」

                                                                      刀箱師 | 中村圭佑 | 展示ケース作家 | 刀とくらす。 @katana_case_shi 「わけのほる 麓の道はおほけれど おなじ高ねの 月をこそみれ」 どうやら「わけのほる」という一休宗純の和歌のようで、以下のサイトを見ると解説がありました。 当時この鐔を付けて戦った武士はこの和歌にどのような想いを重ねたのだろうか。 575.jpn.org/article/174793… pic.twitter.com/dSIJbpS4OB 2022-12-22 23:40:23

                                                                        崩し字を訳してくれる「miwo」というスマホアプリで鐔に書かれた文字を読み取ったら解読できてしまった「技術の進歩がすごい」
                                                                      • 書籍「ゲームの歴史」について(7) | Colorful Pieces of Game

                                                                        このテキストは岩崎夏海・稲田豊史両氏による『ゲームの歴史』の1、2、3の中で、ゲームの歴史的に見て問題があり、かつ僕が指摘できるところについて記述していくテキストだ。 (7)は2巻の第10章を扱ったものになる。 該当の本は、ハッキング・箱庭・オープンワールド・疑似3D・2Dなどの通常のゲーム&コンピュータ用語に筆者の独自解釈が含まれていて、それを筆者の都合に応じて定義をいじりながら論を展開するために、極めて独特の内容になっている。 例えば3D描画で背景をテクスチャで埋めると3D+2Dの疑似3Dになると言われたら、普通のゲーム屋なら目を白黒させるだろう。ただ、それは筆者の主張なので「自分はそこは批判はしないが、筆者の見方には全く同意できない」とだけ書いておく。 該当の本の引用部は読みやすさを考慮してスクリーンショットからonenoteのOCRで文字の書きだしをしたものを僕が修正したものになっ

                                                                        • 宿題は人工知能にやらせる今どきの小学生。中国政府は宿題をAIにやらせることを禁止 - 中華IT最新事情

                                                                          中国共産党中央弁公庁と国務院は、「義務教育段階の生徒の家庭学習と校外課程の負担のいっそうの軽減についての意見」を公開した。内容は、「拍照捜題」を禁止するものだ。これを受けて、多くの学習アプリが拍題捜答機能を停止させていると青少年教育新聞が報じた。 宿題は人工知能にお任せの今どきの小学生たち 拍照捜題とは、学習アプリの人気機能で、宿題をするときに便利な機能。プリントなどの問題を、アプリ経由でスマホで撮影すると、その内容をAIが解析し、解法と答えを表示してくれるというもの。同じ問題が見つからない場合は、類似の問題の解法と答えを表示してくれる。 本来は、自分で解けない問題を調べるためのものだが、学習アプリの競争が激しくなる中で、解答を直接表示するようになり、多くの学生が、学習アプリが表示する解法と答えを丸写しして提出することが増え、教師や父兄の間で問題になっていた。 ▲学習アプリ「作業帮」の拍照

                                                                            宿題は人工知能にやらせる今どきの小学生。中国政府は宿題をAIにやらせることを禁止 - 中華IT最新事情
                                                                          • 書籍「ゲームの歴史」について(10) | Colorful Pieces of Game

                                                                            このテキストは岩崎夏海・稲田豊史両氏による『ゲームの歴史』の1、2、3の中で、ゲームの歴史的に見て問題があり、かつ僕が指摘できるところについて記述していくテキストだ。 (10)は3巻の第17-18章を扱ったものになる。 該当の本は、ハッキング・箱庭・オープンワールド・疑似3D・2Dなどの通常のゲーム&コンピュータ用語に筆者の独自解釈が含まれていて、それを筆者の都合に応じて定義をいじりながら論を展開するために、極めて独特の内容になっている。 例えば3D描画で背景をテクスチャで埋めると3D+2Dの疑似3Dになると言われたら、普通のゲーム屋なら目を白黒させるだろう。ただ、それは筆者の主張なので「自分はそこは批判はしないが、筆者の見方には全く同意できない」とだけ書いておく。 該当の本の引用部は読みやすさを考慮してスクリーンショットからonenoteのOCRで文字の書きだしをしたものを僕が修正したも

                                                                            • Windows 10の標準機能だけで画像からテキストを抽出する方法

                                                                              画像ファイルからテキストを抽出したい場合、何らかのOCR(光学式文字認識)ソフトウェアを利用するのが一般的だ。しかし、BetaNewsは1月6日(米国時間)、「Windows 10 has a secret way to grab text from images」において、特定のソフトウェアを使わずに、Windows 10に付属する標準機能だけでテキストの抽出を行う方法を伝えた。なお、この方法は現在のところ英語のテキストにしか対応しておらず、残念ながら日本語は読み取ることができない。 Windowsの標準機能といっても、何らかのORCツールが標準でインストールされているというわけではない。したがって、スタートメニューのアプリケーション一覧を探しても該当する機能は見つからない。Betanewsで紹介されているのは、Windowsの検索ユーティリティとスクリーンショットを取得するための「切り

                                                                                Windows 10の標準機能だけで画像からテキストを抽出する方法
                                                                              • 書籍「ゲームの歴史」について(11) | Colorful Pieces of Game

                                                                                このテキストは岩崎夏海・稲田豊史両氏による、先日絶版・回収になると発表があった『ゲームの歴史』の1、2、3の中で、ゲームの歴史的に見て問題があり、かつ僕が指摘できるところについて記述していくテキストだ。 (11)は3巻の第19-21章を扱ったものになる。 該当の本の引用部は読みやすさを考慮してスクリーンショットからonenoteのOCRで文字の書きだしをしたものを僕が修正したものになっている。なので校正ミスで本文と若干ずれたり、誤植がある場合があるかも知れないが、そこは指摘いただければ謹んで修正させていただく。 シリーズは以下のリンクを読んでいただきたい。 『ちょっとは正しいゲームの歴史』を国会図書館に納本しましたゲームレジェンド新刊『ちょっとは正しいゲームの歴史』できました書籍「ゲームの歴史」について(12/終)書籍「ゲームの歴史」について(11)書籍「ゲームの歴史」について(10)書籍

                                                                                • 書籍「ゲームの歴史」について(9) | Colorful Pieces of Game

                                                                                  このテキストは岩崎夏海・稲田豊史両氏による『ゲームの歴史』の1、2、3の中で、ゲームの歴史的に見て問題があり、かつ僕が指摘できるところについて記述していくテキストだ。 (9)は2巻の第13-16章を扱ったものになる。 該当の本は、ハッキング・箱庭・オープンワールド・疑似3D・2Dなどの通常のゲーム&コンピュータ用語に筆者の独自解釈が含まれていて、それを筆者の都合に応じて定義をいじりながら論を展開するために、極めて独特の内容になっている。 例えば3D描画で背景をテクスチャで埋めると3D+2Dの疑似3Dになると言われたら、普通のゲーム屋なら目を白黒させるだろう。ただ、それは筆者の主張なので「自分はそこは批判はしないが、筆者の見方には全く同意できない」とだけ書いておく。 該当の本の引用部は読みやすさを考慮してスクリーンショットからonenoteのOCRで文字の書きだしをしたものを僕が修正したもの