並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 13279件

新着順 人気順

NLPの検索結果41 - 80 件 / 13279件

  • AI研究者が問う ロボットは文章を読めない では子どもたちは「読めて」いるのか?(湯浅誠) - エキスパート - Yahoo!ニュース

    「ロボットは東大に入れるか」プロジェクトでぶつかった「ある疑問」国立情報学研究所(NII)の社会共有知研究センター。 「ロボットは東大に入れるか(東ロボ)」プロジェクトで知られる人工知能(AI)の研究チームが、子どもたちの読解力テストに着手した。 なぜ、AI研究者が「読解力」に関心をもつのか。 そこには、AIの限界を探る研究の過程でぶつかった、ある疑問が関係している。 センター長の数学者・新井紀子さんに話を聞いた。 今日(11月14日)の「東ロボ 2016成果報告会」で冒頭あいさつする新井紀子教授。東ロボプロジェクトは2011年にスタートしたAIは国語が苦手――なぜ、AI研究者が「読解力」に関心を? 東ロボは、問題を解き、正解も出すが、読んで理解しているわけではない。 現段階のAIにとって、文章の意味を理解することは、不可能に近い。 そうすると、特に難しいのが国語と英語だ。 国語では、20

      AI研究者が問う ロボットは文章を読めない では子どもたちは「読めて」いるのか?(湯浅誠) - エキスパート - Yahoo!ニュース
    • Prompt Engineering Guide – Nextra

      Prompt Engineering Guide プロンプトエンジニアリングは、言語モデル(LMs)を効率的に使用するためのプロンプトを開発および最適化する比較的新しい学問分野です。プロンプトエンジニアリングのスキルを身につけることで、大規模言語モデル(LLMs)の能力と限界をより理解することができます。 研究者は、プロンプトエンジニアリングを使用して、質問応答や算術推論などの一般的なおよび複雑なタスクのLLMsの能力を向上させます。開発者は、LLMsやその他のツールとのインタフェースとなる強固で効果的なプロンプテクニックを設計するためにプロンプトエンジニアリングを使用します。 プロンプトエンジニアリングは、プロンプトの設計と開発に限らず、LLMsとのインタラクションおよび開発に役立つ幅広いスキルと技術を含みます。これは、LLMsとインタフェースすること、ビルドすること、能力を理解すること

      • シソーラス・類語辞典

        Weblio類語辞典の特徴 様々な同義語や同意語の日本語表現を約40万語を収録。 使う場面やニュアンスごとに、類語とシソーラスを分類・整理。 リンクによって「類語の類語」を簡単に検索。 名詞や形容詞、感嘆符など、品詞の区別にとらわれず類語を紹介。 通俗表現やセリフも多数収録。 Weblio類語辞典は、以下の辞書を利用しています。 「Weblio類語・言い換え辞書」 Weblioシソーラス(自動抽出機能)

        • 東大の「教員向けChatGPT講座」無料公開 「多くの教員が困るだろう」から

          ChatGPTの基本からその構造、教育利用を検討する際の注意点、具体的な活用法などを解説した講座。 「教育機関などの勉強会、研修などでご活用ください」と呼び掛けており、利用の際に事前の連絡は不要という。 関連記事 「東大生や教員は、生成系AIにどう対応すべきか」東大副学長が声明 「組換えDNA技術に匹敵する変革」 「東京大学の学生や教職員が生成系AIに対してどのように向き合うべきか」――東京大学副学長の太田邦史教授が声明。 「GPT-4」搭載ChatGPTに東大入試数学を解かせてみた GPT-3.5との回答の違い、点数は? AIチャットbot「ChatGPT」「新しいBing」に、人間には答えにくい質問や、答えのない問い、ひっかけ問題を尋ねてみたらどんな反応を見せるのか。それぞれの反応からAIの可能性、テクノロジーの奥深さ、AIが人間に与える“示唆”を感じ取ってほしい。 東大松尾教授が答え

            東大の「教員向けChatGPT講座」無料公開 「多くの教員が困るだろう」から
          • Google Trends

            オーストラリアとニュージーランドで開催される2023年女子ワールドカップは2023年7月20日に開幕する。

              Google Trends
            • GPT-4

              We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhibits human-level performance on various professional and academic benchmarks. We’ve created GPT-4, the latest milestone in OpenAI’s effort in scalin

                GPT-4
              • 【漫画】パラダイムシフト①ぼくんち こんな感じの漫画です、表現とか苦手.. | -EMI- さんのマンガ | ツイコミ(仮)

                作者:-EMI-,e3_noguchi, 公開日:2017-09-29 18:16:31, いいね:5082, リツイート数:1903, 作者ツイート:【漫画】パラダイムシフト①ぼくんち https://t.co/pJJ3ZVhBYF こんな感じの漫画です、表現とか苦手な方はすみません

                  【漫画】パラダイムシフト①ぼくんち こんな感じの漫画です、表現とか苦手.. | -EMI- さんのマンガ | ツイコミ(仮)
                • 物書きがネットを使い倒すための7つの検索

                  ==ネタ編== まだ書こうとするものがはっきりと見えて来ない段階や、曖昧模糊とした「原初のスープ」にスパイスの一撃を加えたい時など、探してみて見るとよい検索たちです。 ■物語要素事典 古典、民話から小説、映画や漫画に至るまでを対象に、物語のパーツとなる「物語要素」(物語素)を拾い出し、分類、整理したもの。いわば定番的あらすじ/エピソードの集成なので、ストーリーを考えたり、必要な要素を加えたりする際のヒントになる。 (使用例)上の検索ボックスをつかって ・「"犬" site:http://www.aichi-gakuin.ac.jp/~kamiyama/」で犬が活躍する物語を探す。 ・「"雨宿り" site:http://www.aichi-gakuin.ac.jp/~kamiyama/」で雨宿りにまつわるエピソードを探す。 (サイトURL) http://www.aichi-gakuin.

                    物書きがネットを使い倒すための7つの検索
                  • 「しりとり」の戦いかた、すこし反省した - Active Galactic : 11次元と自然科学と拷問的日常

                    「しりとり」は経験者人口が極めて多いゲームだけど、鬼神のごとき強さで他を圧倒するしりとりプレイヤーを私は知らない。ちょっと真剣に戦ってみたところで、 そんな程度のレベルで満足していやしないか。 さいしょは「る」の同字返しでガッチリ組み合う。先に「る→る」のストックが切れて、「る」で返せなくなったほうがひたすら「る攻め」で投げられ続ける。 小学生の時から進歩していないような、こんな大雑把でマンネリな「る攻め」戦略から脱却できないものか。 攻撃防御比最大の最強文字「る」 復習。周知の事実だが「る」は強い。 下の表は、[A](文字Xで終わる単語)と、[B](文字Xではじまる単語)をその比[A/B]の高いものから順にリストしたものである。標本の単語数は20万語であり豚辞書から、伸ばし棒をトリムした上で抽出した。*1 文字X[A]Xで終わる単語[B]Xで始まる単語[A/B] 1位る43235208.

                      「しりとり」の戦いかた、すこし反省した - Active Galactic : 11次元と自然科学と拷問的日常
                    • 経産省発の npm モジュール!住所や電話番号の正規化、ジオコーディングなどができる IMI コンポーネントツールを試した!

                      経産省発の npm モジュール!住所や電話番号の正規化、ジオコーディングなどができる IMI コンポーネントツールを試した! Code for Japan の関さんが SNS でシェアしてて知ったのですが、経産省さんがなにやらオープンソースで住所や電話番号の正規化などなどをするツールを公開したとのこと。 https://info.gbiz.go.jp/tools/imi_tools/ 経産省が住所変換や法人種別名、電話番号の正規化に使えるIMIコンポーネントツールを公開しました。 ソースコードも公開。README にも使い方が丁寧に書かれていました。https://t.co/fPbV00EgZP 素晴らしい動き。こういう... #NewsPicks https://t.co/bew0qGKMFE — Hal Seki (@hal_sk) May 28, 2020 ぶっちゃけ当初はあまり期待

                        経産省発の npm モジュール!住所や電話番号の正規化、ジオコーディングなどができる IMI コンポーネントツールを試した!
                      • 上手に反論する方法

                        他人と上手くコミュニケーションをとるには、どうしたらよいのだろう?と思い始め、調べているうちにある「考え方」にたどり着きました。 心の動きが手にとるようにわかるNLP理論 とても奥が深い考え方で、ブログの一記事ではとても収まりきりません。今すぐに実践できるものをピックアップしてまとめてみました。 NLPとは、言語学と心理学に基づいた新しい学問です。そして、成功を手に入れるための実践的な方法と技術です。この技術を身につけることで、自分自身の目的とアイデンティティーと、目的が明確になります。さらに、相手との信頼関係を築けるようになり、スムーズなコミュニケーションが築けるようになります。 コミュニケーションが上手い人の考え方、話し方を徹底的に研究して広く一般の人にも応用できるように体系化させたものが「NLP理論」です。まさに私が求めていた知識そのものでした。 Soviet Socialist R

                          上手に反論する方法
                        • 機械学習 はじめよう 記事一覧 | gihyo.jp

                          運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

                            機械学習 はじめよう 記事一覧 | gihyo.jp
                          • 東京大学の松尾研究室が無料公開している「Deep Learning基礎講座演習コンテンツ」の自主学習方法 - karaage. [からあげ]

                            新たな教育プログラム「DL4US」が開始しています。 2019年5月に、松尾研究室の新たなディープラーニングの無料教材「DL4US」が公開されています。「Deep Learning基礎講座演習コンテンツ」のバージョンアップ版の位置付けなので、今から学習する方はこちらに取り組んだ方が良いかと思います。 Dockerを使った環境構築方法を紹介している記事を書いたので、もし良ければ以下記事参照下さい。 Deep Learning基礎講座演習コンテンツが無料公開 以下のようなサイトが無料公開されていました。 学習に自由に使用してよいとのことです。ただ、肝心の使用方法が詳しく書いてないので、初心者には環境構築が厳しく、簡単に環境構築できる人にとっては、知っている内容のところが多い気がして、内容が良いだけにもったいなと感じました。 そこで、ちょっと初心者向けに環境構築の補足をしてみたいと思います。 そ

                              東京大学の松尾研究室が無料公開している「Deep Learning基礎講座演習コンテンツ」の自主学習方法 - karaage. [からあげ]
                            • クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)

                              You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)
                              • 無料でここまでできる→日本語を書くのに役立つサイト20選まとめ

                                (例文/コーパス) ◯KOTONOHA「現代日本語書き言葉均衡コーパス」 少納言 www.kotonoha.gr.jp/shonagon/search_form 現代の日本語の書き言葉の全体像を把握できるように集められた約1億語収録の『現代日本語書き言葉均衡コーパス』をジャンルを指定したり、前後にくる言葉を指定した上で検索できる。用例を探したいときはまずここを当たる。 ◯コーパス検索ツールNINJAL-LWP for BCCWJ (NLB) nlb.ninjal.ac.jp/ 『現代日本語書き言葉均衡コーパス』を検索するために、国語研とLago言語研究所が共同開発したオンライン検索システム。上の少納言との違いは、名詞や動詞などの内容語の共起関係や文法的振る舞いを網羅的に表示できるところ。 たとえば「タバコ」を検索すると、用例が「タバコ+助詞+動詞」や「動詞+タバコ」+「タバコ+助詞+形容詞

                                  無料でここまでできる→日本語を書くのに役立つサイト20選まとめ
                                • Python Webスクレイピング テクニック集「取得できない値は無い」JavaScript対応@追記あり6/12 - Qiita

                                  この記事について 本記事はPythonを使ったWebスクレイピングのテクニックを紹介します。 ※お酒飲みながら暇つぶしで書いたので割と適当です。 今回紹介するテクニックを使えれば経験上大体どんな値でも取得でき、これらはRubyだろうがGolangだろうが同じ様に動作します。 Webスクレイピングが出来ないサイトがあればコメントにて教えてください。全身全霊を持ってやってみます。 また、Webスクレイピングをしたことが無い方は下記の記事を読むことをお勧めします。 Python Webスクレイピング 実践入門 - Qiita 追記更新 6/12 コメントに対応しました。 はじめに 注意事項です。よく読みましょう。 岡崎市立中央図書館事件(Librahack事件) - Wikipedia Webスクレイピングの注意事項一覧

                                    Python Webスクレイピング テクニック集「取得できない値は無い」JavaScript対応@追記あり6/12 - Qiita
                                  • はてブニュース

                                    クロールは15分おきです。日付はクローラーが初めて見つけた日時です。最新情報を追いかければ、新しくブックマークされた人気・注目エントリーを追いかけることができます。

                                    • 5ch(旧2ch)をスクレイピングして、過去流行ったネットスラングの今を知る - にほんごのれんしゅう

                                      5ch(旧2ch)ではここ数年はTwitterを使用するようになってしまいましたが、ネットのミームの発信地点であって、様々なスラングを生み、様々な文化を作ってきたと思います。 学生時代、2chまとめとか見ていたので、影響を受けてきたネット文化で、感覚値からすると、どうにも流行り廃りがあるようです。 5chの過去ログを過去18年ほどさかのぼって取得する方法と、懐かしいネットスラングのドキュメントに占める出現具合を時系列でカウントすることで、時代の変遷でどのように使用の方法が変化したのか観測することができます。 文末に「orz」って付けたら若い人から「orzってなんですか?」と聞かれて心身共にorzみたいになってる— ばんくし (@vaaaaanquish) October 19, 2018 図1. 今回集計したorzの結果 例えば、今回集計した5chの書き込み500GByte程度のログからで

                                        5ch(旧2ch)をスクレイピングして、過去流行ったネットスラングの今を知る - にほんごのれんしゅう
                                      • http://www.rider-n.sakura.ne.jp/regexp/regexp.php

                                        • 【2023年】美少女AIコスプレイヤーをStable Diffusionで生成する方法についてまとめていく!【ChilloutMix】

                                          気になったゲームの攻略情報、PCの豆知識、様々なガシェットのレビューなどを紹介してます!その他にも管理人の趣味をいろいろと書き綴っています。

                                            【2023年】美少女AIコスプレイヤーをStable Diffusionで生成する方法についてまとめていく!【ChilloutMix】
                                          • シソーラス(類語)検索

                                            • オランダ発!記憶に残る画期的な単語学習法 - [TOEIC・英語検定] All About

                                              単語カードによる英単語の学習は、学習者に根強い人気を持つテクニックです。単語カード学習の効果を高めるためには、どうしたら良いのでしょうか? 単語カードによる学習の効果を最大限に高めるためにオランダで開発された、hand computerという独創的なシステムをご紹介いたします。 単語カードでは単語は覚えられない!? 単語カードによる英単語の学習は、学習者に根強い人気を持つテクニックです。しかし、コミュニケーションを重視する最近の英語教育では、「単語は文脈の中で学ぶもの」と考えられているため、単語カードによる暗記は「機械的すぎる」・「すぐに忘れてしまう」・「つまらない」などと批判されることが多いようです。単語カードによる学習が否定的に捉えられる一方で、多読による語彙学習が奨励される傾向にあります。 しかしながら、近年の研究では、単語カードによる暗記は非常に効果的かつ効率的であることが示さ

                                              • Webプログラマと数学の接点、その入り口

                                                フロントエンドのパラダイムを参考にバックエンド開発を再考する / TypeScript による GraphQL バックエンド開発

                                                  Webプログラマと数学の接点、その入り口
                                                • ChatGPTの使い方<26例>|入江 慎吾 🚀 生成AIでプロダクト開発

                                                  こんにちは!いろんなプロに相談できるMENTA代表の入江です。 話題のChatGPT。いろんな質問例がTwitterに上がっていて未来を感じさせてくれます。 ※ただし、どんな質問にも答えてくれるChatGPTですが間違いもあるので注意が必要です。 1)バグを見つけてもらう

                                                    ChatGPTの使い方<26例>|入江 慎吾 🚀 生成AIでプロダクト開発
                                                  • ChatGPTをより有効的に使う為のテンプレートがまるで呪文「検索エンジンでキーワードを捏ねるのと似てる」など

                                                    きたがわ 🍥 ChatGPT活用術 @bukuta_3 <ChatGPTテンプレート> コピーしてすぐ使えます。▼ココから下▼ # 命令書 あなたは、プロの■■です。以下の制約条件から最高の●●を出力してください。 # 制約条件 ・(例)重要なキーワードを取りこぼさない ・○○○ ・○○○ ・○○○ # 入力分: <ここに入力文章> # 出力文: 2023-03-18 12:45:07 きたがわ 🍥 ChatGPT活用術 @bukuta_3 深津さんご本人がプロンプトの使い方や補足情報を詳しく解説しているYouTubeのリンクを共有します。 動画は1時間と少し長いですが、重要な要素がぎっしり詰まった内容なのでChatGPTを仕事に活用したい方は必見です。 m.youtube.com/watch?v=ReoJce… 2023-03-19 12:47:22 リンク YouTube あなたの

                                                      ChatGPTをより有効的に使う為のテンプレートがまるで呪文「検索エンジンでキーワードを捏ねるのと似てる」など
                                                    • 「怠惰・短気・高慢」であれ、ChatGPTを使って業務効率化しよう(要件定義編)

                                                      例として読書記録アプリをつくります! 筆者が欲しいサービスを作ろうと思い、今回は「読書記録アプリ」をつくります。 最低限の要件は、次のように設定しました。 デモアプリの要件(読み飛ばしてOK) 読書記録アプリを作る目的 読書が苦手なエンジニアが読書記録をし、記録を共有することで、継続して技術本を読めるようになること ターゲット 新人、中堅のWebエンジニア おおまかな要件 ユーザーは新規登録することで、読書記録アプリにログインできる ユーザーは読む本を登録できる ユーザーは本を何ページ読み終えたかを記録できる ユーザーは本を読み終わったら次の本を登録できる ユーザーは他の人がどの本を読んでいるのか、また何ページ読み終えたかを閲覧できる 質問する前に... また、ChatGPTに業務で使用するコードを渡す場合、環境キーやサービスを特定できる情報を送信しないでください。入力内容が他の人に渡って

                                                        「怠惰・短気・高慢」であれ、ChatGPTを使って業務効率化しよう(要件定義編)
                                                      • 思いどおりの日本語入力 - Google 日本語入力

                                                        メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

                                                          思いどおりの日本語入力 - Google 日本語入力
                                                        • 機械学習入門 - 基本のPythonライブラリ、9つを触って学ぶ - エンジニアHub|若手Webエンジニアのキャリアを考える!

                                                          機械学習入門 - 基本のPythonライブラリ、9つを触って学ぶ 機械学習を学ぶために、まず知っておきたいPythonライブラリを、機械学習エンジニアの「ばんくし」こと河合俊典さんに厳選し、そのエッセンスをつづってもらいました。機械学習入門に向けたスタートアップガイドです! こんにちは。機械学習エンジニアの「ばんくし」こと河合俊典(かわい・しゅんすけ/ @vaaaaanquish )です。 近年の機械学習関連の開発では、多くの場合Pythonが用いられます。 本記事は、「機械学習をこれから初めてみたいけど何から始めればいいか分からない」「基本のキから学びたい」という方に向けて執筆しました。プログラミング言語「Python」の中でも、特に機械学習における使用頻度の高いライブラリを厳選し、その解説を目的としています。 「この記事の内容に沿ってPythonを学習すれば、機械学習エンジニアとして入

                                                            機械学習入門 - 基本のPythonライブラリ、9つを触って学ぶ - エンジニアHub|若手Webエンジニアのキャリアを考える!
                                                          • 専門知識の仕入れ方 - Preferred Networks Research & Development

                                                            今日は,普段どのようにして専門知識を仕入れているかについて書いてみようと思います.特に自分が得意でない分野を知りたいと思った時に,どうするかに注目したいと思います.自分の専門の場合は,いくらでも時間を注ぐことが出来るので,世界中のリソースを全て探し当てて勉強すれば良いのですが,ちょっと興味が有るぐらいではそこまでやる時間は取れません.なので出来るだけ効率的に分かった気になるのが目標です. まず,論文を直接読むのはあまり効率的では無いと思います.論文は広い分野の中の或る問題に対して一つの解決方法を書いているだけで,分野全体を俯瞰することは目指していません.論文だけ読んで分野全体を理解するには,最低50本ぐらい読む必要が有ると思います.

                                                              専門知識の仕入れ方 - Preferred Networks Research & Development
                                                            • Google翻訳の「リアルタイム翻訳」がおもしろ過ぎて試す人続出「電脳をハックされてる感じがたまらない」【画像まとめ】

                                                              リンク アンドロイドアプリが見つかる!スマホ情報ならオクトバ 画像を認識してリアルタイム翻訳!「Google翻訳」アプリに新機能登場 | オクトバ 米Googleは1月14日(現地時間)、翻訳アプリ「Google Translate(Google翻訳)」に画像を認識して翻訳してくれる新機能を追加すると発表しました。 Android/iOSアプリとも、今後数日以内に行われる予定のアップデートにより提供されます。 画像を認識してリアルタイムに翻訳 端末のカメ 2 users 20

                                                                Google翻訳の「リアルタイム翻訳」がおもしろ過ぎて試す人続出「電脳をハックされてる感じがたまらない」【画像まとめ】
                                                              • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

                                                                追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

                                                                  Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
                                                                • やる夫で学ぶ機械学習シリーズ · けんごのお屋敷

                                                                  これは、機械学習に関する基礎知識をまとめたシリーズ記事の目次となる記事です。まとめることで知識を体系化できて自分自身の為にもなるので、こういうアウトプットをすることは大事だと思っています。ただ、普通にブログ記事を書くのも面白くないので、ちょっといつもとは違う方法でやってみようというのが今回のシリーズ記事。 2 ちゃんねるのキャラクターが登場人物として出てきて、彼らが会話して話が進んでいく「やる夫で学ぶシリーズ」という講義調の形式のものがあります。個人的にはやる夫で学ぶシリーズや 数学ガール のような会話形式で話が進んでいく読み物は読みやすいと思っています。さらに、先日みつけた やる夫で学ぶディジタル信号処理 という資料がとてつもなくわかりやすく、これの真似をして書いてみようと思い至りました。記事中のやる夫とやらない夫のアイコンは http://matsucon.net/material/m

                                                                  • 文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。

                                                                    「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。 それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。 間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか? 日本語の文字コードは大きく以下の2つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。 上で挙げた「文字コード」とは正確には「エンコーディング(文字符号化方式)」の事を指す。 文字符号化方式 文字集合って? 読んでそのまんま”文字の種類の集まり”。「キャラ

                                                                      文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。
                                                                    • 富士ゼロックス株式会社

                                                                      既存システムや業務プロセスを1つのプラットフォームで繋いで、ワンストップでDXやデジタル化を支援するクラウドサービスを紹介します。

                                                                      • 日本語形態素解析の裏側を覗く!MeCab はどのように形態素解析しているか - クックパッド開発者ブログ

                                                                        こんにちは、買物情報事業部の荒引 (@a_bicky) です。 前回、「検索結果の疑問を解消するための検索の基礎」で単語単位でインデキシングする前提で説明しましたが、今回は文などを単語単位で分割するために使う技術である形態素解析について触れます。 形態素解析器には色々ありますが、中でもメジャーと思われる MeCab の仕組みについて説明します。 MeCab の解析精度を上げるために辞書に単語を追加したことのある方もいると思いますが、動作原理を理解することで単語を追加する際に適切な生起コストを設定できるようになったり、学習の際に適切なパラメータを設定できるようになったりするはずです。 なお、MeCab は汎用テキスト変換ツールとしても使用できます が、簡単のため MeCab + IPA 辞書のデフォルト設定前提で説明します。 アジェンダ 形態素解析とは MeCab における最適な解析結果の推

                                                                          日本語形態素解析の裏側を覗く!MeCab はどのように形態素解析しているか - クックパッド開発者ブログ
                                                                        • Chat GPTの完全な上位互換!Bing AIの面白い使い方まとめ|梶谷健人 / 新著「生成AI時代を勝ち抜く事業・組織のつくり方」

                                                                          テレビ番組で特集されるなどChatGPTへの注目が高まっていますが、その上位互換となるBing AIはもう使われましたでしょうか? ChatGPTで使われてるGPT3.5というモデルの発展版を開発元のOpenAIがマイクロソフトに提供する形で作られたBing AIは、過去の学習範囲内で回答するChatGPTと異なり、事前学習データ+対話ごとに関連する検索結果を都度読みにいくことで、非常に精度の高く正確な解答をすることが可能になっています。 このnoteではそんなBingAIを時間を忘れて使い倒してみた自分が特に面白いなと思った使い方をジャンル別に紹介します。 仕事SpotifyとApple MusicのARPUを聞いたらWeb上の開示情報から比較数字を提示してくれ、さらにSpotifyの方が低い理由も仮説を提示してくれました。 Bing+GPTが凄すぎて深夜3時に興奮が止まらなくなってる。

                                                                            Chat GPTの完全な上位互換!Bing AIの面白い使い方まとめ|梶谷健人 / 新著「生成AI時代を勝ち抜く事業・組織のつくり方」
                                                                          • 執筆者やライターに向けて、編集者からのお願い→原稿を書き終わったらチェックして欲しい点がこちら

                                                                            中村明博(編集者) @naka727 【編集者からのお願い】 著者やライターさんへ、原稿が完成したら、 ・「という」をカット ・「と思います」をカット ・「こと」をカット ・「もの」をカット ・過剰敬語をカット できないか見直していただけないでしょうか。ざっとでもかまいません。関係者全員が幸せになります。なにとぞ、、! 2021-03-05 12:14:24 中村明博(編集者) @naka727 【なぜこんなお願いをするか】 誰かが直さなければならないからです。その分、「磨き上げ」の時間が減り、本のクオリティーが落ちます。本の売り上げが落ち、関係者全員が不幸になるためです。 2021-03-05 14:37:22 中村明博(編集者) @naka727 さらに可能なら、 ・40字を超える長文は短く・簡潔にする ・「これから説明します」的な余計な前置きはカット ・「ひとつ・1つ」「ひとり・1人

                                                                              執筆者やライターに向けて、編集者からのお願い→原稿を書き終わったらチェックして欲しい点がこちら
                                                                            • オンラインで無料で読める統計書22冊|Colorless Green Ideas

                                                                              はじめに 今回は、ウェブを通じて無料で読むことができる統計に関する書籍を紹介したい。英語で書かれた本が多いが、日本語で書かれた本も若干ある。 入門書 まず、統計の初学者のために書かれた入門書を紹介したいと思う。 福井正康 (2002). 『基礎からの統計学』基礎から扱っている統計の入門書である。統計を扱う際に必要となる場合の数、確率などについて詳しく説明している。理解を助けるための演習問題とその解答がついている。統計処理用のソフトとしてはExcelを使っている。同じサイトに社会科学系の学生向けの数学の教科書もある。 小波秀雄 (2013). 『統計学入門』基礎から扱っている統計の入門書。内容としては、記述統計、確率、確率分布、簡単な推定・検定、相関と線形回帰などがある。確率や確率分布などの理論的な話が占める分量が多いので、分量のわりには、具体的な統計手法はあんまり載っていない。もちろん理論

                                                                                オンラインで無料で読める統計書22冊|Colorless Green Ideas
                                                                              • 「生成AIを仕事で使い倒す人たち」に取材して回ったら「自分の10年後の失業」が見えてしまった

                                                                                ChatGPTの発表から、1年が経過しようとしています。 熱狂は徐々に醒め、現在の利用状況はLINEの調査によると、全体の5%程度。*1 その中でも、仕事で積極的に利用している人は、1%程度ではないかと推測します。 では、この1%の人たちはどのような方々で、どのように生成AIを仕事で使っているのか? 9月の中旬から、10月の末にかけて、私は約40名の方に取材を行いました。 そして、私は一つの確信を得ました。 それは、「私は間違いなく10年後、失業する」です。 私は間違いなく10年後、失業する なぜなら、現場での生成AI利用は、仕事によっては 「ホワイトカラーの代替」 をかなり高いレベルでできることがわかったからです。 例えば、コンサルティング。 コンサルティングには、初期の段階で、仮説構築という仕事があります。 平たく言うと、調査・提案にあたって「課題はここにあるのではないか?」というアタ

                                                                                  「生成AIを仕事で使い倒す人たち」に取材して回ったら「自分の10年後の失業」が見えてしまった
                                                                                • 最近ローカルLLMがアツいらしい

                                                                                  最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。 ローカルLLMって何じゃ?というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。 オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。 だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題 & OpenAIがAIベンチャー皆殺しにしてしまう問題 まず「結局GPTのAPIを叩いてサービス運営して成功し