ありがとうございます! 実は私本人がそのモデルの構築に関わっているのですが、詳細はまだ言えない状況です...。 来年3月の言語処理学会年次大会(NLP2023)での続報をお待ちください!このモデルに関する論文が公開される予定です(一応それを待ってからこの記事にも掲載します)。 (私が書いたものではありませんが、現段階で公開できる情報をまとめた記事があります: https://note.com/utokyo_itc/n/nb18b2a753f23 )
YATTSUKE BLOG なんか音楽、英語、Pythonとかの他愛も無いブログだったのですが、海外で暮らしてるとトランプが大統領になってから日本と英語圏の温度差が酷いので政治の話をツイッターでしてました。でも2020年大統領選挙で保守派論陣アカウントと共に凍結。マスクがツイッター買収で6代目がようやく復活。現在、政治の重い話はnoteに書いてます。ココログはPCとかPython、Linux、音楽へ戻す。 トップへ 最近、「スタイリッシュで高機能になったTiddlyWiki5の使い方。」という記事を書いて紹介したTiddlyWiki5のカスタマイズネタの記事第2弾です。TiddlerWiki5はEverNoteよりも柔軟性が高いウィキスクラップブックです。 その壱はこちらからご覧ください。 まずは、アナウンスメントです。ここまで色々と使い方やカスタマイズの仕方を紹介してきましたが、ぶっちゃ
シソ改 ~~ 『日本語大シソーラス』の全語彙検索EPWING化 ~~ 更新履歴 2019/04/18 ロゴヴィスタの『第2版』発売について追記 2018/08/14 ダウンロード版での動作確認情報を追記 2016/03/27 ダウンロード版での動作確認情報を追記 2013/06/08 初版公開 ここにあるのは、2006年に発売された『日本語大シソーラス』“初版” [すでに販売終了]のEPWING化であって、 2019年に発売の”第2版”のEPWING化ではありません。 第2版のロゴヴィスタ版は、データが暗号化されているでしょうからEPWING化はできません。 対応予定もありません。あしからず、ご了承ください。 1. はじめに 山口翼氏による『日本語大シソーラス』(大修館書店)は、約千個の意味のカテゴリから語彙を検索することを主目的として作られているようです。これは、跋語にある ロジェズ・シ
(例文/コーパス) ◯KOTONOHA「現代日本語書き言葉均衡コーパス」 少納言 www.kotonoha.gr.jp/shonagon/search_form 現代の日本語の書き言葉の全体像を把握できるように集められた約1億語収録の『現代日本語書き言葉均衡コーパス』をジャンルを指定したり、前後にくる言葉を指定した上で検索できる。用例を探したいときはまずここを当たる。 ◯コーパス検索ツールNINJAL-LWP for BCCWJ (NLB) nlb.ninjal.ac.jp/ 『現代日本語書き言葉均衡コーパス』を検索するために、国語研とLago言語研究所が共同開発したオンライン検索システム。上の少納言との違いは、名詞や動詞などの内容語の共起関係や文法的振る舞いを網羅的に表示できるところ。 たとえば「タバコ」を検索すると、用例が「タバコ+助詞+動詞」や「動詞+タバコ」+「タバコ+助詞+形容詞
印刷の日本語は、非常に質が高い。編集者や校正者によってチェックされているからだ。 それに対して、ネットの日本語は質がバラバラだ。書くことのプロでない一般人が日本語を書くので、どうしてもそうなってしまう。 かといって、お金をもらうわけでもない文章にそんなに手間はかけられない。自分で気をつけるのが精一杯だ。 ここでは、気をつける時*1に参考になるようなことを、「森のくまさんの謎」を例として、特に「漢字と平仮名の使い分け」を中心に書いてみる。 ここでは、解説記事などの実用文を想定している。 また、この記事は「森のくまさんの謎」のようなスタイルを身につけたい人を対象としているので、もちろん誰かに強制するつもりはない。 漢字と平仮名の原則 大きな原則として、「意味の重いところは漢字で書き、軽いところは平仮名で書く」というものがある。以下では、それを具体的に解説する。 形式名詞は平仮名で書く また、娘
If you were looking for MSDN or TechNet blogs, please know that MSDN and TechNet blog sites have been retired, and blog content has been migrated and archived here. How to use this site Archived blogs are grouped alphabetically by the initial letter of the blog name. Select the initial letter from the TOC to see the full list of the blogs. You can also type the name of the blog or the title of the
はじめにPerl は Larry Wall によって1987年に開発されたインタープリタ方式のプログラミング言語である。 ここで紹介するように、きわめて優れた機能を持つプログラミング言語であり、しかも無料で配布されている。Larry Wall 自身によれば、Perl はテキスト処理言語としてスタートしたといい、その名前は「Practical Extraction and Report Language(実践的(データ)抽出およびレポート作成用言語)」を略したものだそうだが、「Pathologically Eclectic Rubbish Lister (病理学的には選りすぐりのがらくたリスト出力機)」でも良いとしている。Perl のモットーは、「それをやる方法は1通り以上ある」という点にある。これは言語学者でもある Larry Wall が、人間が普段話している自然言語では、言葉が1通りと
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く