タグ

関連タグで絞り込む (228)

タグの絞り込みを解除

textに関するmyrmecoleonのブックマーク (196)

  • NDL Ngram Viewer | NDLラボ

    サービスURL https://lab.ndl.go.jp/ngramviewer/ 概要 OCRによって作成されたテキストデータから、出版年代ごとの単語及びフレーズ(以下「キーワード」といいます。)の出現頻度を可視化・列挙することができるサービスです。 可視化グラフの縦軸は、年代ごとにキーワードが何回出現したかを表す出現頻度と、出現頻度を出版年代ごとの総ngram数で割った値を表す出現比率の2種類を切り替えることができます。 2023年1月現在の対象は、国立国会図書館デジタルコレクションで提供されているデジタル化済み資料のうち、図書約97万点及び雑誌約132万点のOCRテキストデータから集計した、約17億種類のキーワードです。 具体的な内訳は次の通りです 図書及び雑誌約230万点(約17億種類のキーワード) 図書約97万点(約8.5億種類のキーワード) 雑誌約132万点(約8.9億種類の

  • 一番広い世代に知られている国語の教科書の話はなにか調べてみる

    小学校のものはだいたいなんでも懐かしいが、なかでも懐かしいのが国語の教科書だ。 『スイミー』『おおきなかぶ』『くじらぐも』...ちょっと思い出すだけでもとにかくすべてが懐かしい。しかし、日全国に配られている教科書でも、世代が違うと載っている作品はけっこう違う。 国語の教科書のうち、みんなが知っている作品はどれなのか。歴代の国語の教科書を調べ、「もっとも知られている国語の話」を探し当てたい。 日の6割以上の小学生に読まれている光村図書 題に入る前に、まずは私の”推し”の教科書について話したい。 この表紙にビビッときたら、あなたは「光村に育てられたアラサー」だ。(教科書クロニクル 小学校編(光村図書)よりキャプチャ) 光村図書出版。小学校の国語の教科書の最大手だ。 これ以外にも教科書はあるが、光村のシェアはなんと約67%。 「教科書の出版社なんか覚えてないよ」という人も、だいたいは光村で

    一番広い世代に知られている国語の教科書の話はなにか調べてみる
    myrmecoleon
    myrmecoleon 2022/03/24
    ちょっと古いけど『教科書掲載作品13000』という参考図書があって、だいたいの作品はいつからいつのどの教科書に載ってたか調べられるんよね。光村のシェアも時代で多少違うからまじめにやるとまた複雑。
  • ラーメン評論家の実態:ロマン優光連載196

    実話BUNKA超タブー2022年11月号 コンビニ・書店で9/30より発売中 偶数月2日発売(次号は12月2日発売) 特別定価620円(税込) ▼統一教会の天敵 鈴木エイトとは何者なのか ノンフィクション作家橋信宏が迫る ▼対談 元統一教会信者多田文明×やや日刊カルト新聞総裁藤倉善郎 統一教会信者とのヤバい交流体験 ▼自由で楽しいなんて大間違い 独身だと絶対不幸になる理由 ▼安倍晋三国葬の酷い舞台裏 ▼「山上徹也の思い通りになる」と屁理屈で反社宗教擁護 統一教会を批判するなと言うバカたち ▼同志社アメフト部が暴行 運動部は日常的に性犯罪を犯す ▼表現の自由の敵 鳥取県があらゆる点で最低 ▼庶民が高価なだけのiPhone14購入はムダ ベストな中古iPhoneはどれ? ▼東京のべログTOP10ラーメン全部まずい ▼芸能人がロケ弁としてもてはやす有名弁当ホントは別に美味くない ▼小室佳代さ

    ラーメン評論家の実態:ロマン優光連載196
    myrmecoleon
    myrmecoleon 2021/10/02
    “あのblogを読んだら事実関係が確認できなくても「絶対こっちが悪い」と思わせるような力を持つ文章です。”
  • 高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表

    スマートフォンやスマートスピーカー、銀行ATM、券売機など、あらゆる場面で合成音声が使われるようになって久しい。近年では特に機械学習技術を活用した音声合成システムの製品化やサービス化が進んでいる。 音声合成の研究開発や製品化を行う際には、学習素材として大量の音声が必要だ。しかし学習に適した上質な音声ファイルはネット上にもあまりない。いまだに素材を集めにくい状態にある。 これまでは研究開発用の素材を得るため「音素バランス文」と呼ばれる台を用意し、それをアナウンサーや声優などに読み上げてもらい、まとまったデータを取得していた。 「しかし、これまでの音素バランス文には『使用料』『ライセンス』『台の読みにくさ』3つのハードルがありました」 そう話すのは明治大学で音声合成の研究をしている小口純矢さんだ。音声合成ソフトの販売を手掛けるSSS(仙台市)と小口さんが所属する明治大学、九州工業大学は6月

    高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表
    myrmecoleon
    myrmecoleon 2021/06/24
    パブリックドメインの音声読み上げ用日本語コーパスか。
  • 音楽の教科書に載っているロックの説明が詳しすぎる

    1997年生まれ。大学院で教育学を勉強しつつ、チェーン店やテーマパーク、街の噂について書いてます。教育関係の記事についても書きたいと思っているが今まで書いてきた記事との接点が見つからなくて途方に暮れている。 前の記事:”Campusノート”のふつうに想いを馳せる > 個人サイト Note それがこの系譜図なのだが、とてもくわしい。アーティストやジャンルごとの関係性がよくわかる 隣のページ。これが教科書に出てきたら驚いてしまう お話をうかがった教育芸術社取締役第二編集部長の呉羽弘人さん。この教科書の編集に携わった方である 保護者が喜ぶ教科書 谷頭:このロックの系譜図、すごいですよね。教科書のイメージとぜんぜん違います。 呉羽:現場の先生から、休み時間に読んでる生徒を見かけると聞きました。ロックってやはり生徒の心を掴むんだな、と思って印象的でした。 林:休み時間に読むなんてあんまりないですよね

    音楽の教科書に載っているロックの説明が詳しすぎる
    myrmecoleon
    myrmecoleon 2021/04/29
    そうそう。編集から読まれるまで3年かかるんだよね教科書。あれでポピュラーミュージックまでちゃんと扱ってるのすごいなと思う。最近では初音ミクとか普通に載るしなあ。
  • 桃太郎なのに、とっても Apple

    こんな桃、見たことない。 川上に目をやれば、どんぶらこ。 洗濯をしていたおばあさんが見つけたのは、世界でいちばん大きな、桃でした。 このような桃は、わたしたちも見たことがありません。もちろんおばあさんも、見たことがありませんでした。山に柴刈りに行っていたおじいさんも、見たことがなかったはずです。流れてきたのは、当に大きな桃だったのです。 Hello, Momotaro. 家に持ち帰って割ってみれば、中にはなんと、玉のような赤ん坊。 おじいさんもびっくり。おばあさんもびっくり。わたしたちまで、びっくり。 おじいさんもおばあさんも、最初はべるつもりで桃を切ろうとしたのです。でも、中から飛び出したのは、元気な男の赤ん坊でした。こどものいなかったおじいさんとおばあさんは、おおよろこび。桃から生まれた男の子は、桃太郎と名付けられました。 身長は4倍、パワーは最大300倍。 元気いっぱい、すくすく

    桃太郎なのに、とっても Apple
  • あえぎ声を書くバイト

    大学時代、ひたすらあえぎ声を書くバイトをしていたことがある。 先輩から紹介してもらった、エロゲメーカーのバイトだ。 その会社のエロゲはストーリーに力を入れていて、所属するライターも自分の文章にプライドを持っている人ばかりだった。 彼らからすると、Hシーンのあえぎ声を書くなどというのは苦痛でしかなく、学生バイトにでも任せておけということになったらしい。 仕事がどういう感じだったかというと、 1. まず、「チャックを開けた」とか「腰を動かすスピードが速くなっていく」といったHシーンの「ト書き」部分だけを渡される。 2. ここに私が「んっ……」とか「あんっあんっ」といったあえぎ声をてきとうな塩梅で足していく。 3. シナリオライターのチェックを受けて終了。 という流れだった。 簡単に思えるかもしれないが、これが意外に難しい。 まず、Hシーンにはある程度の長さがあるので、その範囲内で的確に盛り上げ

    あえぎ声を書くバイト
    myrmecoleon
    myrmecoleon 2021/04/08
    “「あえぎエディタ.xls」と題されたエクセルファイルは、前任者が残したあえぎ声専用のマクロであった。”この前任者、論文書いたらイグノーベル賞もらえそう。
  • 判例PDFをパースする際にハマること - Qiita

    概要 最近は行政データをオープンに公開することで、広く官民に使ってもらおうと言う動きが活発だ。裁判所も過去の判例データを公開している。こちらのサイトで、過去の判例データを検索して、判決文や判決に至る根拠を書いたPDFをダウンロードできる。 しかし、そのPDFは人間が読むことを想定しており、PDFの内容を機械が読み取ってデータとして利用することは想定していないように見られる。 今回は、判例PDFをダウンロードして、機械的に読み取り、テキスト化する際にどのような不便があるかを共有する。 アドベントカレンダーへの参加 こちらの記事は、CivicTechテック好き Advent Calendar 2020 12/15に参加しています。 使用ツール PDFから機械的にテキストを抜き出すツールは色々ある が、今回は、pdfminer を利用して判例PDFからテキストファイルを抜き出す。pdfminer

    判例PDFをパースする際にハマること - Qiita
    myrmecoleon
    myrmecoleon 2021/04/03
    法律をプログラム的に扱うなら当然必要だよなと思っていたら、芝尾さん判例のテキスト構造化まではじめてるんか…
  • cakes炎上と、消滅した連載|あさのますみ

    2020年10月と11月、cakesが立て続けに2度、炎上しました。 その炎上の影で、開始直前だった私の連載は、突然、運営サイドから「掲載できない」と言われてしまいました。「自死というセンシティブな内容を扱っているから」。それが、編集部が主張する理由でした。 一体どうすれば、この結末を回避できたのか。答えは、未だに見つけられないままです。今私は、協力して下さったご遺族になんて説明したらいいのだろうと、毎日そのことばかりを考えて暮らしています。 お母さまと、お姉さま友人が、自ら逝ってしまった。そう連絡を受けたのは、2019年1月でした。親しい人と、こういう形で別れたのは、私にとってはじめてのことでした。 そこから始まった、苦しく、出口の見えない日々。濁流に流されるような毎日の中、それでもどうにか呼吸ができるようになったころ、私は、友人のことをnoteに書きました。ずっと口にできなかった気持ち

    cakes炎上と、消滅した連載|あさのますみ
    myrmecoleon
    myrmecoleon 2020/12/10
    執行役員さんの言う“cakesは未熟で、センシティブな内容を取り扱えるほど成熟しておりません。”が一番しっくり来る。
  • ライトノベルにおける現実-川原礫『ソードアート・オンライン』論- | CiNii Research

    myrmecoleon
    myrmecoleon 2020/11/09
    大塚英志のまんが・アニメ的リアリズム,東浩紀のゲーム的リアリズムを引いての異なるリアリズムとしてのSAO論。面白かった。
  • 【お詫び】IPアドレスが他者からも確認できてしまう不具合について|note株式会社

    経緯と再発防止策について追加のご報告をいたしました。くわしくはこちらをご覧ください。https://note.jp/n/naf3775e93a58 (2020年8月14日 22:33追記)noteサービスにおいて、記事投稿者のIPアドレスが記事詳細ページのソースコードから確認できてしまう不具合が存在していました。 なお、一般的なIPアドレスから、個人情報を特定することはできません。 現在は、該当部分を修正し問題なくご利用いただける状態です。ご迷惑をおかけして、大変申し訳ありませんでした。 今回の不具合により、名誉毀損などの被害をこうむったクリエイターに対しては、ご人と連携して法的措置を含めてnote社がサポートいたします。 以下、発生内容と今後の対策についてご報告します。 IPアドレスとは? インターネットでの通信先の情報です。一般的にはIPアドレスは地域や建物、組織で同一の値が共有され

    【お詫び】IPアドレスが他者からも確認できてしまう不具合について|note株式会社
  • 文科省通知の読み方 - 教育長ブログ

    新型コロナウイルス対策に関連して、連日のように文科省からの通知が発出されています。教育委員会や学校の皆様も、日々どんな通知が出てくるのか、気になっていると思います。 しかし、文科省の通知は、その読み方を知らないと、一言一句に過度に振り回されてしまいます。すると、文科省が意図している以上のことを読み取ってしまい、「そんなの無理だ」とか「そんなのは国の仕事ではない」などと、無用の反感を持ってしまうことにもなりかねません。 実は、文科省の通知は、説明、修飾、例示が多く、「絶対にやってください」という部分は、全体の分量からするとさほど多くありません。通知を読む時のルールを知った上で読めば、だいぶ精神的に楽になるのではないかと思います。 (文科省通知を読む時のルール) 〇「など」「例えば」「たり」→ 例示なので、別のことでもいい。 〇「等」→ それだけでなく、別のものも含む。 〇「場合には」「必要に

    文科省通知の読み方 - 教育長ブログ
  • 日本ゲームシナリオライター協会 | Japan Game ScenarioWriters Association

    ゲームシナリオの執筆を中心とするライターの活動の促進、および生活面での支援などを行うことを目的として、日ゲームシナリオライター協会(JAGSA)を設立いたしました。

  • 「コピペできるようになったら神→対応しました」Google、驚異のリアルタイム文字変換の進化

    Search, watch, and cook every single Tasty recipe and video ever - all in one place! News, Politics, Culture, Life, Entertainment, and more. Stories that matter to you. 「コピペできるようになったら神→対応しました」Google、驚異のリアルタイム文字変換の進化2月にβ版がリリースされたGoogle製の音声文字変換(Live Transcribe)アプリ。もともと聴覚障害者のために作られたアクセシビリティ機能だが、精度の高さから文字起こしとしても使えるのではないかと話題だ。来日中のプロダクトマネージャー、ブライアン・ケムラー氏に話を聞いた。

    「コピペできるようになったら神→対応しました」Google、驚異のリアルタイム文字変換の進化
  • 京都アニメーションの功績について(メモ) - 氷川竜介ブログ

    【中村光毅氏、イデの元に召される・・・】メカニック・アートの第一人者 (ジョニー暴れん坊デップの部屋) 「Confort」中村光毅氏インタビュー ( // musi-musi //) 崖の上のポニョ 感想 (崖の上のポニョ 感想) 【アニメ】:これがプロフェッショナルの仕事と生き様、マクロスの河森正治監督が語る「アニメーション監督という職業」 (白石運送) 足利事件から日鬼子まで (cancerkiller173のブログ) 今敏 追悼BOOKだけを目当てに今月号のコミックリュウを買ってしまうのは不謹慎なんでしょうか…。 (新製品と価格のメモ) 「破」全記録全集・庵野総監督インタビューの感想 (ユイさんのこと、を想う) Twitter Trackbacks () Twitter Trackbacks () 早すぎる、今敏監督 (札幌生活) 7/18~7/19 マスコミ対応のために作ったメモ

    京都アニメーションの功績について(メモ) - 氷川竜介ブログ
  • viを:wqや:q!、あるいはZZで終了するのとではどちらが効率的か - 人間とウェブの未来

    後ろの方に追記をいくつか書いているのでそちらも是非参照ください 今日さくらインターネット研究所の雑談タイムで、viの終了時には:wqや:q!とかで終了するよりもZZで終了すべき、という話題が出た。 ここで簡単に整理しておくと、 :wqはファイルを上書き保存して終了 :qは上書きせずに終了 ZZ はファイルに変更があれば保存して終了、なければ上書きせずに終了 というコマンドである。 最初はZZ便利だよなぁと思っていたけど、確か過去にZZだとやりにくいところがあって使うのをやめた記憶があった。それで色々話をしていると、やっぱりZZを使った方が良いケースが思いつかなかった。 そこで、ZZいらんでしょ、などと発言したりしていたのだった。 といのうも、僕のviの終了するパターンとしては、 まず:qを押す 変更がなければそのまま終了、変更があれば変更があるよとwarningが出て終了できない warn

    viを:wqや:q!、あるいはZZで終了するのとではどちらが効率的か - 人間とウェブの未来
    myrmecoleon
    myrmecoleon 2019/06/26
    いつも :w → :q か :q か :q! だった(修正したかどうかは把握してる)ので :wq を学んだ。
  • もし文章を読みたい部分だけ読みたい粒度で読めるようになったら、というアイデアがめっちゃ面白い「これすごいな」

    きゅぶんず @kyubuns 「読みたいところだけ、読みたい粒度で読める文章」ってネタが降ってきたので作ってみた 拡大すると、文章の意味も拡大される pic.twitter.com/kEr7XsWaRA 2019-03-24 21:03:13 きゅぶんず @kyubuns 自分は文字ばっかりの文章が当に読めなくて、 文章を読んでいる間に退屈してしまって読み飛ばしまくってしまうのだけれど、 こんな風に気になった部分だけ、それも自分の好きな粒度で読める、みたいな媒体出来ないかな〜っていう妄想 2019-03-24 21:07:48

    もし文章を読みたい部分だけ読みたい粒度で読めるようになったら、というアイデアがめっちゃ面白い「これすごいな」
    myrmecoleon
    myrmecoleon 2019/03/27
    3段階でいいなら、本当は タイトル・見出し→抄録・あらすじ→本文 はこれと同じことをしてるんだよな。タイトルで注目を集める芸が増えすぎて機能果たしてないけど
  • 謎の「左右逆」ファミコン写真の正体判明 遠野市教委「(今の)子供に撮影協力を依頼」

    あるツイッターユーザーが投稿した小学校の副読の画像に、不自然な様子でファミコンを使っている子供の写真が載っていると話題になっていた件で、岩手県の遠野市教育委員会は2019年3月11日、同市教委が作成し、写真も新たに撮影したものと認め、「来であれば、当時をイメージさせるための写真である旨を明記して掲載するべきでした」とお詫びした。 3月2日に投稿されたツイートの画像に対しては、「子供の持っているコントローラーの向きが左右逆である」「電源ケーブル等が接続されていない」など多くのツッコミが入っていた。 「イメージ写真ですってことをきちんと明記すればよかった」 遠野市教委の11日の発表などによると、地元の状況を説明する副読は、採択した教育出版の教科書に沿って市教委が作成。教科書との連動性を確認しながら作った。基的に写真の転用は禁止されているため、ルールに基づき、独自に写真を用意した。 J-

    謎の「左右逆」ファミコン写真の正体判明 遠野市教委「(今の)子供に撮影協力を依頼」
    myrmecoleon
    myrmecoleon 2019/03/12
    遠野市か。副教材とかほんと雑に作ってるんだなあ。やっぱり出版者違ったので教育出版の教科書紙面丸コピはいいのかと思うが、採択されてるから出版社強く出られないし、一種の便宜だね。
  • 5ch(旧2ch)をスクレイピングして、過去流行ったネットスラングの今を知る - にほんごのれんしゅう

    5ch(旧2ch)ではここ数年はTwitterを使用するようになってしまいましたが、ネットのミームの発信地点であって、様々なスラングを生み、様々な文化を作ってきたと思います。 学生時代、2chまとめとか見ていたので、影響を受けてきたネット文化で、感覚値からすると、どうにも流行り廃りがあるようです。 5chの過去ログを過去18年ほどさかのぼって取得する方法と、懐かしいネットスラングのドキュメントに占める出現具合を時系列でカウントすることで、時代の変遷でどのように使用の方法が変化したのか観測することができます。 文末に「orz」って付けたら若い人から「orzってなんですか?」と聞かれて心身共にorzみたいになってる— ばんくし (@vaaaaanquish) October 19, 2018 図1. 今回集計したorzの結果 例えば、今回集計した5chの書き込み500GByte程度のログからで

    5ch(旧2ch)をスクレイピングして、過去流行ったネットスラングの今を知る - にほんごのれんしゅう
    myrmecoleon
    myrmecoleon 2018/11/12
    これは素晴らしい。
  • 陸自イラク「日報」 防衛省が公表した全文書:朝日新聞デジタル

    <div class=\"Section videoranking\" id=\"VideosSlide\">\n<div class=\"Title\">\n<h2><a href=\"//www.asahi.com/video/?iref=com_rnavi_video#ranking-list-wrap\">動画ランキング</a></h2>\n<ul class=\"SubLink\"><li class=\"Fst\"><a href=\"//www.asahi.com/video/?iref=com_rnavi_video\">動画一覧</a></li></ul>\n</div>\n<div class=\"VideosSlide cFix\">\n<div class=\"VideosListOuter\">\n<ul class=\"VideosList cFix\">\n<

    陸自イラク「日報」 防衛省が公表した全文書:朝日新聞デジタル