タグ

言葉に関するsh19910711のブックマーク (22)

  • 特定のイディオムだけで使われる英単語は韻を手掛かりに探すとたくさん見つかりそう - 🍉しいたげられたしいたけ

    前回6月6日付の拙エントリー で教えてもらったと書いた英語版ウィキペ "Fossil word"(化石語)を少しずつ読んでいるのだが、とにかく馴染みのある熟語がない。 私の勉強が足りていない可能性が高いにせよ、疑問が湧いた。数少ない知っていた熟語として "helter skelter" を挙げたのだが、ヘルター・スケルターがアリなら他にも知ってる熟語でアリそうなものがあるんじゃないか、と思ったのだ。 何が言いたいのかよくわからないな。その熟語以外では使われない単語を含む熟語を集めたいのだ。ただし辞書にしか載っていないようなものは除外して、外国語としての英語学習者でもなんらかの理由で知っていてもおかしくないもの限定で。 一例として "Fossil word" 項目中の "spick and span" というのが記憶に引っかかった。「真新しい/ぴかぴかの」という意味だそうだ。 この熟語は知ら

    特定のイディオムだけで使われる英単語は韻を手掛かりに探すとたくさん見つかりそう - 🍉しいたげられたしいたけ
    sh19910711
    sh19910711 2022/06/05
    "Fossil word: その熟語以外では使われない単語を含む熟語を集めたい / 英語には「頭韻」とか「脚韻」とか「韻を踏む」という重要な概念がある"
  • 英独文法誤り訂正と機械翻訳の同時学習をする(本当は中間言語を再現したかった)話 - Qiita

    はじめに 文法誤り訂正のシステムは,誤り文を入れると修正文が出てきます.これは,一般的に,ニューラル機械翻訳の手法を使うことにより,誤り文から修正文への翻訳として実現されます.この学習データとして,学習者コーパスの誤り文と修正文のペアがよく用いられます.ここで,誤り文は図の「おかしい文」の集合全体,修正文は「ただしい文」の集合全体の部分集合になっています.(ただしさ・おかしさをgrammaticalである・ないってそのまま言っていいのかよくわからないので,あえてこういう言い方をしています) この学習者コーパスの規模が小さいく,質の良い機械翻訳モデルを学習するには不十分だということがよく言われています.そのため,「ただしい文」に人工的な誤りを加えて,データ拡張を行う研究が活発に行われています.流行りというやつです. ただ,ここで言うところの人工的な誤りが必ずしも「おかしい文」である保証はあま

    英独文法誤り訂正と機械翻訳の同時学習をする(本当は中間言語を再現したかった)話 - Qiita
    sh19910711
    sh19910711 2022/06/03
    "中間言語: 言語学習者の発達途上の言語体系 / 言語転移: 学習者の母語の知識が言語習得に影響を及ぼすこと / 英語とドイツ語は同じ西ゲルマン語群 > 英語が母語でない学習者であっても,英語からの転移が多く起きる"
  • 外国語学習における偽りのともだち (false friend)|itchy_hasshy

    語には外来語がたくさん入っていて、中には和製英語なども混ざっていて、でも基はカタカナで表記されているそういうグループの言葉があります。 それらが、元の英語(だったり)の発音と違っていたり、意味が違っていたりと目くじらを立てるひとがいらっしゃいます。それらを英語だと思ってしまうことによる弊害を述べられるのですが「カタカナになった瞬間それはもう日語だ」と私は思っています。 ピッタリくる日語が無いので英語を借用するというのであれば、書き言葉であれば英語表記し、音の場合は英語発音するというのが良いのではないかと思います。 いずれにせよ、カタカナになっているというだけで身構えることができるのでまだ安心です。 ドイツ語にも外国語由来の言葉がいろいろ入っています。 フランス語由来でフランス語発音する Orange (オランジュ)とかGarage(ガラージュ)とかある中、今日出会った Image

    外国語学習における偽りのともだち (false friend)|itchy_hasshy
    sh19910711
    sh19910711 2022/05/04
    "ドイツ語にも外国語由来の言葉がいろいろ / 日本語と違ってカタカナがないので全部アルファベットの中に紛れ込んでいるので分かりにくい / 外国語・外来語・和製英語他がカタカナになっているという幸せ"
  • 「翻訳できない世界の言葉」を読んだ - ツナワタリマイライフ

    はじめに ツイートがきっかけ。 屋さんで表紙に惹かれて買った。 「翻訳できない世界のことば」。 個人的にいいなと思ったのが、イヌイット語の「イクトゥアルポク」(だれか来ているのではないかと期待して、何度も何度も外に出て見てみること)。 pic.twitter.com/kdwSsdubTL— うい (@257kce9) 2016年4月17日 名古屋に旅行しにきたついでに、屋に寄って買って、カフェで読んでしまいました。 翻訳できない世界の言葉 翻訳できない世界のことば 作者: エラ・フランシス・サンダース,前田まゆみ出版社/メーカー: 創元社発売日: 2016/04/11メディア: 単行この商品を含むブログ (2件) を見る 著者もあとがきで触れているとおり、ここでいう「翻訳できない」は1:1で結びつかない、という意味。 お気に入りをいくつか紹介します。 SAMAR(サマル) 「日が暮れ

    「翻訳できない世界の言葉」を読んだ - ツナワタリマイライフ
    sh19910711
    sh19910711 2021/12/29
    "単に「こんな意味に対応する言葉があるんだ!」という驚きのその先に、なぜそういう言葉があるのか、その言葉を通じて我々はどうしたいのかということを考えざるを得ません"
  • ヨーロッパのそれぞれの言語はどれぐらい似ているのか、の図

    スペイン語が母語の友人によると、イタリア語は、しゃべることはできなくても、ずっと聴いているとなんとなく言うことがわかるんだそうです。それぐらい二つの言語は似ているのだという話。もしかすると東京弁と関西弁みたいなものなのでしょうか。 Teresa Elms さんが、ロシアの1999年の論文”Metatheory of Linguistics”の研究結果を2008年に図にしたのが、このヨーロッパ言語距離チャート。 ヨーロッパに多数ある言語の間の、「語彙」の類似性を元に、似ている言語の間をより太い線で繋いでいます。(文法が似てる、ではありません) それぞれの丸の大きさは、その言語を話す人口の大きさを示します。同じ言語グループに属している言語は、同じ色が塗られています。 フランス語・イタリア語・スペイン語などを擁するオレンジのロマンス語、ドイツ語英語・北欧諸語の青いゲルマン語、ロシア語や東欧諸語

    ヨーロッパのそれぞれの言語はどれぐらい似ているのか、の図
    sh19910711
    sh19910711 2020/05/31
    "Teresa Elms さんが、ロシアの1999年の論文”Metatheory of Linguistics”の研究結果を2008年に図にした / 「語彙」の類似性を元に、似ている言語の間をより太い線で繋いでいます。(文法が似てる、ではありません)"
  • 日本語低情報密度説

    「日語 情報密度」で検索をすると、日語の書き言葉の情報密度が高いという話が、特に最近は日での Twitter の普及に絡んでたくさん出てきます。その一方で、英語の “Japanese informatin density” で検索をしてみると、なんとその反対に、日語の情報密度が低いという話が目立つのです。 日人にしてみると、日語の書き言葉の情報密度がきわめて高くなりうるというのは直感的に納得できるが、話し言葉も含めた一般的な文章となると、他の言語と比べて特に高くも低くもないんじゃなかろうか、特に根拠もないけど、というあたりが一般的な感想なのではないでしょうか。そんな中で、日語の情報密度が他の言語と比べて極端に低いという主張を見たら、あれっと思うはずです。 ここ最近の「日語低情報密度説」の根拠となっているのは、どうやら2011年に出版されたリヨン大学の研究者らによる論文のよう

    日本語低情報密度説
    sh19910711
    sh19910711 2020/05/24
    "日本語の書き言葉の情報密度が高いという話が、特に最近は日本での Twitter の普及に絡んでたくさん出てきます / “Japanese informatin density” で検索をしてみると、日本語の情報密度が低いという話が目立つ"
  • マサカリ - 西尾泰和のScrapbox

    言葉のニュアンスは時代によって変わるもんで、もともとポジティブな意味だった「貴様」が今ではネガティブな言葉なのと同じように、「マサカリ」って言葉も同じ変遷を辿ったということなのだろう。 若い時期を楽しくマサカリを投げあって過ごしたアラサーエンジニアとしては世知辛い気持ちだが、まあ「かつてポジティブな意味で使われていたこともあったのだ」というエビデンスを、消え去ってしまう前に集めておこうと思った。

    マサカリ - 西尾泰和のScrapbox
  • http://yomikata.org/

    http://yomikata.org/
  • 【CEDEC 2013】基調講演・ガンホー森下一喜氏が語る「開発讃歌」 「ちゃぶ台返しだ!」ドラマ名言になぞらえたガンホー的ゲーム作りの姿勢

  • RFC 2119 - Key words for use in RFCs to Indicate Requirement Levels

    Network Working Group S. Bradner Request for Comments: 2119 Harvard University BCP: 14 March 1997 Category: Best Current Practice Key words for use in RFCs to Indicate Requirement Levels Status of this Memo This document specifies an Internet Best Current Practices for the Internet Community, and requests discussion and suggestions for improvements. Distribution of this memo is unlimited. Abstract

    RFC 2119 - Key words for use in RFCs to Indicate Requirement Levels
  • これを押さえれば業界人?:スタートアップ業界5つのバズワード | The Startup

    スタートアップ業界の皆さん、会議とかで訳の分からぬ横文字が出てきて「???」と思ったこと、ありませんか?横文字の多さでは右に出るものはいないと(不名誉な意味で)いわれることも多い誌が、スタートアップ業界でバズワード(流行語)について簡単にまとめてみました。ハイコンテクストを売りにしてきた誌ですが、読者層拡大のために情弱にも優しいメディアを目指したいと思います。 なぜ横文字で話してくる奴らはあんなにドヤ顔なんでしょうかね。外資系投資銀行やコンサルの奴らのドヤ顔具合とかマジMother Fuckerですよね!これでもうミーティングで相手に横文字使われてドヤ顔されても大丈夫daze! 1:グロースハッカー(Growth Hacker) 2013年に入ってから国内のインターネット業界でもよく耳にするようになったワード。2013年上半期バズワード賞があれば大賞といえるでしょう。主にwebサービス

    これを押さえれば業界人?:スタートアップ業界5つのバズワード | The Startup
    sh19910711
    sh19910711 2013/05/24
    『O2Oサービスをコンテンツマーケティングとゲーミフィケーションでグロースハックして、そのビッグデータを活かすのが当社の戦略です。』 うさんくせぇ
  • 「うれくやしい」という感情 - 「うれくやしい」

    このブログのタイトルでもある「うれくやしい」という感情について。 「うれしい」+「くやしい」=「うれくやしい」 この「うれくやしい」という感情は、私がこだわり続けている感情のひとつで、「うれしい」と「くやしい」を足した造語。 一体どんな感情かというと、素敵なモノやサービス、または圧倒的にすごいヒトと出会った時に感じる、「うれしい!」という感情と、でもそれは自分が創ったモノや自分自身じゃないから、なんだか「くやしい!」という感情とが合わさった感覚です。 結論からいうと、この「うれくやしい」を感じる数が多いほど、感性が豊かになり、ピンチに見舞われた時に生き延びられる「自分だけの哲学」が見つかりやすくなるということです。 この言葉を強く感じる人は、何かを創ったことがあるヒトかもしれません。 「創る」という言葉はなにかクリエイティブな感じがしますが、遊びや仕事をしている時点で、何らかの価値を生み出

    「うれくやしい」という感情 - 「うれくやしい」
  • 人を bot にする道具 - レジデント初期研修用資料

    それが親しい人であっても、見知らぬ誰かであっても、自分に対して好意的な反応を返してもらうことは気分がいい。 共感はサービスの原動力で、共感が上手な人はそれ自体で商売をすることもできるし、ユーザーを共感してくれる誰かと結びつけてくれるサービスには人が集まる。 人間と区別がつかない、極めて精巧な人工知能を生み出すことができたとして、そうした人工知能によって提供された共感は、サービスとして商売になる。 高性能な人工知能を完成させるのは難しいけれど、人間の認知を、ネット上に多数存在する単純な人工知能、bot のレベルに引き下げることができるのならば、bot が提供する幼稚な共感から、 人間はより多くの快適さを引き出せるのかもしれない。 「マジやべぇ」はマジやべぇ いろんなアプリケーションとして提供されている人工無能、入力された言葉に対して、あらかじめ用意された単純な文章を返すだけの機能しか持たない

  • Python Workshop 02 | TRIVIAL TECHNOLOGIES 4 @ats のイクメン日記

    みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。 みんなのブロックチェーンは,ブロックチェーンの入門書。暗号やハッシュなどを含め,基礎からブロックチェーンの仕組みを学べる書籍です。 いろんな方に「新しい技術を学ぶことの楽しさ」を感じ取ってくれたら著者として嬉しいです:-)。お金技術的にどのように定義されるのか。 みんなのIoTは,モノのインターネットと呼ばれるIoTの入門書です。IoTの基について,読者に寄り添って優しく解説しました。裏テーマは一番とっつきやすいPython入門書。サポートページはこちら みんなのPython 第四版は,より分かりやすい入門書を目指し,機械学習やデータサイエンスの章も追加して第三版を大幅に書き換えました。Python 3.6にも華

  • プログラミング言語「日本語」

    ■ はじめに 日語は約1万年前、古代縄文人によって考案された世界的にも最も古い部類のプログラミング言語の一つである。(※) 日語の起源は、古代の北方系言語と南方系言語であり、それぞれの特徴、即ち、強力なマクロ機能と柔軟な音節構造を共に持ち合わせているかなり珍しい言 語である。 更に、日語はその後、約1万年の間にわたって仕様の変更や拡張が幾度も行われ現在の形に至っている。その過程で日独特の固有な機能を有するように なった。 これらの特徴は日語の利点であると同時に、習得する上での障害ともなっている。 書はプログラミング言語としての日語を習得する上で、比較的良く使われる構文を主に取り上げ解説したものであり、これから日語プログラミングを始 める人を対象として書かれている。 ※念のために書いておくと、書は日語をプログラミング言語のように解説することによって、普段意識 しないで使っ

  • 「課金」の誤用が気になる

    最近「課金」が話題ですね。 ネットを見ていると、「課金する」という言葉が「料金を課する」という意味とは逆の「料金を払う」という意味で使っていることに気づく。実際にゲームをやっている人が「課金する」という言い方をしているのだ。 ドリランドに課金しすぎてヤバイことになった:キニ速 この人はユーザーみたいですが、次のKAWANGOってドワンゴの社長じゃないの? (「ドワンゴ会長?「kawango」氏、人力検索はてなで質問中 ほか」をみると会長みたいですね。人は否定しているそうだけど)。 課金する側だけど、あきらかに「会員が課金する」という使い方をしている。 Twitter / KAWANGO: 今週はじめてわかり、ドワンゴ社内で衝撃が走ったある数 …(リンク先ははてなブックマーク – もとの投稿は消されているようだ) 今週はじめてわかり、ドワンゴ社内で衝撃が走ったある数字を紹介する。ニコニコの

  • 「ユーザーが課金する」という用法はいつから使われだしたか

    尾野(しっぽ) @tail_y パズドラ関係の記事についたコメントに「課金は『する』ものではない」という趣旨のコメントは10年来だ、というコメントがあり、確かにこの「ユーザーが課金する」という言葉の使われ方は「最近の間違った日語」として扱われているが、いつ産まれた用法だろうと気になった。で、調べてみた(続く) 2013-01-26 12:07:36 尾野(しっぽ) @tail_y 軽く気になっただけだったので方法は何でもよかったのだけど、使ったのは「教えてGoo!」課金周りでトラブルになってる人が質問を投げている可能性が高いのではないかということと、質問の日付を絞り込んで検索できるので。 2013-01-26 12:09:30

    「ユーザーが課金する」という用法はいつから使われだしたか
  • 「課金」の誤用はやめたほうがいいのでは

    課金 – Wikipedia 料金を課す、つまり「費用や支払いを引き受けさせる」のであり、ユーザーが料金を支払った意味で使用するのは誤りであるが、黎明期のオンラインゲーム利用料金決済を発端として誤用が広まり、今もって正しくない言葉のまま使う人が多い。さらに近年では、事ある毎に利用者の射幸心を煽り、納金させようとするソーシャルゲームの台頭により、利用者どころかサービス運営者、ゲームコンテンツ提供者までもが誤用しているケースが多々見られている。 たぶんこの誤用が格的にネットに広がりだしたのってグリーとかモバゲーあたりからだと思います。 格的にっていうのはネットゲームプレイヤー以外のネットユーザーにもってことです。 ネットゲームユーザーの間ではもっと昔から使われていたようですし、ネットに全く関心のない層にとっては課金とは来の意味での課金でしかないと思います。 僕が最初にモニョりだしたのは2

  • ネットに広がる「正しい」日本語 - アスペ日記

    ネットで日語を観察していると、「正しさ」を求めて知恵袋などで質問する人がいます*1。 「ラジオを『つける』というのはどう書くのが正しいの?」 「『分かる』『解る』『判る』はどう使い分けるのが正しいの?」 一方で、ネットではいろいろな「正しさ」の主張も目にします。「訊く」や「目をみはる」については、これまでここで扱いました。 「正しさ」の主張としてよくあるのは、「来はこう書くのが正しいが、当用・常用漢字によってそれがゆがめられた」というものです。 ただ、そういう人が思う、ゆがめられる前の「正しい」日語というのは、実は昔から「スタイル」のひとつにすぎないということが多いのです。 以前記事にした「訊く」はその典型ですが、今回は 失(な)くす*2 点(つ)く・点(つ)ける 保(も)つ の三つを取り上げます。 この三つに共通するのは、「これまで平仮名で書かれることが一般的だった」ということです

    ネットに広がる「正しい」日本語 - アスペ日記
  • 俗語を覚えたスーパーコンピュータ Watson、口汚い言葉を使うように | スラド

    ストーリー by reo 2013年01月15日 11時50分 fuckin-bullshit-daisy-daisy♪ 部門より IBM が開発したスーパーコンピューターの Watson が、一時的に「スマート」から「スマートアス (smart ass)」になっていたとのこと。Watson に人間味を持たせたいと考えた IBM の研究チームが、俗語ばかりを集めたオンライン辞書「Urban Dictionary」を Watson に記憶させたのだそうだ (International Business Times の記事、家 /. 記事より) 。 結果、形式張っていない自然な人間の言葉で会話できるようにという目的を大きく逸れて、下品な言葉を使うようになってしまったようだ。Watson は「時と場合」による言葉の使い分けができないため、例えば研究者の質問に答えるのに「bullshit」といっ