タグ

languageに関するnatu3kanのブックマーク (265)

  • LEIA: 言語間転移学習でLLMを賢くする新しい方法

    Studio Ousiaと理化学研究所に所属している山田育矢です。 この記事では、大規模言語モデル(LLM)の性能を向上させる新しい方法であるLEIA(Lightweight Entity-based Inter-language Adaptation)を紹介します。 LLMは言語によって性能に顕著な差があり、訓練に使われるテキストが最も多い英語において特に性能が高い傾向があることが知られています。LEIAは、LLMが蓄えている英語の知識を他の言語から使えるようにする訓練を施すことで、英語以外の言語でのLLMの性能を向上させる新しい手法です。 この度、英語・日語の2言語LLMであるSwallowの7Bと13Bのモデルに対してLEIAによる訓練を施して性能向上を行ったモデルを公開します。 ライセンスは、Swallowと同様のLlama 2 Community Licenseです。これらのモ

    LEIA: 言語間転移学習でLLMを賢くする新しい方法
  • 編集とのやり取りで「甘噛みなんて日本語はない。辞書にもない」と言われ「ナポレオンかお前は」と思った話…知らない単語を無いもの扱いされた体験続々

    松田洋子 @matuda そういや知らない言葉を無いもの扱いされたの思い出した。 「“甘噛み”なんて日語は無いですよ」て編集に言われて「いやあるから」て言っても「僕の持ってる辞書にも無いですし!」て自信たっぷりで、ナポレオンかお前はって思った。言わんけど。 あれはまだGoogleも無い時代のことじゃった。 2024-03-25 18:06:08

    編集とのやり取りで「甘噛みなんて日本語はない。辞書にもない」と言われ「ナポレオンかお前は」と思った話…知らない単語を無いもの扱いされた体験続々
    natu3kan
    natu3kan 2024/03/27
    最初は辞書になかったカバン語や合成語で世間に浸透したものなんてゴロゴロあるからなあ。
  • 「ちゃんと」「しっかり」はビジネスで使っちゃダメ? 日本語研究者の石黒圭さんに副詞の使いこなし方を聞いた - ミーツキャリアbyマイナビ転職

    「伝えることは具体的に」。これがビジネスコミュニケーションの鉄則です。 ところが、日々の仕事では、それは真逆の「抽象的」で「不明瞭」なやりとりが、そこかしこで展開されます。 上司から「『きちんと』やって」と指示されたり、「『ほとんど』できています」と報告して叱られたり。きっと皆さんも経験があることでしょう。 そして、こんな“言葉遣いで認識の齟齬が生まれる場面”に必ずと言っていいほど登場するのが「きちんと」「ほとんど」などの副詞です。 伝えることを曖昧(あいまい)にしてしまう副詞。でも、使わないわけにはいかない……。そんな状況があるなかで、私たちは副詞とどう付き合っていけばいいのでしょうか? 今回は『コミュ力は「副詞」で決まる』(光文社新書、2023年)を執筆された、日語研究者の石黒圭さんとともに、ビジネスコミュニケーションと副詞の関係性を深掘りしました。 副詞を使いこなすとコミュニケーシ

    「ちゃんと」「しっかり」はビジネスで使っちゃダメ? 日本語研究者の石黒圭さんに副詞の使いこなし方を聞いた - ミーツキャリアbyマイナビ転職
    natu3kan
    natu3kan 2024/03/14
    「ちゃんと」と「しっかり」の基準を明確化しないと何がちゃんと、しっかりなのかわからんとはなるよな。
  • 日本語でプレイするために1年間勉強を続けたという海外ゲーマーが話題に―日に4,5時間日本語に触れるという熱量 | Game*Spark - 国内・海外ゲーム情報サイト

    日本語でプレイするために1年間勉強を続けたという海外ゲーマーが話題に―日に4,5時間日本語に触れるという熱量 | Game*Spark - 国内・海外ゲーム情報サイト
  • 平安時代でも「先」と言えば「未来」を指していた

    これ面白くて、未来が自分の後ろ側にあった時代には矛盾がなかったんですよ 我々現代人は普通「未来が前、過去が後ろ」なのが当たり前だと思ってますが、昔は過去が前、未来が後ろにあったんです 全く日独自のことではなく、古代ギリシャやソマリ語など世界の地域/言語であった/あることらしいですが https://t.co/3iG9Uaqgae pic.twitter.com/hkoAEAJjB0— 重藤小藤太 (@Kotouta_Sige1) February 18, 2024 この言説は正しいのだろうか。この場合、過去に書かれた文学などにおいてどのような用法があったかを確認すればいいだろう。というわけで『源氏物語』から「先」が未来をあらわしている箇所を引用する。 わが御世もいと定めなきを、ただ人にて朝廷の御後見をするなむ行く先も頼もしげなめることと思し定めて、いよいよ道々の才を習はさせ給ふ。 「私の

    平安時代でも「先」と言えば「未来」を指していた
    natu3kan
    natu3kan 2024/02/25
    今は昔の今とか、前みたくみたいに。ベクトルの方向はくっつく言葉によって決まるような言葉ってあるよね。
  • 1日6分でOK。言いたいことを「瞬時に」言葉にするための言語化トレーニング | ライフハッカー・ジャパン

    バックパックの背中「汗」問題を解決! これを取り付けるだけで夏場でもさらっと快適【今日のライフハックツール】

    1日6分でOK。言いたいことを「瞬時に」言葉にするための言語化トレーニング | ライフハッカー・ジャパン
    natu3kan
    natu3kan 2024/02/25
    場数を踏んで要点をまとめなれてないと即座にまとめられない。短期記憶が弱いADHDだと余計にね。
  • ”車=ブーブー”などの幼児語を覚えさせるのは非効率的では?という意見に数多くの体験談&研究成果が集まる→言葉が難しいと幼児は独自の幼児語を発明するらしい

    Physalia*💯 @Pandoras_eous 幼児語、まじで嫌い 子供に後で恥をかかせるために大人がグルになって一般的でない言葉を覚えさせてるとしか思えない、悪質すぎる 百害あって一利ないだろ 2024-02-06 22:45:44 Physalia*💯 @Pandoras_eous 小学校低学年のころ友達とか大人との会話で自分の喋った言葉に変な反応される度に「ちっ、これも幼児語かよ」って語彙を改めていく手間、まじでなんだったんだ 2024-02-06 22:48:18 Physalia*💯 @Pandoras_eous 段階的にと言ってもね 例えば幼児に「くるま」が言えず「くーま」のようになってしまうとして、そこを「ブーブー」で代用していたら「くるま」の習得は遅れるばかりでしょ 「くるま」と言えるまでは、初めから別の言葉にするんじゃなくて、「くーま」からの連続的な変化を促すべ

    ”車=ブーブー”などの幼児語を覚えさせるのは非効率的では?という意見に数多くの体験談&研究成果が集まる→言葉が難しいと幼児は独自の幼児語を発明するらしい
    natu3kan
    natu3kan 2024/02/08
    脳の発育的に低年齢だと理解できない抽象的な概念が必要な言葉があるから、大きくなっても擬音の概念に転用できる幼児語って合理性ありそうなんだよね。
  • 「No, thank you.」の消滅......アメリカは日本化しているのか?

    <日でもアメリカでも、ネットを介した短いコミュニケーションで関係性を悪化させないための知恵が必要に> 日の若者がLINEなどのメッセージで「句点(。)」を一切使わないということが、話題になっています。句点無しの短い文章を区切りながら繰り出すことで、リアルタイムのコミュニケーションを取るためのようです。それが完全に定着する中で、句点を使うことが「威圧感、怒りの感情」の表現として受け取られるようにもなっているようです。 若い人たちに指摘されて気付いたのですが、実はこれはアメリカでも全く同じです。短いメッセージをどんどん繰り出してリアルタイムの交信をする場合には、ピリオド(フル・ストップとも言います)を使いません。反対に、あえてピリオドで切るとそこには「納得していない」という拒絶や怒りのニュアンスが感じられるといいます。 英語の場合は、少しバリエーションがあり。二人称の you について、い

    「No, thank you.」の消滅......アメリカは日本化しているのか?
    natu3kan
    natu3kan 2024/02/01
    冷泉彰彦。角の立たない婉曲表現の変遷。
  • 多言語話者になるための脳科学的条件――新たな言語の文法習得を司る脳部位を特定―― | 東京大学

    2024年1月19日 国立大学法人 東京大学 マサチューセッツ工科大学 一般財団法人 言語交流研究所 発表のポイント 英語スペイン語等の習得経験のある日語母語話者が、新たにカザフ語の文に音声で触れた時、その文法習得を司る脳部位を特定しました。 この新たな言語習得を司る脳部位は、これまで母語や第2言語の文法処理に関わる「文法中枢」として研究チームが特定してきた「左下前頭回の背側部」と完全に一致しました。 多言語の習得効果が累積することで、より深い獲得を可能にするという仮説「言語獲得の累積増進モデル」が、脳科学によって明確に裏付けられました。 発表概要 東京大学大学院総合文化研究科の酒井邦嘉教授と梅島奎立助教は、マサチューセッツ工科大学言語哲学科のスザンヌ・フリン教授との共同研究において、新たな言語に触れた時に「誰が、何時、何を」習得したかを司る脳部位を初めて特定しました。この研究は、一般

    多言語話者になるための脳科学的条件――新たな言語の文法習得を司る脳部位を特定―― | 東京大学
    natu3kan
    natu3kan 2024/01/21
    言語の構造を類型化して多言語を身につける言語オタクいたり、人間の多様性だよな。
  • AIにプログラミング作業を奪われている - k0kubun's blog

    せっかく10年以上かけて学んだプログラミングだが、人間がコード書くよりChatGPTにやらせた方が早いなということが度々あり、だんだん自分でプログラミングをやる時間が減ってきた。AIにコードを書かせてそれをGitHubにコピペして残りの時間は遊んでるだけで成果が出てお給料ももらえる日は近いし、段々会社もそのことがわかってきて失職する日も近い。 残念ながら現時点では全ての仕事AIで上手くいくわけではないが、どういう時に使えるかを知っておくと楽をしやすくなるので、僕がどう使っているかをまとめておく。 失職できるケース 簡単なスクリプトを高速に書かせる 僕はRubyが全ての言語の中で一番慣れており、StackOverflowやドキュメントをほぼ見ずに大抵のプログラムを書き切れるため、Rubyを書いている時がプログラマとして一番生産性が高いのだが、それでも最近AIRubyを書かせたことがあった

    AIにプログラミング作業を奪われている - k0kubun's blog
    natu3kan
    natu3kan 2024/01/19
    いま主流のAIって、この文や形式の次にはこれが来そうみたいな、過去のお約束の確率が高い組み合わせでしかないのに意思があるように見えるの面白いよね。
  • なんでcasualがカジュアルでcasualtyが死傷者なんだよ わけわからん

    なんでcasualがカジュアルでcasualtyが死傷者なんだよ わけわからん

    なんでcasualがカジュアルでcasualtyが死傷者なんだよ わけわからん
    natu3kan
    natu3kan 2024/01/08
    連想される意味に転用されてそっちがメインになって定着するの言語の面白さだよな。可惜しと新たしみたいな似た音が混同されて、新しいになるみたいなのもあるし。
  • こういう表現がすごく苦手

    例えば「増田に投稿をされたことがある方以外はチェック不要です」という文面。 つまり”増田に投稿したことがあるならチェックを付けよ”ということ。 例えば「5千円超の場合は申請が必要です」という文面。 つまり"5千円ジャストの場合は申請は不要である"ということ。 目に見えてる文面の”逆”をアタマの中で想像するのが苦手。 なんか行政の文書に多い気がする。 「増田に投稿したことがある方はチェックをしてください」とか 「5,001円以上の場合は申請が必要です」とか、 見たままのとらえ方をすればいい書き方をしてくれればいいのに。

    こういう表現がすごく苦手
  • まるで人間と会話「ChatGPT with voice」が無償公開 「語尾に“にゃん”と付けて」とお願いしたら気まずくなった

    OpenAIが提供する対話型AIChatGPT」のアプリ版(Android、iOS)で、まるで人間と会話しているように受け答えする音声対話機能「ChatGPT with voice」が無償の一般ユーザーでも使えるようになった。 ChatGPTのアプリを開き、右下にあるヘッドフォンのアイコンをタップすると音声による対話を始められる。初期設定時は5種類の声から任意に選べ、後から変更も可能だ。 画面を見ずにハンズフリーで会話できる他、ユーザーが発した言語を自動認識して返答する。設定で主な言語を設定すると、より認識精度が高まる。やりとりした内容はテキストで後から確認できる。 ChatGPTはもともと人間と対話しているような返答をする。これに声が付くことで、より一層に人と会話しているような感覚を覚えるだろう。実際に試してみたところ、独特なイントネーションがある日語が達者な外国人と話しているよう

    まるで人間と会話「ChatGPT with voice」が無償公開 「語尾に“にゃん”と付けて」とお願いしたら気まずくなった
    natu3kan
    natu3kan 2023/11/25
    お年寄りの話し相手に良さそう
  • ChatGPTのアプリ版すごくね!?

    モバイルアプリ版に実装されてる音声入出力機能が無課金ユーザーにも開放されたってニュースを見て貧乏人の俺は早速ダウンロードしたわけね。 英会話の練習に使えるみたいなニュースを見てたから興味津々でトライしたわけよ。 そしたらまあ俺の英語力では話すのも聞き取るのもままならず、到底使いこなせる”域”に達してねえなこりゃ、と早々に自分に失望したよ。 はあ、アンインスコするか・・・と思いながら設定ちょろちょろ弄ってたら「Speach」の欄にMain Languageって項目があって、そこがAuto-Detect(自動検出)になってたんよね。 あっこれのせいか!俺の英語力が悪いからじゃなかったんだと思って、Englishに切り替えてもう一回やってみたわけ。 そしたら案の定結果は変わらずさらに落ち込んだ。 で、もうどうでもいいやと思いながら日語で適当に話しかけたんだよ。 そしたら! なぜか俺が日語で話

    ChatGPTのアプリ版すごくね!?
  • 「奥さん」呼びは時代遅れ…じゃあ「妻さん」と呼ぶの? 言語学者が提案する既婚女性の“新しい呼び方”とは?<11月22日いい夫婦の日> | 集英社オンライン | 毎日が、あたらしい

    「奥さん」という言葉には、ネガティブなイメージを持つ人もいる。その理由としてよく挙がるのが、「家の奥にいる人」という前時代的な意味合いで、家族のために掃除や洗濯、料理といった家事をせっせとこなす姿を連想させるというものだ。 「まずは『奥さん』がどのように広まっていったのか、歴史的に見ていく必要があります」 東京外国語大学・名誉教授の井上史雄さんが話す。 「江戸時代の長屋のように家が狭いと玄関を上がってすぐに行き止まりで、家の奥はありませんよね(笑)。『奥さん』とはもともと、広い屋敷に住んでいる武家、それも身分の高い人にだけ使われていた言葉なんです。 今でも、代々続いている商店や旅館では『おかみさん』と呼ぶように、商家では『おかみ』が使われていました。農家では、『かあちゃん』『おっかさん』『かかあ』など。その呼び方は豪農や自作農、小作農でも分かれていたようです。 ところが戦後、高度成長期にサ

    「奥さん」呼びは時代遅れ…じゃあ「妻さん」と呼ぶの? 言語学者が提案する既婚女性の“新しい呼び方”とは?<11月22日いい夫婦の日> | 集英社オンライン | 毎日が、あたらしい
    natu3kan
    natu3kan 2023/11/23
    お連れ様も、私は連れても、連れられてもいない主従みたいなニュアンスを感じるとはなりうるよな。
  • 「なるほど」って目上の人に使うと失礼ですか? 国語辞典の編纂者・飯間浩明さんに“本当のところ”を聞いてみた​​ - ミーツキャリアbyマイナビ転職

    「なるほど」は目上の人に使っちゃダメだよーー。こんな指摘を上司や先輩に受けたことのある方も少なくないでしょう。 昨今は、言葉遣いに関するビジネス書やWebサイトでも、しばしば同様の意見に出会います。SNSなどには、特に目上の人と話すとき、どんな相づちを使えばいいのか判断に困ってしまう、といったビジネスパーソンの声も数多く寄せられています。 そもそも「なるほど」ってそんなに「失礼」な表現なのでしょうか。「なるほど」に代わる便利な相づちってあるのでしょうか。そんな素朴な疑問を、今回は国語辞典の編纂者で言葉のプロである飯間浩明さんにぶつけてみました。 インタビューで語られたのは、「なるほど」の語源から、言葉や表現一般に対する飯間さんのスタンスまで、実に幅広いトピックです。この記事を読んで、日々の言葉遣いを振り返るきっかけにしてみてはいかがでしょうか。 飯間浩明(いいま・ひろあき)さん。1967年

    「なるほど」って目上の人に使うと失礼ですか? 国語辞典の編纂者・飯間浩明さんに“本当のところ”を聞いてみた​​ - ミーツキャリアbyマイナビ転職
    natu3kan
    natu3kan 2023/11/09
    多用しすぎて慇懃無礼になるとは、なるほどですねー。敬意漸減の法則、なるほどなるほど。
  • 「真逆」はなぜ広まったのか(前編)

    「真逆」という言葉は、毎日新聞で確認できる限りでは1998年から見られる歴史の浅い言葉ですが、急速に拡大しました。反発も根強いのですが、なぜこの言葉は昔にはなく、最近広まったのでしょう。前後編で掘り下げて考えます。 9月に出た毎日新聞校閲センター著「校閲記者も迷う日語表現」(毎日新聞出版)は、主にこのサイトの「質問ことば」から厳選して構成されています。今回はその中から「真逆」という語について掘り下げてみます。稿の筆者・岩佐の個人的見解が含まれることをご承知おきください。 定着進むが言い換えを推奨 「真逆=まぎゃく」は2004年の新語・流行語大賞にノミネートされたように歴史の浅い語ですが、一気に広まりました。この「質問ことば」のアンケートでも「使う」が18年に55%、23年に58%と過半数です。「定着した」は18年77%、23年83%と、浸透ぶりが表れています。 23年2月のNHK調査で

    natu3kan
    natu3kan 2023/11/08
    偶(たま)さか。関連:東海テレビ|空言舌語(https://www.tokai-tv.com/kuugenzetsugo/20051230_takai_6666.php) 京極夏彦が魍魎の匣でマサカ多用(https://yourei.jp/%E7%9C%9F%E9%80%86)。遡ると海野十三の蠅男もマサカ。マギャクの用法の始まりは?
  • 認知言語学から小説の面白さに迫る『小説の描写と技巧』

    小説の面白さはどこから来るのか? 物語のオリジナリティやキャラクターの深み、謎と驚き、テーマの共感性や描写の豊かさ、文体やスタイルなど、様々だ。 小説の面白さについて、数多くの物語論が著されてきたが、『小説の描写と技巧』(山梨正明、2023)はユニークなアプローチで斬り込んでいる。というのも、これは認知言語学の視点から、小説描写の主観性と客観性に焦点を当てて解説しているからだ。 特に興味深い点は、小説の表現描写が、人間の認知のメカニズムを反映しているという仮説だ。私たちが現実を知覚するように、小説内でも事物が描写されている。 認知言語学から小説の描写を分析する 通常ならメタファー、メトニミーといった修辞的技巧で片づけられてしまう「言葉の綾(あや)」が、ヒトの、「世界の認知の仕方」に沿っているという発想が面白い。これ、やり方を逆にして、認知科学の知見からメタファーをリバースエンジニアリングす

    認知言語学から小説の面白さに迫る『小説の描写と技巧』
    natu3kan
    natu3kan 2023/11/04
    風景描写ってカメラの視点みたいだと言われると確かに。
  • 後輩『すみません、ねじが壊れちゃいました...』先輩『ん?(ねじが)なめてんの?』後輩『すみません...』先輩『だからなめてんのって』後輩『本当にすみません...』

    ちょこ西 @chocolate_noise 後輩『すみません、ねじが壊れちゃいました...』 先輩『ん?(ねじが)なめてんの?』 後輩『すみません...』 先輩『だからなめてんのって』 後輩『当にすみません...』 という会話を聞いたのを思い出して笑っちゃった 自分も気を付けないと言っちゃいそう 2023-11-01 15:21:26 ちょこ西 @chocolate_noise そもそも、ねじがなめる(ねじ穴がつぶれて広がって回せなくなる)ってどの分野の人なら通じるんだろう、工学系なら通じると思ってたけど、実は機械系にしか伝わらないのかな 2023-11-01 15:24:49

    後輩『すみません、ねじが壊れちゃいました...』先輩『ん?(ねじが)なめてんの?』後輩『すみません...』先輩『だからなめてんのって』後輩『本当にすみません...』
    natu3kan
    natu3kan 2023/11/02
    ネジ山がなめるとかバカになるは大工や設備系の業界用語みある。人を軽く見ることもなめるっていうのも業界用語が一般化したような例外的な用法な感じ。ネジ山を切ったり立てたりとかも経験ないとピンと来ないよね。
  • 「履歴書の字が汚いと採用で不利」は本質的じゃないと思ってたけど「使用言語:swift」って表記を見たときはそこで人を判断しそうになった

    kumamo_tone @kumamo_tone iOS/Android/Flutter developer at YOUTRUST Inc. (ex. Merpay, Yahoo! JAPAN) kuma.dev kumamo_tone @kumamo_tone なんだろう、履歴書の字が汚いと採用で不利になるみたいなのナンセンスとか思ったりする割に、いざレジュメ見る立場になったとき「使用言語:swift」って表記見て「まともなエンジニアがそこ小文字にするか…?」って全然質じゃないところで人を判断しようとした自分に驚いたんですよね 2023-10-25 01:36:36

    「履歴書の字が汚いと採用で不利」は本質的じゃないと思ってたけど「使用言語:swift」って表記を見たときはそこで人を判断しそうになった
    natu3kan
    natu3kan 2023/10/26
    履歴書の字が汚いの文字の勉強を他の所に投入した秀才以上か、文字の教育をスルーしてた怠け者か割れるからなあ。仕事だと適した表記で記入する人もいるし履歴書の表記ごときで他人を見抜けるかっていうと運。