タグ

考察と言語に関するsnjxのブックマーク (18)

  • トキポナ - Wikipedia

    一般的に、アクセントは単語の先頭の音節に置かれる。 音素の分布[編集] 統計的な母音の分布は、他の言語と比較するとかなり典型的である。単語を1回ずつ数えると、母音の32%が/a/、25%が/i/、15%強が/e/と/o/、10%が/u/である。10kBのテクストでの使用頻度はわずかに偏っており、/a/が34%、/i/が30%、/e/と/o/がそれぞれ15%、/u/が6%であった。 音節頭の子音のうち、/l/が最も一般的で、合計20%を占める。/k、s、p/が10%を超え、鼻音/m、n/(音節末のnは含まず)が続き、/t、w、j/が最も少なくそれぞれ5%強であった。/l/の頻度が高く、/t/の頻度が低いのは、世界の言語の中でもやや珍しい特徴である。[独自研究?] 文法[編集] 品詞[編集] 文脈によって単語の品詞が決定されるものが多く、あいまいさが大きい。 名詞[編集] 地名や言語名は修飾語

    トキポナ - Wikipedia
  • 大規模言語モデルの驚異と脅威

    2022年11月にOpen AIが公開したChatGPTが世界で注目を集めている。一般ドメインかつ多言語で、従来のチャットボットとはレベルの異なる高品質の対話をリアルタイムに実現するサービスを(Research Preview版ではあるが)無料で提供し、検索、金融、広告、教育、法務などの広範囲な分野の転換点となり得ることは、驚異的なことである。講演では、ChatGPTがベースにしているInstructGPTを中心に、大規模言語モデルやプロンプト、人間のフィードバックによる強化学習などの技術を概観する。また、ChatGPTのような生成型の人工知能が社会やビジネス、学術にもたらす脅威について述べる。 https://aip.riken.jp/sympo/sympo202303/

    大規模言語モデルの驚異と脅威
  • 野尻抱介の「ぱられる・シンギュラリティ」第17回 嘘つきは創造の始まり│ケムール

    007巻き方小津安二郎小説小野繙山ゴハン山梨ソロキャンプアワード山田勇魚川奈まり子工芸作家市川海老蔵対策幌倉さと平塚年齢制限店舗庭ゴハン廃番弥富マハ彫刻家彫金小林圭輔対処法御徒町奇才紳士名鑑増税変え方多崎ろぜ大園恵実大庭繭大手失われた青を求めて失敗女性向け寄木女流雀士女郎蜘蛛姉の結婚安い安さ実話怪談宮台真司家庭家族影響徹底坂上秋成旅行/レジャー故障教えて!「聖蘭(せいら)20歳」さん斜線堂有紀新作新幹線方山敏彦方法旅行星をみるひと改善映画時間暇つぶし書評最新月曜日のたわわ有楽町有限会社ファクタスデザイン朝藤りむ改正採用怖い話手塚大輔怪談怪談一服の集い恋は光成人成年年齢引き下げ成長戦野の一服手作り手巻きたばこ掌編小説手巻きタバコ手書き地図手順投稿怪談投資持ち方持ち込み捨て方掃除境貴雄地図木原直哉体験記付け方会津木綿伝説の92住宅ローン佐々木 怜央佐々木亮介佐々木愛実佐藤タイジ作家今日のほごに

    野尻抱介の「ぱられる・シンギュラリティ」第17回 嘘つきは創造の始まり│ケムール
  • CUE言語(cuelang)に入門しよう

    Abstruct 記事においては、The CUE Configuration Languageを用いて設定ファイルを記述することはどのようなメリットがあるのか。また、どのような使い方が想定されるのかについて議論する。 私は、実際の開発現場において、各マイクロサービスチームがKubernetesのManifestを生成するテンプレートとして活用している。 そのため、KubernetesのManifestをcuelangを用いて記述している。(この件に関する記事は現在執筆中だ。) その経験から、CUE言語がどのような言語であるかについてここで述べることにする。 Keyword: CUE, cuelang, configuration, 設定記述言語, JSON, YAML, Kubernetes, manifest Introduction あなたは普段どんな設定記述言語を利用しているだろう

    CUE言語(cuelang)に入門しよう
  • Introduction | Cuetorials

  • 【徹底解説】『メッセージ』に隠された世界観の変容を物理学研究者が読み解く | Fan's Voice | ファンズボイス

    記事には映画『メッセージ』のネタバレが含まれます。 まずは簡単に『メッセージ』のあらすじを復習しておこう。 突如地球の各地に来訪した楕円状の黒い宇宙船。地球外生命体の訪問と人類は気づき、彼らとの意思疎通を図るため、世界的言語学者のルイーズ・バンクス(エイミー・アダムス)が派遣された。始めは、地球外生命体「ヘプタポッド」が扱う異質な言語の難解さに気が滅入っていたルイーズだったが、学ぶにつれて言語が内包していたヘプタポッドの世界認識を理解していく。人間は「原因が結果を生み出す」というように因果論的に世界を認識しているが、ヘプタポッドの認識は過去・現在・未来を同一視する、いわゆる同時的認識様式に基づいていた。同時的認識様式を獲得したルイーズは、自分の娘の死が未来に待ち構えていることを知りながらも、後の夫となる物理学者のイアン・ドネリー(ジェレミー・レナー)と共に過ごしていくことを選択する。い

    【徹底解説】『メッセージ』に隠された世界観の変容を物理学研究者が読み解く | Fan's Voice | ファンズボイス
  • Variables · The Julia Language

  • 西暦2018年を他の元号で表すと2561年?4351年?それとも1439年? - QR Translator

    は今年西暦2018年(平成30年)を迎えましたが、来年には元号が変わると話題になっています。 先日、QR Translatorのコンテンツを制作していると、「クーポンの有効期限は2018年までです。」というテキストがありました。日語の他にも英語や簡体字、繁体字や韓国語などの多言語展開をしていた為、他の言語を見比べていると、なんとタイ語だけ数字部分が「2561」になっていました! タイ語だけ年号の数字部分に誤りがあったのかと思い、念の為調べてみたところ、タイには「タイ太陽暦」といった独自の換算方法が用いられていることが分かりました。 日でも西暦とは別に和暦(現在は「平成」)が使われていますが、他の国でも独自の表示が使われていることがあるようです。 元号(げんごう)は、特定の年代に年を単位として付けられる称号である。年号(ねんごう)とも呼ばれることもあるが、元号のみならず、紀年法の名称

    西暦2018年を他の元号で表すと2561年?4351年?それとも1439年? - QR Translator
  • ぼくたちのかんがえたさいきょうのi18n国家

    記事は下記のtweetから始まるスレッドに触発され、@qnighyや@na4zagin3からアイディアを拝借して書いた。 i18n力が最強の国は国内に複数の言語があり、そのうちいくつかは他国でも使われている言語の方言で、1バイト文字での代替表記が困難で、歴史的にISO-2022ベースの文字コードとUnicodeと独自エンコーディングが混在していて、フリガナなどの特殊な組版規則があり、右書き左書き縦書きを併用し、 — Masaki Hara (@qnighy) 2018年8月6日 皆さんのおかげで最強のi18n国家が建設されつつある。一瞬で滅びそう — Masaki Hara (@qnighy) 2018年8月6日 長い前置き ソフトウェアのi18nは難しい。自文化では当たり前と思っていてハードコードしてしまった仮定が崩れて、大幅な再設計を余儀なくされるからだ。気づいて再設計できればまだ良

    ぼくたちのかんがえたさいきょうのi18n国家
  • 「Javaの方針転換」リスクに関する考察 - Qiita

    Java捨ててC#にでも振ったほうがいいのかなあ」 なんて聞かれ、 「nodeとかあるしJSのがまだマシじゃないすかね、というかOracleから逃げた結果がMS行きってどうなんすか」 とか答えたあと、もう少し考えてみたほうが良さそうだなあ、と思ったので考えてみる。 なお、筆者は諸事情でこれまでJava仕事が多かった人種ではあるものの、基的にJava嫌いかつOracle嫌い1であるため、考察には強いバイアスが掛かっている可能性が高いことを申し添える。 TL; DR 「Javaは捨てたほうがいいんじゃないのか」という発想は間違っていないが、性急、または手遅れである。 そもそも特定言語一で行くような無茶をしてはならない。また今回みたいなことになりたいんでなければ。 Javaの強み 「Javaの強みはなんですか?」 たぶん、Javaの草創期は「オブジェクト指向」が上がったのではなかろうか。

    「Javaの方針転換」リスクに関する考察 - Qiita
    snjx
    snjx 2018/07/03
    「極めて限定的な一地方 (具体的には島根県) を拠点とするなら、場合によっては政治的に強力かもしれない」
  • Javaを使うなら知っておきたい技術、フレームワーク、ライブラリ、ツールまとめ

    Javaの開発と言っても、各種ミドルウェアやフレームワーク、ライブラリ、ツールなどが豊富にあり選択に悩むことは少なくないと思います。 そこで関連技術のインデックスになればと作成しました。 あくまで知っている範囲で記述しているので、コメントしてもらえれば随時追加します! すべてを書くと膨大な量になるため、現状採用が減ってきているものや、そもそもあまり採用されていないもの、後継があったり、類似のものと比較した場合に明らかに劣っているものは省いています。 ちなみにライブラリには高機能なものも多いので、分類は参考程度にご覧下さい。 サーバ系 Apache HTTP Server 世界中でもっとも多く使われているWebサーバ。 nginx フリーかつオープンソースのWebサーバで、処理性能・高い並行性・メモリ使用量の小ささに焦点を当てて開発されている。 Tomcat Java ServletやJSP

    Javaを使うなら知っておきたい技術、フレームワーク、ライブラリ、ツールまとめ
  • Rubyのtrueとfalseの話 - Qiita

    この記事は、技術同人誌としてまとめるはずだった原稿をほぼそのまま転載しています。諸事情により向こうかなり長い間同人誌即売会に売り手として参加することが難しくなったためです。 長いですが、お楽しみいただければ幸いです。 まえがき このは、Rubyコミッタである卜部昌平に、そのである私、卜部一恵がRubyのtrueとfalseについて突っ込んで聞いてみた話です。文は両者の対話形式で進んでいきます。 私は昌平と同じ大学同じ研究室に所属していたのでプログラミングについての基礎は一応ありますが、エンジニアとして職を得たことはありません。つまり、プログラミング初級者です。このはそのくらいのレベル感のだと思います。 私自身が初級者なりにRubyを使っていて、if文が思った通りに動かない、そんなときに抱いた疑問からこのが生まれました。 同じような疑問を抱いている方の一助になれば幸いです。 は

    Rubyのtrueとfalseの話 - Qiita
  • 絵文字がある種のUnicodeバグを世界から一掃しつつある件について|Rui Ueyama

    UnicodeのUTF-16エンコーディングではほとんどの文字(コードポイント)は2バイトで表現されるが、Unicodeに後から追加収録された文字の多くは4バイトで表現される。4バイト文字がうまく扱えないプログラムというのはわりとよくある。しかし世界中で広く使われるようになった絵文字がよりによって4バイト文字であるせいで、そのような文字が扱えない問題がよいペースで解決に向かいつつある。それについて少し説明してみようと思う。 Unicodeが80年代から90年代初頭にかけてデザインされたときの目標の一つは、Unicodeに含まれる文字数を65536個以内に収めることだった。現代の文章を実用的なレベルで表すためには、漢字などを含めてもそれだけの種類の文字があれば十分だと考えられたのだ。当然これは1文字を2バイトで表すことを念頭に置いていた。つまりコンピュータの揺籃期から当時に至るまで単純に英語

    絵文字がある種のUnicodeバグを世界から一掃しつつある件について|Rui Ueyama
    snjx
    snjx 2017/11/13
    かくして、世界中の人間が表意文字を使うようになったのだ。
  • 日本語しかわからなくても大丈夫!多言語対応の前に学びたい「やさしい日本語」表記のポイント

    店舗や施設を利用する顧客は、母国語として日語を話せる日人だけではありません。 日に在住している外国人のなかには、簡単な日語はわかっても難しい文章は理解できないという方もいるでしょう。 せっかくホームページやSNSを使って情報発信していても、日語が理解されずにトラブルになったことがある企業もいるかもしれません。 しかし*「英語中国語も話せないし、翻訳にお金はかけられない」*という方もいるでしょう。そんな方にとって、取り組みやすいのが「やさしい日語」 による表記です。 今回は「やさしい日語」とは何か、また表記のポイント5つを紹介します。 「やさしい日語」とは、難しい日語を避け、わかりやすい日語で表記する方法で、災害時の情報発信を中心に行政でも取り入れられています。 ぜひこの機会に表記のポイントを学んで、きちんと顧客に伝わる情報発信を行っていきましょう。 「やさしい日語」

    日本語しかわからなくても大丈夫!多言語対応の前に学びたい「やさしい日本語」表記のポイント
  • 人工言語アルカ

    はじめに アルカは人工言語の一種です。 同時に、人はゼロから言語を作ることができるのか、またどこまで精巧に作り込むことができるのかという、人文科学・哲学・言語学的な挑戦です。 アルカは英語や日語など既存の言語から単語を一切借用せず、エスペラントなどとは違い完全に無から作られています。 それをどこまで人間用の言語レベルにまで近づけられるのか。 そして、人はその言語を使って何もないところから文学を生み出せるのか。 アルカの活動はWikipediaに似ています。 辞書の登録語数、記事の詳しさ、正確さ。これらがその言語の作りこみ、使い勝手を左右します。 そしてアルカはWikipediaのように様々な人が単語を作ったり記事を書いたりすることで発展しています。 Wikipediaを編集する感覚でお気軽にご参加ください。(→アルカの辞書) また、他にもプロジェクトを企画しております。皆様のご参加をお待

  • プログラミングのパラダイムをちょっと考えてみた | システム設計日記

    私が仕事で使っているプログラミング言語は、最近は Java ばかり 。 SQL は、昔は得意技の一つだった。最近はほとんど書いていない(人まかせ)。 HTML, CSS, JavaScript は、画面まわりで必要なので、いちおう書く程度。 XML は、各種の定義ファイルやデータ交換形式として使うが、サンプルの写経レベルだな。 スクリプト言語だと、groovy を年に数回は使う。 プログラミング言語の遍歴 過去に仕事で使ったことがあるプログラミング言語を並べると、 Z80アセンブラ C言語 Lisp Prolog Visual C++ C# PL/SQL ... ベターなアセンブラとして、C言語にのめり込み、C++ のわけのわからなさに挫折し、人工知能の研究プロジェクトで、Lisp と Prolog を使っていろいろ試作して、オラクルに転職してから数年間 SQLと PL/SQL の世界にど

  • Google先生が教えてくれた日本におけるFacebookの利用の実態 - もとまか日記

    憶測で物を語るのが3度の飯より好きな、ネットの実名「もとまか」です。でも辛子明太子の方が好きです。 さて、先日Facebookについて以下の記事を書きました。 Facebookが楽々と世界で普及していった当の理由 この記事にはたくさんの方からTwitterで反応を頂きました。ありがとうございますm(_ _)mFacebookのこと書いてるのにTwitterからってのがインターネットは相変わらず面白いなぁと思いました。 でも、実は私にはまだモヤモヤした感が残ってたんです。それが、以下のこと。 そうです、あのFacebookに関するGoogleトレンドの結果。この記事のGoogleトレンドへの言及部分は、来筋から言えば外しても構わなかったんですが、この図に気がついてしまって、その意味するところが理解出来ず、どうしても気になったので入れてみたわけでした。 決して別記事にするのが面倒くさかった

    snjx
    snjx 2011/02/19
    素晴らしい考察
  • 書籍出版 双風舎:【連載】「脳は心を記述できるのか」第3信 「人間」と「言語」、あるいは偶有性のアスペクト

    斎藤環から茂木健一郎への手紙 ■はじめに 茂木さん。2年半のブランクを経て、この往復書簡がゾンビのごとく蘇ったことを、とりあえずはどう受けとめたものでしょう。 ずっと涙目で返信を待ち続けていたものの、私はこの往復書簡はとうに終わったものと考えていました。返信がいただけなかったのは、とても悲しいことではありましたが、その事実もまた「茂木健一郎」という人物の一側面であることを示しえたと考えて、それで満足することにしたのです。 もっともこの企画、茂木さんによるガン無視パフォーマンスによって世間的に有名になったというところもあって、私もずいぶんとおもしろい経験をしました。 いろんな媒体から取材を受けました。たくさんの人たちから「無視されてかわいそうに」と同情していただきました。なかでも、さる著名ミュージシャンは、この企画が往復しないほうに賭けてずいぶん儲けたということで、お礼にとごちそうしてくれま

  • 1