まぎらわしい言葉。 間違えやすい言葉あるよね。 大人になってもうっかり覚え間違えること、あるよね。 お年を召したかたが、Excelをマクセルと言ったり、エクセス、っていうのはよくあるよね。マクセスって言われても大体解るけど、エクセラになると、もうすでに飲み物だよね。 インストールをインストロール、イントンロール、「ほらソフトをクルクル回すあれよ」と、ジェスチャー付きで説明してくれるってことは、ロール部分だけ覚えて言っていると思うんだけど、インストールに「ロール」はないね。 でも、全然笑えないよね。 マツコデラックスだって、デラックスマツコって言っちゃうことあるよね。・・・それは、どっちでもいいか。 [広告] アボカド【avocado】 ○アボカド ×アボガド 最初ね、絶対アボガドって、言ってたと思うのよ。みんな。 で、あるときから「あれはアボカドだからね(ドヤ顔)」になったと思う。カドもな
難易度の規準には、小中高大の教科書127冊から抽出した1478サンプル、約100万字のコーパス(教科書コーパス)を用いています。 プログラムは、まず、それぞれの難易度に対する尤度を、連続する2文字の生起確率(文字bigram)に基づいて計算します。 得られた尤度のうち、最大の尤度をとる難易度が、求める難易度となります。 実際の難易度の計算は、もう少し複雑です。 あるテキストに対して、文字の生起確率から計算された13個の尤度を難易度順にプロットしたのが、下のグラフの点線です。 理想的には、なめらかな曲線を描くはずですが、実際には、そうはなりません。 そこで、これら13個の値に対して、スムージングを適用します。 スムージングによって得られた結果を、青線(4次多項式)および赤線(2次多項式)で示しています。 スムージングを適用した結果に対しても、最大の尤度をとる難易度を求めます。 こうして、難易
私が日本語入力について思っていることを書いてみる。 自分としては、デフォルト以外の日本語入力システムとして、ATOK と Google 日本語入力ぐらい(まあ、Baidu IME とかもあるが)しかないのが心の底から残念でたまらない。 雑誌の特集などで、Google 日本語入力と ATOK に単語や文章を変換させて精度を比較しているものを見かける。まあ総合的には同じぐらいの結果になっている。だが、実際に長い間使っているとわかるのだが、Google 日本語入力の間違え方のほうが「理不尽」なのだ。どうしてこれがこうなる? と思わず言いたくなるような。その点、ATOK は弱い部分が前もってわかる。アニメやゲームなど、マニアックな変換には弱い。しかし、ATOK である程度日本語の文章を打ち慣れた人にとっては、そういう「難しいだろうな」と思うようなところは、打つ前からそのことがわかるものだ。 ATO
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く