ベイカレントのサマーインターンシップでは、大手外資ファーム出身の戦略コンサルタントのアシスタントとして、スピード感溢れる戦略コンサルティング業務を体感していただきます。 事業会社としても急成長している当社ならではの事業経営の神髄も垣間見ながら、企業経営戦略をシミュレートしていただきます。 なお、短期間でのアウトプットを目標とするため、精神的・肉体的にタフなプログラムであることが予想されますが、皆さんに大きな成長を実感していただける内容となっております。 <具体的には> 戦略コンサルタントチームを結成し、特定の業界を題材にして、実現可能性の高い企業経営・成長戦略を1週間かけて企画、提案いたします。 また、企業の経営課題を解決する為に、ロジカルシンキングや問題解決手法、各種フレームワーク等を活用していただきます。 そして、最終日は当社役員に対してプレゼンテーションを実施していただき
4月からPFIで働いてます。海野です。 今日は単語の話をします。読み物的な話なので軽く読んでください。 テキストデータなどの自然文を機械処理するときには、まず最初に単語に分割するということをよく行います。一般的にはMeCabやChasenといった形態素解析エンジンに投げて行います。形態素と単語の区別という話もあるのですが、ここでは大雑把に「連続した文字列の単位」くらいの意味で話します。 検索という文脈ですと形態素インデックスという言葉がありますが、これは検索の最小単位を文字単位ではなくて形態素の単位にするということです。例えば「東京都」は「東京」「都」に分かれるため、「京都」というクエリに対して見つかるのを防ぐなど、精度を上げる効果があります。反面、深刻な検索漏れを引き起こす可能性があるため嫌われることが多いです。こうした漏れは検索に限らず、テキストマイニングなどの文脈でも問題となることが
Unixで、テキスト中にマッチする単語の「個数」を数えたいです。 Perlとかで書けば出来ますが、grepとかwcとかをうまく使えば、コマンドだけで簡単に出来そうな気がするのに、思いつきません。 簡単に出来る方法を教えてください。
入力\(x\)から出力\(y\)への関数を学習する機械学習の中で、出力が構造を有している問題は構造学習(Structured Output Learning)と呼ばれ、自然言語処理をはじめ、検索のランキング学習、画像解析、行動分析など多くの分野でみられます。 今回はその中でも複数の構造情報を組み合わせても効率的に学習・推論ができる双対分解による構造学習について紹介をします。 # 構造学習についてよく知っているという方は双対分解による構造学習のところまで読み飛ばしてください。 構造学習の導入 構造を有した出力の例として、 ラベル列 (品詞、形態素列の推定、時系列におけるアクションの推定、センサ列) 木 (係り受け解析における係り受け木、構文解析木、談話分析、因果分析) グラフ (DAG:述語項構造による意味解析 二部グラフマッチング:機械翻訳の単語対応) 順位付集合(検索における順位
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く