タグ

研究に関するUDONCHANのブックマーク (28)

  • 二十代で研究者人生をダメにするための"論文"の読み方

    二十代の人が、研究者人生を棒に振ってしまうためのフラグの立て方は色々あるが、そのなかでも有名なものの一つに「悪性の論文調査」というやつがある。若いうちから、アカデミズムの海で実験結果を誤魔化すような処世術を身につけたり、捻れた教科書や論文との付き合い方を覚えてしまったりした人は、まぁ、あとあと難しいだろう。 研究者人生をダメにするための“論文”いろいろ では、研究者人生を棒に振るような“悪性の論文調査”とはどういうものか。色々なパターンをみかけるなかでも特に頻度の高いもの三つを、書き残しておこうと思う。 ・研究分野を色眼鏡で眺めるために論文を読む 目の前の実験結果なり、自分が置かれているポストなりが気に入らなくて、それを色眼鏡でみる為に論文調査に耽溺するタイプ。このタイプの人は、実験装置のややこしさや理論の不完全性を承知しながら注意深くモデルを適用してみようという姿勢になりにくく、むしろシ

    二十代で研究者人生をダメにするための"論文"の読み方
  • aki note » フィールドワーカーに学ぶノートのとりかた

    フィールドワーカーに学ぶノートのとりかた総合地球環境学研究所の阿部健一先生のお話を聞いて、世界各地のお話もおもしろかったのですが、個人的には断片情報に溺れていてこれをどうにかしたい研究をしていることもありフィールドノートの話とてもおもしろかったです。 というわけで、フィールドワーカーに学ぶノートの取り方をまとめておきたいと思います。 阿部先生は小さいフィールドノートと大学ノートを使っていて、まとめ用の大学ノートの実物を見せていただきました(^^) フィールドノートにその場で見聞きしたことを描写して、一日の終わりに大学ノートにまとめるそうです。このまとめ作業を怠ったら駄目で、さらに読み返して反芻することがとても大事。みんなで見ながら当時の話をしてくれる先生はとても楽しそうで、これを開くとぱっと記憶が読みがえってくるそうです。 大学ノートはまとめ用で、フィールドノートの切れ端やパンフレットや地

  • 研究が面白い理由(2) - Ockham’s Razor for Engineers

    理論、文献に携わる時は、静かにひとりで考える時間が大切。計算プログラムを組むときも同じ。頭にスイッチがあって、スイッチがはいると思索の部屋にひきこもることができる。この静かな時間が結構好き。わからないことが続くと、結構苦しい時間でもありますが。ときどき論理がつながると、天上から光がさしこむ瞬間がある。

  • HTML::ExtractContent - An HTML content extractor with scoring heuristics - metacpan.org

    NAME HTML::ExtractContent - An HTML content extractor with scoring heuristics SYNOPSIS use HTML::ExtractContent; use LWP::UserAgent; my $agent = LWP::UserAgent->new; my $res = $agent->get('http://www.example.com/'); my $extractor = HTML::ExtractContent->new; $extractor->extract($res->decoded_content); print $extractor->as_text; DESCRIPTION HTML::ExtractContent is a module for extracting content fr

  • HTMLから本文を抜き出せるモジュールHTML::ExtractContent - perl-mongers.org

    This domain may be for sale!

  • Webstemmer(クローラーツール)

    語サイトでは、具体的な性能は測定していませんが、 以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞 日刊スポーツ 信濃毎日新聞 livedoor ニュース 使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。 取得したページのレイアウトを学習する。 別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。 ひとたびサイトのレイアウトを学習してしまえば、 あとはレイアウトが大きく変更さ

    UDONCHAN
    UDONCHAN 2009/02/17
    mv: overwrite `urldb'? y
  • 卒論発表会 - yaotti's diary

    計算機科学コースの卒論発表会に行き,12人くらいの発表を見てきた. そのとき感じたことを,短いけれどもまとめておく. その研究の意味は何?それは○○大学生が卒研でやることなの? 卒研はアプリケーション作成ではない 人力/主観で有用性を判定してはならない 例えば新しい検索アルゴリズムを考えたとして,得られたデータが良いか悪いかの判断(基準)は慎重に行わなければならない. 「僕が/私が良いと思いました」は信頼性が低いので,できる限り数値で示す. 局所最適解になっていないか?/汎用性の有無を自分で認識しているか? 「サンプル数が少ないためにうまくいっている」わけではないことを示す. 汎用性が有ることを示さず,あたかも汎用性があるかのように言ってはならない. これは突っ込まれると痛い. 全体を通して,「卒論ってこの(ry」「事前に思ってたぐらいのレベルかな」というところ. (自分の時はできなくて泣

    卒論発表会 - yaotti's diary
  • 広告を見せるなら、シングルカラムだろう - カナかな団首領の自転車置き場ダイアリー

    ブログとか。どうやって広告を見せるかという話。 文の右側や左側に広告を突っ込む 2 カラムとか、文が広告に挟まれる 3 カラムとか。たぶん、多くのユーザは、左、或は右側、または両側に並ぶ広告を見ない。しかも、画像等を使った広告になると、地味な文との対比が、よりはっきりとしてしまい、縦スクロールで流れて行く両サイドの広告は、単なる模様と成り果て、無視される。 ユーザがどこに注目するか。文である。 ということは、文の中に広告を出現させればいいのだ。あまり長くない文なら、その視線の延長線、つまり文終了後に広告を出現させるとか、長い文なら、ちょうど好い区切りで、広告を出現させる。 TV の場合。地デジになって、画面が横に長くなったけど、両サイドに CM が常時表示されてたら、どうなんだろう。うざいか。無視されるか。編部分がカラーだから、両サイドの CM も極彩色で迫られたら煩いね

    広告を見せるなら、シングルカラムだろう - カナかな団首領の自転車置き場ダイアリー
  • 日経BP

    株式会社 日経BP 〒105-8308 東京都港区虎ノ門4丁目3番12号 →GoogleMapでみる <最寄り駅> 東京メトロ日比谷線「神谷町駅」4b出口より徒歩5分 東京メトロ南北線 「六木一丁目駅」泉ガーデン出口より徒歩7分

    日経BP
  • ユーザーが「見る広告」「見ない広告」--ユーザーの行動を決める要素とは?

    「どんなサイトのどんな広告をユーザーは見るのか」――これは、広告主もメディア運営者も非常に興味ある事項ではないでしょうか。 今回は、いくつかの大手サイトを男女計5人の被験者に自由に閲覧してもらい、ユーザーがどの広告に目を引かれていたのかをアイトラッキングマシン(被験者の視線の動きを追跡するツール)を使って検証しました。はたしてどんな結果が出るのでしょうか。 口コミに夢中で広告見ず 図1は@cosme(アットコスメ)を見ていた被験者A(女性、20代後半)の視線です。右側に配置された広告は全く見られていません。被験者Aはトップページから迷わずユーザーの感想が書かれているページへと行き、その後ずっと口コミを丹念に見ていました。また、口コミ以外の要素には全く目を向けませんでした。 図1:@cosmeを見ていた被験者Aの視線。水色の線は視線の動きを、丸の大きさは視線の滞留時間の長さを示す。青で囲った

    ユーザーが「見る広告」「見ない広告」--ユーザーの行動を決める要素とは?
  • クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)
  • Proceedings of Data Engineering Workshop(DEWS)

    Proceedings of Data Engineering Workshop は,電子情報通信学会 データ工学研究専門委員会の第二種研究会として毎年3月に開催されるデータ工学ワークショップ(DEWS)のオンライン会議録です. データ工学ワークショップの変遷

  • 論文の練習をしてたら自分の意見がわからなくなった

    「練習です。死刑制度は存続させるべきかというテーマで論文書け」というから、おれはまず「廃止すべきだ」というゴールに向けて書いた。おれは「廃止しても凶悪犯罪は増えん」ということと「被告人の人権を侵害する」ということ、「そんな犯行するような被告人を作った社会にも責任の一端があり、社会も被告人を更正さすという形で責任を負うべき」などをちりばめた。 で次に「存続するべきだ」というゴールに向けてもうひとつ書いた。「目には目を、人権には人権を(ry」ということと「凶悪犯人は再犯率が高いので野に放てば再び市民に害なす可能性高い、殺すべき」ということ、「取り返しがつかないと廃止派はいうけど、それは懲役刑の服役期間も戻ってこないし根拠にならねえ」などをちりばめた。 見比べてできのよさげな方(どっちだっけ)を出し終えた後、おれはへんな気分になった。あたまがぐちゃぐちゃイライラして落ち着かない感じ。 「正しい」

    論文の練習をしてたら自分の意見がわからなくなった
  • なんとか修士論文提出した。活躍した便利グッズなど - 死に舞

    出来については保証できないが、自分の中ではかなり勉強したカンジがあった。自己満足的にはOK いろいろ人の世話になりました。ここでもお礼を言っておきます。ありがとうございます。 諮問はまだまだ時間がありますので、研究の話はまたおいおいしていくことにして、一日10時間の仕事するために必要だったもの、お世話になった商品をここで紹介しておきましょう。 ロイヒつぼ膏156枚 RT156 ロイヒつぼ膏。なかなかオーセンティックなパッケージング。しかし、これは効く。結構、がんばって仕事していると肩と首がこるのだが、これをつけて自転車で家から学校にいくだけでたいていのこりはほぐれる。腰が痛いとか言う友人たちにもすすめたけど、ほぼ私の周りでは絶賛されている商品。最高。安いし。というかもっと小ロットで売って欲しい。 というか、結構、自分の年代くらいの人たちが軒並み腰が痛いとか言っていて、オッサンに近づいている

    なんとか修士論文提出した。活躍した便利グッズなど - 死に舞
  • 楽天テクノロジーカンファレンス 2008にいってきました - d.hatena.zeg.la

    1000人以上のエンジニア、全国各地に開発拠点をもっている 楽天テクノロジーカンファレンスにいってきました。 分散並列処理フレームワークfaily,P2PオンメモリストレージROMAが 2009年にOpenSource化されるとのことでした。 楽天ウェブサービス APIの紹介 16種類のAPI 直近だと楽天ランキングAPI 1500万件,2万件の宿泊施設 Affiriateと連動可能 REST,JSON,SOAPのフォーマットをサポート 楽天ダイナミックアド 楽天版アドセンス 記事の内容にマッチした楽天の商品を出す 楽天経済圏 APIを使ったアプリが入り込める マッシュアップブームおちちている ALL 35,000ID Active 5,000ID Webサービス経由の流通金額は7.24% 3,500万request/day ItemSearch,GenreSearch,Itemcode

    楽天テクノロジーカンファレンス 2008にいってきました - d.hatena.zeg.la
  • MySQLでTF-IDFの計算、あと2つのベクトルの内積の計算 (2006-12-19)

    文を形態素分解し、必要な品詞をtfテーブルとdfテーブルに入れる。分析対象となる文書群すべてについてこの処理を行い、各形態素のTF-IDF値を求めて文書をベクトル化する。他の文書ベクトルと内積を比較し、小さい順に「似ている記事」を求めたい (クラスタリングとかは別途)。 HarmanによるTF値の正規化とSparok JonesによるDF値の正規化をする場合のTF-IDF値の計算式は以下のようになる (参考文献): tfidf(i,j) = log2(freq(i,j) + 1) / log2(NoT) * (log2(N / Dfreq(i)) + 1)

  • http://diaspar.jp/node/212

    See related links to what you are looking for.

  • 怖い先生に質問をしにいくコツ - 発声練習

    私の指導教員は怖い先生だった。論理があいまいな点、言葉の意味があいまいな点に関してとても容赦のない追求がある。たとえば、特に何気なく「〜などがあります。」と言おうものなら、「『〜など』ということは、他にもあるということですよねぇ?全部列挙してください」と突っ込まれる。また、先生が「***という言葉の意味を教えてください。」と尋ねてきたときに「たとえば〜」などと始めると、即座に「たとえはいりません。質を教えてください」とくる。でも、基的には優しい先生だったのでしどろもどろな学生の説明を長々とよく聞いてくれた、先生のコメントは「あなたが何を説明しているのかサッパリわかりません。もう一度まとめてから来てください」だったけど。 私が、四年生のときは当然のことながら、上記のような振る舞いをする先生が怖くて仕方なかった。ゼミや先生と一対一の討論のときは結構涙目になってしまうことがあった。 でも、先

    怖い先生に質問をしにいくコツ - 発声練習
  • サイジニア、複雑系理論でおすすめ抽出・推奨エンジンに挑む人々(1) インターネット-最新ニュース:IT-PLUS

    電通、三菱UFJ信託銀行など大手企業が相次ぎ参入を表明する「情報銀行」。ここに挑むベンチャー企業がDataSign(東京・渋谷)だ。同社の太田祐一社長は情報銀行という言葉が生まれる…続き 中部電力が「情報銀行」参入へ 電力データを活用 [有料会員限定] 「情報銀行」説明会に200社 データ流通の枠組み始動

    サイジニア、複雑系理論でおすすめ抽出・推奨エンジンに挑む人々(1) インターネット-最新ニュース:IT-PLUS
  • 卒業研究・修士研究時のセルフケアをお忘れなく - 発声練習

    一つ前のエントリーでも書いたけど、卒業研究や修士研究で体調崩したり、心の調子を崩したりするのはバカらしい。真剣にかつ楽しくやろう。定期的に次の事柄を確認してみて。 週を平均して、自分にとってベストな睡眠時間ぐらい寝れている? 睡眠は精神バランスの維持に重要な要素なので、十分に寝ること 定期的に運動しているのに眠気がこない場合は、念のためカウンセリングに行こう 定期的(最低週に一度)は運動している? 中国理系最高峰の清華大学の格言「7は8に勝る」。意味:7時間勉強して1時間運動する方が、8時間連続で勉強することよりも効率が良い 研究においては、一時的に頭を研究以外にそらすことが重要。運動は良い方法。 私にとって、悩んだときの常套手段は散歩。1〜2時間くらい歩くと良いアイデアが浮かぶことが多い 中国でアイデアが一番浮かぶ場所と言われているのが3乗(馬の上、トイレの上、ベッドの上)。頭を緩める必

    卒業研究・修士研究時のセルフケアをお忘れなく - 発声練習