タグ

考え方と開発に関するteitei_tkのブックマーク (2)

  • これからチーム開発に立ち向かう花ざかりの君たちへ

    2017年度新卒研修がはじまりました! - ペパボテックブログ 上記エントリにあるように、今年の4月に入社してくれたフレッシュ・フレッシュ・フレーッシュな若者たち、社内では「新卒7期生」と呼ばれているみんなの研修の日々が続いています。毎日、彼ら彼女らががんばる姿を見ることができて、刺激的で楽しい最近を過ごしてきました。どうも @june29 です。 今は職種別の研修期間に突入していまして、エンジニア研修の座学もはじまりました。この座学は、ペパボの仲間たちがかわるがわる教壇に立ち、7期生に知っておいてほしい内容をおおいに語る時間になっています。下記は、座学講師を募集するインターネット掲示板の様子です。 ぼくも、ペパボに入社した2015年、その翌年の2016年と、こうした新卒生たちと交流する機会には積極的に関わってきました。自分とは違う世代の人たちと話していると気付くことが多いですからね。少し

    これからチーム開発に立ち向かう花ざかりの君たちへ
  • Webを進化させるスクレイピングのセオリー

    WebAPIだけに頼る必要はない。HTML構造を解析し、さらに情報集約や付加情報を加えたまとめサイトを作る。この特集は、Webをさらに使いやすくするためのガイドだ。 第1回目では、マッシュアップできないならば、スクレイピングすればよいと説明した。それでは、具体的に、どのようにスクレイピングすればよいのか。今回は、スクレイピングの考え方と技法を説明していこう。 CSSの普及で、容易になったスクレイピング 実際に、ほかのサイトにあるHTMLスクレイピングする場合、次の処理の流れとなる。 1)サーバからHTMLデータを取得する これは単純に、HTTP通信してHTMLデータを取得する操作である。例えばPerlであれば、LWP(libwww-perl)を利用すればよいだろう。もっと簡単に、UNIXに付属のwgetコマンドやfetchコマンドを使ってもよいはずだ。 2)HTMLから取り出したいデータ

    Webを進化させるスクレイピングのセオリー
  • 1