タグ

Perlに関するkitoneのブックマーク (24)

  • Time::Piece - 日付・時刻を扱う新しい方法 - Perl入門ゼミ

    Perl › モジュール › here Perlの5.10からTime::Pieceと呼ばれる時刻を便利に扱うためのモジュールが標準モジュールに加わりました。Perlの5.10以上を使用している場合はTime::Pieceモジュールを日付と時刻を扱いたい場合に利用すると便利です。 従来のPerlでは日付や時刻を直感的に扱う手段が標準モジュールにはありませんでした。日付や時刻を扱うためには少し面倒な作業が必要でした。Time::Pieceは日付と時刻の直感的な操作を提供します。また日付・時刻の書式化の機能や解析する機能も備えます。 Perlには実質的に日付を扱うモジュールのスタンダードといえるDateTimeというモジュールがあります。ただしこのモジュールは標準モジュールではなくCPANからインストールする必要があります。また巨大なモジュールですのでモジュールを読み込む時間が非常にかかります

    Time::Piece - 日付・時刻を扱う新しい方法 - Perl入門ゼミ
    kitone
    kitone 2014/08/28
  • サイトの言語を判定する perl script

    とあるサービスを作るために必要となったのがサイトの言語判定。まぁもう少しわかりやすく言うと、多言語サイトを対象としてクロールすることを考えたりすると、そのサイトがどんな言語で記述されているかを把握しておく必要があるってわけです。 でもって CPAN でモジュールをあさって見るも、日語や中国語のような全角系?2byte 系?の言語に対応した判定器がないわけです。 Lingua::Identify Text::Language::Guess Text::Ngram::LanguageDetermine そんな中で見つけたのが Lingua::LanguageGuesser というモジュールです。CPAN には登録されていませんが、東京大学情報基盤センター中川研究室で公開されている専門用語(キーワード)自動抽出サービス「言選Web」で用いられている言語判定器です。 では実際にサンプルスクリプト

    kitone
    kitone 2014/08/20
    Lingua::LanguageGuesserのサンプルコード&レビュー。
  • Lingua::LanguageGuesser はいかにして生まれたのか

    言選Webは東京大学情報基盤センター中川研究室で公開している 専門用語(キーワード)自動抽出サービスです。 このシステムは内部で、専門用語(キーワード)自動抽出Perlモジュール"TermExtract"を活用しています。 特に西欧言語版では英語だけではなく、フランス語、イタリア語などの用語抽出を行うことができます。 しかし、入力テキストがどの言語で書かれているか判定する仕組みをもたず、ユーザがその都度指定する必要がありました。 そこで、入力テキストがどの言語で書かれているか、自動判定する仕組みを新たに考えることになった次第です。 言語判定を行う方式を調べたところ、いくつかの手法があることがわかりました。 N-Gramモデルを用いたテキストの分類器を使う 各言語で頻出する単語や特徴的な単語があるかどうかで判定する アクセス先サイトのURLから国名を得る HTMLのMETAタグの記述を確認す

    kitone
    kitone 2014/08/20
    前田さんだった。。
  • HTTP::Request - HTTP 形式のリクエストメッセージ - perldoc.jp

    そして通常は以下のようにして使います: $ua = LWP::UserAgent->new; $response = $ua->request($request); 説明¶ HTTP::Request is a class encapsulating HTTP style requests, consisting of a request line, some headers, and a content body. Note that the LWP library uses HTTP style requests even for non-HTTP protocols. Instances of this class are usually passed to the request() method of an LWP::UserAgent object. HTTP::Request

    kitone
    kitone 2014/07/01
  • 雑多の備忘録 - Perl - LWP

    概要 libwww-perlPerl 用の WWW ライブラリモジュール群。 HTTP プロトコルだけではなく、HTTPS や FTP、Gopher、NNTP などを介したリクエスト、あるいはローカルファイルや CPAN のファイルへのアクセス、sendmail によるメールの送信などが行える。 HTTPS プロトコルを利用する場合は、Crypt::SSLeay がインストールされていることが必要。 インストール root ユーザで cpan -i LWP とすると必要なモジュールも自動でインストールされる。Windows の ActivePerl には入ってるのか分からない。ppm install LWP とかやるとインストールできるかも。 LWP の簡単な例 use LWP; print LWP::UserAgent->new->request( HTTP::Request->new

    kitone
    kitone 2014/07/01
  • YAPCで「はてなブログの開発フロー」について話してきました - 大西ブログ

    今年も参加しました!YAPC ASIA TOKYO!今回は40分トークを応募して、はてなブログの開発フローについて話してきました。 プロジェクトの開発プロセスを健全に保つための タスク管理、ワークフロー テスト、CI リリース管理 を中心に、実際にチームで行っている開発フローやさまざまなとりくみについて紹介しました。 開発フローは、作るものやチームにとって最適なものを選ぶべきだと思いますので、この手法が誰にでも使えるものではないと思いますが、何かの参考になれば幸いです。 また、こんな事をやるといいよ、というあなたの工夫もぜひ教えてください!

    YAPCで「はてなブログの開発フロー」について話してきました - 大西ブログ
  • Perlで配列の中身の表示するには最低11文字あればいい。 | sekimon.jp

    Perlという言語は、かなり省略して書くことができます。 その反面、コードを書いた人でなければ理解するのが難しいことがあります。 しかし、コードを短くすればサイズも抑えられますし、例えば配列の中身をただ単に出力するだけであれば、むしろ省略すべきです。 今回は、配列の中身を表示させるためのコードを省略してみます。 1.配列の用意 適当に配列を用意します。 my @i; push @i, $_ for(1..10); iという配列に、1から10までの整数を格納します。 ちなみに、これも省略されたものです。 最後まで読んで頂ければきっと理解できると思います。 2.配列の中身の表示 次に中身を表示させます。 まずは、省略されたものから。 say for @i; #1 #2 #3 : #10 スペースを入れ、たった11文字です。 単純に配列を表示するだけですが、たったこれだけの文字で実

    kitone
    kitone 2013/09/12
    say for 配列!
  • Kyoto.pmを作成&開催します! - $shibayu36->blog;

    この度、Kyoto.pmを作成し、開催できることになりました! 今回の件で助言を頂いた id:charsbar さんやKansai.pmの皆様に最初に感謝します。ありがとうございます。 経緯 去年のYAPC::Asiaで、Osaka.pmやらKyoto.pmの開催の話が出て、そのあとid:charsbarさんから下のような指摘を受けました。 関西近郊の地方.pmの話 - Charsbar::Note 僕としても関西近郊のperl mongersが「棲み分けもできずに共倒れしたり、対立のネタになってしまう」のは望みませんでした。そこでOsaka.pmの提起者であるid:papixさんとSkypeで連絡をとったり、Kansai.pmの皆さんとMLでやり取りを行いました。 結果として、ある程度住み分けをした上でKyoto.pmを開いても良いのでは無いかという話になり、Osaka.pmは初心者用勉

    Kyoto.pmを作成&開催します! - $shibayu36->blog;
    kitone
    kitone 2012/02/17
    おお。2012/3/17にはてな本社で第1回目のTech Talks開催。
  • A Perl regex that matches composite numbers (and doesn't match prime numbers)

    Take a look at this Perl regular expression: perl -lne '(1x$_) =~ /^(11+?)\1+$/ && print "$_ is composite"' This regular expression matches only the composite numbers (and doesn't match prime numbers). Can you figure out how it works? I'll give the explanation below but try to figure it out yourself. Here is what happens when you run it: $ perl -lne '(1x$_) =~ /^(11+?)\1+$/ && print "$_ is composi

    A Perl regex that matches composite numbers (and doesn't match prime numbers)
  • GitHub - libraryhackers/library-callnumber-lc: Perl and Python modules for normalizing Library of Congress call numbers

  • モダンPerlの世界へようこそ 記事一覧 | gihyo.jp

    第42回Template ToolkitPerl製テンプレートエンジンのデファクトスタンダード 石垣憲一 2011-06-30

    モダンPerlの世界へようこそ 記事一覧 | gihyo.jp
  • ATOKダイレクト API for Perl / Ruby | さらに使いこなす | ATOK.com

    株式会社ジャストシステム(以下「弊社」)は、以下に定めるドキュメント、サンプルプログラム[ソース/インストールツール]、開発用ツール(以下総称して「技術情報」)を受領するお客様(以下「受領者」)が下記にご同意されることを条件として、技術情報の使用を許諾いたします。受領者が技術情報のご使用を開始された場合は、下記条件に同意いただいたものとみなします。 ドキュメント: 【Win】 atok_direct_script_api.pdfMac】 atok_direct_script_api_mac.pdf サンプルプログラム: atok_direct_script_perl_sample.pl/atok_direct_script_perl_sample.xml atok_direct_script_ruby_sample.rb/atok_direct_script_ruby_sampl

    kitone
    kitone 2009/07/30
    ATOK欲しくなった
  • JSONでJavaScriptとPerlをつなぐ=Jamila - kwitknr - builder by ZDNet Japan

    ここしばらくはまり込んでいたプロジェクトは主なユーザーインターフェイスとしてWebブラウザを利用しました。 なんてたって配布が楽ですからね。 問題は結構ダイナミックに画面を変更しなくちゃいけないってこと。いちいちサーバーに処理も画面も戻したくないッ。 となれば当然、JavaScript使うしかありません。 NeoCoreXMSなどのデーターベースやBPMSエンジンであるAgilePointBPMSと連携するのでサーバー側の処理も当然必要。 かくしてAjaxライクに連携すればいいじゃんとなりました。(AでもXでもないAjaxライクってどう呼べばいいんだろう?) でもSOAPやXMLRPCの利用も考えたんですが、JavaScriptで使うの面倒くさそう。 そんなこんなでJSONでシリアライズしてHTTP連携することにしました。 名前はJamila(for JSON Approach to Ma

  • [Perl] HTML::TagParser - HTMLソースの解析/属性値やinnerTextの取得

    Kawa.netxp [Perl] HTML::TagParser - HTMLソースの解析/属性値やinnerTextの取得 HTML::TagParser は、HTML ソースコードの解析を行う Perl モジュールです。 DOM 風のインターフェースで、各 HTML タグごとに属性値やinnerText値を取得できます。 Pure Perl 実装ですので、コンパイル不要で手軽に利用できます。 ページ中の特定のタグの内容を抽出したり、リンクを辿っていくスクリプトなどで利用できます。 Encode.pm バージョン 2.10~2.12 間で発生していた FB_XMLCREF 問題に対応しました。(2006/11/01) Encode::FB_XMLCREF でなく Encode::XMLCREF を利用します。(効果は同じです) 2.12 は既に最新バージョンではありませんが、Perl

  • perl - HTMLをXMLとして扱う : 404 Blog Not Found

    2009年02月19日08:30 カテゴリLightweight Languages perl - HTMLをXMLとして扱う そのXML::Liberalが test でこけまくっていたところから旅が始まった。 ゆーすけべー日記: 壊れた Premiere (映像編集ソフト) のプロジェクトファイルが XML::Liberal (Perlモジュール) で直った ということは、なんとかして壊れたプロジェクトファイルを「well formed」な XML にすればいいじゃないのか!と思ったわけ。そこで活躍したのが「XML::Liberal」という miyagawa プロダクトな Perl モジュール。 やりたかったのは、XHTMLでないHTMLを、XML::*なモジュールで扱うこと。例えばXML::LibXMLを使えば、JavaScriptみたいな感覚でDOMを操作できるし、XML::Sim

    perl - HTMLをXMLとして扱う : 404 Blog Not Found
  • 簡体字と日本語漢字の相互変換ツール Kanconvit を公開

    簡体字と日語漢字の相互変換ツール Kanconvit を公開 2009-06-14-1 [Release][Programming][Bookmarklet] Hack部(ハック部)の合宿で、中国語の簡体字と日語漢字の相互変換ツール Kanconvit を作りました。 オフィシャルな読みは「カンコンビット」ということでよろしくです。 まあ別になんでもいいんですが。 - Kanconvit - 簡体字と日語漢字の相互変換ツール http://kanconvit.ta2o.net/ 簡体字と日語漢字の違い分かりますか? 下図では、右が簡体字で左が日語漢字(Kanconvitで変換したもの)です。 左だと漢字だけ見るだけでも中国語の意味がなんとなくわかりそうでしょ? Kanconvit ダイジェスト - 文字変換ライブラリ「Kanconvit.pm」(Perlモジュール) http:/

    簡体字と日本語漢字の相互変換ツール Kanconvit を公開
  • Happy Testing Perl 記事一覧 | gihyo.jp

    第4回Test::Perl::Critic, Test::Pod, Test::Pod::Coverage, Test::Exception, Test::Warn, Devel::Coverの紹介 小林篤 2008-06-25

    Happy Testing Perl 記事一覧 | gihyo.jp
  • Perlでアニメ顔を検出&解析するImager::AnimeFace - デー

    というのを作ったので自己紹介します。 2月頃から、コンピュータでアニメ顔を検出&解析する方法をいろいろ試しつつ作っていて、その成果のひとつとして、無理やり出力したライブラリです。 はじめに はじめにざっとライブラリの紹介を書いて、あとのほうでは詳細な処理の話を僕の考えを超交えつつグダグだと書きたいと思います。 Imager::AnimeFaceでできること Imager::AnimeFaceは、画像に含まれるアニメキャラクター的な人物の顔の位置を検出し、さらに目や口など顔を構成する部品位置や大きさの推定、肌や髪の色の抽出を簡単に行うことができるライブラリです。 これらが可能になると、 画像から自動でいい感じのサムネイルを作成できる 動画から自動でいい感じのサムネイルを作成できる 自動的にぐぬぬ画像が作れる 自動的に全員の顔を○○にできる 顔ベースのローカル画像検索 など、最新鋭のソリューシ

    Perlでアニメ顔を検出&解析するImager::AnimeFace - デー
    kitone
    kitone 2009/04/13
  • Unshortening URLs with Modern Perl

    Tiny URLs, like the ones Twitter uses, have been stirring up a lot of controversy lately. People wonder what will happen if the tiny URL service goes down, goes away, or goes rogue. The links in their Twitter posts could become useless, and that would be tragic. This is a problem that's easier to work around than to whine about, so I've implemented a web service that unshortens any short URL. You

    kitone
    kitone 2009/04/07
  • イベント/第11回ミーティング告知 - Kansai.pm

    Kansai.pm第11回ミーティングを行います Kansai.pm第11回ミーティングを開催します。第11回ミーティングのメイントークでは、大学で情報科学を専攻する学生ら若いメンバーを中心として、幾つかのアルゴリズムやコルーチンの実装など情報科学分野をテーマに発表いたします。 また恒例の10分枠ではテーマを自由に Kansai.pm 有志が、開発の成果やプログラミングテクニックなどについて発表をいたします。 日時 2009年03月22日(日) 13時30分〜17時 開場時間:13時00分 3月22日は日曜日のため正面玄関が開いていません。入館には会場である株式会社はてなのスタッフによる解錠が必要ため、13時00分頃に1F セブンイレブン正面まで集合をお願いします。 会場 株式会社はてな 京都社 https://www.hatena.ne.jp/company/ 定員 30から40名程度