タグ

Perlに関するmorobitokozouのブックマーク (60)

  • Wikipediaから人名(姓・名別、読みつき)を取り出す - アスペ日記

    小ネタです。 日Wikipediaから人名(姓・名別、読みつき)を取り出すスクリプトを書きました。 https://github.com/hiroshi-manabe/extract_jawp_names 日語の処理をする際に、Wikipediaのデータを使うことは多いと思います。 いろいろと便利なWikipediaのデータですが、人名に関しては「姓と名が分かれていない」という問題があります。 まあ、文の冒頭にはたいていスペース区切りで書かれたものがあるので、それを使えば切ることができます。 また、Wikipediaの記事名には読みがついていないという問題もあります。 これも、たいてい文の冒頭でカッコ内に書いてあります。 ですので、大きな問題はないのですが、Wikipediaのデータは基的に人が編集しているので、形式がけっこう自由です。 例えば、文冒頭の記事名はたいてい太字で

    Wikipediaから人名(姓・名別、読みつき)を取り出す - アスペ日記
  • perldoc.jp

    このサイトは Perl の公式ドキュメント、モジュールドキュメントを日語に翻訳したものを表示するサイトです。 サイト内の翻訳データは、有志が翻訳しているperldoc-jp/translationから取得しています。 最近の更新 / RSS commitログから最新の50件を取得しています。稀に翻訳者とcommitした人が違う場合があります。また、修正のcommit、登録しただけで未翻訳のものも含まれる場合があります。 2024-02-04 github.com ppc0018-module-true / melonsode 2024-02-03 Data::Dumper Dumper(2.183) / melonsode 2024-01-25 github.com ppc0016-indexed-builtin / kobaken 2024-01-08 perlclassguts(5.

  • 勝手に添削 - find(1) : 404 Blog Not Found

    2007年03月30日00:15 カテゴリ一日一行野郎Lightweight Languages 勝手に添削 - find(1) 「ウノウラボ Unoh Labs: コマンドラインで作業する上で知っておくといいテクニック」の用法に首を傾げたので。 まずはこちら。 $ find . -type f | fgrep index.html これは % find . -type f -name index.html でOK。パイプ不要。.htmlだけ見つけたい時も % find . -type f -name \*.html でOK。findはシェルのワイルドカードを受け付ける。ただしシェルにそれを展開して欲しくないので、\でエスケープしている。要は $ find . -name '*~' と同じなのだが、なんで上記の例でfgrepを使っているか不明。 ここからが番。 $ find . -nam

    勝手に添削 - find(1) : 404 Blog Not Found
  • PERL(perl_bunpou)

  • Script Note : ファイルを改行区切りで読み込む

  • 技術メモ帳: [unix]複数のファイルの名前をまとめて変更する

    複数のファイルの名前を変更する際に、 便利なコマンドというものがある。 いくつかご紹介させていただこう。 カレントディレクトリにあるファイルの名前を、 たとえば、*.html を *.htm と名前を変更するという課題に対し どのぐらいエレガントに書けるかというのを比較してみる。 まず、普通にやったらどうだろう。 おそらく、for文 をつかうことだろう。 for file in *.html do base=`basename $file .html` mv $base.html $base.htm; done; zshだともうちょっとスマートにかけて、 for file in *.html do mv $file:r.html $file:r.html; done; こんな具合。 for文 が嫌いなネット右翼のために、 xargs を使ってこの問題を解いてみよう。 ls -1 *.htm

  • AppleScript で Perl に GUI をつける (hPod)

    (「Perl で Exif を扱う」のつづき) Xcode を使って、 Perl スクリプトに AppleScript の GUI を付けてみて、そこそこうまくいったので忘れないように、いや、忘れるので、忘れないうちにメモ。 AppleScript から do shell script という命令を使うと、 UNIX コマンドを起動する事ができる。コマンドが起動できるということはつまり、なんでもできるということになるかしら? それはさておき、その仕掛けを使えば、無愛想なコマンドライン・ツールであった Perl スクリプトに GUI をかぶせて Mac OS X 用のアプリケーションに仕立てる事もできる。 Objective-C を使わなくとも(いえ、知らないんです) Perl (や他の言語でもいいけどそれら)と、少しの AppleScript の知識があれば、それっぽいものが「手軽に」でき

  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • K2Editorでの正規表現の解説 目次

    K2Editorでの正規表現の解説 K2Editor では検索、置換、キーワードの強調などに正規表現を使う事が出来ます。このページは、その正規表現を説明する目的で書かれています。 K2Editorで公式にサポートしているのは、K2Regexp.dll による正規表現です。これから述べる内容も、K2Regexp でサポートしているものを対象としています。 K2Regexp.dll は BREGEXP.DLL(より正しく言えば、Linux 用の Bregexp ライブラリ)に制御系の拡張をしたものです。正規表現エンジン部分は BREGEXP から変更されていないようです。 BREGEXP は Perl5(perl version 5.002 だと思われる)互換の正規表現エンジンなので、Perl の解説がほぼそのまま使えますが、Perl 自体が正規表現と密接につながっているため、うまく適応するこ

  • http://www.nextindex.net/perl/pattern.html

  • Script Note : Normalization

    Script Note - Note of Programming Language on Macintosh Computer. - since Feb.2006 Unicode には Normalization(正規化)という面倒くさい仕様があります。プログラマーの方は、かなの濁点半濁点つきの文字で遭遇すると思います。OS X でのファイル管理は Normalization Form D 方式を採用しています。こいつが頭を悩ませる! Normalization Form C であれば苦労もなかったのに・・・ と、なんだかんだと Normalization の話題を今日は書きますが、詳しい情報は申し訳ないですが他のサイトを参照してくださいね。私はそれらのサイトを参照して、実際に実務で使えるレベルで検証しているだけですので(笑)曲がりなりにも、私も教えなくてはいけないスタッフができましたの

    morobitokozou
    morobitokozou 2006/09/01
    Normalization Form Dの話
  • perlreref

    名前 説明 演算子 構文 エスケープシーケンス キャラクタクラス アンカー 量指定子 拡張構造(EXTENDED CONSTRUCTS) 変数 関数 用語 Titlecase AUTHOR SEE ALSO THANKS 名前 perlreref - Perl の正規表現のリファレンス 説明 ドキュメントは、Perl の正規表現のクイックリファレンスです。 完全な情報は、perlre と perlop、また、ドキュメントの ”SEE ALSO セクションを参照してください。 演算子 =~ 正規表現が適用される変数を決定します。省略された 場合には、$_ が使われます。 $var =~ /foo/; !~ 正規表現が適用される変数を決定し、マッチの結果を反転します。 マッチが成功すれば偽を返し、失敗すれば真を返します。 $var !~ /foo/; m/pattern/igmsoxc パ

  • The Perl5 Manual - Table of Contents

    Edition 0.1 for Perl Version 5.00 Dec 1998 Copying 概要 環境変数 ファイル 診断 バグ 注釈 データ構造 変数名 コンテキスト スカラ値 スカラ値の構成 リスト値の構成 構文 単純実行文 複合実行文 演算子と優先順位 優先順位 項とリスト演算子 (左方向) アロー演算子 インクリメントとデクリメント 指数演算子 単項演算子 拘束演算子 乗法演算子 加法演算子 シフト演算子 名前付き単項演算子 比較演算子 等価演算子 ビットごとの AND ビットごとの OR と XOR C スタイルの論理積 C スタイルの論理和 範囲演算子 条件演算子 代入演算子 コンマ演算子 リスト演算子 (右方向) 論理否定 論理積 論理和と排他論理和 Perl にない C の演算子 クォートとクォートのような演算子 I/O 演算子 定数の畳み込み 整数演算 正規表現

  • Perl: One-Liner

    速習 Perl: 1行スクリプト ■1. フィルターとしての Perl ここでは,主として,grep や sed のように「フィルター」として Perl を使う方法について簡単に見ていく。 [cf.「Perl によるテキスト処理入門」] ■2. 基的な形 [詳しい解説] perl -オプション 'スクリプト' 入力ファイル 文字列の検索: perl -ne 'print if (m/検索文字列/[i])' 入力ファイル 文字の置換:  perl -pe 'tr/文字列1/文字列2/' 入力ファイル 文字列の置換: perl -pe 's/検索文字列/置換文字列/[ig]' 入力ファイル ■3. 文字列の検索 (cf. grep) [詳しい解説] 以下のようにすれば,grep と同じように,「検索文字列」を含む行を出力することができる。 perl -ne 'print if (m/検索文字

  • Script Note : その後の「AppleScript で Perl による置換」

    Script Note - Note of Programming Language on Macintosh Computer. - since Feb.2006 AppleScript で Perl の正規表現、そして one-liner 上のリンクにある過去に書いた記事の『日語対応版』として掲載したスクリプトにマズイ点を見つけてしまったよ。XMLの定義済み実体を実体参照に置き換えようとして気がついた。あの時のスクリプトでは置換したい元の文字列の中にシングルクォーテーション(アポストロフィ)が含まれていると、どうにもエスケープのしようがない。シングルクォーテーションだけを先行して置換しなきゃいけなくなる .... Perl を呼び出すプロセスが増えてしまうなぁ。どうする? あっ、quoted form of を忘れてた もう少し便利にしよう! ということで、『日語対応版』を書き直

  • AppleScript for OS X

    Macintosh OSXのアップルスクリプトについての覚え書き。自分用なので説明が足りなかったり、順番バラバラだったり、あまり参考にならないかも。間違った記述があ るかもしれません。特に断わりがない限り、このページ内ではXcodeを使ったAppleScriptの開発のことです。 ページ内にスクリプトがいくつか書いてありますが、ご利用はご自由にどうぞ。ただし、これらを使って何らかの損害を被ってもいっさいの補償はあり ません。アンドなんかバグってるかも。オウンリスクでね。 いやー、しかしOS XではAppleScriptに簡単にインターフェースがつけられたり、便利な世の中になりましたな。これで処理速度がもう少し……それは言わない約束 よ。 新規プロジェクト AppleScript Droplet propertyに注意 自作ルーチン 自分のパスを取得する AppleScriptとP

  • とほほのperl入門 ◆ 正規表現

    ラリー・ウォール氏によって1987年に開発されたスクリプト言語です。 C言語、AWK、sed, sh などの影響を受けて開発され、PHP, Ruby, Python などに影響を与えました。 聖書の中の「高度な真珠」にちなんで pearl と名付けられる予定でしたが、同盟の言語がすでに存在したため Perl と名づけられました。 現在では Perl は "Practical Extraction and Report Language" の略とされています。 プログラミング言語を示すときは先頭大文字で「Perl」、処理系を表すときは先頭小文字で「perl」と表します。 2023年9月現在、5.38 が最新版です。 RHEL7系では 5.16、RHEL8系では 5.26、RHEL9系では 5.32、Ubuntu 22.04では 5.34 がインストールされます。 Windows用の実装として

  • http://homepage1.nifty.com/typhoon/at-cgi/index.html

  • シェルスクリプトの基礎

    シェルスクリプトは運用・管理で利活用すると非常に便利ですが、その反面root権限で誤ったシェルスクリプトを走らせてしまうと、システムを破壊してしまう恐れもあります。ここで紹介している一切の構文・サンプル文は自己責任でご参考下さい。 ・はじめに ・クオーテーション ・標準入出力 ・シェルスクリプト中の変数定義 ・制御文の構造 ・制御文の条件 ・シェルスクリプトでループ ・コマンドの連結 ・エイリアス と関数 ・Perlとの連動 ・シェルスクリプト構文集 ・戻る UNIXはMS-Windowsと違い拡張子でファイル形式を判別しません。ファイルの中身の先頭部分で判断します。つまりシェルスクリプトであると認識させるためにはファイルの先頭に、/bin/shと記述します。perlと認識されるには、/usr/bin/perlと記述します。これらはWindowsファイルの.txt(ド

  • http://homepage1.nifty.com/typhoon/at-cgi/perl_c1.html