タグ

ブックマーク / okumuralab.org/~okumura (14)

  • Zipファイルのクラック

    メールでZipファイルを送って次のメールでパスワードを送るという無意味より悪いセキュリティ対策が問題になっている。なぜ無意味より悪いかというと,Zip暗号化は強度が十分でない上に,次のメールで送るパスワードは無意味で,さらにゲートウェイでのウイルス対策ができなくなるのでウイルス送付に利用されやすいためである。 PythonZipファイルを展開する方法は文字コードのところに書いたが,同様にしてパスワードをブルートフォースで破ることも原理的には可能である。4桁数字のパスワードで暗号化した test.zip をクラックするには次のようにすればよいであろう: from zipfile import ZipFile with ZipFile('test.zip') as z: for i in range(10000): pw = f'{i:04d}' try: z.setpassword(pw.

    kkobayashi
    kkobayashi 2020/12/05
    ブルートフォースでクラックできる、と言うだけならほとんどそうだろうしzipのパスワード自体はどのくらい強いんだろ
  • ひどいグラフいろいろ | Okumura's Blog

    最近Twitterで教えていただいたことの備忘録。 まず12月29日の「池上彰の学べるニュース」から[2010-06-05: リンク先が別内容に変わっていたのでリンクを外しました。旧内容の片鱗は下のコメントで書いていただいたリンク先に残っているようです]の写真をクリックしてよく見ていただきたい。 こういう情報操作はビジネスのグラフではよくあるようだ。有名なのが早稲田アカデミーが毎年出しているこういう感じのグラフ。ひどいグラフを集めた日図表審査機構 [JGRO]というサイト(個人ブログ)もある。私のブログでも「3D」とか「グラフ」で検索すればいろいろ見つかる(例えばこんな驚異の3D)。 インチキグラフを揶揄したアスキーアートのPS3とWiiは有名。 3Dグラフといえば,Excelの積み重ね棒グラフに,円錐・角錐がある。これは上ほど小さく見せたいインチキグラフ作成用。CE97の発表でも取り上

    kkobayashi
    kkobayashi 2010/04/12
    ひどいなー。
  • Webで数式を簡単に使う方法 | Okumura's Blog

    以前Webで数式を書く方法について書いたが,今なら Google Chart Tools のAPIを使うほうが簡単。例: <img src="http://chart.apis.google.com/chart?cht=tx&amp;chl=x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}" alt="" /> URL中に使えない文字は%16進2桁で表記する。例えばスペースは試した限りではそのまま使えたが用心するなら%20とする。詳しくはGoogleの解説 Mathematical (TeX) Formulas 参照。 問題点:ピクセルサイズの指定はできるが,標準の2倍の大きさにしたいという指定はできないみたい。

    kkobayashi
    kkobayashi 2010/03/04
    これいいな!はてなのtex記法が糞汚いのでありがたい。(もっとも、あれはmimeTeXが汚いのであって、はてなに罪はないんだけど)
  • twitteRたのしいよtwitteR | Okumura's Blog

    楽しすぎる統計・データ解析用言語 R の欠点は,Googleで検索しにくいことである。 そのRに twitteR というTwitter APIを操るパッケージができていた。これまた楽しい! 使い方の例: install.packages("twitteR") library(twitteR) userTimeline("h_okumura") # 例 sess = initSession("h_okumura", "パスワード") tw = tweet("MacのRならtwitteRで化けないのかな", sess) # もし化けたら deleteStatus(tw, sess) する 詳しい使い方はvignetteやreference manualを見ればわかるが,実例がほしい。しかし残念なことに,Google検索ではtwitteRTwitterも同じと扱われてしまう。Twitterで教

    kkobayashi
    kkobayashi 2010/02/21
    http://ja.doukaku.org/comment/9461/ windowsでもUTF-8でエンコーディングすれば・・・いけるはず・・・
  • グラフの描き方

    的な考え方 棒グラフは比例尺度の量を表すのに用い,棒の長さ(面積)が量に比例するように描くのが基。一つだけずば抜けて大きい値があるときに棒の上のほうで省略線を用いることはあるが,下を省略して全体の長さを切り詰めることは好ましくない。例えば気象観測データについては,雨量は比例尺度であるので棒グラフで表してもよいが,気温は(絶対温度でない限り)間隔尺度であり,棒グラフは使えない。 折れ線グラフは,両軸とも間隔尺度以上であるのが基。0点から始める必要はない。特に時系列データについてよく使われる。 円グラフは全体における割合を表すにはよいが,全体との比較ではなく個々の値どうしの比較には棒グラフがよい。いわゆる3次元(3D)円グラフは,錯覚を利用して特定の部分を大きく見せるためのもので,一般には用いない。 円グラフは複数回答のアンケート結果の図示には絶対に用いない。 色分けして凡例を付けるの

    kkobayashi
    kkobayashi 2010/02/12
    尺度とグラフの使い方の話が参考になる。
  • RによるWebサービスの作り方 | Okumura's Blog

    web アプリを R で作るのか R を使える web アプリなのか 話題にしてるのは前者ですよね? 後者については RWebUI ってのを作ってる人がいるようです。 http://thira.plavox.info/

    kkobayashi
    kkobayashi 2009/08/18
    使い方がよく分からない・・・
  • 統計グラフの色 | Okumura's Blog

    時間がないのでメモだけ。 Excel(特に2007より古いもの)の色のセンスは最悪。専用ツールで作画する場合も,ついred,green,blue,yellowのような原色を使ってしまうが,広い面積を原色で塗りつぶすと長く見つめるのが難しくなり,統計グラフには不向き。彩度・明度の調節が必要。参考文献: Ross Ihaka (Rの作者), Colour for Presentation Graphics, DSC 2003 Achim Zeileis, Kurt Hornik and Paul Murrell, Escaping RGBland: Selecting colors for statistical graphics, Computational Statistics & Data Analysis, 53, No.9, 3259-3270 (2009); 著者最終稿PDF Rで

    kkobayashi
    kkobayashi 2009/07/01
    色づけには悩まされるよね。センスのいい色使いをしたい。
  • 青木先生のRの本 | Okumura's Blog

    青木先生の Rによる統計解析 ゲット。実は私もこの手のを書き始めたことがあるが,あまりにも多い類書に辟易して,止まってしまっている(そのときの断片を寄せ集めたのが ここ にある)。 パラパラ見た感じでは,青木先生のは意外と古典的で,まじめな内容だ。Excel批判は「はじめに」の最初にちょこっと書いてあるだけだ。どちらかといえば統計というよりはRのだからか。 青木先生はプロットにジッター(点がかさならないようにランダムにずらすこと)をかけるよりここにあるようにするほうがよいというご意見のようだ。

    kkobayashi
    kkobayashi 2009/04/24
    ほしーなー
  • 下手な散布図 | Okumura's Blog

    体力と学力に相関関係も 秋田ともに上位、大阪は危機感(朝日),とりあえず小学校: 体力 = c(105.48, 110.1, 111.34, 107.63, 116.1, 110.72, 110.12, 114.21, 109.96, 107.24, 111.97, 113.26, 106.26, 105.41, 114.52, 111.64, 112.38, 116.79, 108.68, 109.33, 109.83, 111.63, 106.31, 105.61, 105.98, 108.84, 105.6, 106.64, 105.7, 108.49, 112.04, 112.41, 112.66, 109.66, 109.23, 105.41, 109.89, 109.52, 103.8, 106.2, 108.47, 111.33, 111.78, 106.64, 112.43

    kkobayashi
    kkobayashi 2009/02/05
    なぜかワラタ
  • 折れ線グラフもゼロから描かなければならないと教えられている? | Okumura's Blog

    ユーレイ棒グラフ?によしだはじめ先生が貴重なコメントをくださったので,改めてグラフの書き方がどのように教えられているかを調べ始めている。まず見つかったのが,東京都統計協会・グラフコンクール・グラフのしくみ。折れ線グラフまでゼロを省略してはならないとしている: <折れ線グラフを作る上での注意点> ・0の基線を必ず引きましょう。目盛りの基点は必ず0にします。20とか300とかに変えてはいけません。 …… ・必要に応じて波線を入れて途中の目盛りを省くのは、オーケーです。 例として温度変化の折れ線グラフを二つ挙げているが,いずれも(摂氏)0度から書かれている。負の温度になったらどうするのだろう。 折れ線グラフで表すものは間隔尺度でよい。意味のある0点がなくてよいし,0点から書き始める必要はない。これに対して,棒グラフは比率尺度(比例尺度)だという強いメッセージを持っている。だから雨量を棒グラフで表

    kkobayashi
    kkobayashi 2009/01/14
    尺度については正しく学ぶべきだよね。ゼロ点が大切かどうか。40℃は20℃の2倍暑いわけじゃない(間隔尺度)からゼロ点なくてもOK
  • Excel使うな | Okumura's Blog

    Computational Statistics and Data Analysis Volume 52, Issue 10 (2008) に Excel 2007 特集がある。 まず最初の論文 (B.D. McCullough and David A. Heiser, On the accuracy of statistical procedures in Microsoft Excel 2007, pp.4570-4578) のアブストラクト: Excel 2007, like its predecessors, fails a standard set of intermediate-level accuracy tests in three areas: statistical distributions, random number generation, and estimat

    kkobayashi
    kkobayashi 2008/10/25
    ExcelのRGN(乱数生成器)はくるっとる、という話。そもそも、Excelで計算させた論文なんて通るの??w
  • 3D円グラフを使うのはやめよう | Okumura's Blog

    落伍弟子さんの目の錯覚を誘うグラフの受け売りで申し訳ないが,都立高校教科書採択結果のPDFの図がすべて3D円グラフになっており,目の錯覚で誤解が生じやすい。例えば右図で日文は啓林の2倍あるのに中心角は啓林のほうが大きく,面積比でもほぼ互角に見える。情報リテラシーではっきり「3D円グラフは使うな」と教えてほしい。 Rのヘルプの「pie」の項目にも次のようにあるように,そもそも円グラフが良くない。 Pie charts are a very bad way of displaying information. The eye is good at judging linear measures and bad at judging relative areas. A bar chart or dot chart is a preferable way of displaying this ty

    kkobayashi
    kkobayashi 2008/09/17
    Rのpie chartも推奨しないって書いてあるよね・・・って書こうとしたら先に書かれてた!
  • 欧文句読点の後にはスペースを | Okumura's Blog

    技術の粋を集めた新幹線も,欧文は等幅フォントしかないのか。しかも,コンマの後にスペースがない。詰まった感じがして見苦しいばかりか,このような書き癖をつけると,WordもTeXもスペースのあるところを改行の候補点とするので,行分割できない語の連なりができてしまい,それがまるまる次の行に送られて,間延びした行ができやすい。欧文のコンマやピリオドの後には必ずスペースを打つよう心がけよう。また,欧文はプロポーショナルフォントを使おう。

    kkobayashi
    kkobayashi 2008/03/29
    何を言ってんだ・・・と思ったけど、奥村先生がいうならきっとそうすべきなのでしょう
  • 縦×横?横×縦? | Okumura's Blog

    ある方からのタレコミ。小4のお子さんが学校で長方形の面積を横×縦で計算したら減点された。学校に問い合わせたら,担任にも教務主任にも縦×横が正解と言われたとのこと。横×縦でも同じになることを自分で見つけたならば褒めるべきところを減点するようでは,創造性を伸ばすなというようなもの。

    kkobayashi
    kkobayashi 2007/12/13
    小1くらいの頃、田上くんが「田植え」を「田上」と書いて○をもらってた(「植え」はまだ習ってないので「田うえ」が正解だった)ので「その上は違う!」と喧嘩したことを思い出した
  • 1