タグ

ブックマーク / ameblo.jp/kimito001 (46)

  • 『Google は、江戸末期の活字のOCRに成功している。』

    2007年に慶応大学の江戸末期、明治初期の活字のOCR化に挑戦していたが、 それは、もう解読済みになっている。 なら、Google は、今何を企んでいるのか? Google Books 慶応大学プロジェクト 明治の図書のOCR解析作業完了 學問すゝめ 自第一篇至第十七篇 「天」「西洋」で、検索 検索成功(2011.1.22確認)

    『Google は、江戸末期の活字のOCRに成功している。』
    myrmecoleon
    myrmecoleon 2011/01/31
    うわ。GoogleのOCR技術は江戸時代の活字までいけるようになったんか……。
  • 『個人のための電子図書館の創造』

    黒澤公人のドキュメンテーションシステムの100年(1960年-2060年) 一次情報ダイレクトアクセス時代のドキュメンテーションシステム 蔵書の量の増加にともなって、管理コストが増大する。 10000円分の図書があれば、10000円の管理コストが 100万円分の蔵書があれば、100万円分の管理コスト(一部屋分ぐらいかな) 1000万分あれば、1000万円の管理コストが 1億円分あれば、1億円の管理コストが 単純に図書の価格と管理コストが、比例することは簡単にわかるが、蔵書の価格と管理コストが 同じかどうかは、いろいろな比較検討が必要ですね。 図書を管理するのはたいへんなのだ。 もし、図書を物理的に管理しなくてもよくなれば、このコストが軽減できる。 具体的には、図書の全ページスキャンをする。 いままでは、このスキャンするためには、を分解してページをバラバラする必要があった。) しかし、最近

    『個人のための電子図書館の創造』
    myrmecoleon
    myrmecoleon 2009/07/21
    「もし、図書を物理的に管理しなくてもよくなれば、このコストが軽減できる」そう思ってた時代が俺にもありました。
  • 『大型書店の図書の売上げを伸ばす方法』

    黒澤公人のドキュメンテーションシステムの100年(1960年-2060年) 一次情報ダイレクトアクセス時代のドキュメンテーションシステム 久しぶりに都心の大型書店に行った。 最近は、もっぱら、アマゾンで図書を買うことが多い。 注文して翌日配達してくれるので、うれしい。 さて、大型書店をウロウロして考えたこと。 基データ この書店に1日何人が訪れるのか。 一人あたり、何冊買っているのか。 求める図書に何分ほどで、必要な図書を手にいれているのか。 売り筋の図書をどのように分析しているのか? さて、この書店には、どのくらいの図書があるのか? いつ頃もまでの図書があるのか? この書店の売上げと補充の関係は 実は、せっかく書店に来たのだから、を買おうと思ったが、著者名の苗字しか思い出せない。 しかも、それも、あやふや。 店内の端末にとりあえず、苗字をカタカナで入れてみる。 さんざん待たせたあげく

    『大型書店の図書の売上げを伸ばす方法』
    myrmecoleon
    myrmecoleon 2009/06/29
    「地域ごとに代表的な図書館で、予約情報を公開している図書館システムを探します」予約情報公開してる図書館ってあるのかしら。/ブクマ済みでした;
  • 『図書が巻物になるとき(電子図書館の到来)』

    黒澤公人のドキュメンテーションシステムの100年(1960年-2060年) 一次情報ダイレクトアクセス時代のドキュメンテーションシステム 電子図書館に格納される図書は巻物でなければならない。 10m、100mにおよぶ巻物でなければならない。 電子図書館は、巻物を管理する図書館である。 すべての図書が巻物になるとき、電子図書館が登場する。 電子図書館の中で、ページ形式の図書は、限られた存在でしかありえない。 ------------------------------------------------------------------------- 印刷と紙の限界から開放された電子図書館は、巻物の世界に突入し、現代の巻物として 復活する。 おそらく、この巻物化現象によって、日縦書きは、非常に衰退することになるだろう。 その一つの原因は、縦書き世界において、日語と他の言語(英語など)

    『図書が巻物になるとき(電子図書館の到来)』
    myrmecoleon
    myrmecoleon 2009/05/21
    黒澤さんは縦書き横書きを重要視しすぎてる気がするんだよなあ。/それはそれとして巻物の比喩は面白い。
  • 『図書館の密やかな悲鳴(図書館サービス原論)』

    新年度がはじまり、学期外のつかの間の静けさが失われた。 (学期外も図書の蔵書点検、掃除でてんてこ舞いであったので、静けさなんてなかったけど。) 授業が開始されると図書館の利用は急速に増加。 貸出冊数が伸びるのはかまわないが、問題は、予約の増加である。 毎日、毎日、数十人が予約をつけていく。 授業に使う図書はリザーブブックとして短期貸出(当日、1日、3日間)で対応する。 事前に、利用が集中することがわかっているからである。 しかし、一般図書も次々と予約がついてくる。 しかし、図書館の利用は、利用規則によって利用されるので、予約が付いたから 早く返せとはいえない。 最初の利用者が返却するのをひたすら待つばかりである。 図書館は、基的にサービスという概念が成り立たないところで、サービスをしているのではないかと 思う。 どのくらいの予約が、許容されるべき量なのであろう。 ICU図書館では、学期中

    『図書館の密やかな悲鳴(図書館サービス原論)』
    myrmecoleon
    myrmecoleon 2009/04/30
    「ICU図書館では、学期中は、500冊から1000冊程度は予約がつく」何その公共図書館。うちは月に10数件だが……
  • 『OPACに付くべき機能(案)』

    黒澤公人のドキュメンテーションシステムの100年(1960年-2060年) 一次情報ダイレクトアクセス時代のドキュメンテーションシステム 図書館の図書を基的に1冊しかないので、利用が集中するのはさけなければならない。 書店のベストセラー、ランキング、図書紹介など、図書にとって、混乱を招く原因にしかならない。 そこで、OPACにつくべき機能 OPACにつけるべき機能 貸出中図書を除く (貸出中の図書を検索してみ、すぐに使えないから) 返却期限が、1ヶ月以上先の図書を除く (すぐに利用できない) 1週間以上先の図書を除く 長期延滞図書を除く(長期延滞には、理由があるので、すぐに利用するのはむずかっしい。) 最近使われた形跡のない図書を除く (1,2,3年程度の幅で) 最近使われた形跡のある図書ののみを検索する。(1,2,3年程度の幅で) 日返却された図書、チェックされた図書を除く (まだ、

    『OPACに付くべき機能(案)』
    myrmecoleon
    myrmecoleon 2009/04/08
    「本日返却された図書、チェックされた図書を除く」リアルタイム処理がされてない場合は意味がないが。あとは比較的現実的な機能かな。何をデフォルトにするかの設定は考慮。
  • 『自動ページめくり技術 ブックタイム』

    黒澤公人のドキュメンテーションシステムの100年(1960年-2060年) 一次情報ダイレクトアクセス時代のドキュメンテーションシステム 2009年1月5日の読売新聞(夕刊)を見ていたら、 信州大学などが開発した自動ページめくり装置が紹介されていた。 日にもあった。自動ページめくり技術 2008年 「今年のロボット大賞」の「最優秀中小ベンチャー企業賞」を受賞したそうだ。 製品開発は2004年で、社会的に認められるまで、4年を要したということだろうか。 世界中で、図書のデジタル化が急速に進む中、日技術の進化も期待したい。 現在、Googleがスキャンした図書は既に、数千万冊、もしくは1億冊に達しているかも知れない。 重複読取を除いても、1000万冊のデータを確保しているのは、間違いない。 一応、アメリカでの著者権問題も和解に持ち込み、いままで、読み取っても公開できずに いた、大量のデー

    『自動ページめくり技術 ブックタイム』
    myrmecoleon
    myrmecoleon 2009/01/06
    35万なら海外のと比べると馬鹿安いな。個人でも買えそう/ああ。めくるだけでスキャン(撮影)する機構は別に用意せにゃならんのか。いろいろ制限もあるなあ
  • 『図書館の不思議シリーズ 大学図書館が成り立つわけがないのだが』

    大学のような閉じられたコミュニティでは、図書の需要に関する情報源(授業や研究)など かぎられた情報源で多数の学生が誘導される傾向になる。 そのような限られたコミュニティーをサポートするのに、図書を1冊づつしか持たない 図書館が存立できるわけがないように思われる。 もっと、小さな学校図書館で、1冊の図書を順番にみるというようなことが 可能だろうか? まぁ、興味にある学生だけがみればいいということを考えれば、図書があっても なくても、特に問題ないのかもしれないが。 2学期の試験期に突入中。 図書館の利用および、図書自体の利用率も急速に高くなり、 予約も増加していく。 しかし、予約が需要を満たすことなく、棚に戻されることも多い。 タイムリーなサービスは、いろいろ難しいね。

    『図書館の不思議シリーズ 大学図書館が成り立つわけがないのだが』
    myrmecoleon
    myrmecoleon 2008/11/17
    「図書を1冊づつしか持たない図書館が存立できるわけがない」そのせいか,大学図書館は複本大目ですね。学校図書館の場合は公共図書館や他の学校図書館から借りて集めるとか。
  • 『図書館の不思議シリーズ 適正な予約数とは』

    黒澤公人のドキュメンテーションシステムの100年(1960年-2060年) 一次情報ダイレクトアクセス時代のドキュメンテーションシステム 貸出が多くなると予約が増加する。 この予約数は、貸出数とどのような関係にあるのが、適正というべきだろうか まさか、貸出数より、予約数が多いということはあるまいが、 瞬間貸出数にたいして、何パーセントぐらいが、適正な数値だろうか 現在、10000冊の図書が貸し出されているとして、1000冊など、10%  500冊だと 5% の予約ということになるのだが。 5%の予約でもかなり多いような気がするね。 数%というあたりが、活発な図書館(公共図書館を除く)かもしれないね。 この予約を予約せずに充足できるようになる(すなわち複を多くする)と、 貸出数が、10%から20%あがることになるのではないか? 予約しない潜在的な利用も見込んでいますが。

    『図書館の不思議シリーズ 適正な予約数とは』
  • 『電子図書館』

    黒澤公人のドキュメンテーションシステムの100年(1960年-2060年) 一次情報ダイレクトアクセス時代のドキュメンテーションシステム LPがCDに変化するとき、LPのケース、付随資料など、多くのものが失われ、小さなケースに変更された。 しかし、その小ささは、存在の量を拡大させた。 それは、象よりも、ねずみがいっぱいいるのと同じ原理が働く。 小さくなると、その分、量が拡大して、バランスがとれる。 それでも、量が飽和にたっすると、大きさをもっと小さくして、その量を増やす。 現在は、小さなiPODなどに、数万曲を収納可能になっている。 LP時代に数万曲を管理するには、たぶん、家一件分のレコード保存スペースが必要だった。 しかし、いまは、ポケットに入ってしまう時代になった。 それが、うまく実現できないのは、図書の世界だ。 文字情報という非常にコンパクトの情報形態にもかかわらず、ポケットに入る図

    『電子図書館』
    myrmecoleon
    myrmecoleon 2008/10/01
    目録情報の共有はフォーマットの違いがネックかなあ。
  • 『図書館の不思議 シリーズ1』

    黒澤公人のドキュメンテーションシステムの100年(1960年-2060年) 一次情報ダイレクトアクセス時代のドキュメンテーションシステム 図書館の不思議シリーズ 1 大きな市立図書館になると、年間100万冊の貸出を行う図書館の多くなった。 1日あたり、4000人、5000人の来館者もある。 よく読まれる図書には、1000人、2000人の予約がつくことも珍しくない。 図書館は、書架を公開して、書架から自由に図書を抜き取り、手続きをすれば、自分の家に もっていっていい。 100万冊の図書が1年間で動くというのは、大図書館の図書が一度すべて、外に出で、また 正しい位置に戻されるとことになる。 100万冊を300日でわれば、1日3333冊が移動していることになる。 3000冊の図書となると、トラックで1台で運ぶことができるだろうか? 段ボール箱に30冊入れてみると、100箱にに達する。 かなり大き

    『図書館の不思議 シリーズ1』
    myrmecoleon
    myrmecoleon 2008/10/01
    「100万冊を300日でわれば、1日3333冊が移動していることになる」まあその手のとこは分館とかも複数ある気がしますが。大学図書館でも一日千冊くらいは普通かな。「段ボール箱に30冊入れてみる」文庫本なら
  • 『県内書店 12年で半減』

    佐賀県書店商業組合(岩永藤房理事長)に加盟する書店が、この12年間で124店から62店に半減している。インターネット書店の普及や、雑誌販売ではコンビニエンスストアとの競合などで売り上げ減少に歯止めがかからないことが主な要因で、地場の小規模店を中心に今後も厳しい状況が続きそうだ。

    『県内書店 12年で半減』
    myrmecoleon
    myrmecoleon 2008/09/16
    佐賀県。
  • 『Google Book Search 1000万越え』

    どうも、画像がきれいに表示できませんが 9月10日に観測された 10100600。 スクリーンショットはきれいにできているのだが、このブログにアップするとどうも、こんな画像に なってしまった。 DATE:0-99999 で、検索 (日付検索としては無効の数字です。) 日によって、800万から900万代の場合もあり、毎日大きく変動中。

    『Google Book Search 1000万越え』
  • 『書誌ユーティリティとしてのアマゾン、図書供給のとしてのアマゾン』

    もしかすると、世界最大の書誌ユーティリティーは、OCLCではなく、アマゾンだろう。 OCLCは、図書館に書誌を有料で供給しているが、AMAZONは、無料で、多くの個人のブログや サイトに供給している。無料という以上に、アフリエイトして、お金さえ払って供給、利用させている。 こんな手法に、なかなか対抗することはできないね。 そんな意味で、世界最大の書誌ユーティリティーはアマゾンだろうと思うのだがいいかがだろうか。 もちろん、アマゾン書誌ユーティリティーをみなすのは、定義が間違っているという意見も あるとおもうが、すでに、多くの書誌ユーティリティーが消滅した現在、書誌ユーティリティーの 定義も、考えなおした方がよいのかもしれしれない。 図書供給としてのアマゾン。 図書館間では、相互貸借という制度があり、全国では、かなりの数が行われているらしい。 その数は、年間数百万とも言われる。それほど、図書

    『書誌ユーティリティとしてのアマゾン、図書供給のとしてのアマゾン』
  • 『Google Book Search 減少は収束して、安定してきたか?』

    出版年 0000-9999 4月28日計測 .com ALL 3910600 LIMIT 2540600 .co.jp すべて 3910600 限定  2530600 どうも、減少は、なくなり、安定状態に入ったような印象である。 いつものことながら、原因、理由を知ることはできない。 (Google Book Search 側にすれば、特に問題にすべきことでもないということでしょう。)

    『Google Book Search 減少は収束して、安定してきたか?』
  • 『Google Book Search 減少とまらず』

    Google Book Search 減少とまらず。 年代 0000-9999 で、検索 すべて 3810600 限定  2930600 4月1日は 530万あったのに、すでに、30% ほどが、減少した。 ニュースは、ないようだ。 原因不明

    『Google Book Search 減少とまらず』
  • 『Google Book Search 大幅減少中(?)』

    GoogleAmazon は、情報をほとんど公開しないため、何が起きているのか ほとんど不明である。 Google Book Searchが、どうやら、急速に縮小をしているようだ。 理由は不明である。 Google Book Search (co.jp 調べ) 4月1日では 年代   すべての書誌 限定表示 全体表示 0000-9999    5270600 3840600 381600 530万ほどあった書誌は、現在(4月13日現在) 400万程度に減少。 年代   すべての書誌 限定表示 全体表示 0000-9999   4030600 3080600 220206 年代 すべての書誌 限定表示 全体表示 0000-9999 4030600 3080600 220206 1000-1500 2280 0 0 1501-1800 18900 12200 12200 1801-1850

    『Google Book Search 大幅減少中(?)』
    myrmecoleon
    myrmecoleon 2008/04/14
    インデックスの更新あたりの問題だと思うのだけど
  • 『Google Book Search, Amazon 定点観測(2008年2月末動向)』

    Amazon は、安定した増加傾向にある。 2006年4月と2008年2月の比較をすると 和書は、当時の4,5倍に増加 洋書は、当時の2倍弱に増加したと推定される。 へたをすると、Google Book Search を越える規模に発展する可能性も大きい。 Google Book Search は、2月上旬 かなりの減少傾向をしめしたが、下旬に回復傾向にある。 原因は、不明だが、索引再作成や、大幅な書誌調整(重複チェック作業)などが、考えられるが 不明。 慶応との明治の活字のOCR化は、ほとんどめちゃくちゃ。 いろいろ難しい問題が山済み。 Google は、不可能とも思えるようなことに挑戦するのが、好きなので、ar どのように、江戸末期、明治時代の活字を攻略するのか、興味が尽きない。ha MSは、ヒット件数が多くなると Thousands になるため、計測不能 Google schola

    『Google Book Search, Amazon 定点観測(2008年2月末動向)』
  • 『図書館、書店の共存(出版不況の原因について)』

    出版不況の乗り越えるひとつの方法は、図書館と書店の共存関係にある。 図書の売り上げの減少を、図書館のせいにする見方もあるが、それは、根的に 間違っている。(ただし、書店とブックオフの共存は難しい利害関係にある。) あまり、例がないかもしれないが、図書館のとなりに書店を開くべきである。 ともに、繁盛するにちがいない。 なぜ、そう思うのか。 実は、の行動をみていると、それに思い至る。 彼女は、市の図書館のヘビーユーザーの一人であるが、同時に大量に図書を買い込んでおり、 いつも、図書館と書店がとなり同士にあれば、いいのにと嘆いているからである。 この相乗効果ははかりしれない。 図書館に足しげく通う人に、図書館は、十分に機能するわけがない。 図書館が、ベストセラーの図書を数十冊買い込んでサービスしたところで、 図書館がユーザーを満足させることはできない。 それでも、数ヶ月1年待ちでも、図書を読

    『図書館、書店の共存(出版不況の原因について)』
    myrmecoleon
    myrmecoleon 2008/01/29
    京都の市立図書館のとある分館の向かいにエロ本屋があって戦慄した覚えが……ってぜんぜん趣旨ちがうけども/さいきんは書店自体が図書館の業務委託受けてたりもするなあ
  • 『Googleの次の一手(まったく根拠がありません)』

    Googleの次の一手。(あくまで、想像です。もしかすると、なにか既に実現していたりするかもしれませんが。) Web 2.0 時代のビジネスとして、出版ビジネスをサポートすることだろう。 図書を出版するビジネス たぶん、作家とかは、つかわないんでしょうね。 自主出版や、年1冊、数年に1冊程度の出版しかしない人のための、図書作成ソフトの作成。 Web2.0的で、Googleの巨大サーバーに向かって、世界中で、図書を作成したい人は、 このサーバーに向かって、書き込む。 完成したら、出版サポートや、インターネットサポートをする。 有料販売、無料提供など、いろいろ可能。 スペルチェック、文法チェックはもとより、時代考証、索引、目次、抄録、人物、地域の内容チェック、 自動作成等をする。 (類似、盗作がないかとうをチェックする。) そのまま、著作権処理をして、Google Book Search 

    『Googleの次の一手(まったく根拠がありません)』