タグ

ブックマーク / japan.cnet.com (87)

  • グーグルの「Lookout」アプリ、食品ラベルの識別なども可能に--視覚障害者を支援

    Googleは米国時間8月11日、視覚障害者支援アプリ「Lookout」の対応機種を拡大し、さらに多くの「Android」デバイスで使えるようにした。また、2つの新たなモードを追加して、品ラベルの識別や文書のスキャンを可能にしたほか、アプリのデザインにおけるアクセシビリティーも改良した。2019年3月にリリースされたLookoutはこれまで、Google製スマートフォン「Pixel」でしか利用できなかった。 「Food Label」モードでは、スマートフォンのカメラを品パッケージのラベルに向けると、Lookoutが中身を識別する。カメラがラベルを正しくとらえられない場合は、商品のパッケージまたはバーコードがはっきり写るまで商品を動かすよう促す。 「Scan Document」モードの目的は、手紙やメールを読みやすくすることだ。Lookoutを利用して文書のスナップショットを撮影すると、

    グーグルの「Lookout」アプリ、食品ラベルの識別なども可能に--視覚障害者を支援
    kzakza
    kzakza 2020/08/15
  • グーグルの「音声文字変換」アプリ、犬の鳴き声やノックの音も表示へ

    Googleの「Live Transcribe(音声文字変換)」アプリに音事象を表示する機能が加わる。Googleによると、聴覚障害者が音の世界をもっと楽しむのに役立つという。 Google機械学習および音声認識技術のアップデートにより、Live Transcribeは会話だけでなく、犬のほえる声やドアをノックする音、拍手、笑い声、音楽、ホイッスル、通りすぎる車などの音も文字化できるようになる。 Live Transcribeは、「Sound Amplifier(音声増幅)」とともに2月にリリースされた。Live TranscribeとSound Amplifierはいずれも、聴覚障害者がより簡単にコミュニケーションできるようにする狙いがある。 Live Transcribeは、スマートフォンのマイクを通じて会話を捕捉し、その内容をディスプレイに自動表示する。 Google機械学習の公

    グーグルの「音声文字変換」アプリ、犬の鳴き声やノックの音も表示へ
    kzakza
    kzakza 2019/05/21
  • IBMフェローの浅川智恵子氏、全米発明家殿堂に--視覚障がい者用ウェブ読み上げ技術で

    社会的に優れた発明や発見をした人々をたたえる目的で活動している非営利団体の全米発明家殿堂(National Inventors Hall of Fame:NIHF)は、2019年の殿堂入り対象者として、IBMのIBMフェローである浅川智恵子氏を選んだ。同氏の研究チームが開発した視覚障がい者向けウェブページ読み上げ技術「Home Page Reader(HPR)」を評価したもの。 HPRは、目の不自由な人々のインターネット利用を支援するため、ウェブページの内容を解析し、合成音声で伝える技術。マウスでなくテンキーによる操作が可能で、ウェブページ上のテキストやフレーム、画像、リンクなどの情報を音声で出力する。シンプルな情報にとどまらず、クリッカブルマップ、テレビ番組表のような複雑な構造のテーブルといった情報も音声化できるという。米国特許「SYSTEM AND METHOD FOR INFORMA

    IBMフェローの浅川智恵子氏、全米発明家殿堂に--視覚障がい者用ウェブ読み上げ技術で
    kzakza
    kzakza 2019/01/17
  • 本の内容を手話で伝える「StorySign」アプリ、ファーウェイが提供 - CNET Japan

    文字を読む能力を身につけるのは、どのような子供にとっても長い時間のかかる複雑なプロセスだ。しかし、世界中の耳の不自由な子供たちは、一層の努力をしなければならない。こうした子らは、ほとんどの学童が頼りにする音声ベースの教材を利用できず、教師や親が繰り返し話す言葉を聞き取ることもできない状況で、に書かれた文字を解釈する方法を学ぶ必要がある。 中国のスマートフォンメーカー、華為(ファーウェイ)は無料アプリ「StorySign」によって、この問題を解決できると考えている。StorySignは人工知能AI)を活用し、子供がを読んでいるときに文字とともに手話を表示する。 アプリを開いてページの上にかざすと、Aardman Animations(「ウォレスとグルミット」を制作したアニメ工房)によって作り出されたStarというキャラクターが文字を認識して、該当箇所を強調表示しながら手話で子供に伝える

    本の内容を手話で伝える「StorySign」アプリ、ファーウェイが提供 - CNET Japan
    kzakza
    kzakza 2018/12/05
  • アップルのクックCEO、企業の個人データ収集に警鐘--欧州のGDPRを称賛

    Tim Cook氏は欧州のプライバシー監視機関に対して現地時間10月24日、データとプライバシーをめぐる世界規模の「危機」は実在すると述べ、人々の好み、恐れ、望みが、個人データを収集する企業の間で「軍隊のように効率的に」取り引きされていると警告した。 同氏は、 欧州連合(EU)の一般データ保護規則(GDPR)を称賛する熱のこもったスピーチを繰り広げ、そうした個人情報の取引が「データ産業にまで発展している」と主張した。 「日々の情報から極めて個人的な情報まで、われわれの個人情報が武器化され、軍隊を思わせるほどの効率的なやり方で、われわれ自身に向けられている」と、Cook氏は民間企業による個人情報の利用を批判した。 ベルギーのブリュッセルで開催中の第40回データ保護プライバシーコミッショナー国際会議(ICDPPC)で行ったこの基調講演でCook氏は、プライバシーとデータ収集をめぐり、以前に名指

    アップルのクックCEO、企業の個人データ収集に警鐘--欧州のGDPRを称賛
    kzakza
    kzakza 2018/10/29
  • Echo Showに音声使わずAlexaを操作できる新機能--Alexa Captioningの国内展開も明らかに

    Amazon Echo」などのスマートスピーカによって、音声操作が多くの家庭で使われるようになっている。しかし、「Alexa」の言葉が聞こえない人はどうするのか。そもそも、Alexaに話しかけるのが困難または不可能な人はどうするのか。 Amazonは、そうした疑問に対する答えを用意した。米国時間7月23日から導入された「Tap to Alexa」機能は、その名前が示すとおり、タッチ画面付きスマートスピーカ「Echo Show」の画面をタップするだけで、カスタマイズ可能なショートカットにアクセスし、天気やニュース、タイマーなど、Alexaの一般的なアクションを起動することができる。これらのショートカットは、ユーザーの使い方に合わせて並べ替えたり、他のショートカットと入れ替えたりできる。また、新しくキーボードアイコンも追加され、これをタップすると、話しかけなくても特定のコマンドを文字入力でき

    Echo Showに音声使わずAlexaを操作できる新機能--Alexa Captioningの国内展開も明らかに
    kzakza
    kzakza 2018/07/28
  • 手書き文字を99.3%の精度で読み取る「Tegaki」--開発元が総額13億円を調達

    人工知能の研究開発を手がけるCogent Labsは3月1日、SBIインベストメントおよび、トッパン・フォームズを引受先とする総額13億円の第三者割当増資を実施すると発表した。 今回の調達により、印字・手書き文字をデータ化する「Tegaki」の事業化と複数の新規アプリケーション開発、リサーチとエンジニアリング体制のさらなる強化、次世代人工知能の研究・開発に活用するという。 Tegakiは、印字された文字や手書き文字を高精度で読み取るプロダクト。手書き文字でも、最大99.3%の読み取り精度を実現しているという。業界や事業規模を問わず、手入力作業にかかる業務の効率化とコスト削減、労働生産性の向上を目指す。また、SBIインベストメントとトッパンのネットワークや顧客基盤を活かし、国内市場やアジアなどでのサービス提供も視野に入れるという。 同サービスでは、APIを通じたサービスを提供することで、同社

    手書き文字を99.3%の精度で読み取る「Tegaki」--開発元が総額13億円を調達
    kzakza
    kzakza 2017/03/05
  • 富士通、少数データで効率よく学習できる深層学習技術--中国古文書文字で成果

    富士通研究開発中心(FRDC)は2月21日、中国古文書文字の文字認識において、少数の学習データでも高精度な文字認識を実現する深層学習技術を開発したと発表した。 同技術は、古文書の文字画像と文字を紐づけたデータ(教師データ)で学習させる深層学習の認識エンジンと、文字とは紐づけられていない2つの文字画像が、同じ文字かどうか特徴を学習する深層学習エンジンを組み合わせたもの。一文字当たり約70%少ない教師データ数で、従来技術と同じ精度の認識率を達成したという。 深層学習技術による文字認識では、あらかじめ文字画像と正解の文字を紐づけた教師データを用いて認識エンジンに学習させる。この時、教師データの数が多いほど認識精度が高くなるが、多様な書体があり同じ文字でも異なる字形が多数存在する中国古文書では、十分な数の教師データを用意することに課題があった。 今回の技術では、学習データを増やすため、正解の文字と

    富士通、少数データで効率よく学習できる深層学習技術--中国古文書文字で成果
    kzakza
    kzakza 2017/02/22
  • 人工知能Watsonにテープ起こしさせてみた:WebClip - ウェブ制作、UXD/IA、アクセシビリティ

    この記事は、IBM Bluemix に関するブログを、12月1日からリレー投稿していく teratail Bluemix Advent Calendar の14日目の記事です。 UXデザイナーの羽山 祥樹(@storywriter)です。最近、ライターとしての仕事も増えてきました。 どちらの仕事でも共通するのが「インタビューのテープ起こし」です。 UXデザインでは、調査でユーザーインタビューした結果を、録音から文字に書き起こして、分析します。 ライターとしては、取材したインタビューを、文字に起こして、原稿にします。 この「テープ起こし」、けっこうな手間がかかります。インタビューした時間が2時間だとすると、書き起こしに10時間かかる、なんてこともザラです。 テープ起こしの専門会社にお願いすることもできますが、1〜2万円ほどの費用がかかります。報酬が潤沢な案件ならよいですが、そうでないと、ちょ

    人工知能Watsonにテープ起こしさせてみた:WebClip - ウェブ制作、UXD/IA、アクセシビリティ
    kzakza
    kzakza 2016/12/19
    ここまでできれば、音声とテキストデータがあれば、それらを自動同期させてマルチメディアDAISY化することはすでに十分可能では
  • 本を開かずに読み取る方法、MITが開発

    マサチューセッツ工科大学(MIT)の研究者らは、テラヘルツ波と呼ばれる種類の電磁波を利用することにより、閉じたの内容を読み取ることのできる画像処理方法を考案した。このチームは、積み重ねられた紙と、テラヘルツ波を短バーストで放射するカメラを用いて、9枚下までの紙に印刷された文字を正しく読み取ることができるという。 テラヘルツ波は、マイクロ波と赤外線の間に相当する電磁波の一種。化学物質によってテラヘルツ波の吸収率と反射率が異なるため、物質を容易に見分けることができ、非破壊材料分析に有効だ。これによって、紙上のインクで印字された部分と空白部分を区別することができる。カメラがテラヘルツ波を放射し、内蔵された検出器が反射を受信する。 現時点では、透視できるのは20枚下まで、文字を正確に判読できるのは9枚下までにとどまる。それよりも深くなると、信号雑音比(SNR)が高くなって信号がかき消されてしまう

    本を開かずに読み取る方法、MITが開発
    kzakza
    kzakza 2016/09/14
    いずれキャビネに収納された紙の書類群も一括で全文検索できる時代がくる予感..
  • 電子書籍のスキャンダル--経産省「緊デジゲート」がはじけたようです

    こんにちは、林です。一部では、かの「ウォーターゲート事件」になぞらえて、「緊デジゲート」とも呼ばれている、電子書籍の国家プロジェクトに関するスキャンダル。そこに、会計検査院のメスが入ったようです。 “電子書籍の市場を広げて東北の情報発信などにつなげようと国の復興予算を使って電子化されたが、少なくとも1600冊以上、著作権の調整がつかないなどの理由で配信できていないことが会計検査院の調べで分かりました。(中略)配信されていないに使われた補助金は5600万円に上り、会計検査院は配信を進めるよう求めました。この事業では、電子化されたのうち東北関連は全体の3%にとどまったほか、復興事業にふさわしくないわいせつな内容だったとして20冊分の補助金が返還されています。” 読売、日経、毎日各紙も報じています。 緊デジとは何か? 「緊デジ」とは何か? 2012~2013年にかけて、国からの10億円、出

    電子書籍のスキャンダル--経産省「緊デジゲート」がはじけたようです
    kzakza
    kzakza 2015/10/05
  • アマゾン、「Apple TV」「Google Chromecast」を販売禁止に--「Prime Video」に関連しての措置

    Bloombergの記事によると、世界最大のオンライン小売業者であるAmazonは、同社マーケットプレイスの販売者宛てに電子メールを送付し、「Apple TV」とGoogleの「Chromecast」の販売を廃止すると伝えたという。新たな出品は許可されず、在庫はすべて米国時間10月29日に削除されるという。 Amazonの広報担当者は、同社の「Prime Video」サービスに関連する変更だと述べた。Prime Videoは、AppleGoogleの機器上では簡単には利用できない。

    アマゾン、「Apple TV」「Google Chromecast」を販売禁止に--「Prime Video」に関連しての措置
    kzakza
    kzakza 2015/10/02
    自分の商売を優先するあたりがプラットフォーマーとして信頼できないところだな。
  • 学会講演における音声認識を用いた情報保障(字幕付与)の試験運用開始

    一般社団法人情報処理学会(会長:富田達夫)と京都大学(学長:山極壽一)は、情報処理学会アクセシビリティ研究グループ(SIG-AAC)の発足に際して、聴覚障害者を対象として、京都大学で研究開発されてきた音声認識システムを用いた字幕付与(情報保障)の試験運用を開始します。8月22日に開催されるSIG-AACの第1回研究会において実施する予定です。講演者の音声を高い精度で文字化する音声認識システムの学会における継続的な運用は前例がなく、複数の熟練者による連係タイプ入力と比べて、大幅に低いコストで情報保障の提供が期待されます。 2016年度(平成28年度)から施行される障害者差別解消法では、障害者に「合理的配慮」を行うことが義務づけられています。大学等に在籍する障害学生数は年々増加しており、講義や学会等の講演会において情報保障を提供することが要請されています。聴覚障害者に対しては、要約筆記・字幕付

    学会講演における音声認識を用いた情報保障(字幕付与)の試験運用開始
    kzakza
    kzakza 2015/08/22
    障害者差別解消法の施行を見据えた学会の情報保障の試み。
  • 著者が“最も適切と思う長さ”で電子出版できるサービス--アマゾンが日本でも開始

    アマゾンは4月28日、著者が“最も適切と思う長さ”で電子書籍を配信できるサービス「Kindle Singles」を開始した。プロの作家だけでなく、新進の作家、出版経験のない人による作品や、英語ドイツ語Kindle Singlesでのベストセラー作品などを対象タイトルに追加していく方針。コミックの取り扱いも予定しているという。 Kindle Singlesは2011年に米国で開始。現在は英国やドイツでも展開しており、これまでに900作品近いを配信しているという。 Kindle Singlesの書籍は、通常30~150ページ(400字詰め原稿用紙換算)で構成。価格は一冊99円~399円で、同社の電子書籍リーダー専用端末「Kindle」や「Fireタブレット」、Kindleのアプリに対応する。なお、Kindle Singlesに直接作品を提供した著者は、最大70%のロイヤルティを受け取れる

    著者が“最も適切と思う長さ”で電子出版できるサービス--アマゾンが日本でも開始
    kzakza
    kzakza 2015/04/28
  • 始まるか、電子図書館「仁義なき戦い」--新展開を迎えた日本の電子書籍

    こんにちは、勝負事には、めっぽう弱い林です。 ゲーム全般、特にボードゲームが大好きなのですが、ルールを覚えたばかりのまったくの初心者に、初戦で敗北、なんてこともしょっちゅう。ゲームの「仕組み」には興味があっても、勝つことへの執着が低いのですね……。先日、中学2年の末っ子にチェスを教えてやりましたら、また初戦敗退しまして……さすがにこれはないだろうと、ちょっと頭を痛めているところです。 最近はやりの「カタンの開拓者たち」を入手したので、今週末は、これでリベンジを狙っています(というか2人でできるんだろうか?)。 ところで、Aというゲーム(戦場)では旗色が悪いので、Bという別のゲーム(戦場)で勝負を挑む――。これは経営学でいうと、「ランチェスター戦略」と呼ばれる戦略ですね。ランチェスター戦略では、大きな市場シェアを持つ「強者」と、それ以外の「弱者」とでは、取るべき選択が大きく異なる、と考えます

    始まるか、電子図書館「仁義なき戦い」--新展開を迎えた日本の電子書籍
    kzakza
    kzakza 2015/04/18
  • コードをつうじて、ユーザーを考える ~「コーディングWebアクセシビリティ」書評:WebClip - ウェブ制作、UXD/IA、アクセシビリティ

    まもなく発売の新刊を、ひと足先に、ご恵贈いただいた。 じつはすでにAmazonで予約していたので、手元に2冊、あることになる。 コーディングWebアクセシビリティ - WAI-ARIAで実現するマルチデバイス環境のWebアプリケーション Heydon Pickering (著), 太田良典, 伊原力也 (監修) アクセシビリティのイベントに行くと、国内のトップクラスといわれるマークアップエンジニアが、多く参加している。いつも不思議に思う。 優れた技術者は、アクセシビリティに興味を持ちやすいものなのだろうか。 書を読んで、腑に落ちた。 コードはどうあるべきか。マークアップの美学を追っていくと、やがて、アクセシビリティに辿りつく。 書は、そういうである。 コードには、良いコードと、悪いコードがある。美学があるコードと、ダサいコード、ともいえる。 ベテランのエンジニアに、おおむね共通する美

    コードをつうじて、ユーザーを考える ~「コーディングWebアクセシビリティ」書評:WebClip - ウェブ制作、UXD/IA、アクセシビリティ
    kzakza
    kzakza 2015/03/24
  • アップルと共同開発した世界初の「スマート補聴器」--ジーエヌリサウンドのこだわり

    ヘッドホンやウェアラブル端末など、スマートフォンと連動して管理できる機器は増え続けているが、この流れは高齢者や障がい者などハンディを持つ人のための“アクセシビリティ製品”の領域にも広がってきている。 デンマークの補聴器メーカーであるジーエヌリサウンドは、世界で初めてスマートフォンで管理できる補聴器「ReSound LiNX(リサウンド リンクス)」を5月22日に日で発売した。 耳掛けタイプの小型デジタル補聴器で、価格は片耳で49万円。決して安くはないが、それはこの製品が日頃から外出することの多い50~60代のアクティブシニア層をターゲットにしており、小型でありながら通常の補聴器と比べて、高い性能や機能を備えているためだと、ジーエヌリサウンド ジャパン マーケティング部 部長の池田慶弘氏はいう。 アップルと共同開発--ひと味違う音声処理技術 ReSound LiNXは、ジーエヌリサウンドが

    アップルと共同開発した世界初の「スマート補聴器」--ジーエヌリサウンドのこだわり
    kzakza
    kzakza 2014/07/10
  • ウェブ誕生から25年--生みの親T・バーナーズ・リー氏が語る次のステップ(前編)

    (編集部注:ウェブ誕生から25年に際して米CNETが公開したTim Berners-Lee氏のインタビューを前編と後編の2回に分けて翻訳して公開します。後編は3月19日に公開されています) 25年前の1989年3月12日、Tim Berners-Lee氏は、移動の多い研究者たちが複雑な粒子加速器の研究を世界中からできるようにしようと、「すべてがリンクされた情報システム」を提案した。 World Wide Webはそうした当初の期待をはるかに上回るものとなっている。 Berners-Lee氏は、スイスにある欧州原子核研究機構(CERN)の研究施設を支援することを目指していたが、それよりはるかに広い範囲で使えるシステムを求めていた。それが広まったのは、当時は新しかったハイパーリンクというアイデアが後押しとなったからだ。ハイパーリンクによって、人々は大量の情報をウェブに供給し、情報を後から見つけ

    ウェブ誕生から25年--生みの親T・バーナーズ・リー氏が語る次のステップ(前編)
    kzakza
    kzakza 2014/03/21
  • CNET Japan - mobile

    人気の記事 1お手頃価格のスマホ「Pixel 7a/6a」「Galaxy A54 5G」を比較--買うならどれ? 2023年11月30日 2大和ハウス工業、建設DXへの取り組み語る--「守り」と「攻め」のDXを両立 2023年11月30日 3「Android」から「iPhone」に乗り換えて1年--気に入った機能と欲しい機能 2023年12月01日 4森ビル、麻布台ヒルズにVC集積拠点「Tokyo Venture Capital Hub」--ユニコーン創出へ 2023年11月29日 5「iOS 17.1.2」「iPadOS 17.1.2」公開、悪用された可能性のある脆弱性に対処 2023年12月01日 6「Chrome」、緊急セキュリティアップデートをリリース--ゼロデイ脆弱性に対処 2023年11月30日 710年愛用した「Android」にサヨナラ--「iPhone」に乗り換えたワケ

    CNET Japan - mobile
    kzakza
    kzakza 2014/02/24
  • グーグル、サービス利用規約の変更を発表--プロフィール名や写真の広告利用を説明

    ユーザーがウェブのいたるところで残してきた「Google +1」が、そのユーザーを後から困らせるものになろうとしている。 Googleは2011年、ユーザーデータを1つのプロフィールに一元化するという動きを取った。この動きが米国時間11月11日より、同社広告事業に対して効果を見せ始める。Googleがユーザーの名前やプロフィール写真のほか、それとなく残してきた「+1」などの支持表明をさらに多くのディスプレイ広告に使用する準備を進めているためだ。 Googleは10月11日、同社のサービス利用規約の変更を発表した。最も重要な点は、ユーザーのプロフィール名と写真がディスプレイ広告を含む「Google製品」にどのように表示されるのかを明確に説明していることだ。Googleはユーザーに対し、Google広告へのこれらの表示は「Shared Endorsements」設定からオプトアウトできると述べ

    グーグル、サービス利用規約の変更を発表--プロフィール名や写真の広告利用を説明
    kzakza
    kzakza 2013/10/13