chemical0918のブックマーク (168)

  • Astrategyを支える技術: gRPC, Elasticsearch, Cloud TPU, Fargate... SaaS型AIサービスの内側の世界

    ストックマークでは、法人ユーザー向けの「Astrategy」というウェブサービスを開発、提供しています。 エントリでは、Astrategyで使われている技術やシステム構成をご紹介したいと思います。 AstrategyとはAstrategyとは、AIがウェブニュースを解析してあらゆる市場の動向やトレンド、有力企業の経済活動を可視化し、ユーザーが市場調査や市場分析レポート作成を行うことができるウェブサービスです。 国内外約3万メディアから配信された約5000万件のビジネスニュースから、企業情報、言及されているニューストピック、業界や地域属性を抽出して分析に利用します。 抽出には汎用言語モデルBERTを用いており、その処理はCloud TPU上で動く重たい処理であるため、事前に全てのニュースデータに対して抽出処理をかけた状態で検索サーバーに登録しています。 ユーザーがAstrategyにアクセ

    Astrategyを支える技術: gRPC, Elasticsearch, Cloud TPU, Fargate... SaaS型AIサービスの内側の世界
    chemical0918
    chemical0918 2021/05/11
    ここまで出しちゃっていいのかってぐらいの記事。自然言語処理サービスのリファレンスアーキテクチャ。
  • 更地の可能性を楽しみたい。20代の若きマーケターが「ストックマーク」に抱く夢。–マーケター・宮成勇輔 | 社員インタビュー

    インターネットの広告事業を行うメガベンチャーに新卒入社後、大手電機メーカーのマーケティングや販売戦略を担う会社の勤務を経て、「ストックマーク」に入社。若くして多彩なキャリアを重ねるマーケティング担当の宮成にインタビューしました。 プロフィール 宮成勇輔(みやなり ゆうすけ): 神戸大学経営学部卒業後、「株式会社セプテーニ社」入社。インターネット専業広告代理店でアカウントプランナーとして勤務。顧客の売上拡大に向けた、運用型広告を中心としたWEBマーケティングのプラン作成及び提案と実際の納品業務に関するディレクションに従事。2018年4月より「ソニーマーケティング株式会社」にて、Xperia専用アプリのビジネス企画・推進担当として、事業拡大のための新たな収益モデルを確立、0→1の新規事業の推進も担当。 2019年9月に「ストックマーク」入社。 ——現在行なっている業務内容を教えてください。 マ

    更地の可能性を楽しみたい。20代の若きマーケターが「ストックマーク」に抱く夢。–マーケター・宮成勇輔 | 社員インタビュー
  • Flutterで高速開発したAnewsモバイルアプリ

    はじめに2020年11月にリリースされた、ストックマークのAnewsのモバイルアプリケーションにはFlutterが利用されています。記事では、Flutterをなぜ採用したのか、どのような点に課題があり、どのように工夫していったのか、という開発現場の知見について紹介いたします。(記事は、実際に開発を行った祖父江 聡士さん・海老原 隆太さんへの社内インタビューを元に執筆されています) Flutterで開発されたAnewsの画面イメージ FlutterとはGoogle社によって開発されているオープンソースのフレームワークです。クロスプラットフォーム向けの開発が可能であり、iOSやAndroidといったモバイルアプリケーションに多く利用されますが、Windows/Mac/Linuxといったプラットフォームのアプリケーションも開発可能です。 StockmarkにおけるFlutterの適用領域An

    Flutterで高速開発したAnewsモバイルアプリ
  • Wikipediaを用いた日本語の固有表現抽出データセットの公開

    ML事業部の近江崇宏です。 ストックマークではプロダクトで様々な自然言語処理の技術を用いていますが、その中のコア技術の一つに固有表現抽出があります。固有表現抽出はテキストの中から固有表現(固有名詞)を抽出する技術で、例えば「Astrategy」というプロダクトでは、固有表現抽出を用いてニュース記事の中から企業名を抽出しています。(企業名抽出については過去のブログ記事を参考にしてください。) 一般に、固有表現抽出を行うためには、大量のテキストに固有表現をアノテーションした学習データをもとに機械学習モデルの学習を行います。今回、ストックマークは固有表現抽出のための日語の学習データセットを公開いたします!ご自由にお使いいただければと思います! レポジトリ:https://github.com/stockmarkteam/ner-wikipedia-dataset 固有表現をハイライトしたサンプ

    Wikipediaを用いた日本語の固有表現抽出データセットの公開
  • TPU VS GPU(日本語版)

    はじめに(この記事の英語版はTPU VS GPU(English Edition)にあります。) Machine Learning部門の江間見です。ストックマークでは、自然言語処理技術の研究開発を行っています。 昨今、大規模データでニューラルネットワークを訓練し良い結果を得ようとするならば、深層学習モデルの訓練にかかる時間の膨大さに誰もが悩まされたことがあるかと思います。さらに、深層学習モデルはハードウェアのリソースを多く必要とします。 深層学習モデルの学習では、計算の特性上、CPU(Central Processing Unit)より GPU(Graphics Processing Unit)が高速であるため、GPUが推奨されます。しかし、GPU以外の選択肢として、TPU(Tensor Processing Unit)があります。 そこで、記事では、自然言語処理のタスクで深層学習モデル

    TPU VS GPU(日本語版)
  • ストックマークにおけるB2B SaaSセキュリティへの取り組み

    こんにちは、ストックマークでSREを担当している松下です。 ストックマークでは企業向けの情報収集・企業分析・営業支援サービス(Anews, Astrategy, Asales)を運営しており、導入を検討されているお客様よりセキュリティの取り組みに関してお問い合わせをいただくことが多々あります。 お客様のセキュリティ基準をプロダクトが満たせるかどうかは、ストックマークにとっても最重要課題であり、ストックマークのセキュリティ向上への姿勢をより分かりやすく示すために、8月にはISMS認証を取得しました。 今回はISMS認証取得を記念して、私が担当しているAsalesを例にしながら、これまでにストックマークが行ってきたセキュリティ対策の一部をざっくりとご紹介させていただこうと思います。 AsalesについてAsalesはセールスなどの提案資料や社内資料を自然言語処理技術で学習・解析し、売上拡大のた

    ストックマークにおけるB2B SaaSセキュリティへの取り組み
    chemical0918
    chemical0918 2020/09/03
    B2B SaaS且つAIが組み込まれたアーキテクチャ、公開!
  • リモートワークにおける課題から考えるデジタルワークプレイスの構築に必要なこととは? | ストックマーク株式会社

    新型コロナウイルスの影響の中、一時的とはいえリモートワークを余儀なくされる期間を過ごしたのは記憶に新しいだろう。各企業ではチャットツールやWeb会議システムなどのITルツールの導入を進め、デジタル上で働く環境の構築が進んできているはずだ。 その反面、これからはデジタルワークプレイスの構築に取り組んでいく必要がある。今回はデジタルワークプレイスの構築のために必要なことをリモートワークの課題から考えていく。 デジタルワークプレイスとは? デジタルワークプレイスとは、ガートナー社の定義によると「ビジネスの成果の向上のために、これまでにないテクノロジーを活用することで、従業員のエンゲージメントを高め、より直感的に働くことのできる環境を目指すビジネス戦略」とされている。 リモートワークを推進するためのチャットツールやWeb会議システムの導入といった、デジタル上で働くためのITツールの導入に留まらず、

    リモートワークにおける課題から考えるデジタルワークプレイスの構築に必要なこととは? | ストックマーク株式会社
  • BERTによるニュース記事の構造化:企業名抽出

    はじめにMachine Learning部門の近江です。ストックマークでは、自然言語処理技術の研究開発を行っています。 先日、弊社のTech Blogにて弊社が公開している言語モデルを紹介しました。 ストックマークが公開した言語モデルの一覧と振り返り 今回は、言語モデルがプロダクトにおいて実際にどのように利用されているかについての一例を紹介します。 ニュース記事の構造化マーケティング、新規事業開発などの調査業務では、調査を行う人が書籍、ニュース記事、ホームページなどの情報を網羅的に調べ、整理し、報告書などにまとめていきます。その際に扱う情報は膨大であり、そのため調査業務には多くの時間と労力がかかります。 弊社のプロダクトである「Astrategy」は機械学習を用いてニュース記事から特徴となる情報を抽出し、構造化することで、大量のニュース記事を効率的に俯瞰し、さらに新規事業開発などに繋がりう

    BERTによるニュース記事の構造化:企業名抽出
  • 大企業辞めて起業した会社を退職して、再就職した話

    が寝ちゃって暇なので、深夜に私の転職した話を書くよ。 ■経歴と話のまとめ WEBメディアとかやってるIT企業に就職。イメージは、楽天かリクルートかYahooサイバーエージェントかDeNAかGMOかその辺りで考えていただければと。そこを7年ほど勤めた後に、大学時代の友人に誘われて共同で起業。ただ、とあるきっかけで起業した会社を離れることになって、転職活動を新たにして無事内定もらって働いているって話。 ■起業の経緯 自分で言うのもあれだが、最初の会社ではかなり評価されていて同期の中では昇進早い方だった。年上のメンバーもマネジメントしてたし、IT企業なりの実力主義みたいなのにうまく適応できて、トントンと昇進して年収も900万円前後だった。 ただ、そんな中で大学時代の友人起業に誘われ、共同創業で起業することになった。もともと起業には興味があって、何かやるネタがないかなと考えていたところだった

    大企業辞めて起業した会社を退職して、再就職した話
    chemical0918
    chemical0918 2019/06/21
    めっちゃいい話だ。
  • BERTは本当に人間を超えているのか?自然言語処理の実態と本当の活用方法 | AI専門ニュースメディア AINOW

    Google AI Languageチームが2018年10月に発表した自然言語処理のモデル「BERT」は、質疑応答や自然言語推論といったさまざまな自然言語処理のタスクにおいて先行する言語モデルを凌駕する性能を実現しました。 国内では、2019年2月にチャットボットシステムを展開する株式会社サイシードが、「BERT」を文章の類似度を算出するためのキーワード抽出を自動で行う『sAI FAQ Builder』のサービスをリリースした他、株式会社ABEJAが2019年5月に「BERT」を活用したコンタクトセンター向けの新サービス「ABEJA Insight for Contact Center」をリリースするなど、徐々に活用が進んでいます。 今回取材したのは、ストックマーク株式会社のCTO 有馬 幸介氏です。ストックマークは、組織の情報収集の活性化ツール「Anews」や営業活動をAIを活用して効率

    BERTは本当に人間を超えているのか?自然言語処理の実態と本当の活用方法 | AI専門ニュースメディア AINOW
    chemical0918
    chemical0918 2019/05/31
    BERTどんだけ学習モデルつくるんだよ問題。
  • マイクロソフト、開発者向け共有サイト買収 8200億円  :日本経済新聞

    【シリコンバレー=白石武志】米マイクロソフト(MS)は4日、ソフト開発者が設計図(ソースコード)を公開・共有できるサイトを運営する米ギットハブを75億ドル(約8200億円)で買収すると発表した。MSは世界で約2800万人が利用するギットハブを取り込むことで、ソフト開発者向けのクラウドサービス事業を強化する。ギットハブは2008年の設立。スマートフォンの普及などとともに、無償公開し自由に改良でき

    マイクロソフト、開発者向け共有サイト買収 8200億円  :日本経済新聞
    chemical0918
    chemical0918 2018/06/05
    ひどいなこの書き方。それぐらいいまの経営層はデジタルに弱いってことだけど。それでデジタルトランスフォーメーションと騒いでいるこの国の行く末が怖い。
  • 元給食営業マンが給食会社シダックスのカラオケ事業の進出と撤退について考察してみた。 - Everything you've ever Dreamed

    シダックス カラオケ運営から撤退 | NHKニュース シダックスがカラオケ事業から撤退、今後は給事業に集中。僕はニュースそのもより、シダックスが給会社であることを知らない人が多いことに驚いてしまった。シダックスは日有数の給会社である。僕は、給の営業に携わっていたので(今もだけど)、シダックスといえば競合相手、給会社(通称/シダ)という認識しかないが、業界の外にいる人たちが、驚くのも無理はないとも思う。カラオケと給ではイメージが違いすぎるからだ。僕は給営業時代にシダックスの営業マンから、カラオケ事業について聞いたことがある。今回は、その情報をベースに、なぜ給会社であるシダックスがカラオケ業に進出することになったのか、そして撤退の理由について、給会社の営業マンの目線で考察してみたい。 物流で利益を出す仕組み エス・ロジックスという会社をご存じだろうか。材の一括購買と物流、

    元給食営業マンが給食会社シダックスのカラオケ事業の進出と撤退について考察してみた。 - Everything you've ever Dreamed
    chemical0918
    chemical0918 2018/05/31
    給食系の解説の安定感が半端じゃない。
  • 世間はそれをワークライフバランスと呼ぶんだぜ - Everything you've ever Dreamed

    「すこしワークライフバランスを配慮してもらえませんか」と同僚に言われてしまった。ワークライフバランスとは「国民一人ひとりがやりがいや充実感を感じながら働き、仕事上の責任を果たすとともに、家庭や地域生活などにおいても、子育て期、中高年期といった人生の各段階に応じて多様な生き方が選択・実現できる社会」のこと。今の職場環境では多様な生き方が出来ないらしい。申し訳ない。 当該同僚は営業として僕の下で働いている五十代前半の男性、勤務態度はまじめで、仕事の能力はうちのメンバーではよくいえば中の下、悪くいえば下の上といったところか。性格は穏やかで、いい意味で目立たない人間なのである。最初に、部長、ちょっといいですか、と声をかけられたのは黄金週間明けである。彼は、ミーティングルームに入るなり、「給与を上げてくれませんか?」といい、その際に冒頭のワークライフバランスという言葉を持ち出したのである。仕事と生活

    世間はそれをワークライフバランスと呼ぶんだぜ - Everything you've ever Dreamed
    chemical0918
    chemical0918 2018/05/22
    美しい韻だ。 “破綻したライフ。激怒するワイフ。応じないワーク。”
  • NLP Meetup Vol.0 まとめ

    先日行われたNLP Meetupのまとめです。 ビジネス側とテック側が共存するイベントもあって、150人以上の参加がありました。自然言語処理界隈のビジネスの課題・スタートアップとの共存共栄について語りました。

    NLP Meetup Vol.0 まとめ
    chemical0918
    chemical0918 2018/05/20
    日本の自然言語処理界隈のスタートアップが集結!NLP Meetupまとめ。
  • 今なら、サラリーマンがスタートアップに転職すれば、大儲けできる理由|ふろむだ@分裂勘違い君劇場

    今、2つのバブルがやってきている。 一つは、スタートアップ投資バブルであり、 もう一つは、人材待遇バブルだ。 今、日のスタートアップ界隈には、 過剰な資金が流れ込んでいる。 この過剰な資金のせいで、 スタートアップは、潤沢な資金を過剰に獲得しやすくなっている。 また、人材市場では、優秀な人材が不足しているため、 スタートアップ企業は、なかなか必要な人材を調達できずに、困っている。 これは、スタートアップにとって、死活問題だ。 なぜなら、スタートアップ企業は時間勝負なので、 良い人材が採用できるまで、何年でも待ち続けるということができないからだ。 彼らは、破格の待遇を提示してでも、 優秀な人材を素早く集めなければならないのだ。 このため、優秀な人材は、スタートアップ企業の足元を見ることができる。 かなり強気の条件を提示しても、 スタートアップ企業は、その条件を飲まざるを得ない状況にある。

    今なら、サラリーマンがスタートアップに転職すれば、大儲けできる理由|ふろむだ@分裂勘違い君劇場
    chemical0918
    chemical0918 2018/05/16
    実際は大企業並みに出すとこは少ない。スタートアップは固定費抑えないといけないので、まずはビジョンに共感する仲間を集める。こういう感覚でこられてもすぐクビになるだろう。
  • LOVE PIECE CLUB - 田房永子 - 山口達也と非生産

    TOKIOのメンバー山口達也氏の事件、醜悪なハラスメントのデパートすぎてどの方向からも一切擁護できない。 それとは別に、「病院」についての報道に衝撃を受けた。スーパースターが、病院からテレビ局に通ってテレビに出ていた。もしかしたら芸能界ってそういうことが結構あるのかもしれない。でも初めて聞いた。 5年前、私はバラエティ番組に出演したことがあった。芸能人と専門家がたくさん出る、お悩み相談の番組。「毒親漫画家」という肩書きをつけられ、2〜3時間かけて打ち合わせしたのだが、当日になると自分の考えとはまったく違うセリフが用意されていて、ママタレントたちに向かって大きい声でそれを読み上げるように、と指示された。 控え室っぽいところで「練習してみましょう」とディレクターの人に言われて「あなたは毒親予備軍です」「もっと大きい声でお願いします」「あなたは毒親予備軍です!」と繰り返した。 「ほんとに? 私こ

    chemical0918
    chemical0918 2018/05/08
    草彅事件にも共通するなぁ
  • http://blog.zerotoone.jp/entry/2018/04/26/124401

    http://blog.zerotoone.jp/entry/2018/04/26/124401
  • AIに代替されないために――マッキンゼー、Google、楽天で働いたプロの仕事術 | CAREER HACK

    #2 は5分で読みきる 届ける相手のことを考え抜いたギブ…そのためには当然、自身のインプットも欠かせない。 尾原さんは月に100冊以上、一日に4冊以上のを読む読書家。一体どのようなの読み方をしているのか? そこには彼ならではの読書術があった。 「1冊3~5分くらいで最後まで読みきります。パラパラとページをめくって全体をさらっておきます。キーワードを先に押さえ、気になる文章はスクショする。そうすることでキーワードを脳にインプットします」 それは、“頭の中の引き出しを増やす”という行為に近いのかもしれない。 「を読んだ、その瞬間にはつながらなかったことも、ある日突然“あの文章はこういう意味だったのか”と新しい結びつきが得られることもあるんですよね」 を読む時、熟読・完読しなければ…と思いがち。ただ、それでは頭の中の引き出しは効率的に増やせない。 「読書でやるべきことはインプットによっ

    AIに代替されないために――マッキンゼー、Google、楽天で働いたプロの仕事術 | CAREER HACK
    chemical0918
    chemical0918 2018/04/29
    これはいい事書いてある。
  • 深層学習の今のところの限界「何ができて、何ができないか?」

    深層学習の今のところの限界「何ができて、何ができないか?」 2018.01.08 Updated by Ryo Shimizu on January 8, 2018, 08:29 am JST あけましておめでとうございます。 先日、MIT Technology Reviewにこのような記事が掲載されていました。 深層学習の過大評価は危険、ウーバーAI研究所の前所長が指摘 この論文を発表したのはニューヨーク大学の心理学者のゲイリー・マーカス教授。心理学者ということで、我々情報工学の立場とはまた違う立場で深層学習にできることとできないことを分離しています。 筆者はこのニュースを見て最初は反発したのですが、原文を読んでみると現状のディープラーニングの課題についてよくまとまっているのではないかと思いましたので紹介します。原文はこちら ■ディープラーニングの限界 マーカス教授によると、ディープラー

    深層学習の今のところの限界「何ができて、何ができないか?」
  • 「女性問題」という仕事の能力とあんま関係ないトラップで轟沈する人について | 文春オンライン

    俗にいう「人間としての魅力」と、いまの民主主義 もちろんスキャンダルとは無縁な人がトップに来てくれれば、それは安定するでしょう。でもまあ、俗にいう「人間としての魅力」って、ある種のヤバい部分も持ち合わせる清濁併せ呑む系の人たち特有の匂いもあるし、暴言吐いてみたり、剛腕であったり、何か人を強烈に惹きつける何かを持ちつつ、凄く敵が多いとか、スケールの大きさや懐の広さなんてのをもっていたりもする。でも、そういう人がネット全盛のいまの民主主義では、ちょっとした問題を見つけては叩かれ、沈んでいくのでありまして。 福田次官「セクハラ発言問題」について話す麻生太郎・財務相 ©時事通信社 政治家も経営者も官僚も、いわゆる大物がいなくなった、という批判もまた、出るわけですよ。何十億と利権を堂々と漁って金権政治を切り盛りした政治家もいなければ、日の丸を背負って世界を相手に戦う名物経営者も数えるほどしかいなくな

    「女性問題」という仕事の能力とあんま関係ないトラップで轟沈する人について | 文春オンライン
    chemical0918
    chemical0918 2018/04/19
    “相互監視して、問題が起きないように首をすぼめて生きてきた結果、無難な小粒が揃った社会になってしまったのでありましょうか。”