  • KDD 2019 | 150 successful Machine Learning models: 6 lessons learned at Booking.com

    150 successful Machine Learning models: 6 lessons learned at Booking.com Booking.com is the world’s largest online travel agent where millions of guests find their accommodation and millions of accommodation providers list their properties including hotels, apartments, bed and breakfasts, guest houses, and more. During the last years we have applied Machine Learning to improve the experience of ou

    • Mary Meeker’s 2019 internet trends report

      • Large Language Models for Software Engineering: Survey and Open Problems

        This paper provides a survey of the emerging area of Large Language Models (LLMs) for Software Engineering (SE). It also sets out open research challenges for the application of LLMs to technical problems faced by software engineers. LLMs' emergent properties bring novelty and creativity with applications right across the spectrum of Software Engineering activities including coding, design, requir

        • (論文)中央銀行の財務と金融政策運営 : 日本銀行 Bank of Japan

          2023年12月12日 日本銀行企画局 全文 [PDF 895KB] 要旨 日本銀行は、1990年代後半以降、ゼロ金利制約に直面するもとで、様々な非伝統的な金融政策を実施してきた。主要な海外中央銀行においても、グローバル金融危機の発生以降、大規模な資産買入れなどを実施してきた。こうした大規模なバランスシートの拡大を伴う非伝統的な金融政策は、その引き締め局面で、中央銀行の財務に影響をもたらし得るとして、そのことと金融政策運営能力、ひいては通貨の信認を関連付けた議論がみられている。 中央銀行は、買い入れた国債等から利息収入を得る一方、負債である当座預金(所要準備)と銀行券については金利が付されない収益構造となっている。このため、通常、安定的に収益(通貨発行益)をあげることができる。 中央銀行が非伝統的な金融政策を実施するもとで国債の買入れ等によってバランスシートを拡大すると、資産側では国債等が

          • Trusted Web推進協議会|デジタル市場競争本部

            Trusted Webのコンセプトや情報をより探しやすく、読みやすくするため ウェブサイトを新設しました。今後は下記サイトにて内容を拡充していきます。

            • ビッグデータ時代の文学研究に何ができるのか?/Ted Underwood 『遠い地平線』序文「文学の地平線の弧」和訳 - digitalnagasakiのブログ

              3/15(金)、一橋講堂(千代田区一ツ橋)にて、DHの国際シンポジウム「ビッグデータ時代の文学研究と研究基盤」が開催されます。そこで基調講演をしてくださるTed Underwood先生は、ビッグデータ時代の文学研究に正面から取り組む英文学者として活躍しておられ、2019年、その成果として「Distant Horizons: Digital Evidence and Literary Change」をシカゴ大学出版局から刊行されました。この本の序文は、大変興味深いものであり、膨大なデジタルテキストをにどのように取り組めばよいのか、そして、それによって、人がただ読むだけではうまく見えてこなかった文学の様々な側面、特に文学史やジャンルがどのようにして見えるようになるのか、ということについて、ラディカルな議論と一つの解決の方向性を提示しておられます。本の全体としてはその具体的な方法も示されています

              • 行政におけるデジタル・トランスフォーメーションの推進に関する調査研究 | AIS | 一般社団法人 行政情報システム研究所

                本調査研究は、4つの国で進められているDXについて、その経緯や全体の戦略・計画も含めて明らかにした上で、DXによって上げられた成果、現状の課題、具体的なツール・システム・教育等を整理・考察し、今後、我が国行政機関が"DX"を推進するにあたり役立つ知見を、実践的な参考事例とともに提示するものです。 現在、政府・自治体では、行政のデジタル・トランスフォーメーション(以下「DX」)が重要な課題となっていますが、各行政機関がDXにおいて取り組むべき具体的なアプローチについて一定の方法論は確立しておらず、各組織で試行錯誤が行われるにとどまっています。 デジタル・ガバメント先進国では、英国のガバメントデジタルサービス(GDS)、豪州のデジタル変革庁(DTA)、デンマークのデジタル化庁(DIGST)等に見られるように、DX推進体制を設置し、組織的に改革を進める動きが拡がっており、その推進手法の高度化と拡

                • Language Models are Few-Shot Learners

                  Recent work has demonstrated substantial gains on many NLP tasks and benchmarks by pre-training on a large corpus of text followed by fine-tuning on a specific task. While typically task-agnostic in architecture, this method still requires task-specific fine-tuning datasets of thousands or tens of thousands of examples. By contrast, humans can generally perform a new language task from only a few

                  • 2020年をおさらい!オレオレ深層学習論文ベスト10! - Qiita

                    オミータです。ツイッターで人工知能のことや他媒体の記事など を紹介していますので、人工知能のことをもっと知りたい方などは @omiita_atiimoをご覧ください! もう2020年も終わりますね。いかがお過ごしでしょうか。私は今年を積極的にアウトプットしていく年にしていたので、深層学習の論文を可能な限り読みました(それでも略読含めて150本程度だと思いますが...)。僭越ながら、今年2020年に読んだ論文たちの中から独断と偏見に基づいて面白かった論文を10個ランキング形式にてまとめます。2020年に読んだ論文なので必ずしも2020年に発表された論文とは限りません。完全なるオレオレランキングなので画像系多めです。簡単な説明に加え論文、解説記事、実装へのリンクをそれぞれに載せましたので興味ある論文があれば是非読んでみてください!それでは第10位から早速見ていきましょう! 【第10位】: "M

                    • Google Research: Looking Back at 2019, and Forward to 2020 and Beyond

                      Philosophy We strive to create an environment conducive to many different types of research across many different time scales and levels of risk. Learn more about our Philosophy Learn more

                      • 即時オープンアクセス義務化への反応 - やわらか図書館学

                        明日からオープンアクセスウィークというこのタイミンで折よく(?)、即時OA義務化の報道がなされました。 nordot.app Xを見てると、研究者と思われる方々が多くの反応をされていまして、とても参考になりましたので、togetterでざっくりとですが、まとめてみました。 togetter.com はてブのコメントも参考になります。 b.hatena.ne.jp b.hatena.ne.jp 皆様の反応を概観しての寸感としては、 研究者の方々にとって、オープンアクセスの手段は、 Gold OA >>>>>>>>>>>>>プレプリントサーバー>>>>>>>>>>>>>>>Green OA という感じなのだなということが再認識できました。 懸念として挙げられている、APCの件や、人文系の研究成果のことなど、全てごもっともで、そうしたことがきちんと考慮された指針が出るといいなぁと思いました。 個

                        • Google謹製アプリ、まさかの紙製スマホを実現!

                          Google謹製アプリ、まさかの紙製スマホを実現!2019.10.30 07:0041,067 湯木進悟 突き詰めればこうなる? なんでもありな超豪華機能のスマホより、最近はミニマル化の方向へ進んでいるようにも思えます。Google(グーグル)が発売した「Pixel 4」では、指紋認証センサがカットされましたし、イヤフォンジャックが非搭載となったスマートフォンは数知れません。スマホ中毒を警告し、通知の嵐からユーザーを解放するサイレントモードで、デジタルデトックスを目指す動きなども…。 Image: Special Projects/YouTubeこのほどThe Inquirerは、なななんと、Googleが自らリリースした、スマートフォンの束縛からユーザーを解き放つためのAndroidアプリとなる「Paper Phone」について伝えています。デザインスタジオのSpecial Projec

                          • Presto | Paper

                            Presto: SQL on Everything IEEE International Conference on Data Engineering (ICDE) Raghav Sethi, Martin Traverso, Dain Sundstrom, David Phillips, Wenlei Xie, Yutian Sun, Nezih Yigitbasi, Haozhun Jin, Eric Hwang, Nileema Shingte, Christopher Berner Abstract Presto is an open source distributed query engine that supports much of the SQL analytics workload at Facebook. Presto is designed to be adapti

                            • GitHub - geekan/MetaGPT: 🌟 The Multi-Agent Framework: First AI Software Company, Towards Natural Language Programming

                              🚀 Mar. 29, 2024: v0.8.0 released. Now you can use Data Interpreter via pypi package import. Meanwhile, we integrated RAG module and supported multiple new LLMs. 🚀 Mar. 14, 2024: Our Data Interpreter paper is on arxiv. Check the example and code! 🚀 Feb. 08, 2024: v0.7.0 released, supporting assigning different LLMs to different Roles. We also introduced Data Interpreter, a powerful agent capable

                              • GPT-4 Technical Report

                                We report the development of GPT-4, a large-scale, multimodal model which can accept image and text inputs and produce text outputs. While less capable than humans in many real-world scenarios, GPT-4 exhibits human-level performance on various professional and academic benchmarks, including passing a simulated bar exam with a score around the top 10% of test takers. GPT-4 is a Transformer-based mo

                                • SOK: On the Analysis of Web Browser Security

                                  Web browsers are integral parts of everyone's daily life. They are commonly used for security-critical and privacy sensitive tasks, like banking transactions and checking medical records. Unfortunately, modern web browsers are too complex to be bug free (e.g., 25 million lines of code in Chrome), and their role as an interface to the cyberspace makes them an attractive target for attacks. Accordin

                                  • Code Red: The Business Impact of Code Quality– A Quantitative Study of 39 Proprietary Production Codebases

                                    Code Red: The Business Impact of Code Quality – A Quantitative Study of 39 Proprietary Production Codebases Adam Tornhill CodeScene Malmö, Sweden adam.tornhill@codescene.com Markus Borg RISE Research Institutes of Sweden Lund University Lund, Sweden markus.borg@ri.se ABSTRACT Code quality remains an abstract concept that fails to get traction at the business level. Consequently, software companies

                                    • Central emotions and hubs in a colexification network - Scientific Reports

                                      Thank you for visiting nature.com. You are using a browser version with limited support for CSS. To obtain the best experience, we recommend you use a more up to date browser (or turn off compatibility mode in Internet Explorer). In the meantime, to ensure continued support, we are displaying the site without styles and JavaScript.

                                      • Google Scholar PDF Reader

                                        Supercharge your paper reading: follow references, skim outline, jump to figures, cite and save. When you install Scholar Reader, PDFs on all sites will have a new look in Chrome. To make this happen, Chrome will ask for permissions to read and change data on all sites. Scholar Reader makes no changes other than the presentation of PDFs. • Preview references as you read. Click the in-text citation

                                        • 矢谷流論文の読み方 | IIS Lab / 東大矢谷研究室

                                          研究するにあたって,過去の論文を読むことはとても重要な作業です.しかし,論文を読むのは存外大変な作業でもあります.特に英語の論文を読むのは,多くの学生さんにとっては大変な苦労だと思います.またそもそも論文を探すこと自体に苦労することがあると思います.しかし慣れてくれば,どういうキーワードで論文を検索すべきか,誰がこのトピックでは多くの論文を書いているか,論文のどのあたりを重点的に読めばよいか,がわかってくるようになります. 以下は,IIS Labの学生さんに,どのように論文を読んでほしいかをまとめた内部向けのドキュメントを,2018年5月に一般に公開したものに随時更新を加えているです.「『論文を読みなさい』と言われたけれど何をすればいいのだろう...」という方の一助になれば幸いです. Reading papers is one of the important research activ

                                          • SP 800-207, Zero Trust Architecture | CSRC

                                            Date Published: September 2019 Comments Due: November 22, 2019 (public comment period is CLOSED) Email Questions to: zerotrust-arch@nist.gov Author(s) Scott Rose (NIST), Oliver Borchert (NIST), Stu Mitchell (Stu2Labs), Sean Connelly (DHS) Announcement This draft publication discusses the core logical components that make up a zero trust architecture (ZTA) network strategy. Zero trust refers to an

                                            • コンピュータサイエンス論文を多読する試み

                                              コンピュータサイエンスに関連した論文をもっと読むべく新しい試みを始めてみました。本記事ではなぜ始めたのか、どのようにやるのか言語化してみます。 はじめに 論文を読むのは一般的に労力のかかる作業です。労力のかかる部分は人によって違うと思いますが、私の場合は徹底的に内容を理解しようと論文の枝葉末節まで精読し、それを詳細に記録に残そうとして膨大な時間がかかっていました。これを意識レベルで直すことが難しかったので、論文を全文精読しないようにする仕組みを作ることにしました。 問題意識 好奇心から論文を読むようにしています。例えば、昨年は以下の論文を読んで記事にしました。 Reconsidering Custom Memory Allocation (OOPSLA 2002) (07/22) snmalloc: A Message Passing Allocator (ISMM 2019) (07/0

                                              • GitHub - fkubota/Carrier-Owl: arxiv--> DeepL --> Slack/LINE

                                                You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                • Origami Simulator

                                                  × ORIGAMI SIMULATOR This app allows you to simulate how any origami crease pattern will fold. It may look a little different from what you typically think of as "origami" - rather than folding paper in a set of sequential steps, this simulation attempts to fold every crease simultaneously. It does this by iteratively solving for small displacements in the geometry of an initially flat sheet due to

                                                  • Normcore LLM Reads

                                                    normcore-llm.md Anti-hype LLM reading list Goals: Add links that are reasonable and good explanations of how stuff works. No hype and no vendor content if possible. Practical first-hand accounts of models in prod eagerly sought. Foundational Concepts Pre-Transformer Models The Illustrated Word2vec - A Gentle Intro to Word Embeddings in Machine Learning (YouTube) Transformers as Support Vector Mach

                                                    • My Writing & Coding Workflow

                                                      My personal workflow for terminal-based coding, writing, research, and more! Hello everyone! It has been quite sometime since I last posted! Suffice it to say, I have been immensely busy the past year but I am happy to say I am able to resurrect this blog! :tada: I have thoroughly grown into my own workflow for programming, research, and writing. Today, I am happy to be able to share it with you!

                                                      • Meta AIが機械学習を利用してWikipediaの出典をチェックするツールを構築

                                                        インターネット百科事典「Wikipedia」の記事にはどういった参考文献を用いたのか出典が求められます。しかし、誰でも編集できるというWikipediaの特性上、出典となった情報源が本文と全く無関係のものだったり、情報源が削除されて記事の品質が低下する可能性があります。これらの問題を解決する方法の1つとして、AIを用いて情報源の整合性を調べることをMetaの研究者が提案しました。 Improving Wikipedia Verifiability with AI | OpenReview https://openreview.net/forum?id=qfTqRtkDbWZ Meta wants to supercharge Wikipedia with an AI upgrade | Digital Trends https://www.digitaltrends.com/computi

                                                        • 研究の常識:論文を探せ! – Complex Robot Systems Lab

                                                          学術論文がどんなものかは別の記事「研究の常識:論文ってなに?」をまずは読んでみてください。 今回は実践編として、論文を手に入れる方法を解説します。 理工系・情報系の汎用的な論文探しの方法を紹介しますが、とくにロボット分野に特化した部分もあります。 広くGoogle Scholarで検索する 主要な学術雑誌は電子化されており、論文はPDFで読むのが主流です。また、研究成果をオープン化しようという大きな流れがあり、無料で読める学術論文が増えています。こういった背景から、ネットで検索するのが基本的な論文の探し方です。 しかし、例えば「ロボット論文」というつもりでrobot paperと検索しても、ロボット紙工作のWebページが出てくるばかりです。まずは検索対象を学術論文に絞りましょう。そこで便利なのがGoogle Scholar(グーグルスカラー)です。Google Scholarは、ジャーナル

                                                          • 「グローバルなデータガバナンスに関する特別委員会」最終報告 - Zホールディングス株式会社

                                                            2021年10月18日 グローバルなデータガバナンスに関する特別委員会 Zホールディングス(以下、ZHD)グループにおけるデータの取り扱いをセキュリティ観点およびガバナンス観点から外部有識者にて検証・評価する「グローバルなデータガバナンスに関する特別委員会」は、最終報告を取りまとめましたのでここに公表いたします。 最終報告書において記載された主な項目は以下となります。 • 特別委員会の概要等 • LINEアプリ関係の越境データアクセスおよびデータ保管の状況 • LINE社のガバナンスに関する検証結果及びLINE社による改善策 • LINE社の重要なデータを取り扱うグループ会社の状況 • LINE社におけるデータガバナンスの状況と改善に向けた提言 • ZHD社によるガバナンスの状況と改善に向けた提言 等 特別委員会による最終報告書の本編については以下リンクをご参照ください。 ・最終報告要旨

                                                            • Firecracker: Lightweight virtualization for serverless applications

                                                              The Research Team at Amazon Robotics is seeking a passionate Applied Scientist, with a strong track record of industrial research, innovation leadership, and technology transfer, with a focus on ML Applications. At Amazon Robotics, we apply cutting edge advancements in robotics, software development, Big Data, ML and AI to solve real-world challenges that will transform our customers’ experiences

                                                              • On the Opportunities and Risks of Foundation Models

                                                                AI is undergoing a paradigm shift with the rise of models (e.g., BERT, DALL-E, GPT-3) that are trained on broad data at scale and are adaptable to a wide range of downstream tasks. We call these models foundation models to underscore their critically central yet incomplete character. This report provides a thorough account of the opportunities and risks of foundation models, ranging from their cap

                                                                • A Second Conversation with Werner Vogels – Communications of the ACM

                                                                  CACM Web Account Membership in ACM includes a subscription to Communications of the ACM (CACM), the computing industry's most trusted source for staying connected to the world of advanced computing. Sign In Sign Up When I joined Amazon in 1998, the company had a single U.S.-based website selling only books and running a monolithic C application on five servers, a handful of Berkeley DBs for key/va

                                                                  • https://proceedings.mlsys.org/paper/2021/file/3636638817772e42b59d74cff571fbb3-Paper.pdf

                                                                    • Report 16 - Role of testing in COVID-19 control

                                                                      Key info Date: 23 April 2020 Authors: Nicholas C Grassly1, Marga Pons-Salort, Edward PK Parker, Peter J White, Kylie Ainslie, Marc Baguelin, Samir Bhatt, Adhiratha Boonyasiri, Olivia Boyd, Nicholas Brazeau, Lorenzo Cattarino, Constanze Ciavarella, Laura V Cooper, Helen Coupland, Zulma Cucunuba, Gina Cuomo-Dannenburg, Amy Dighe, Bimandra Djaafara, Christl A Donnelly, Ilaria Dorigatti, Sabine L van

                                                                      • 富士通クライアントコンピューティング「電子ペーパー」【公式サイト】

                                                                        「クアデルノ」は、あなたの思考を深める「もう一つの頭脳」です。 自在に扱える直感的な操作性や、目的に合わせて使い方を変えられる柔軟性を生かし、 あなたの脳の一部として、良質な思考時間をサポートします。

                                                                        • Sudachi同義語辞書をElasticsearchで使う(暫定方法)

                                                                          TL;DR Sudachi同義語辞書を「Solr Synonyms形式」に変換して使う あくまで暫定的な使い方: 本来は形態素解析結果を元に厳密に展開されるべき ちゃんとしたフィルタープラグインは、徳島のSudachi公式がもうすぐ公開してくれるはず Sudachi同義語辞書とは ワークス徳島NLPが開発する、専門家の手による大規模で高品質な辞書 Apache2.0ライセンス、商用利用可 詳細は公式ドキュメントを参照のこと 同義語が単に羅列されているわけではなく、詳細化した同義関係が付与されています。 そして、この言語資源は定期的に専門家によりメンテナンス、更新されています。例えば、以下のような語も2020年7月のアップデートなどで追加されています; ... 023538,1,0,1,0,0,0,(医療),新型コロナウイルス感染症,, 023538,1,0,1,2,0,0,(医療),COV

                                                                          • WSDM 2019 : How A/B Tests Could Go Wrong : Automatic Diagnosis of Invalid Online Experiments を読んだ - OKIYUKI99 Blog

                                                                            dl.acm.org LinkedinでInvalidなA/B テスト検知するための方法論を紹介している論文を読みました A/Bテストにおけるメトリック解析の話から、丁寧にメトリックを分解し、検知ロジックを提案しています。LinkedinのA/B テストプラットフォームで実際に動いてるみたいです Introduction まずはじめに、invalidなA/BテストにはInternally または Externally なテストがあることを紹介しています Internally invalid とは? Treatment と Control間の差がTreatmentによる効果と結論づけれるのが本来のA/B テストの魅力の1つですが、その差がTreatmentによる効果ではない ことを言います 特にこの論文では、incomparable samples(つまり、比較不可なサンプル群)における I

                                                                            • AutoML | Literature on Neural Architecture Search

                                                                              Maintained by Difan Deng and Marius Lindauer. The following list considers papers related to neural architecture search. It is by no means complete. If you miss a paper on the list, please let us know. Please note that although NAS methods steadily improve, the quality of empirical evaluations in this field are still lagging behind compared to other areas in machine learning, AI and optimization.

                                                                              • How to represent part-whole hierarchies in a neural network

                                                                                This paper does not describe a working system. Instead, it presents a single idea about representation which allows advances made by several different groups to be combined into an imaginary system called GLOM. The advances include transformers, neural fields, contrastive representation learning, distillation and capsules. GLOM answers the question: How can a neural network with a fixed architectu

                                                                                • The #1 bug predictor is not technical, it's organizational complexity

                                                                                  (Higher numbers are better. A more detailed description follows.) That's pretty interesting! Organizational structure has the highest precision, and the highest recall. (Again, more on the details later). That's pretty interesting, isn't it? The distance to decision makers and the number of developers working on a project is clearly and unambiguously the issue that is the best predictor of future