  • Digital Solution Offerings: Techniques to Deliver Success for Digitalization

    When we talk about digital solution offerings, first of all, let’s discuss what digital solutions are, what are digitalization and digitization, and what are the needs for that. What is Digitalization Simply put, digitalization is the journey of shifting business activities – processes, data management, communication, and more – from paper to an online environment. It involves utilizing digital to

    • 最新の自動運転研究 in NeurIPS2023

      TuringでResearcherをしているいのいちです。 先日、会社にサポートしていただいてニューオーリンズで開催されたNeurIPS 2023に参加させていただくことができたので、今年のNeurIPSで発表された自動運転系の論文をいくつかピックアップして紹介しようと思います。 NeurIPSとは NeurIPSは1987年から開かれている機械学習系でトップの国際会議です。この会議が発足した当初はBiologicalとArtificialの両方の側面からニューラルネットワークを研究しようという趣旨があり、長らく神経科学からも理解しようという趣旨があったようです。現在はこの国際会議で発表される多くの研究が機械学習や人工知能といったコンピューターサイエンス系のものが主体にはなっていまが、参加してみて他の機械学習やコンピュータビジョン系の学会よりも生物学と関連した研究も多く、生物学出身の私とし

      • Contrastive Learningの最新動向のレビュー - Morpho Tech Blog

        こんにちは。CTO室リサーチャーの鈴木です。今回は、深層学習の分野でここ数年盛り上がっているContrastive Learning系の手法について、主だった論文を系統的にまとめて紹介したいと思います。 はじめに 近年発展した自己教師あり学習(Self-Supervised Learning:SSL)は、アノテーション情報を人の手ではなく機械的に付与することで、データセットの構築にかかる時間やコストを軽減し、深層学習モデルの精度向上を目指した手法です。自然言語処理分野におけるSSLは大きな成功を収め、ChatGPT等の超高性能なチャットボットの出現にも影響を与えました。 SSLは主に深層学習モデルの「事前」学習として用いられます。SSLによって、文章や画像に含まれる一般的な特徴を大量のデータから学習することができます。これにより、文章生成や画像認識などの本学習の効率が向上し、最終的な性能向

        • K-Means Clustering for Unsupervised Machine Learning

          K-means clustering is a type of unsupervised learning when we have unlabeled data (i.e., data without defined categories or groups). Clustering refers to a collection of data points based on specific similarities. K-Means Algorithm K-means aims to find groups in the data, with the number of groups represented by the variable K. Based on the provided features, the algorithm works iteratively to ass

          • Kotoba Technologies

            We Develop End-to-End Speech Foundation Models.LLM 2.0: Multimodal, Real-Time Large Language Models. 2024/1/19: Kotoba Technologies Seminar Series Mamba 101 — Deep State Space ModelsHiroto, Kazuki, Nori, and Jungo will be lecturing about the basics of Mamba, a deep learning model that has recently gained traction as an alternative to transformers. 2023/12/10: NeurIPS 2023One paper is presented at

            • Guide for Foreigners to Find Software Developer Jobs in Japan

              Guide for Foreigners to Find Software Developer Jobs in Japan Have you ever wondered what it would be like working in Japan as a software developer? This article is about finding a tech, specifically an Information Technology job in Japan, including software development and other software engineering positions. Most of us wish to travel to other countries, experience different cultures and learn a

              • 日本語の音声コーパスCSJでE-Branchformerの音声認識モデルを作って性能を評価する - RevComm Tech Blog

                こんにちは、RevCommでMiiTelの音声解析機能に関する研究開発を担当している石塚です。 2023年1月に開催された国際会議IEEE Workshop on Spoken Language and Technology (SLT) 2022で発表されたE-Branchformer: Branchformer with Enhanced Merging for Speech Recognition (Kim et al., 2023)*1という論文で、音声認識タスクで高い性能を発揮するE-Branchformerという新しい深層学習モデルが提案されました。論文中では英語の音声コーパスを用いて音声認識精度が評価されていますが、日本語についての評価は行われていません。 End-to-end音声処理ツールキットESPnetのversion 202301からこのE-Branchformerが利

                • Best Practices for Writing Step Functions Terraform Projects | Amazon Web Services

                  AWS DevOps Blog Best Practices for Writing Step Functions Terraform Projects Terraform by HashiCorp is one of the most popular infrastructure-as-code (IaC) platforms. AWS Step Functions is a visual workflow service that helps developers use AWS services to build distributed applications, automate processes, orchestrate microservices, and create data and machine learning (ML) pipelines. In this blo

                  • New – Improve Amazon S3 Glacier Flexible Restore Time By Up To 85% Using Standard Retrieval Tier and S3 Batch Operations | Amazon Web Services

                    AWS News Blog New – Improve Amazon S3 Glacier Flexible Restore Time By Up To 85% Using Standard Retrieval Tier and S3 Batch Operations Last year, Amazon S3 Glacier celebrated its tenth anniversary. Amazon S3 Glacier is the leader in cloud cold storage, and I wrote about its innovations over the last decade. The Amazon S3 Glacier storage classes provide you with long-term, secure, and durable stora

                    • CARTA MARKETING FIRMのデータサイエンス、データエンジニアリング基盤の変遷に迫る - CARTA TECH BLOG

                      TL; DR CARTA MARKETING FIRMでは、データサイエンティストが本質的な価値創出に専念できる分業体制を目指す過程にある Snowflake中心のデータ基盤を活用しながら、プロダクトチームがプロダクト要件に合わせたデータ設計を行える組織体制を実現 プロダクトチームとデータサイエンティストが密接に協業しプロダクトドメインを吸収できるチーム体制へ移行 データサイエンティストが開発したモデルを短期間で検証・実装・改善するフィードバックループを実現できる環境を整備しつつある CARTA MARKETING FIRMとは? CARTA MARKETING FIRMでは、”クライアントの事業を進化させる”をミッションに、以下4つのサービスを運営しています。 広告代理事業を展開する「ATRAC」と「CARTA AGE」 国内最大級のスマートフォンアドネットワークやグローバル広告主向けに

                      • Technology Trends for 2024

                        What O’Reilly Learning Platform Usage Tells Us About Where the Industry Is Headed This has been a strange year. While we like to talk about how fast technology moves, internet time, and all that, in reality the last major new idea in software architecture was microservices, which dates to roughly 2015. Before that, cloud computing itself took off in roughly 2010 (AWS was founded in 2006); and Agil

                        • AWS認定資格10種類を一覧で解説! 難易度や費用、おすすめの学習方法も - エンジニアtype | 転職type

                          2024.03.26 エンジニア辞典 AWS AWS認定資格とは、Amazonが提供する世界最大規模のクラウドプラットフォーム『Amazon Web Service(以下、AWS)』に関する知識とスキルを持つことを証明できる資格です。AWSは数あるクラウドサービスの中で特に高いシェアを占めており、日本でも多くの企業が採用しています。 この記事では、AWS認定資格の概要や取得方法、役割や分野ごとに分かれた10種類(※)の資格それぞれについて詳しく解説します。おすすめの学習方法も紹介しますので、AWSの知識を深めたい、エンジニアとしてキャリアアップを目指したいと考えている方はぜひ参考にしてください。 (※)2024年4月に廃止される下記三つの専門資格の説明は除外しています ・AWS Certified Database – Specialty ・AWS Certified SAP on AWS

                          • Interview with Anand Joshi of SmartNews, Japan

                            Name: Anand Joshi Title: Software Engineer Organization: SmartNews Inc., Japan Hometown: Mumbai, India Living in Japan: Since January, 2017 LinkedIn: https://www.linkedin.com/in/anandhjoshi/ Blog: https://anandjoshi.me/about/ This is the 12th interview in the “Interviews with Foreign Information Technology Engineers in Japan” series. “ EJable.com’s Ryoko Nagai talks to Anand Joshi of SmartNews, Ja

                            • Extracting Training Data from ChatGPT

                              Authors Milad Nasr*1, Nicholas Carlini*1, Jon Hayase1,2, Matthew Jagielski1, A. Feder Cooper3, Daphne Ippolito1,4, Christopher A. Choquette-Choo1, Eric Wallace5, Florian Tramèr6, Katherine Lee+1,3 1Google DeepMind, 2 University of Washington, 3Cornell, 4CMU, 5UC Berkeley, 6ETH Zurich. * Joint first author, +Senior author. We have just released a paper that allows us to extract several megabytes of

                              • ChatGPT(GPT-3.5とGPT-4)の性能が変化している?スタンフォード大学とカリフォルニア大学バークレー校の研究チームが調査

                                3つの要点 ✔️ 大規模言語モデル(GPT-3.5とGPT-4)の性能が短期間で大きく変わる可能性を示唆。 ✔️ 大規模言語モデルの性能の中長期的な変化を理解するため、継続的な調査が必要。 ✔️ 大規模言語モデルの性能変化に関する研究促進のため、本実験の評価データとChatGPTのレスポンスを公開。 How is ChatGPT's behavior changing over time? written by Lingjiao Chen, Matei Zaharia, James Zou (Submitted on 18 Jul 2023) Comments: Published on arxiv. Subjects: Computation and Language (cs.CL); Artificial Intelligence (cs.AI); Machine Learning (

                                • Using Linear and Logistic Regression in Machine Learning

                                  Logistic Regression and Linear Regression are two fundamental statistical methods used for predictive modeling within the supervised machine learning framework. Before discussing these two concepts, let’s discuss what regression is and the use of regression analysis in machine learning. What is Regression Regression in statistics refers to a type of predictive modeling technique that analyzes the

                                  • GitHub Actions: Hardware accelerated Android virtualization now available

                                    GitHub Actions: Hardware accelerated Android virtualization now available actions April 2, 2024 Available now, Actions users of our 2-vCPU GitHub-hosted Linux runners will be able to make use of hardware acceleration for Android testing. Previously this feature was only available on runners with 4 or more vCPUs. To make use of this on Linux, Actions users will need to add the runner user to the KV

                                    • Data Engineer: Interview Questions

                                      Here is a list of common data engineering interview questions, with answers, which you may encounter for an interview as a data engineer. The questions during an interview for a data engineer aim to check not only the grasp of data systems and architectures but also a keen understanding of your technical prowess and problem-solving skills. This article lists essential interview questions and answe

                                      • Run Llama 2 uncensored locally · Ollama Blog

                                        Run Llama 2 uncensored locally August 1, 2023 In May 2023, Eric Hartford, a machine learning engineer authored a popular blog post “Uncensored Models” providing his viewpoints to the merits of uncensored models, and how they are created. It’s a great read! This post will give some example comparisons running Llama 2 uncensored model vs its censored model. Some of the uncensored models that are ava

                                        • [登壇レポート]「生成AI時代の必須スキル!RAGの回答精度向上のコツ全部教えます」で登壇しました | DevelopersIO

                                          新規事業部 生成AIチームの山本です。 2024/04/24にオンラインで開催した弊社セミナー「生成AI時代の必須スキル!RAGの回答精度向上のコツ全部教えます」にて登壇をしましたので、自分の発表資料を共有いたします。 資料 資料に関する補足 今回は、RAGを始めたい方や始めてすぐな方に向けて登壇を行いました メインの内容は、1~73ページです。 また補足として、既にRAGを導入し進めている方向けに、補足情報を74ページ以降に記載しました。 Q&A 以下、いただいた質問と、差し上げた回答の内容です。山本がメインで回答していますが、一部は(同じく登壇した)熊谷が回答しました。一部、本記事の記載に伴い補足を追加しました。 Q: LLMとragを活用し、毎日の1000人規模全社のeメール(参考ドキュメント)から、トラブルや不正予兆のあるメールを抽出することはできますか。なお、教師データ(メール)

                                          • A Guide to Clustering in Machine Learning

                                            When we cluster things, we put them into groups. In Machine Learning, Clustering is the process of dividing data points into particular groups. One group will have similar data points and differentiate from those with other data points. It is purely based on the patterns, relationships, and correlations in the data. Clustering is a form of Unsupervised Learning. Let’s quickly recap the definition

                                            • Data Science: Theories, Models, Algorithms, and Analytics

                                              Data Science: Theories, Models, Algorithms, and Analytics Sanjiv Ranjan Das 2017-03-24 Preface I developed these class notes for my Machine Learning with R course. It traces my evolution as a data scientist into redundancy, I expect I will be replaced by a machine soon! There is a lot of work remaining to be done on this, including adding many more citations, replacing figures, and making sure ful

                                              • Cingulate dynamics track depression recovery with deep brain stimulation - Nature

                                                Patients with treatment-resistant depression (TRD) experience a wide variety of debilitating symptoms, including persistent negative mood, anhedonia, psychomotor retardation and suicidal thoughts. While many patients with TRD who receive experimental subcallosal cingulate (SCC) deep brain stimulation (DBS) have responded to continuous stimulation with durable symptom relief4,5,6,7,8, the clinical

                                                • iOS 17/iPadOS 17/watchOS 10/tvOS 17/macOS 14 RC版がリリース - こぼねみ

                                                  Appleは日本時間9月13日、「iOS 17」「iPadOS 17」「watchOS 10」「tvOS 17」「macOS 14」のRC(Release Candidate)版を開発者およびパブリックベータ登録者に向けてリリースしました。 同時に、「iOS 16.7」「iPadOS 16.7 」のRC版もリリースされています。 正式版の一般公開は、「iOS 17」「iPadOS 17」「watchOS 10」が日本時間9月19日、macOS 14が同9月27日です。 新たにリリースされたバージョン リリースノート iOS 17 iPadOS 17 macOS 14 iOS 16.7 これまでに確認されているバージョン パブリックベータについて デベロッパベータ版も無料で利用可能に Appleデバイス 新たにリリースされたバージョン iOS 17 Release Candidate (21

                                                  • Improvements to Amazon ECS task launch behavior when tasks have prolonged shutdown | Amazon Web Services

                                                    Containers Improvements to Amazon ECS task launch behavior when tasks have prolonged shutdown Amazon Elastic Container Service (Amazon ECS) now launches tasks faster on container instances that are running tasks that have a prolonged shutdown period. This enables customers to scale their workloads faster and improve infrastructure utilization. About Amazon ECS scheduling Amazon ECS is a container

                                                    • The New Language Model Stack

                                                      ChatGPT unleashed a tidal wave of innovation with large language models (LLMs). More companies than ever before are bringing the power of natural language interaction to their products. The adoption of language model APIs is creating a new stack in its wake. To better understand the applications people are building and the stacks they are using to do so, we spoke with 33 companies across the Sequo

                                                      • Amazon DynamoDB zero-ETL integration with Amazon OpenSearch Service is now available | Amazon Web Services

                                                        AWS News Blog Amazon DynamoDB zero-ETL integration with Amazon OpenSearch Service is now available Today, we are announcing the general availability of Amazon DynamoDB zero-ETL integration with Amazon OpenSearch Service, which lets you perform a search on your DynamoDB data by automatically replicating and transforming it without custom code or infrastructure. This zero-ETL integration reduces the

                                                        • GLAM:強化学習エージェントとしてのLLM

                                                          3つの要点 ✔️ 大規模言語モデルを強化学習における方策として捉え,追加学習させる ✔️ 強化学習タスクを言語で表現する環境やプロンプトを開発 ✔️ 大規模言語モデルを強化学習に使用することによって,サンプル効率や汎化性能に向上が見られることがわかった Grounding Large Language Models in Interactive Environments with Online Reinforcement Learning written by Thomas Carta, Clément Romac, Thomas Wolf, Sylvain Lamprier, Olivier Sigaud, Pierre-Yves Oudeyer (Submitted on 6 Feb 2023 (v1), revised 12 May 2023 (this version, v2),

                                                          • Vectorize:AI搭載のアプリケーションを本番環境に迅速に出荷するためのベクターデータベース

                                                            Vectorizeは、Cloudflareのグローバルネットワーク上で完全にフルスタックのAI搭載アプリケーションを構築できるように設計された、すぐにでも構築を始めることができる当社の全く新しいベクトルデータベース製品です。Vectorizeはオープンベータであり、Cloudflare Workersを利用されている開発者であれば、どなたでもご利用いただけます。 Vectorize with Workers AIをご利用いただくと、Workersを使用したセマンティック検索、分類、推奨、異常検出のユースケースの直接強化、LLM(大規模言語モデル)からの回答の精度やコンテキストの向上、OpenAIやCohereなどの一般的なプラットフォームからの独自の埋め込みを取り込むことができます。 ベクトルデータベースが何をするものか、Vectorizeは何が違うのかをより詳しく知りたい方は、Vecto

                                                            • AWS Well-Architected Tools のレンズカタログで選択出来る全てのレンズの設計原則と柱をまとめてみた | DevelopersIO

                                                              今回は上記のうち、ドキュメントとレンズカタログどちらも存在しているレンズ全てについて、これらを採用したときに、例としてアーキテクチャー上でどのような技術やサービスが取り入れられるのか、柱ごとにまとめてみました。 実際には Well-Architected 上は背景やそれによって実現したいこと、トレードオフなどもっとたくさんの情報があります。 今回はアーキテクチャー上の実装視点でどのような考慮が発生し得るのかを把握するためにまとめました。 それぞれのレンズの各柱で3行まとめをしています。今回は具体的な実装例や戦略について敢えてフォーカスしました。実際には柱で推奨される内容はもっとふわっとしたものであり、これらの実装は例に過ぎず、また、採用しないほうが良い場合すらあります。今回は公式レンズの実装例についてイメージしやすいように敢えてまとめに盛り込んでいます Serverless Applica

                                                              • Introducing RAG 2.0 - Contextual AI

                                                                I consent to receiving email communications and marketing material from Contextual AI Thank you for joining our waitlist – we will be in touch. In the meantime, you can follow us on LinkedIn and Twitter. Homepage Today, we’re announcing RAG 2.0, our approach for developing robust and reliable AI for enterprise-grade performance. Unlike the previous generation of RAG, which stitches together frozen

                                                                • Understanding and Building Authentication Sessions with Golang

                                                                  The Authentication Session of a web app is the heart of its defense against malicious threats. Hence, it is among the first points of recon for a security tester. This article will discuss the authentication sessions of a web app in the “Go” programming language (Golang). It will also discuss the vulnerabilities and design flaws in authentication sessions, the difference between Session-Based and

                                                                  • Serverless ICYMI Q4 2023 | Amazon Web Services

                                                                    AWS Compute Blog Serverless ICYMI Q4 2023 Welcome to the 24th edition of the AWS Serverless ICYMI (in case you missed it) quarterly recap. Every quarter, we share all the most recent product launches, feature enhancements, blog posts, webinars, live streams, and other interesting things that you might have missed! In case you missed our last ICYMI, check out what happened last quarter here. Server

                                                                    • Reindex, Transform, and Aggregate datasets using pandas Library

                                                                      Most of the time, the dataset we will get from the business will be dirty and cannot be used straight forward to train machine learning models. Therefore, we must treat the dataset and bring it to the desired form to input it into an algorithm. This tutorial discusses reindexing, transforming, and aggregating datasets in Pandas. What are Reindexing, Transforming, and Aggregating? Reindexing, trans

                                                                      • Pandas: An Ultimate Library for Data Science

                                                                        Introduction to Pandas Pandas is a great library of Python for data science for most industry applications with massive amounts of different types of data. In this tutorial, we will discuss the use of Pandas, including the advanced concepts of the Pandas library for data science. We generally have a massive amount of data. And to handle it, we have already explored NumPy for data science. But is N

                                                                        • ‘The Gospel’: how Israel uses AI to select bombing targets in Gaza

                                                                          Israel’s military has made no secret of the intensity of its bombardment of the Gaza Strip. In the early days of the offensive, the head of its air force spoke of relentless, “around the clock” airstrikes. His forces, he said, were only striking military targets, but he added: “We are not being surgical.” There has, however, been relatively little attention paid to the methods used by the Israel D

                                                                          • AWS Cost Anomaly Detection reduces anomaly detection latency by up to 30%

                                                                            Starting today, AWS Cost Anomaly Detection will detect cost anomalies up to 30% faster. Customers can now identify and respond to spending changes more quickly. Cost Anomaly Detection leverages advanced machine learning to identify unusual changes in spend, enabling customers to quickly take action to avoid unexpected costs. With this new capability, AWS Cost Anomaly Detection analyzes cost and us

                                                                            • Hierarchical Clustering in Machine Learning

                                                                              If you read the “An Introduction to Clustering” article, you will know that Hierarchical Clustering is a type of Connectivity model in Machine Learning. To recap, Connectivity Models are based on the fact that data points in the same data place have similarities. What is Hierarchical Clustering? Hierarchical Clustering is an algorithm that groups similar data points into clusters. Hierarchical Clu

                                                                              • Bye Bye Bye...: Evolution of repeated token attacks on ChatGPT models

                                                                                Bye Bye Bye...: Evolution of repeated token attacks on ChatGPT models We recently discovered a new training data extraction vulnerability involving OpenAI’s chat completion models (including GPT-3.5 and GPT-4). This work builds upon prior Dropbox LLM prompt injection research as well as that of academic researchers. Our findings were shared with OpenAI in January 2024, confirmed as vulnerabilities

                                                                                • DDoS threat report for 2023 Q2

                                                                                  This post is also available in Français, 繁體中文, 한국어, Deutsch, 简体中文, 日本語, Português, Español. Welcome to the second DDoS threat report of 2023. DDoS attacks, or distributed denial-of-service attacks, are a type of cyber attack that aims to disrupt websites (and other types of Internet properties) to make them unavailable for legitimate users by overwhelming them with more traffic than they can handl

