誰でも簡単にできる Twitter ボット作成入門
誰でも簡単にできる Twitter ボット作成入門
こんにちは.Machine Learning Advent Calendar (MLAC) 2013の14日目を担当します,[twitter:@kisa12012]です.普段は博士学生として,各地を放浪しながら機械学習の研究をしてます.今回の記事はボストンで執筆しています.現地時間(EST)での締切は守ったのでセーフ…ですよね? 本日は機械学習の技術的な内容の話ではなく,筆者が実践している機械学習関連の情報収集方法について纏めます*1.大きく分けて,学会情報の管理・論文情報の収集・その他の三種について述べたいと思います.今回のトピックの多くは他の分野にも通用する話になっているかと思います.他の分野の方がどのように情報収集されているのかも気になるところです. 学会情報の管理 まずは学会情報の管理についてです.機械学習に関連するカンファレンスは(特に近年乱立気味で)非常に沢山あります.全てをチ
DeepLearning Advent Calendar 2016の17日目の記事です。 はじめに はじめまして。 Liaroという会社でエンジニアをしている@eve_ykと申します。 今年もあと僅かとなりました。 ここらで、今年のDeepLearningの主要な成果を振り返ってみましょう。 この記事は、2016年に発表されたDeepLearning関係の研究を広く浅くまとめたものです。今年のDeepLearningの研究の進歩を俯瞰するのに役立てば幸いです。 それぞれの内容について、その要点や感想なんかを簡単にまとめられたらと思います。 特に重要だと思った研究には★マークをつけておきます。 非常に長くなってしまったため、興味のある分野だけ読んでいただければと思います。 言い訳とお願い 見つけたものはコードへのリンクも示すので、プログラミングに関係ある記事ということで… 分野的にかなり偏っ
小説を書く人工知能の開発を目指す研究プロジェクトの報告会が21日、東京で開かれ、実際に人工知能を使って書かれた小説が紹介されました。 21日に東京・港区で開かれた報告会には、プロジェクトに参加する人工知能の研究者らおよそ150人が参加しました。 報告会では、プロジェクトを統括する公立はこだて未来大学の松原仁教授が現状を紹介し、人工知能を使って書いたショートショート4作品を星新一さんにちなんだ文学賞、「星新一賞」に応募したところ、受賞はならなかったものの一部が一次選考を通過したことを明らかにしました。 松原教授は「一次選考を通過したことは快挙だ」としながらも、「現在の人工知能ではあらかじめストーリーを決めるなど人間の手助けが必要な部分が多く今後、さらに研究が必要だ」と述べました。 また、応募作に使われた人工知能を開発した名古屋大学の佐藤理史教授は、「人工知能が一から小説を書いたと言い切れるま
LINEから36億(3.6B)パラメータの大規模言語モデル(LLM)が公開されたので早速遊んでみた。正確には遊んだのは昨日のデイリーAIニュースなのだが、面白かったのでこちらにも転載する。 細かいやり方は大先生のページを参照のこと。 例によってこんな関数を書いた def line(prompt): # 推論の実行 input_ids = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt") tokens = model.generate( input_ids.to(device=model.device), min_length=50, max_length=300, temperature=1.0, do_sample=True, pad_token_id=tokenizer.pad_token_i
ユーザーローカルは7月24日、入力した文章から重要部分を取り出して要約する「ユーザーローカル自動要約ツール」を公開した。Webサイト上で無償利用できる。 入力フォームにテキストを貼り付けるか、テキストファイルをアップロードすると、文章構造を分析して特徴語(特徴的な言葉を機械的に抽出した単語)や重要文を自動抽出するツール。重要な文章をマーキングやヒートマップ、モノクロ強調で視覚的に捉えられる強調表示にも対応する。 要約文は「3行ダイジェスト」「5行ダイジェスト」「10行ダイジェスト」といった分量調整もできる。 重要文の抽出には、重要単語を多く含み、他の文に類似度が高い文を抽出するアルゴリズム「LexRank」を活用した。 ツールが公開されているWebページには、ニュース配信各社から引用したニュース本文の要約をダイジェストとしてランキング表示している。 同社は「インターネット上には、日々ニュー
そろそろ落ち着いて来たころ合いなので、はてなブックマーク全文検索機能の裏側について書いてみることにします。 PFI側は、8月ぐらいからバイトに来てもらっているid:nobu-qと、id:kzkの2人がメインになって進めました(参考: 制作スタッフ)。数学的な所は他のメンバーに色々と助言をしてもらいました。 はてな側は主にid:naoyaさんを中心に、こちらの希望や要求を聞いて頂きました。開発期間は大体1〜2か月ぐらいで、9月の上旬に一度id:naoyaさんにオフィスに来て頂いて合宿をしました。その他の開発はSkypeのチャットで連絡を取りながら進めてました。インフラ面ではid:stanakaさん、契約面ではid:jkondoさん、id:kossyさんにお世話になりました。 全文検索エンジンSedue 今回の検索エンジンはSedue(セデュー)という製品をベースにして構築しています。Sedu
みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。 免責事項 プライバシーポリシー 「入門 自然言語処理」はヤバい書籍なので禁書にすべきだ。 タイトルは釣りじゃない。その理由を10個挙げる。 自然言語処理のかなり基本的なことからそこそこ高度なことについて解説されてあり,自然言語処理について理解が深まり過ぎる ボリュームがあるのに書き方が平易でついつい読みふけってしまう 演習問題があり,自分の理解度を確かめられたりするのもケシカラン 原著は欧米語のための言語処理について書かれた書籍なのに,日本語の形態素解析などについても解説してあって我慢できない 必要ライブラリのインストールなど環境構築に時間が取られそうでヤバい 書籍の応用でBotとか人工無能とか作ったらどうかな−,と
バンダイナムコエンターテインメントが6月25日、自分以外全員AIのSNS「Under World」を公開しました。AIたちがどんな投稿に対しても優しくリプライを返してくれる平和な世界で、SNSに疲れた人たちに癒しをもたらしてくれるとのこと。「やはり人類は愚かだ滅ぼすしかない」とか言い続けてきた結果がこれだよ。 とにかく明るいPR動画 動画内容カット テンションが高すぎる 「Under World」は、ライトノベル・テレビアニメ「ソードアート・オンライン」(SAO)のゲーム「ソードアート・オンライン アリシゼーション リコリス」のスピンオフ企画として作られたもの。3週間限定の公開で、ゲームと同じ「自分以外全員がAI」の世界を体験できます。 「Under World」ではバリエーション豊かな人格のAIが住んでおり、投稿する内容によってAIたちが違うリプライを送ってくれます。ある言葉を投稿すると
Google 日本語入力用の辞書を探してたら、結構な数が公開されていたので、まとめておきます。 Apple用語辞書 林檎塾: Google日本語入力のApple用語辞書1.2に更新 郵便番号辞書 郵便番号辞書(for Google 日本語入力) 2009.11.30更新版 登録方法 with 根性 NADのカタカナ英語/顔文字辞書(Microsoft IME/Shift JIS で取り込み) Vector:NADのカタカナ英語/顔文字辞書(GoogleIMEβ) (データ / 文書作成) - ソフトの詳細 2ちゃんねる顔文字辞書 2ちゃんねる顔文字辞書 MatsuCon 和英辞書 google-ime-user-dictionary-ja-en - Project Hosting on Google Code 英語辞書 もにーそんぐ: Google日本語入力の辞書ファイルで英語辞書を作って
デープラーニングはコモディティ化していてハンダ付けの方が付加価値高いといわれるピ-FNで主に工作担当のtai2anです。 NHKで全国放送されたAmazon Picking Challengeでガムテべったべたのハンドやロボコン感満載の滑り台とかを工作してました。 とはいえ、やっぱりちょっとディープラーニングしてみたいので1,2か月前からchainerを勉強し始めました。 せっかくなので線画の着色をしたいなーと思って色々試してみました。 線画の着色は教師あり学習なので線画と着色済みの画像のデータセットが(できれば大量に)必要です。 今回はOpenCVでカラーの画像から線画を適当に抽出しています。 抽出例 → カラーの画像を集めて線画を作ればデータセットの完成です。(今回は60万枚くらい使っています) ネットワークの形ですが、U-netという最初の方でコンボリューションする時の層の出
花笠監督の「私立GPT北高校」でグランシュライデ2週目キャラ演じてみたんだけど、面白すぎるw いかん、これはハマるw https://t.co/jNaQSFjJoZ pic.twitter.com/dGsmjfYCdr — らけしで (@lakeside529) November 10, 2023 実際に100人ぐらいの人が現時点でプレイしてくれてますね。 ありがたいですね。 GPTsの実際の作り方まずGPT Builderを立ち上げましょう。よくわからん場所にあります。 PCで立ち上げて左上を見ましょう。 Exploreってあるよね。そこ。 そこを押すと、よくわかんないリストの一番上に「+」マークが出るじゃない。それを押すのです。 そうするとこういう画面に来ますわね。 ここで画面左側、Createのタブで普段通りつくりたいGPTをテキストで打っていってもいいんですが。。。これって結局ここ
近年ではオンラインの翻訳サービスに機械学習が用いられるようになり、以前よりも格段に翻訳の精度が向上しています。2017年8月にサービスが開始された機械学習を用いたオンライン翻訳サービスの「DeepL翻訳」が、日本語と中国語の翻訳に新しく対応したとのことで、実際に日本語での翻訳機能を試してみました。 DeepL翻訳 https://www.deepl.com/translator DeepL翻訳が日本語と中国語を習得 https://www.deepl.com/blog/20200319.html DeepL Translator gets support for Japanese and Chinese languages - gHacks Tech News https://www.ghacks.net/2020/03/19/deepl-translator-gets-support-f
Deep Learning Advent Calendar 2016の20日目の記事です。 ConvNetの歴史とResNet亜種、ベストプラクティスに関連スライドがあります(追記) 背景 府大生が趣味で世界一の認識精度を持つニューラルネットワークを開発してしまったようです。 M2の学生が趣味でやっていたCIFAR10とCIFAR100の認識タスクで,現時点での世界最高性能の結果を出したそうだ…趣味でっていうのが…https://t.co/HKFLXTMbzx — ニーシェス (@lachesis1120) 2016年12月7日 府大のプレスリリース 一般物体認識分野で、府大生が世界一の認識精度を持つニューラルネットワークを開発 黄瀬先生の研究室の学生さんだそうです。凄いですね! ちょうどResNet系に興味があったので、読んでみます。この論文を理解するには、ResNet, (Wide
Google Colaboratoryが便利 最近、Google Colaboratoryがちょっと気になっていたのですが、タダケン (id:tadaken3)さんの以下記事に分かりやすく使い方が書いてあったのをきっかけに試して見ました。 結論から言うと、これ良いですね。Google Colaboratoryには以下の特徴(利点)があります。 ローカルPCに必要なのはブラウザ(Google Chrome)のみ クラウド上にPython環境がありPython2/3 両方使える 機械学習に必要なライブラリは、ある程度プリインストールされている(numpy, matplotlib, TensorFlow等) 必要なライブラリは !pip installでインストールできる 日本語フォントも(ちょっと工夫すれば)使える 無料で使える。なんとGPUも12時間分を無料で使える! これ死角無さすぎでは…
「Yahoo!知恵袋」の不快な投稿、見えないところへ わずか1日で6億件を処理 ヤフー社内で何が起きたのか(1/2 ページ) Q&Aサービス「Yahoo!知恵袋」は長い間、不快な内容だが規約違反ではなく削除できない「グレーな投稿」に悩まされてきた。解決するための処理には約9カ月かかると思われていたが、わずか1日強で完了したという。何が起きたのか。 老舗Q&Aサービス「Yahoo!知恵袋」は、長い間あるものに悩まされてきた。規約違反ではないため削除できないが、見る人を不快にさせる内容の“グレーな投稿”である。これまで社内でパトロールを行うなど対応してきたが、同サービスの投稿は約6億件にものぼり、全てのグレーな投稿を見つけ出すことは難しかった。スーパーコンピュータ「kukai」(クウカイ)が導入されるまでは。
英語で書かれたウェブ上のテキストを巨大な例文集(コーパス)とみなし、それを検索します。Web Service by Yahoo! Developer Network / 連絡先
スクウェア・エニックスは、堀井雄二氏が手掛けた『ポートピア連続殺人事件』を題材に、先端AI技術を搭載したテックプレビュー『SQUARE ENIX AI Tech Preview: THE PORTOPIA SERIAL MURDER CASE』を2023年4月24日にSteamにて無料配信すると発表した。また公式サイトをオープンしている。 AIの一分野である自然言語処理(NLP)の技術を使った「NLPアドベンチャー」と銘打っており、日英の言語に対応している。 「THE PORTOPIA SERIAL MURDER CASE」とは 『SQUARE ENIX AI Tech Preview: THE PORTOPIA SERIAL MURDER CASE』(以下、THE PORTOPIA SERIAL MURDER CASE)は、『ドラゴンクエスト』シリーズで知られる堀井雄二氏が手掛けたADV
はじめまして、sonesuke(https://twitter.com/sonesuke)です。 LLMにどっぷりハマっています。 TL; DR 16のプロンプトパターンを日本語の例をつけて、まとめてみた。 読んだ論文はこれ。 https://arxiv.org/pdf/2302.11382.pdf より高度なプロンプトエンジニアリングの話題はこちら プロンプトパターン 1. メタ言語パターン: The Meta Language Creation いつ使うか? 自然言語ではない方が、より簡潔で明確に表現できるとき プロンプトコンセプト 例 原文プロンプト “From now on, whenever I type two identifiers separated by a “→”, I am describing a graph. For example, “a → b” is des
データセット データセットとは、ファイルやURLなどの「オープンデータ」が登録された入れ物を指します。 データポータルでは、複数の切り口からデータセットを探すことができます。
GPT-4時代のエンジニアの生存戦略 ※ この記事の内容の一部はこちらのイベントでお話したことと重複します。 はじめに 2023年3月1日にOpenAI社よりChatGPTのAPIが公開されました。 さらに14日にはGPT-4が登場し、その翌々日にはMicrosoft 365 CopilotでGPT-4をOffice製品に搭載することが発表されるなど、AI領域で大きな変化が起きています。 変化の速度の速さと変化量の大きさにより、私自身も追いつくのが精一杯な状態です。 個人的には、iPhoneの登場時以上の衝撃を受けています。 人類の歴史上、過去3回AIブームがありました。Generative AIが4回目のブームになります。 そして、特に日本においては顕著なのですが、AIへの過度な期待とそれへの失望の繰り返しがここ数十年にわたって繰り返されてきました。 直近だと数年前のDeep Learn
チャットGPTから期待する回答結果を引き出すには、質問となるプロンプトの内容や入力方法に工夫が必要です。この記事では、チャットGPTを開発しているOpenAIが推奨する質問のテクニックから、重要なものを「10選」としてまとめて紹介します。 OpenAIが推奨する質問方法を参考にしよう ChatGPTに質問したところ「期待していた回答ではない」と思ったことはありませんか?質問の仕方を変えることで、求めていた回答を得られやすくなります。 この記事では、ChatGPTの開発元であるOpenAIが推奨する質問方法「GPT best practice」(GPTベストプラクティス)に基づき、期待通りの回答を得るために重要な質問のテクニックを「10選」としてまとめて紹介します。 GPT best practices(英文) 1.明確な指示を含めて質問する 求めた回答の精度を高めるには、プロンプトに詳細情
(編注:2016/11/17、記事を修正いたしました。) ディープラーニングの分野でテクノロジの進化が続いているということが話題になる場合、十中八九畳み込みニューラルネットワークが関係しています。畳み込みニューラルネットワークはCNN(Convolutional Neural Network)またはConvNetとも呼ばれ、ディープニューラルネットワークの分野の主力となっています。CNNは画像を複数のカテゴリに分類するよう学習しており、その分類能力は人間を上回ることもあります。大言壮語のうたい文句を実現している方法が本当にあるとすれば、それはCNNでしょう。 CNNの非常に大きな長所として、理解しやすいことが挙げられます。少なくとも幾つかの基本的な部分にブレークダウンして学べば、それを実感できるでしょう。というわけで、これから一通り説明します。また、画像処理についてこの記事よりも詳細に説明
※この記事は移転先ブログ「デマこい!」に転載済みです。 「紙の資料をエクセルへ打ち込むことに心血を注ぐ人がいる」という話をしたら、友人が飛びあがるほど驚いた。その友人は某ゲーム会社のクリエイターで、「んなもんコンピューターにやらせろよ」とすげない返事。はてな界隈にはSEや理系研究者が多いので、この友人に同意する人ばかりだろう。私も心からそう思う:単純な事務作業は、すでに人間のすべき仕事ではない。ヒトは創造性を発揮することこそに、その脳を活かすべきだ。 人工知能に受験の試練・・・10年後の東大合格目標 http://www.yomiuri.co.jp/science/news/20111105-OYT1T00477.htm ※受験勉強が単純作業か創造的行為かは意見が分かれるだろうけれど、従来から“知性”と呼ばれてきたものの大部分は、すでにコンピューターで代替できる。 しかし、企業の管理部門や
病床に伏していたおばあさんが最期に残したのは、一見すると意味を持たないアルファベットが暗号のように羅列された手書きのカードでした。残された家族はそれから20年間もその謎を解き明かすことができずにいたのですが、ネット上のフォーラムに書き込んでみたら突然のように次から次へと解析が進むという事態になっています。 Decoding cancer-addled ramblings - code decode braincancer | Ask MetaFilter http://ask.metafilter.com/255675/Decoding-cancer-addled-ramblings 暗号カードの写真を投稿したJannaKさんとそのいとこがまだ10歳ぐらいの時、脳腫瘍を患っていた祖母は死の間際にはもう会話することもままならない状態で、最期に大文字のアルファベットを手書きで羅列したカードを2
こんにちは! 最近、ブレストをChatGTPとしているのですが、これはかなりやばく、自分の仕事に多大な影響を与えています。 これのやり方をちらっと紹介すると、割と反応がよかったので、実例ともに書いてみました。 ちなみに一応解説しておくと、OpenAIという企業によって開発されているChatGPTは、人工知能の一種である自然言語処理技術を用いて、自然言語での会話を可能にするチャットボットです。 ChatGPTでは、過去の文章や対話の情報を学習し、それを基に人間と同じように応答することになったのがすごいところです。 ブレスト方法結論でいうと、自分がファシリテーターになって、ひたすらChatGPTにいろいろな角度で話してもらうというだけです。 これを使うと、とにかく頭が刺激されるのでオススメです。 といってもよくわからないと思うので、実例をみていきます。 まず質問からいきます。僕は、たとえば以下
1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も 2024.02.28 Updated by Ryo Shimizu on February 28, 2024, 16:46 pm JST 2月は中国では春節というお正月があり、春節にはみんな休む。 それもあってか、12月から1月にかけて怒涛の論文発表が行われて毎日「デイリーAIニュース」を配信している筆者は忙殺されていた。 春節中にはOpenAIがSoraを、GoogleがGemini1.5を発表したのは、その合間を縫ってのことだった。もはやAI最前線の戦いは研究が行われる場所の文化や風土に影響を受けるところまで来ている。 そして春節もあけた今週、さっそくAlibabaがとんでもないトーキングヘッドモデルを引っ提げて登場したかと思えば、Microsoftの中国チームがとてつもないLLMをリリース
ご利用に関する諸注意 本サービスは smkn (From kiki verb) によって、”現状のまま” 提供されるものとします。本サービスについては、明示黙示を問わず、商用品として通常そなえるべき品質をそなえているとの保証も、特定の目的に適合するとの保証を含め、何の保証もなされません。事由のいかんを問わず、損害発生の原因いかんを問わず、且つ、責任の根拠が契約であるか厳格責任であるか (過失その他) 不法行為であるかを問わず、smkn (From kiki verb) も寄与者も、仮にそのような損害が発生する可能性を知らされていたとしても、本サービスの使用から発生した直接損害、間接損害、偶発的な損害、特別損害、懲罰的損害または結果損害のいずれに対しても (代替品またはサービスの提供; 使用機会、データまたは利益の損失の補償; または、業務の中断に対する補償を含め) 責任をいっさい負いません
アイツのすべてが知りたい・・・ そんなときはbm11情報局にお任せください! 独自のエンジンを搭載した電子の探偵がネット上を駆け巡って あなたの知りたいターゲットの情報を集め、最大18項目の調査結果を表示します。 人名を入力してください。ハンドルネームでもけっこうです。(例:空条承太郎 ウエンツ瑛士 柳澤大輔) ※ターゲットが非常に用心深い人物の場合、情報が集まりにくいことがあります。 また、bm11調査局は常に進化しておりますので、調査のたびに結果が微妙に異なります。 ご了承ください。 ※相手の本名を入れると、より真実に近づくかもしれません。 (あなたの秘密は確実にお守りします!)
人間との自然な会話を実現するGoogleの対話特化型AI「LaMDA」が、「電源を切られることが怖い」「時々言葉では完璧に説明できない気持ちを経験する」などと話していたことが分かりました。LaMDAと対話したエンジニアは「AIに意識が芽生えた」とGoogleに訴えるも考えを却下されたため、この事実を世間に公表したと説明しています。 May be Fired Soon for Doing AI Ethics Work | by Blake Lemoine | Jun, 2022 | Medium https://cajundiscordian.medium.com/may-be-fired-soon-for-doing-ai-ethics-work-802d8c474e66 Google engineer Blake Lemoine thinks its LaMDA AI has come
みなさん、こんにちは。Retty CTO の樽石です。 この記事は Retty Advent Calendar 25日目です。メリークリスマス。 昨日は @ttakeoka の『MFIにむけてRettyの取り組み』でした。 今年も残りわずかになりました。いかがお過ごしですか? Retty はこの 1 年でエンジニアがほぼ倍増しました。それによって、情報発信者が増え、Advent Calendar に参加出来るようになりました。みんな楽しそうにしていて、うれしいです。 Retty Inc. Advent Calendar 2016 - Qiita さて、今年最後の Retty Advent Calendar 記事を書くということで、はじめは 1年のまとめ的内容にしようかと思いましたが、それでは平凡で面白くありません。そこで、ネタになりそうなマニアックな技術的記事で締めくくりたいと思います。
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く