タグ

info*に関するsh19910711のブックマーク (4)

  • 白黒画像のパーシステントホモロジー解析をGoogleColab上でやってみる - Qiita

    はじめに 私は現在大学4年生で、材料科学系の学科に所属しています。 材料科学系でも、機械学習はトレンドのようです。 機械学習の特徴量として、様々なパラメータが考えられますが、その中でも「形状を定量化するパーシステントホモロジーが有用なのではないか」というトピックがあります。 今回は、それをとりあえずやってみようという内容です。 記事のプログラムは、次のColabのリンクから確認できます! パーシステントホモロジー解析(PH解析)とは PH解析の例として、シリカの例がよく用いられます。 左の点の集まりは、液体シリカとアモルファスシリカの原子配置の3Dマップです。 この点の集まりを見ても、どのような構造上の違いがあるのかわかりません。 しかし、それぞれPH解析すると、右のパーシステント図が得られます。 これをみると、何やら違いがあるように見えます。 これがPH解析です。 パーシステント図とは

    白黒画像のパーシステントホモロジー解析をGoogleColab上でやってみる - Qiita
    sh19910711
    sh19910711 2024/05/21
    "PH解析: 形状を定量化 / 原子配置の3Dマップ > 点の集まりを見ても、どのような構造上の違いがあるのかわかりません / PH解析すると、右のパーシステント図が得られ ~ 何やら違いがあるように見えます" 2023
  • 大学が私に与えた影響 - ながめも

    大学は、私の人生にどのような影響を及ぼしたのか、卒業してからよく考えている。世間では就業機会や生涯年収といった実利的な側面についての言及が多いが、それらはあくまで社会構造に起因するものであり、今回私が考えたいのは、人格や考え方に対する、より個人的で抽象的な側面である。 大学にいくと何が変わるのかを考えるには、変わる前、すなわち大学入学前から振り返る必要がある。自分語りが多く含まれる可能性が高いが、個人のブログなので、ある程度はお許し願いたい。自分語りが好きな方に読み進めていただけたらと思う。 小中高 埼玉県に生まれ、公立の小中学校と私立の高校に通っていた私は、とにかく丸暗記が得意で、中学に上がってからは常に学年で成績トップだった。テストの数週間前から教科書とノートを丸覚えし、得点率は90%を越えていた。教科書の文の穴埋め問題なども、一言一句すべて覚えているため、考える必要もなかった。 学

    大学が私に与えた影響 - ながめも
    sh19910711
    sh19910711 2024/05/12
    "生物のリアルの実験と違い、簡単なプログラムならバグってもすぐに治せる / 競技プログラミングで扱うアルゴリズムの有用性はすぐに理解できた / ゲノムのマッピングツールで応用されていることを知っていた" 2021
  • LightGBMによる物性予測モデルの計算過程を視覚化する - Qiita

    はじめに LightGBM の中身について理解するためにやってみたメモ 環境 記事では以下を事前にインストールしておく必要がある。 Graphviz Python numpy pandas matplotlib scikit-learn LightGBM RDKit Graphvizについては、ツールをインストールした後、Pythonのライブラリをインストールする必要がある。Python: LightGBM の決定木を可視化して分岐を追ってみる や、【Windows10】Graphvizのインストール等を参考にしてほしい。 モデル構築 まずはRDKitを使ってもモデルを作成してみよう。 まずはモジュールのインポート import numpy as np import pandas as pd from matplotlib import pyplot as plt from sklear

    LightGBMによる物性予測モデルの計算過程を視覚化する - Qiita
    sh19910711
    sh19910711 2024/05/09
    "データフレームのままLightGBMで学習を行うと可視化の際にpandasの列名が特徴名として表示 / plot_treeメソッドにより可視化 + dump_modelというメソッドを使うとjson形式でモデルの情報が得られる" 2022
  • 特許から化合物の構造情報を抽出する - Qiita

    オープンな化合物データを入手元として最も手軽なのは、主に論文等から収集されたデータを収録しているChEMBLやPubChemなどの公共データベースを利用する方法でした1。一方で、企業等が新薬の候補として創出した化合物の情報は特許として公開される場合が多く、これらの多くは先述の公共データベースには一部しか収録されていません。そこで、この記事では特許から化合物情報を取得する場合のノウハウについて、解説します。 なお、この記事は、創薬 (dry) Advent Calendar 2019 の3日目の記事です。 SureChEMBLを使って化合物の特許を検索する SureChEMBLは、ChEMBLと同じくEBI (European Bioinformatics Institute)によって運営されている化合物の特許情報を集めたデータベースです。キーワードや構造式で特許とそこに紐付いた化合物の情報

    特許から化合物の構造情報を抽出する - Qiita
    sh19910711
    sh19910711 2024/04/20
    "SureChEMBL: 化合物の特許情報を集めたデータベース + SMILESを含むCSVの形式 + 誤ったSMILESが生成されているケースも散見 / 企業等が新薬の候補として創出した化合物の情報は特許として公開される場合が多く" 2019
  • 1