aabbdd

Patauger dans l'inconnu …

<

aabbdd

Patauger dans l'inconnu …

講義資料

講習会 資料
Python 初心者講習会@京都府農林水産技術センター (2020-02)
プログラミング言語未経験者を対象とした Python 入門講習会および機械学習ワークフローの紹介。
Python 入門 /
演習問題 /
線型回帰(コード・データセット等)
Python 初心者講習会@農研機構・広島福山 (2020-02)
プログラミング言語未経験者を対象とした Python ハンズオン講習会。内容は、Python 文法(リスト・ディクショナリ・関数・基本構文・文字列処理・ファイル処理)、パッケージ(NumPy・Pandas・matplotlib)の使い方など。
Anaconda 設定 /
Python 入門
機械学習勉強会@農研機構・つくば (2020-01)
機械学習の手法の全体像を掴むために、教師あり学習(回帰問題、分類問題)、教師なし学習(次元削減・クラスタリング)などの内容を取り上げる。各項目を深入りせずに、できるだけ機械学習とその周辺の概要を把握できるような構成。
機械学習入門 / ノート(
分類, モデル評価, 回帰分析, クラスタリング, 物体分類
Python 初心者講習会@農研機構・北海道札幌 (2019-10)
先進ゲノム支援 情報解析講習会@遺伝研・三島 (2019-10)
Python 中級者を対象とした塩基配列解析&機械学習講習会の視覚化部分。内容は、matplotlib および seaborn による視覚化。
資料(視覚化)
R 講習会(tidyverse)@農研機構・つくば (2019-09)
dplyr/tidyr などを利用したデータの操作方法、ggplot2 を利用したグラフの作成方法などに関する内容。
dplyr/tidyr
ggplot2
Python 講習会(Pandas 実践)@農研機構・つくば (2019-09)
Pandas を使用した行列(データフレーム)の結合、グループ演算、データ視覚化、表データのマークアップなどに関する内容。
Pandas
Python 初心者講習会@農研機構・熊本合志 (2019-08)
Python 講習会@農研機構・香川生野 (2019-07)
R 初心者講習会@農研機構・つくば (2019-07)
プログラミング言語未経験者を対象とした R ハンズオン講習会。内容は、R 文法(オブジェクト・関数・基本構文・文字列処理・ファイル処理・グラフ・回帰分析・主成分分析)。
1-2 日目
Python 初心者講習会@農研機構・つくば (2019-06)
Python 初心者講習会@農研機構・つくば (2019-02)
先進ゲノム支援 情報解析講習会@遺伝研・三島 (2018-11)

データセット

ファイル名 データ
iris.txt 3 種類のアヤメ(setosa、versicolor、virginica)の雄しべと雌しべの長さと幅を測定したデータ。Python/Pandas データフレーム、R/tidyverse 練習用データ。
rice.txt イネの wt 系統と ANU843 系統に対して F10、NH4Cl、NH4NO3 処理を行い、そのシュートと根の乾燥重量を測定したデータ。Python/Pandas データフレーム、R/tidyverse 練習用データ。
diversity_galapagos.txt ガラパゴス諸島の面積とその島で生息している植物の種数を調査したデータ。Python/Pandas データフレーム、R/tidyverse、データ視覚化などの練習用データ。
sleep_in_mammals.txt 62 種の哺乳類の体重、脳の重さや睡眠時間などを調査したデータ。Python/Pandas データフレーム、R/tidyverse、データ視覚化などの練習用データ。
1alk.cif.txt タンパク質立体構造データベース(PDB)からダウンロードした 1ALK タンパク質の立体構造データ。mmCIF フォーマット。ファイル処理や文字列処理の練習用データ。
1alk.fa PDB からダウンロードした 1ALK タンパク質のアミノ酸配列データ。FASTA フォーマット。ファイル処理や文字列処理の練習用データ。
IWGSCv1.1.gff3 (0.1M) IWGSC で公開されている小麦のゲノムアノテーションの一部。GFF3 フォーマット。ファイル処理や文字列処理の練習用データ。
IWGSCv1.1.gtf (0.1M) IWGSC で公開されている小麦のゲノムアノテーションの一部。GTF フォーマット。ファイル処理や文字列処理の練習用データ。
ft.fa GenBank からダウンロードした FT 遺伝子(AF152096.1)の塩基配列データ。FASTA フォーマット。ファイル処理や文字列処理の練習用データ。
camara.jpg 水中や小川沿いで生息するタネツケバナの 1 種 Cardamine amara の写真。JPEG フォーマット。画像読み込みの練習用データ。
dna2aa.tar.gz (3.4M) 翻訳モデル作成用のデータセット。データは TSV フォーマットで保存してある。1 列目は DNA 塩基配列 30 文字、2 列目はその DNA 配列に対応するアミノ酸配列 10 文字のテキストデータが含まれている。DNA 配列を入力して、アミノ酸配列を出力する翻訳モデルを作成するためのデータセット。
flu_dna.tar.gz (26.9M) 自然言語処理用のデータセット。データは TSV フォーマットで保存してある。1 列目にはインフルエンザのヘマグルチニン(HA)またはノイラミニダーゼ(NA)の種類を記載してあり、2 列目そのタンパク質をコーディングする DNA 配列を記載してある。DNA 配列を入力して、HA/NA の種類を予測するモデルを作成するためのデータセット。