Bioconductor入れてみた

 さすがのubuntuも外付けのTVキャプチャは認識してくれないっぽい(?)ので、どうしたってVistaがメイン。ubuntuで解析環境整えておけば、HDDだけ大学に持って行ってノートから起動して完璧、という夢想。


 というわけで、ubuntu7.10にRとBioconductorを入れてみた。RはSynapticでR-base, R-base-coreを指定して、依存関係で一気にインストール。楽ちん楽ちん、と思ったけど、Windows版はexeファイル一発だわ。
 で、Bioconductorを入れようとソースURL指定して、biocLite()。ところが、non-zero statusがどうとかとうるさく言われてBiobaseをはじめほとんどインストールできず。開発環境が色々必要らしく、Bioconductorに限らないでもインストールできないパッケージ続出。R-base-devを入れれば依存関係で必要な開発環境を全部入れてくれる、はずが何故かインストールCDを指定されるは、CDラベルが違っていて読んでくれないはで苦戦。Synaptic→リポジトリでCDから読み込みにチェックがついているのを外して解決。せっかくVMwareからインストールしていたのに、一枚CD-R無駄にしたし。

 agilentのFeature Extractで出力したファイルをRに読ませたいので、とりあえずMAGE-ML形式を読ませる方法を模索しているのだけど、RMAGEMLパッケージが要求してくるSJavaが何故かインストールできない……。というか、標準フォーマットとか言う割にはどこのデータベース探してもMAGE-ML形式で生データ落とせないんですが。おかげで試せないじゃん。
 ものの本を見ても、たいていAffymetrixのGeneChipの話ばかりで参考にしづらいし。選択肢がこれしかなかったのでどうしようもないのだが。


 なんか、GeneSpringの体験版をフル活用して解析するのが一番早い気がしてきた……。

081030追記

 検索できた人がいたみたいなので、一応。

 Feature Extractで出力したTXT形式はarrayQualityのread.AgilentでmarrayRawオブジェクトとして取り込めます。後はnormalizeするなり、limmaで有意差検定するなりすれば、それなりの解析ができるはず。

source("http://bioconductor.org/biocLite.R")
biocLite("arrayQuality")
library("arrayQuality")
setwd("hoge")
mraw <- read.Agilent() #作業フォルダのアジレントTXTファイル全てを取り込み。targetファイルを作って指定した方がいいかも。
mnorm <- normalize(mraw, method = "l")
...