Gyakutaniメモ

生物学と心理学の勉強メモ・本の感想

【感想】バイオインフォマティクスを用いた研究開発のポイントと実例(5)

 
第5章 バイオインフォマティクスのマネジメント


 本章では、バイオインフォマティクス研究において生じやすい問題や注意点について列挙されています。

・人選がマネジメントの最初の通り道。実験計画法と分散分析は現在も浸透していない。
・ゲームの完全さに注意を払う。採用手法で本当に問題が解けるのかを検討する*1
・ゲノムのリファレンスは有無ではなく整備の程度問題である。ショートリードのマップ率やミスマッチの数でリファレンスを評価すべき。
・少しだけでも自分でデータを取ってみる。公共データベースでは付帯情報が少ない。データからの次のステップ、テーマと技術の親和性を見定めるためにも必要。
・サンプルサイズが大きさに気をつける。大きすぎると、実験時間が長くなり、RNA抽出ひいてはトランスクリプトームの結果を変える。培養後半の細胞を用いると起きやすい。
・生物種による特徴が原因で標準のプロトコルから逸れることを覚える。リボソームRNA電気泳動像など。
・ソフトウェアはフィルターとして理解する。ソフトウェアには長短があるが、本当に効果量の大きい生命現象は、ソフトウェアの特性に左右されず同じ解釈になるはずである。
・アンマップリードも活用できる場合がある。コンタミの確認、実験者の特定、病変部の病原菌の特定、新規の融合遺伝子の発見。
・公共データベースの利用。解析対象に似た現象や近縁種のデータから、必要データ量などは検討できる*2

 

総評

以上で本書の内容は終わりです。私の寸評としては、以下の通りです。

 

 第2章は、トランスクリプトームの情報エントロピーの重要性と活用法が詳しく描写されており、特に発現変動遺伝子解析を行う研究者には一読の価値があると思います。脱分化説の検証もストーリーとして面白く、初代細胞培養を行う研究者は興味深く読めるのではないでしょうか。

 一方で、第1章は内容の水準も第2章に比較して低く、存在が蛇足に感じられました。

 第3章と第4章は論の骨格や計画性が感じられず、著者が好きなことを好きなように書くエッセイのように感じられました。その上、内容もあまりバイオインフォマティクスといえないものでした。

 第5章のみが、マネジメント層向けという本書のテーマと合致していました。ここを掘り下げて、バイオインフォマティクス研究のマネジメント理論を構築し、体系化して、一冊にするべきであったでしょう。

 

 また、終始トランスクリプトームの話に尽きたのも、やや不満です。著者は「はじめに」において、ガリア戦記よろしく、最初に地図を広げて「バイオインフォマティクス」の世界を概観することが大切だと説いていました。バイオインフォマティクスは、生物学、情報科学統計学の三本の柱で支えられている、学際的ながらも領域の広い学問だと私は考えます。医用画像解析、行動データ解析、ベースコール、ゲノムアセンブル、タンパク質やRNAの立体構造予測、分子シミュレーション、GRN予測、生体信号処理、コネクトーム予測、代謝フラックス解析・・・。数え上げればキリがないほど、研究活動の領域は多岐に渡っていると思います。そのような多様さの中にも、三本の柱に支えられているが故に生じる共通の問題について扱って欲しかったです。

 結局のところ、本書はただの著者の研究紹介だったのではないかと思います。著者自身の過去の研究に関する特異的な話題ばかりでした。具体例を示すのは結構ですが、それがメインでは、著者の自伝を読んだ気分です。このような本では、体系化した理論とその適用範囲を示し、事例はそれに説得力を持たせるための補助材料であるべきです。本書は逆です。著者の事例をなぞりながら、工夫した点を紹介しているだけです。

 デザインの本などを読むと、様々な体系化された思考や計画、デザインプロセスのフレームワーク・理論を実際の事例と絡めながら紹介している書籍が多いことが分かります。生物分野の科学研究ではまだまだそんなものは少なく(バイオインフォマティクスではなおさら)、本書にはそれを期待していましたが、残念ながら期待外れでした。


 書物としての体裁のレベルが低いことも、残念でした。読み手に大変フラストレーションを与える仕上がりになっています。どうして出版までに誰も気づかなかったのでしょうか?

 これまで何度も指摘したように、図番号が本文中で示されておらず、多くの図が小説の挿絵くらいの役割しか担っていません。引用記号が頻繁に抜けていることや*3、数学的な誤植*4、実験条件を述べた文章の誤記にも注意を払いながら読む必要があります。

 

  以上を総合して、研究室に一冊買っておく必要もないでしょう。(おそらく少数部出版のために)高価であるこという欠点も、入手しない選択を後押しします。発現変動遺伝子解析をしたい研究者に限り、本書を図書館で見かけたら第2章をぱらぱらとめくってみるのがおすすめです。

 

 

*1:ここで挙げられた事例の意味はよく分かりませんでした

*2:ただし、産業価値の大きな生物でそれを対象とするゲノム科学者が少ないものでは配列に問題があるなど、利害が反映されている場合があるそうです。マイクロアレイ製造業者と懇意にしている科学者の研究対象遺伝子がアレイに載っていないなんてこともあるそう。さもありなんという感じですね。

*3:引用にナンバリングしている意味が無いです。

*4:nはpの関数であり~(pp. 11)、など。