http://www.mitbbs.com/article_t/Biology/32062879.html
发信人: reallyloveme (ray), 信区: Biology
标 题: machine learning来对GWAS结果建模
发信站: BBS 未名空间站 (Sun Feb 26 20:24:40 2017, 美东)
最近在做一些machine learning/data science的工作。
因为过去做过很多genomics,突然有一个想法,比如GWAS里top candidate的解释很困
难,或者基于top candidate来预测疾病几乎不可能。
那么是不是可以用各种machine learning办法来training比如几万个SNP;得到这几万
个SNP和疾病状态的关系呢?
Y = a1x1 + a2x2 + a3x3 + ....anxn (n = SNP number比如几万个)
比如这种最简单的线性关系,然后来寻找W=(a1,a2,a3,...an)这个vector的最优解
去搜了一下,有一些这样的paper,但并不是很多。大量GWAS data都是online
available的,而用python的机器学习package的运算量,也不会太大吧?反正比我们分
析WGS要小很多吧?所以我觉得每一种疾病的GWAS都可以拿来做modeling,看是否可以
得到good estimate of parameters
但为何看到的文章这么少(或许是我孤陋寡闻)?然后也没有看到有很好的genetics
modeling运用到临床的。是因为这个真正做起来非常复杂?还是有太多arbitrary(比
如使用哪种classifier),所以也是一个坑?
不知道有没有做这个方向的,说说这是不是个坑。
--
※ 修改:·reallyloveme 於 Feb 26 20:26:25 2017 修改本文·[FROM: 146.]
评论
发表评论