可考虑结合贝叶斯的统计学习,即聚类不仅仅可以考虑距离之间的关系,还可以考虑概率的相对运算,而且考虑网络的幂律分布可以形成一定的高耦合低外聚的内模块
分子层次是生物网络的最低一级亚层,我们可以通过对其的遍历往上构建其他层次:细胞,组织,器官,系统等等。每一个层次都有一定的相似性,这是层次之间的相互作用的基础。但彼此之间的影响强度是收敛的(如分子层次的改变对细胞的影响最大,对其他层次的影响会衰减),此时只有使用影响范围来使得层次之间的作用传递。
生命就是一个复杂系统。网络的结构与遗传信息的传递相耦合。因为其足够细化,可以有很大细化的描述即我们认可的成果。这是机体网络的选择性表达的结果,而以这些成果构建的网络的选择性表达就是我们可以理解的生命现象。
组学是一种网络,提供一个大背景。
疾病是机体网络的选择性表达,具体表现为局部的分子数目失衡和层次之间的交流变异(网络的拓扑结构变化),但不是我们对症治疗即改变局部情况就可以使得整体网络回复稳态,因为网络具有一定的惯性会把这种努力抵消。我们可以暂时理解为聚类过度使得模块过于独立,从而信息传递减少。这是基因表达异常的隐结构。其中分子机制就是网络的坍缩路径,我们不能确定真实的情况,但我们在统计水平的观测可以构建高概率的通路,这是一种等效。
中心法则是整体的趋势,同时也有一定的抵抗性变化,如rnai和rorna等等的作用是我们可以用于四两拨千斤地影响整体网络表达的基础。同时也有如同本征的因子,基因等等可以调节网络行为。
镰状细胞贫血的发病机制是分子层次的表达程度很大,这是网络的分布造成的。同时也揭示了网络相对独立的模块。这是比较底层的,由于遍历形成的网络就是建立在这些底层概念上的,因此可能造成整体网络疾病的影响,如染色体病。
人工重组dna是一种外周体系的代入,可能对网络的表达产生影响。
我们的基因还与外界环境有一定的交流,因为这些基因就是外来物,如癌基因。
组学的测序,数据的指数级爆炸。
酶是网络控制的本征,之前有一个假说:onegeneoneenzyme(基因对性状的控制是通过基因控制酶来实现的),而且酶也是各个层次的耦合点。由于网络的构造需要多层次的沟通交流,这就需要维持在一定水平的速度,不然网络就可能分解为各个模块(层次的聚类收敛),酶就起到这种提高速度的催化剂作用。
基因是有意义的编码区域,是基于我们暂时不明白其意义的非编码区域的选择性表达,这是一种分布:编码dna,rna等等。这是基于组学大数据的层次收敛。