同时已有的关于网络科学的各种发现,如巴拉巴西的幂律分布,小世界模型对于网络的构建也很有帮助。当然数学的各种统计的应用也是必要的,因为网络的各种情况的出现可以一定的分布。也就是说我们需要充分利用各种大数据,也就是说我们还需要利用各种数学知识,尤其是各种统计工具。照目前的趋势,我们还是要学习一下c语言之类的各种程序设计语言,具备基本的编程能力。
附录1:今天分享的是山中伸弥12年获诺奖的文章。其中的逻辑和我以往看的文献一样都是很清晰的,很给人一种美的感受,尤其是你看到他们在introduction和diussion引用的那么多文献由不得你不感慨科研是一件怎样依靠紧密合作的伟大工程。我们只有像他们一样把自己的工作建立于前人的工作成果才能扩大人类的认知边界,这对于我是很大的启发,毕竟我对整体论的系统学说很有好感,对其中的网络学说更是偏爱,一直以来都是试图使用网络的观点来解读这个世界。如果你还记得我之前关于爱情的建模,就是基于序列(还需要良好的定义)的匹配,而序列是网络的一个运算对象。但这都是比较抽象的思考,我必须落到实地才能完成我关于网络学说的理想。这篇文献就体现出我想要的复杂性的哲学,四个转录因子能够产生多能干细胞的机制,以网络的观点来理解是对于特定的中心节点,通过外源性的基因转入表达使得其被影响,从而导致整体的网络拓扑结构变化,能够被激活到原有的干细胞的多能性状态,如同能级跃迁。以上有点太抽象了,我试试简化一点。那就模仿数学的理论构建过程把。那么首先是定义,我们把不同表达水平基因的定义为一定的序列,如oct3/4,-,-klf4,p53,nanog,erain,可以以来理解。理论上我们只要定义的序列足够长,可以把世界上一切的细胞都映射于特定的序列。虽然这是不可能做到的,理论上可行但实际操作难度太大了。第二就是定义基于序列足够对象所进行的运算,如加减乘除。而序列作为一种数学结构,根据以往的生物信息学的知识,我们把序列的运算定义为匹配。序列的表达水平的模式相近,可以近似认为是等价关系。这篇文章就是通过各种关键基因蛋白的测量来确认ips细胞的多能性。同时由于我对经济学的博弈论一直情有独钟,我们可以把这种序列的匹配过程理想化为序列的竞争博弈。而序列之间存在的竞争和均衡达成是重要的网络路径形成的基础。这种序列的耦合可以形成的复杂关系,即我们需要一定的耦合对才能发挥特殊的效应,即其可以由于效应的竞争博弈形成一定的高维空间,其平衡是具体的马尔科夫序列的表达,决定现实的具体表达。其中一个关键的应用就是不动点的概念,序列博弈可以形成一定的均衡点,即不动点。这体现于我们常用的各种marker基因蛋白,我们能够通过对特定的不动点的测量来确定高维结构。这络学说了。网络是序列竞争博弈形成的高维结构,其选择性表达就是特定的序列形成,即可以认为是各种类型细胞的分化。而网络的思考方式不是单向的,而是多方向的综合表达。如抗心律失常药律博定taor的作用机制是抑制早搏,从而减少心脏病的发生,但这种药物最后可能致数万人死亡。网络的观点就不单单是对特定对象进行抑制或者激活,而是对序列进行有选择性地激活和抑制,即对不同的对象产生不同的影响。这篇文章就是对不同序列进行选择性地处理才能使得最终模式的涌现,即ipip1,从而抑制细胞增殖。这可以理解为级数的一阶和二阶导致的泰勒级数收敛。举个很通俗的例子,猜疑链:我知道,你知道我知道,我知道你知道我知道,你知道我知道你知道我知道……,理论上是可以无限进行的,但现实是大家进行几个循环就停止了,这就是收敛。当然我发现聪明人可以进行多几次,这是有一定的分布的。第三是基于定义的各种概念的延伸。我们根据已知的知识,知道细胞的各种基因表达水平是动态变化的,且存在特定的管家基因表达的水平是稳定的,我们就可以根据测量得出的数据构建一定的序列,通过序列的比对来发现各种模式。我们现在能够做到的是对有限基因的明显上调下调进行处理,我们将来的方向是对这些数据综合处理,从而发现各种模式,如特定组合的转录因子的转导可以使得细胞形成干细胞,还有特定的肿瘤形成等等。这篇文章所发现的模式就是oct3/4,-,-klf4高表达可以使得细胞的序列表达接近于胚胎干细胞的序列表达,从而可以近似认为这是等价的。
以上就是我本人在实验室的各种见识和思考,即使其中充满了鲁莽幼稚的猜想,但也是我值得珍藏的经历。