临床诊断就是发现各种不动点式的特征(能够以局部的变化指代整体的变化,这种布劳威尔不动点原理甚至启发纳什构建的博弈论的均衡概念),为最后的模式识别奠定基础(比如说各种病原体的检测可以在很大程度上解释疾病的发生发展),因此收集多层次的数据并且以一定的统计模型统合起来不断逼近不动点是必要的。如各种标记物的检查,病理切片等等。我们必须考虑网络中多层次耦合即相互作用的因素。这种是多层次的利益博弈,需要考虑特定措施的收益和代价。标本—检测对象—检测意义,这是一个如同计算机的输入—计算—输出的过程,因此我们需要把医学诊断这个过程理想抽象化为一个模式识别的计算过程,我们需要大规模的数据采集和机器学习算法等等的帮助,提取出具有意义的线性无关基底,通过其选择性表达可以对比较多的疾病进行一定的对应。理论上来说,我们的基底越多,可以表达的疾病越准确,即我们可以构建abcdefghijk……等等的基底,不同程度的表达可以视为在这个高维空间寻找到特定的点,即我们可以理解的一维序列a25b26c42d12e35f59g85h26i6(字母是对象,数字是表达水平)。当然,这是基于我们认为特定的疾病可以对应于这个高维空间的一定区域的假设的,于是我们可以在这个基础上进行一定的聚类分析来进行模式识别。当然,理论上这是个np难的问题,这个量级的运算不可能在有限的多项式时间内得到求解,因此准确的求解算法是没有的,我们只能使用一些近似的算法来求取这种局部最优解。我个人比较偏向的算法是机器学习的各种聚类算法,但对于特定的边界划分我又希望能够糅合概率的算法如蒙特卡罗(arlo)算法,这方面模拟退火,遗传算法,神经网络等就做出很好的尝试。毕竟我们知道,这种数据的组合数目是指数级增长的,我们必须快速收敛,即筛选出具有更大概率存在最优解的范围进行遍历搜索。这种减少运算范围的行为与达尔文的自然选择学说具有一定的相似性,我们可以把物种进化视为自然界层次的计算,这将是很宏大的图景。个人认为,医生的具体诊断过程中也是运用类似的算法来进行运算,当然,就目前的过程,更多的是采取一种不动点的识别模式,从而总结出一定的模块,与已有的经验进行序列比对,可以进行一定的模式识别即最终的诊断形成。这就可以导入各种an算法和needleman算法等等动态规划这些序列的比对,还有我们最爱的bla算法,其中的seed序列的寻找可以视为一种不动点的寻找策略,然后进行更大范围的比对是如同贝叶斯推断不断提高可能的概率即最终的效果的行为,我们理论上能够以一定精度逼近现实情况,即作出可能的诊断。至于治疗,可以使用相似的思路,把要测量的对象改为要作用的对象即各种靶点,然后通过一定的药物组合来起到最优的疗效,根据傅里叶级数给我们的启示:一对线性无关的基底可以通过其选择性表达即线性组合来遍历空间的每一点,我们有一定把握可以这样说:很多疾病都可以通过一定的药物组合来起到一定的治疗作用,我们确信存在这样的一组最佳配比。这种信息,可以表示为一定的序列,在理论上是必然存在的,我们只是需要知道是哪些药物和其相对比例,这就是一个最优解求解的问题。虽然目前我们不知道具体的疾病对应于哪些药物,但是我们可以通过已有的经验来构建一定的数据库来构建一个大体的训练集,然后运用各种算法来不断逼近这种最优解。因此我们还是可以借助之前的序列比对的各种算法,来不断逼近这种最优解,不同的药物对应不同的序列,我们最后能够找到最佳的组合能够有着较高的序列匹配(根据打分矩阵得出的结论),我们认为能够与具体的疗效构建高相关性,就认为是一种疗效的度量了,这种量化的思想对我们很重要,这是一切运算的基础。我想起我之前和一个人谈论过这种序列的思想,当时我被一个问题问到哑口无言,我要对每个病人都要进行测序吗?我想,就现在不成熟的想法还是:是的,我们需要搜集大规模的数据,但这种测序不同于已有的dna的深度测序,不是寻求acgt的具体序列,而是以一定的数据格式来补充进各种测量的数据(如肌酐酶浓度,浓度,前列腺特异性抗原等等),形成序列这种数据结构,然后在这个基础上根据特定的算法进行各种分析,这方面生物信息学的发展给我们很大的信心。至于病史/家族史、症状/体征以及影像检查/病理检查等我们可以认为是不同层次的特征,可以同样整合到原有的数据模型中。这种多层次的信息可以起到贝叶斯推断的后验概率的提高作用,即不断提高诊断的准确性。最终我们希望能够如同基因组学一样构建一个疾病谱库,这是偏实用意义方面的,能够以一定的信息输入(各种测量的指标)得到一定的信息输出(可能的疾病)。当然,我们在学术上也是有追求的,我们认为可以引用隐马尔科夫模型来解释,我们需要借助各种统计工具来得出高维的转移概率矩阵,具体的疾病就是特定的选择性表达。我们认为高维能够很好地解释低维情况。也就是说,我们之前一直在纠结的各个层次的相互作用,即不同层次的竞争博弈可以在这种高维层次进行简单的运算