每天泡在实验室的曾凡,对一天天过去的时间感觉变得有点迟钝。
他每天琢磨的都是不同基因的选择性表达,rna的作用机制,二十几种氨基酸的排序,新发现的蛋白质功能等等问题。
随着研究的持续深入,他可以参考借鉴的文献论文也越来越少,帕米拉教授能给他的指导也有限了,实验中遇到的各种问题只能自己推敲琢磨,找出合理的解释,再通过重复实验去证实。
不过收集的数据逐渐充实,也让他写的初始版本基因功能模拟程序慢慢成形,尽管还只是模拟细胞内单个基因的分裂复制和转录生成多肽链,再到蛋白质,程序能运行起来,就已经是巨大的进展了。
为了尽可能真实的模拟细胞内的各项化学反应,曾凡设计的程序算法格外复杂,仅仅是这一个细胞内的反应,就占用了实验室的一台小型服务器全部算力,运行了将近一个小时,比真实的实验中细胞实际反应时间还长。
万事开头难,能模拟第一个,稍微修改参数就能模拟出第二个,很多基因的差异性很小,一组编码近似,互有关联的基因都模拟出来,这个程序就可以发挥真正的作用了。
可以节省大量的细胞实验时间,让研究人员只关注最关键的实验,提升基因功能研究的效率。
未来收集的数据越多,这个程序推演的会越准确,功能越强大,当突破一定的临界值,不需要后续的实验,就可以自动补全缺失的数据,完整模拟整个人类基因组的演化过程。
只是这其中需要的算力也是指数级提升,一个基因在一个细胞内最初级演化过程就需要一台小型服务器模拟,人体的细胞数量是万亿级,以目前的计算机水平可是还远远不够。
当然,随着掌握的数据量增加,会摸索到越来越多的规律,很多不必要的算法还能持续优化,未来真实算力肯定不会那么恐怖。
但是再如何优化,用普通的计算机模拟整个人类基因组演化,都不太现实,不过那不知道是多少年后的事情了。
实验室里,十几个研究员,还有帕米拉在内的几个教授,一起观看了曾凡演示的程序模拟细胞内画面。
整个基因解螺旋复制的模拟过程,比显微镜下看到的画面更清晰,看上去更真实可信,曾凡解释道:“这些画面只是为了看着更直观,真正耗费算力的是后台的数据运算,我已经模拟了几个序列相近的基因变化,进行了一些优化,现在演示的就是一个预测的演化过程,后续我们根据得出的数据,再进行实验验证,看看准确率如何!”
“也就是说,现在这个程序输入一个已知的基因序列,就能模拟在细胞内的翻译和表达全过程?”帕米拉教授问道。
“理想状态是这样,现在我们收集的关键参数太少,演示的基因和我们数据收集的比较全的基因序列相似度越高,模拟的准确性应该越有保证!程序初步框架完成了,后续还要逐步修正,数据越多,精确度越高!”曾凡解释道。
“那多个基因同步表达,能不能模拟出演化过程?”一个秃头的教授问道。
“我们这段时间收集的这几个相近基因的关键数据差不多了,可以模拟出来,就是比较时间比较长,在这台计算机上需要估计三十个小时,未知的越多,需要的算力越多!”
“假如不考虑算力,你这个程序现在能实现一个酵母菌细胞全部表达基因的完整演化过程吗?”帕米拉接着问。
“不要求准确率的话,没有问题,我的设计目标可是模拟整个人类基因组完整演化过程,包括从胚胎发育,到人体长大,成熟,衰老,直到死亡的完整过程!”曾凡自信的说道。
“你是知道咱们算力不够才这么说的吧,现在可是才模拟一个细胞内的一个基因!”一个比曾凡大不了几岁的研究员笑着说道,显然认为他在说大话。
“我有一个想法,酵母菌的基因和人类有超过四分之一相似度,它的蛋白质接近一半和人类的同源,我们也已经有了酵母菌的基因组图谱,假如我们调用学校的超算系统模拟酵母菌的演化过程,把酵母菌的数据先收集齐全,或许可以加快后续研究进展!”曾凡提议道。
“这个提议好,一开始哪怕准确率不高也没什么,只要慢慢推进,总会一点点进展,我觉得可以!”秃头研究员率先赞同。
“同意!”
“同意!”
其他的研究员也纷纷表示赞同,他们都比曾凡更有资历,可是经过这一段时间的合作,都已经被他的头脑和学识折服了,科学研究方面,还真不是笨鸟先飞就行,没有领头雁,只能像麻雀一样在一片树林子里面乱飞,可能一辈子也飞不出什么名堂。
有人领路就不一样了,同样的努力,收获的果实很多时候天差地别,科学家也是凡人,完全不在乎名利的在哪里都是少数派,人群中的另类,哪怕再痴迷研究的人,也希望获得更多人的认可。
“那行,曾凡你做一个超算使用计划,我会和学校里申请,他们对咱们实验室的支持不能光停留在口头上,该拿出实际行动了!”帕米拉最后拍板道。
超算第一次模拟酵母菌演化过程用了一百三十多个小时,随后他们对获得的大量数据进行分析验证,准确率超过曾凡的预计,超过了百分之三十。
随后他根据验证数据进行调整重新用超算进行推演,这次只用了一百