写论文的同时,曾凡大脑也在不断思考运转,这次实验向他打开了一个全新世界的大门。
假如把人类基因组序列当做一个程序,一对对碱基就是组成机器语言的一串串零和一,只是它们的组合方式比现在计算机的二进制复杂的多,破解起来难度也更大。
自己这个超级程序员能不能破解开人类基因组这个超级程序呢?
从目前来看,他还需要收集更多更详细的数据,单纯这一个基因包含的信息还远远不够。
就是这一个基因包含的几千个碱基序列,他也还没搞明白呢,这些天的实验也是在前人总结的经验基础上,做了一些简单的假设求证,
目前能得出的结论也只是基因会影响机体脂肪消耗能力,容易造成脂肪累积,从而造成肥胖引发一系列并发症。
至于这个基因如何造成这种现象,其中的碱基序列各部分都发挥了什么作用,还完全两眼一抹黑。
就好像对一个未知程序做黑盒测试,只是知道了程序具备的一部分功能,内部的运行机制,编程算法还没搞明白。
从这个角度看,破译基因功能,和破解一个未知程序很相似,不同的是它的编码规则更复杂,破译过程也更艰难。
破解普通程序只需要在计算机上面对屏幕敲键盘就行了,破解基因序列则必须在显微镜下操作,还需要进行很长时间的实验验证,难度可想而知了。
能不能写一个模拟生命基因功能的程序,在计算机上进行模拟破译呢?
现在已知数据太少,精确度不会很高,随着破解进度的增加,未来精确度会越来越高,当突破某个临界值后,或许不再需要细胞实验,动物实验,在计算机上就能破译基因的功能了。
到时候,不但人体所有基因功能都可以破译出来,还可以修改某些基因,看看能不能达到预期效果,然后再进行实验求证,完成一次基因的进化。
到那时候,甚至可以通过软件设计,用基因编辑重组制造出一个全新物种,那可是神才能拥有的能力!
想想就觉得激动,曾凡被自己这个大胆想法震惊到了,反复思索其中的可能性,越想越觉得值得一试。
人类基因组测序就相当于破解生命程序的源代码,他写的计算机程序就相当于将这些源代码在计算机上重新编译一遍,可以模拟真实人体情况运行起来。
现在的计算机虽然强大,算力方面估计仍然难以支撑,初始的程序架构不能太庞大,功能也不能太复杂,可以根据需要一点点逐步扩展。
人类基因组的测序工作已经进行了大半,他可以尝试根据破解出来的这些序列,总结规律写一个反编译程序,加快测序进度。
测序流程这段时间他天天都在做,已经熟悉的不能再熟悉了,基因碱基序列的组成规律不敢说完全掌握,至少也摸清了大半,对他的程序来说已经够用了。
被这个想法所驱动,曾凡没有像往常那样按时睡觉,熬夜把自己的构想变成了代码。
光有程序代码还不行,还需要把测序完成的基因序列导入进行计算,这些在他宿舍的电脑上做不了。
将程序刻录到光盘上,曾凡凌晨三点多跑到实验室,在实验室的电脑上开始操作,实验室的工作站比他的宿舍电脑当然算力高多了,更主要的可以高速获取基因组数据,还可以调用学校超级计算机的算力进行运算,效率提升可不是一星半点。
由于数据量庞大,导入过程就需要几个小时,程序运行总结规律也不是一时半会能完成,曾凡盯着屏幕困意上涌,趴在桌子上面睡着了。
“喂,醒醒!醒醒!”
曾凡被叫醒的时候实验室外面已经天光大亮,看看计算机的时间,才刚刚五点多钟,计算机还在运行之中。
叫醒他的是实验室的负责人帕米拉教授,看他醒过来问道:“曾,你在搞什么?学校超算中心管理员给我打电话,说我们突然调用了大量超算资源进行计算,是你弄的吧?”
“教授,我昨天睡觉前突然萌生想法,写了一个程序,可以根据已经测出来的基因序列推算后面未知的序列,正在进行验证!”曾凡赶紧从座椅上站了起来说道。
“哦,你有多大把握?”帕米拉好奇的问。
“一半一半吧,第一步估计需要超算中心支持五到十个小时,后面的实际演算还需要一到两天时间,不太确定!”曾凡挠挠头说道。
“咱们的进度已经超前了很多,可以给你三天时间尝试,超算中心那边我会让他们配合!下次再有这事你提前通知我,别再这么鲁莽!”帕米拉笑着说道,这个学生总给她带来惊喜,必须得支持啊。
“知道了,谢谢教授!”
接下来的两天,曾凡大部分时间都泡在实验室的电脑前,盯着程序的运行,这个基因组测序软件,只是他的一个尝试,为后面的基因功能模拟程序做的一个前期测试。
那个程序不仅要包含这个测序部分,还要能模拟基因的分裂复制,怎么样通过基因转录生成不同的氨基酸,再根据碱基序列用氨基酸组成结构不同的肽链,最后将肽链转换成特定功能的蛋白质。
通过这些不同的蛋白质来调控生物体内各种不同的生物酶,激素,抗体的产生,进而控制生物体的生长,发育,新陈代谢和其他本能行为。
程序的最终状态曾凡不知道什么时候能完成,需要的数据太