佳礼资讯网

 找回密码
 注册

ADVERTISEMENT

查看: 3754|回复: 50

如何用DNA序列重建演化关系

   关闭 [复制链接]
发表于 17-8-2011 09:30 PM | 显示全部楼层 |阅读模式

讨论DNA演化基理可以用非洲一个湖里的鱼开始。让我把情况简化重造,但原理不变。


您在一个封闭的湖里放了一种鱼,然后走了。若干年后回来,发现湖里游着数种相似但不同的鱼。为了了解它们的关系,就把它们的染色体里的一段DNA的序列测出来:

A种鱼 AATGGGATCCGTGGAATGCAGGTGA

B种鱼 AATGGGATTCGTGGAATGCAGGTGA

C种鱼 TATGGGATTCGTGGAATGCAGGTGA

D种鱼 AATCGGATCCGTGGAATCCAGGTGA

E种鱼 AATCGGATCCGTGGAATCCAGCTGA

F种鱼 AATCGGATCCGTGGTATCCAGCTGT

G种鱼 AGGTCTTGCTGGATGTCGTAGCTGT

H种鱼 AGCTCTTGCTGGATGTCGTGGCTGT

请问您会如何看它们的关系?

回复

使用道具 举报


ADVERTISEMENT

发表于 17-8-2011 10:00 PM | 显示全部楼层
我認為可以通過Cluster analysis把魚分為若干類別
回复

使用道具 举报

 楼主| 发表于 17-8-2011 10:13 PM | 显示全部楼层
回复 2# puangenlun


    您好。跟几个网友交流发现他们对演化基理不了解。所以开了这个楼。等他们看了,回复后我们才开始谈比较深的格算法吧。
回复

使用道具 举报

发表于 18-8-2011 01:43 AM | 显示全部楼层
本帖最后由 littlepenguin 于 18-8-2011 01:52 AM 编辑

回复 1# 一实相印


   哈哈,好奇怪你会问这个问题。

ok, 我还是贴出来我们的pm给各位看看比较好,免得其他人误会。



我们开始是谈宗教课题,和科学无关,不懂为何你会无端端去提到生物学。

以上述的private message, 我觉得你原本是要讨论科学哲理的,因为你说要开在哲学论坛,不懂为何你会开这一类的技术问题?

而且我用iphone当例子和我懂不懂生物演化论有什么关系呢?和我们一直在谈的宗教课题有什么关系呢?

我觉得你是把话题转去你的专科而已, 因为我一早有和你说明我是part time programmer, 你难道要用你的专科来给我们下马威???

那么我可以问你digital design和programming的问题吗?

你这样的态度很有问题哦,我们讨论着宗教课题,你却说我不懂科学,问我你的生物专科? 那么我可以问回engineering,说你不懂engineering, 所以你不懂科学吗?宗教和科学是两回事,生物学也只不过是科学的一部份而已。


ok,不要紧, 即使你问这个问题的用意是不善的,既然你问到这个问题了,我也好好回答你,尽量回想差不多全部还回给老师的bio知识。

我就step by step来解释我怎样approach这样的问题,尤其是在像我这样没读到大学genetics的情况下。

首先呢,我想到的是mutation和chromosome recombination, 可是依你的data来看,不像chromosome recombination那样一整段的。所以就当着是mutation好了。


ok, 其实你的问题一开始就有问题,因为这里你是做了“在一个封闭的湖里放了一种鱼,然后走了。若干年后回来”这一段假设的。

你开始说只放一种鱼,可是你没说清楚,这一种鱼当时是否是同一个特征,是不是全部是同一条line, 还是放鱼的时候已经是有variation的。

所以这里我就当着你这一句
“在一个封闭的湖里放了一种鱼,然后走了。若干年后回来”没讲过,我当着是一个在isolate的岛上的野生湖,所以可以做第1个assumption,是同一条line的,开始是没有variation的。

第二,这八组data的dna是否是稳定,因为不稳定的话,你根本无法做traceback,因为第3个assumption会用到,所以第2个assumption, 这一段dna是稳定的,没有mutation的话是不会变的。

第三, 你没说清楚过了几久,你的写法,诺干年后,好像不是很久,那些鱼好像不是过了很多代,问题是你的data有两组是与众不同的,和第3个assumption不符,就是natural mutation, 要做这样的traceback, 最重要就是natural mutation, 没有的话,你一样算错。

所以以你的data, 3 个assumption变成有矛盾的,所以,either你data错或你开始那一句写错。

ok, 不要紧,我当着你那一句写错好了,当着过了很多代,当着开始是同一个variation。

我的approach是先将全部data排起来:


   1 2 3 4 5。。。。
A 7 6
C 0 0
T 1 0
G 0 2

以此类推排完,现在懒惰排,夜了,明天才排,现在先讲approach。

因为刚好有25个,每个位置就4%。

每一组data compare算percentage, 如第一个就,4% x 7/8, 25个加起来。

8组里面最高的,和原始最相近,mutation最少。

然后可以将相近percentage的group在一起,就可以用percentage做一个diagram出来了。

不过几相近的percentage可以group在一起,我就不清楚了,因为这一个要用到natural mutation rate来计算,这又是一个statistic assumption了。

然后就是拿一代的natural mutation rate除以每一组dna相差的percentage,就可以推算mutation过了多少代了。

讨论到这里, 其他的明天才看,夜了。












回复

使用道具 举报

 楼主| 发表于 18-8-2011 03:49 AM | 显示全部楼层
本帖最后由 一实相印 于 18-8-2011 06:33 AM 编辑

回复 4# littlepenguin

我和其他网友谈演变时您一直说您看不懂我的演变逻辑。我说我可以解释,但您说您不想谈宗教或哲学。一定要用科学和“实物”证据。还多次提起您有数学和计算机经验。我当然也可用其它专业,但谈演化最强的科学是生物学。所以我才让您先试这题。东西都是我简略的:

1)当初放下的那种鱼是一种鱼。没有多样性。
2)若干年:就是,第一种鱼繁殖好多代。中间发生突变演化,最后发生我列出来的情况。
3)不用想突变率,这是我简化的一个情况。也不是要算演化的时间长短。所以就用这个snapshot就好了。

其实我没让您算,只是让您看看。这些都是有了定论的东西。过后我还是会告诉您遗传学家的方法和结论。也不到我们在这里反对或赞成。这些方法和原理已经用在探讨思想、哲学的演化。我一些同事就是干这些。我的本意是让您有个参与,好了解现在研究科学和哲学演化的逻辑。

您是不是生活在一个非常有敌意的环境?这世上并不是每个人都想“坑”您的。至少我不是。
回复

使用道具 举报

发表于 18-8-2011 10:22 AM | 显示全部楼层
回复 5# 一实相印


   我说看不到逻辑,是你讨论宗教课题没有逻辑,因为你没有一件事一件事讨论,这又和生物学的逻辑有什么关系呢?
你这样的解答,让我更觉得匪夷所思, 因为你又再把两个不相干的事情拿来当着同一件事情讨论了。
回复

使用道具 举报

Follow Us
发表于 18-8-2011 11:11 AM | 显示全部楼层
回复 5# 一实相印


   其实在解这样的问题时,是有两个很不同的情况的:
1. 大学考试, data全部是idealistic的。
2. 真正在野生环境收集到的data。

可是你已经说了是idealistic的,我就当着是大学考试的其中一题好了,那么我要知道的是你要演化什么? 你要的答案你没说清楚。

你又说你不要知道演化时间长短,原本我看的时候,我还以为你要分出来有几group不同种的,谁和谁相近,然后mutation过了多少代。

既然你不要知道mutation过了多少代,那么你要的答案是什么呢? genetic tree? 还是单单将相近的group在一起。

如果是大学考试,也是要将你要的答案是什么说出来,不然不同的学生,会给你不同的答案,有人会给你diagram, 有人会给你statistic计算,有人会给你一大篇理论。
回复

使用道具 举报

 楼主| 发表于 18-8-2011 07:59 PM | 显示全部楼层
回复 6# littlepenguin

现在研究思想演化的人已经用生物演化的基理。我的同事不少在做这个。您不知道是您孤陋寡闻。我原来想一步一步演示给您看两个东西是如何连贯。

但一看人家出题,想都不想,也不等人演示,就大喊伪科学、没逻辑。您既然有自己的真科学那就拿着吧。不过以后人家讨论不要以为自己是最厉害的科学家,大喊大骂。懂科学的人会用科学逻辑礼貌地解释。
回复

使用道具 举报


ADVERTISEMENT

发表于 18-8-2011 08:05 PM | 显示全部楼层
回复 8# 一实相印


   你到现在都不要讲清楚你所谓指的演化是什么意思。
你所谓的生物演化的基理是genetics tree还是taxonomy分类。


我几时讲我是很厉害的科学家,我都讲我是尽量回想差不多已经完全还回给老师的bio知识来答你的问题了。

你一直避答我的问题,然后又讲不要答了, 你这样的态度,讨论什么鬼。
回复

使用道具 举报

发表于 18-8-2011 10:21 PM | 显示全部楼层
我對你們的爭論不感興趣
相信其他網友亦然

根據Cluster analysis,可以這樣歸類
((7,8)((2,(1,3))(6,(4,5))))
(((1,2,3),(4,5),6)(7,8))
等等,因為分類有不同的標準
回复

使用道具 举报

发表于 18-8-2011 10:59 PM | 显示全部楼层
回复 10# puangenlun


   用cluster analysis是可以的,还可以参考Phylogenetic, 有几个不同的系统。
实际上还是需要参考bio来做出statistical model的, 因为这不是单单一个数学题。

因为需要考虑到那边生活环境的carcinogenic level, 得到mutation  rate, 而且mutation可以一次过干掉几个nucleotides的。要得到mutation一次干掉几个nucleotides的机率才可以运算。

所以我才会说其实mutation rate很重要的,出来的model也会很复杂了。

可是呢,说真的,group在一起有什么用呢?

真正呢,是很有争议的,有一些生态学专家,有大力推广过用这样的方法来做taxonomy分类。

不过,到最后还是行不通,国际taxonomy还是以特征分类。

有两个原因:

第1,因为基因相近,特征会相差很远,就如人类和老鼠,基因相近,却不能group在一起。

第2, grouping的方法有很多,争议不断,不同方法,group出来的不一样。
回复

使用道具 举报

发表于 18-8-2011 11:14 PM | 显示全部楼层
回复 10# puangenlun


   你继续分享你的方法吧。
不用理会我和楼主的事情,我和他的事不关科学的。

他也弃楼不要回答了,就你来回答吧。
回复

使用道具 举报

发表于 19-8-2011 02:15 AM | 显示全部楼层
說實在的,我的生物水平停留在中學階段
所以上面的分析只是數學上的
Phylogenetic和carcinogenic level這類深奧的東西我不懂
我也只是想拋磚引玉

至於為什麼分類
這是要回答樓主關於“请问您会如何看它们的关系”
分類可以分為遠親與近親兩大類

“第1,因为基因相近,特征会相差很远,就如人类和老鼠,基因相近,却不能group在一起。”
這句話我持保留態度
我覺得站在生物角度上
基因是貫穿不同物種的
也就是說基因是生物的抽象
這樣就可以將所有生物統一來做分析
如果兩個物種基因相似
我覺得他們之間應該有某種程度上的相似性

生物知識不好,全憑個人推測
如有錯誤,還望相告
回复

使用道具 举报

 楼主| 发表于 19-8-2011 07:47 AM | 显示全部楼层
本帖最后由 一实相印 于 19-8-2011 08:02 AM 编辑

原来这一题是要学生根据自己的想法画演化树。既然您说您已经了解各种格算法。我就直接用电脑画出來。我的方法是 neighbour joining。
这一题要让学生自己发现几个结论:
1)        湖里的鱼经过了演化变为两支。学生如果看的清楚的话应该会发现两支的差别很大,可以推测有一支可能是还有另一个人来放的。
2)        A-F那一支其实有两个支(演化树可能看不出来)。有一个支的突变点在前端,另一支的突变点集中在后段。所以使用这两支的保留讯息可以知道A-F的共祖是(AATCGGATCCGTGGAATGCAGGTGA)。可这个共祖已不存在。
3)        有些序列的差别是物种内部的多样性。有些序列的差别却是两个物种的差别。可用于重建演化关系和物种分类。

我们已经能用同一个原则去看文化基因meme的演变。已有格算法处理。公开或不,我得看我的朋友愿不愿意。况且我已不敢再给您发题了。不清楚或说错了可以礼貌指出。如果非要破口大骂,说人伪科学、假冒等等,恕不奉陪。
回复

使用道具 举报

发表于 19-8-2011 09:38 AM | 显示全部楼层
本帖最后由 littlepenguin 于 19-8-2011 09:46 AM 编辑

回复 14# 一实相印


   你这样的解释根本就不符合Phylogenetics, 而且你又说是单一variation?

所以我就问你是有没有variation的。因为我都讲了,最后两个与众不同,你单单Mutation是不可能这样大变化的。你又讲没有variation, 而且请注意,你讲是一个封闭的湖里, 封闭的湖就是closed system, closed system哪里来后来人家多放另外一种鱼下去???

所以我都讲你开始的假设和data互相冲突。你现在给的答案又和你的假设互相冲突,我就讲你这个问题根本是乱给的。
回复

使用道具 举报

发表于 19-8-2011 09:41 AM | 显示全部楼层
回复 13# puangenlun


   第1,因为基因相近,特征会相差很远,就如人类和老鼠,基因相近,却不能group在一起。

嗨,这句话,是用在taxonomy上。可是在genetic tree的话,人类的确和老鼠group在一起的。所以我问楼主是要用在taxonomy, genetic tree还是演算mutation过了多少代。
回复

使用道具 举报


ADVERTISEMENT

发表于 19-8-2011 10:09 AM | 显示全部楼层
哈,这一楼好乱水哦。

不过这楼主也是的,随便丢一个题目挑战人家。然后给一个这样乱水的答案。尽然可以说封闭的湖,另一支是后期人家放的,扯到够够力。

根本是在玩人嘛,怪不得小企鹅会那么大火,好啦好啦,我为你熄火啦,这样乃人寻味的问题,你不必生气,他是故意惹你生气的, 你越生气,他目标越达成,哈。
回复

使用道具 举报

发表于 19-8-2011 12:30 PM | 显示全部楼层
“原来这一题是要学生根据自己的想法画演化树。既然您说您已经了解各种格算法。我就直接用电脑画出來。我的方法是 neighbour joining。”

樹在哪裡?
回复

使用道具 举报

 楼主| 发表于 19-8-2011 06:09 PM | 显示全部楼层
回复 16# littlepenguin

科学的方法是先立一个假设,然后做分析,然后看假设对不对。如果假设对-接受,如果假设不对-推翻,如果假设稍微不同-修改假设。考题出的时侯同时加入这一个空间。我们的学生高度文明,看到这样的情况就会用学过的科学论证,进行深度思考,给予合理的可能性。不会跳起来乱喊伪科学、假冒。。。

您说的演化树和物种分类的分别是您对生物学的不了解。两者都用外形特征和DNA序列来分析。有时不同物种因为活在同一个环境,可以有几乎一样的外形,但DNA序列完全不同。有时两个同一个物种因为住在不同的环境,外形可以很不同,但DNA序列几乎一样。所以两者要并用才能准确。

您如果明白了这里的道理。您不会直接用人和老鼠比较。在画树的时侯如果您放“人”、“鼠”、“虫”时,人和鼠会被放在一组。但如果您用“人”、“鼠”、“猴”,人和鼠就被分开。所以做科学分析在于您要问的问题,才能决定用的方法和材料。
回复

使用道具 举报

发表于 19-8-2011 06:35 PM | 显示全部楼层
回复 19# 一实相印


   哈哈,问题是你这题你已经说是考题了,不是试验性质的。
现在你的数据推翻你的假设,然后又推翻你的答案。

你连open system和closed system都搞不清楚,还讨论什么鬼。

在这样closed system并没有你讲的假设对不对的问题存在,你在玩文字游戏,如果你要玩文字游戏,请你回去宗教和哲学论坛,在科学论坛不要玩文字游戏,ok?


像你以上这样讲,我就看到你不了解taxonomy了,我一直问你是用在taxonomy还是genetic tree是有原因的。


你了解taxonomy其实并不是为了将基因相近的种类排在一起吗? 同一个family的species可以和自己family的其它species在genetics上相差很远的,而且有可能和不同family的反而基因相近。


因为taxonomy其实并不是要做基因谱,不是基因分类。taxonomy其实是要将不同生物给以科学化的名称而已,为了统一不同国家对同一种类的名称,方便查询。


你了解为什么国际统一的taxonomy是用特征分类,不用genetics吗? 用特征就是为了方便分类,当你有一种你不知名的生物时,只要对照taxonomy的表,你很快可以找到它的family和species了,拿到科学名称,可以用来参考其它人对那个species的研究。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

 

ADVERTISEMENT



ADVERTISEMENT



ADVERTISEMENT

ADVERTISEMENT


版权所有 © 1996-2023 Cari Internet Sdn Bhd (483575-W)|IPSERVERONE 提供云主机|广告刊登|关于我们|私隐权|免控|投诉|联络|脸书|佳礼资讯网

GMT+8, 19-4-2024 07:07 AM , Processed in 0.081589 second(s), 24 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表