如何用Pymol做出那些美呆网的结构图

点击联系发帖人 时间：2017-07-24 04:12

穿汉服美呆外国人

&b&20万年前，人类起源于非洲。&br&6万年前，人类一批一批走出非洲。&br&4万年前，人类遍布世界每一个角落。&br&1万年前，人类开始进入农业时代，人口爆炸。&/b&&br&&br&&b&我读的这些是从DNA的角度分析人类迁徙。不得不说，生物科技的发展不断地给我们惊喜，我们居然可以&u&从基因的角度来分析史前的事情&/u&！并且这个方法&u&很科学、很直接、还很便宜&/u&！&/b&&br&&br&这半年读了挺多人类迁徙的书，最近也检索了很多汉民族的DNA分析文献，中国人的历史教科书大概忽略了史前迁徙这一段，我写下这篇回答也算是这学期的读书总结吧。&br&&br&&u&&b&为什么我会对这个话题感兴趣？因为我从我们的教科书上只读到了我们3000年的历史，我迫切地想要知道我们究竟是怎么在这大地上繁衍至今的。&/b&&/u&&br&&br&&br&&br&与其谈论人类迁徙的具体细节，咱们不如聊聊一些有趣的话题。&br&&br&&b&本文略长，不过每个话题都标了序号，不感兴趣的知友就可以&u&跳过&/u&不感兴趣的小标题。&/b&&br&~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*&b&&br&【1】人类起源于非洲吗？&/b&&br&&b&【2】北京猿人是我们的祖先吗？&/b&&br&&b&【3】这些说法都有没有证据？&/b&&br&&b&【4】人种有优劣之分吗？&/b&&br&&b&【5】Y染色体与线粒体DNA，亚当与夏娃&/b&&br&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&【6】如何从现代人的DNA分析上古时代的迁徙？ &/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&br&&b&【7】澳洲土著以及海上高速公路&/b&&br&&b&【8】欧洲人的祖先——夏娃的七个女儿&/b&&br&&b&【9】日本人的来源&/b&&br&&b&【10】日本和西藏的渊源&/b&&b&&br&【11】古人类化石&/b&&br&&b&【12】欧亚大陆只是非洲的一个省？&/b&&br&&b&【13】黑人为什么这么黑？&/b&&br&&b&【14】尼安德特人&/b&&br&&b&【15】农民的冲击&/b&&br&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&【16】汉族的形成&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&br&&b&【17】人与人的差距能有多大？&/b&&br&&b&【18】中国人的3个超级先祖&/b&&br&&b&【19】汉族由北向南的扩张&/b&&br&~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*&br&&br&&br&&br&先回答题主的问题，再聊别的。&br&&br&&b&【1】人类起源于非洲吗？&/b&&br&&b&全部都是，非洲人是，欧洲人是，亚洲人是，澳洲土著是，美洲土著也是。&/b&&br&&b&&u&有证据吗？有，有铁证，而且是各种各样的铁证。&/u&&/b&事实上非洲起源已经是不争的事实，现在生物学领域的学者们已经利用这些方法来研究世界各地人的迁徙历史。&br&&br&我尽量用一个比较好理解的切入点来解释一下为什么是非洲起源。&br&现在的DNA分析技术已经很发达，人类基因组计划已经基本完成。好，那我们分析一下世界各地人的DNA，有一个发现是&b&非洲人的DNA多样性远远大于欧亚人&/b&。打个比方，随机抽取两个非洲人，他们的DNA序列10000个中有6个不同，而欧亚人10000个只有1个不同。为什么呢？那是因为在6万年前（为什么是6万年前下面再解释），欧亚人只是非洲人的一小部分，只不过他们跑出去繁衍成了很多很多人占领了很多很多地方。具体的解释在“【11】欧亚大陆只是非洲的一个省？”。&br&除此之外，&b&考古上也有证据，10万年前的古人类化石只有东非才有&/b&。你说北京猿人？但北京猿人根本不是是我们的祖先。&br&&img src=&/a098ae0a6a26fba899a4fd7_b.jpg& data-rawwidth=&2298& data-rawheight=&2422& class=&origin_image zh-lightbox-thumb& width=&2298& data-original=&/a098ae0a6a26fba899a4fd7_r.jpg&&&br&上图摘自张振《人类六万年》。把人类的演化画成一棵树，很容易就可以发现，&b&非洲人是树干，欧亚人（非非洲人）只是后来分出的一支小树枝&/b&。&br&&br&&b&20万年前，人类起源于非洲。&/b&&br&&b&4.1万年前，第一批东亚人和非洲人分离。&/b&&br&&b&3.3万年前，欧亚人和非洲人分离。&/b&&br&&b&2.1万年前，第二批东亚人和欧亚人分离。&/b&&br&&br&当然，这个时间点的估计还并不是完全准确，人类的迁徙也远复杂的多，但完全可以作为参照。&br&&br&&br&下面的图均拍自《人类六万年》，图侵删。可以看看大致的迁徙过程。&br&&br&&img src=&/252f5e827c72ee087dea_b.jpg& data-rawwidth=&3136& data-rawheight=&1536& class=&origin_image zh-lightbox-thumb& width=&3136& data-original=&/252f5e827c72ee087dea_r.jpg&&&img src=&/9c3bbbc467_b.jpg& data-rawwidth=&3104& data-rawheight=&1440& class=&origin_image zh-lightbox-thumb& width=&3104& data-original=&/9c3bbbc467_r.jpg&&&br&&img src=&/8dc1687c7fcecc5600fa_b.jpg& data-rawwidth=&3072& data-rawheight=&1440& class=&origin_image zh-lightbox-thumb& width=&3072& data-original=&/8dc1687c7fcecc5600fa_r.jpg&&&img src=&/857c89de0cbd345a7533_b.jpg& data-rawwidth=&3104& data-rawheight=&1536& class=&origin_image zh-lightbox-thumb& width=&3104& data-original=&/857c89de0cbd345a7533_r.jpg&&&img src=&/fd2f5ab8b6fe08246cfe76dd64ba0921_b.jpg& data-rawwidth=&3104& data-rawheight=&1472& class=&origin_image zh-lightbox-thumb& width=&3104& data-original=&/fd2f5ab8b6fe08246cfe76dd64ba0921_r.jpg&&&br&&img src=&/e4943ebcebcf89288eff58ddf2401ce2_b.jpg& data-rawwidth=&3040& data-rawheight=&1472& class=&origin_image zh-lightbox-thumb& width=&3040& data-original=&/e4943ebcebcf89288eff58ddf2401ce2_r.jpg&&&img src=&/78a3a4f464ba4b48a44b607a94ab91a4_b.jpg& data-rawwidth=&3072& data-rawheight=&1408& class=&origin_image zh-lightbox-thumb& width=&3072& data-original=&/78a3a4f464ba4b48a44b607a94ab91a4_r.jpg&&&img src=&/bb3e281bf1da3a9a8539_b.jpg& data-rawwidth=&2944& data-rawheight=&1440& class=&origin_image zh-lightbox-thumb& width=&2944& data-original=&/bb3e281bf1da3a9a8539_r.jpg&&&img src=&/c00dabb4a441d1dc9c40932_b.jpg& data-rawwidth=&3008& data-rawheight=&1472& class=&origin_image zh-lightbox-thumb& width=&3008& data-original=&/c00dabb4a441d1dc9c40932_r.jpg&&&img src=&/d133d53e1f4e02cc10a1_b.jpg& data-rawwidth=&2880& data-rawheight=&1408& class=&origin_image zh-lightbox-thumb& width=&2880& data-original=&/d133d53e1f4e02cc10a1_r.jpg&&&img src=&/9be69bf1fdef27168f10d_b.jpg& data-rawwidth=&2912& data-rawheight=&1440& class=&origin_image zh-lightbox-thumb& width=&2912& data-original=&/9be69bf1fdef27168f10d_r.jpg&&&br&&br&&br&&br&&br&&b&【2】北京猿人是我们的祖先吗？&/b&&br&不是，完全不是。北京猿人比人类更早走出非洲（70万年前），目前已经发掘的北京猿人化石是70万年前至20万年前。而现代人类5万年前才到达东亚。&br&从化石发掘来看，东亚人类化石的发掘有一个明显的断层——&br&&img src=&/ae1d8d0fdced1aacf257be_b.png& data-rawwidth=&1779& data-rawheight=&1890& class=&origin_image zh-lightbox-thumb& width=&1779& data-original=&/ae1d8d0fdced1aacf257be_r.png&&而事实上，&b&早在现代人到来之前，其他古人类早已灭绝。&/b&&br&当然，除了化石证据，我们还有更多更科学的证据&br&&br&&br&&br&&br&&br&&br&&br&&b&【3】这些说法都有没有证据？&/b&&br&有，有科学的证据。线粒体DNA和Y染色体的研究在最近30年有了海量的论文发表在Nature、Science和各种人类学杂志上。&br&~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~&br&中国科学家复旦大学副校长金力院士就是领军人物之一。之前曹操墓身份认定就是他们做的。&br&~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~&br&&br&&br&&br&&b&【4】人种有优劣之分吗？&/b&&br&没有，人种有区别，但绝无优劣。&br&200年前流行的是世界各地起源说，也就是说世界各地的猿类分别独立地进化成人，所以当时的白人说白人比黑人进化更完全，而黄种人介于两者之间。而现在所有证据都指向人类只不过在6万年前出非洲，这在进化史上实际上非常非常短暂，根本不足以进化出多么更智能的东西。&br&打种族歧视的脸！打种族歧视的脸！打种族歧视的脸！&br&&br&&br&&br&&br&&b&【5】Y染色体与线粒体DNA，亚当与夏娃&/b&&br&男性的性染色体是XY，女性是XX，生育下一代时各拿出一支再组合成一对。因此男性继承了他爹、他爷爷、他太爷爷、他爷爷的爷爷…的Y染色体。&br&线粒体是一种细胞器，人类细胞里平均有&a href=&///?target=tel%3A& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&&i class=&icon-external&&&/i&&/a&个线粒体（红细胞没有线粒体）。而DNA不仅仅细胞核里才有，每个线粒体里都有线粒体自己的DNA（分子小得多）。但只有女性的线粒体基因能随其卵子遗传给后代，因为精子的线粒体少的可怜并且受精时绝大部分随尾巴一起扔掉了。&br&好，总结一下，&u&&b&男性的Y染色体传承下去，女性的线粒体DNA传承下去&/b&&/u&。&br&线粒体DNA由于数量多、分子小，因而更容易分析，人类线粒体DNA的研究从上世纪八十年代开始，而Y染色体的研究稍微晚了十几年。&br&&b&而这两条路线可以从不同角度去分析，并且他们得到了非常一致的结果！&/b&&br&现代人的线粒体来自于约15万年前的一位女性，这位母系祖先被称为&b&&u&“线粒体夏娃”&/u&&/b&，也就是我们所有人外婆的外婆的外婆的…的外婆。&br&现代男性的Y染色体都来自于6万年前的一位男性，这位父系先祖被称为&b&&u&“Y染色体亚当”&/u&&/b&，也就是我们所有人的爷爷的爷爷的爷爷的…的爷爷。&br&&br&&br&&br&&br&&br&&br&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&【6】如何从现代人的DNA分析上古时代的迁徙？ &/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&br&打个比方。&br&这一部分是本回答最重要的部分，想往下读下去的知友一定要读懂这一段，不清楚的地方请随意提问。&br&~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*&br&&b&20万年前非洲出现了第一个人类部落，这个部落的酋长举着代表部落的一根长杆子，长杆子上面有100个白色的布条。&br&过了几十年，这个部落人口多了，有一部分人要离开去建立另一个部落。这个新部落的酋长复制了这个长杆子，然而复制会有随机的变化，第68个白布条变成了黑色，我们把这个部落记成M68。&br&人类不断迁徙，不断繁衍，于是现在世界上的各个部落都有了自己的五花八门的长杆子。而从长杆子上黑布条的分布我们可以分析出这个部落的迁徙的信息。&br&这个长杆子就是我们的DNA，长杆子的每一次复制就是父母亲的生育，长杆子上布条颜色的随机改变就是基因突变。&/b&&br&~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*&br&&br&&br&大家都喜欢看图，放几张图。&br&&img data-rawwidth=&3067& data-rawheight=&1586& src=&/a6580d93ffcd3cadca2bfbb9_b.jpeg& class=&origin_image zh-lightbox-thumb& width=&3067& data-original=&/a6580d93ffcd3cadca2bfbb9_r.jpeg&&上图里的M168、M89、M122之类的数字代号是Y染色体种类的代号。&br&~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~&br&&b&&u&M168是绝大多数欧亚人的祖先，所以M168也叫作“欧亚亚当”。&/u&&/b&&br&~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~&br&&br&&br&&br&&br&&br&&img src=&/1f8dbc449d8dd3cba1118f_b.png& data-rawwidth=&1092& data-rawheight=&564& class=&origin_image zh-lightbox-thumb& width=&1092& data-original=&/1f8dbc449d8dd3cba1118f_r.png&&&b&&u&上图是从A到R各种类型的Y染色体，从A到R是根据他们的古老程度（分化出的时间）来编次序的。&/u&&/b&&br&比如说最古老的&b&A和B（20万年）&/b&还在非洲，&b&中国人大部分是O&/b&&b&(一万年)&/b&，算是比较年轻的，而大多数美洲土著&b&Q（1万年）&/b&都很年轻。&br&&b&&u&注意两种DNA类型命名方法的对应关系，M130是第130个发现的单倍群，而为了更方便地判断其古老的程度就用C标记（相当古老）。&/u&&/b&&br&&b&&u&上面的M130就是这里的C，M122就是O，M3就是Q。&/u&&/b&&br&&img data-rawwidth=&1266& data-rawheight=&951& src=&/cbeafd4aeead36b5bdfe15_b.jpeg& class=&origin_image zh-lightbox-thumb& width=&1266& data-original=&/cbeafd4aeead36b5bdfe15_r.jpeg&&全世界男性Y染色体分布，从中也能读出人类迁徙的信息哟。一些细节的分析在下面讲。&br&&br&&img src=&/d510c968beae7c389c10f_b.png& data-rawwidth=&3000& data-rawheight=&1900& class=&origin_image zh-lightbox-thumb& width=&3000& data-original=&/d510c968beae7c389c10f_r.png&&&br&&br&上图是更具体的迁徙路线，看不清不要紧，你只要知道这些都是有根据的Y-DNA的科学的分析结果就够了。&br&&br&&br&&b&【7】澳洲土著以及海上高速公路&/b&&br&&img src=&/6d7b54ec6dcee453b15d_b.jpg& data-rawwidth=&1024& data-rawheight=&812& class=&origin_image zh-lightbox-thumb& width=&1024& data-original=&/6d7b54ec6dcee453b15d_r.jpg&&上图是澳洲土著，很像非洲土著嘛。没错，事实上也是如此。&br&他们是如何从非洲跑到澳洲的？再放一下这张最简单粗暴的图——&b&“海上高速公路”&/b&&br&&img src=&/c7c7d9edf9155bb63ebd78_b.png& data-rawwidth=&1401& data-rawheight=&728& class=&origin_image zh-lightbox-thumb& width=&1401& data-original=&/c7c7d9edf9155bb63ebd78_r.png&&&b&M130也就是C型（途中蓝线标出的那一支），在5万年前沿着阿拉伯半岛、印度次大陆、印尼，一路到达了澳洲大陆。（实际上D型与C型基本同样的时间，同样的路线）&/b&&br&这里不得不提一下第四纪冰期（始于距今200-300万年前，结束于1—2万年前），大面积冰盖的存在改变了地表水分的分布，当时海平面比现在低100米。也就是说，当时日本四岛连在一起并与朝鲜半岛相连，印尼千岛连在一起并与澳洲大陆相连，而红海最窄的地方只有2公里（可以肉眼看见对面）。&br&&br&&img src=&/89fb2bd7d2f_b.png& data-rawwidth=&535& data-rawheight=&539& class=&origin_image zh-lightbox-thumb& width=&535& data-original=&/89fb2bd7d2f_r.png&&上图红色是现在的大陆，绿色是当时海平面较低（100米）时的大陆，橙色即为M130的&b&海上高速公路&/b&。&br&&br&&br&人类最早生活在森林（黑猩猩至今还生活在森林），然后是草原，然后是海边。当年的撒哈拉还是绿色的森林，然而气候变化使得其变成沙漠，人类被迫迁徙。聪明的人类发现海岸是个不错的地方，甚至捡拾贝类什么的就能吃饱哎。&br&于是M130愉快地沿着舒服的海滩向前进发。&br&&b&考古证据：东非海边就曾发现古人类的垃圾场（有大量的贝壳和一些人类打磨过的石器），去往澳洲的必经之路斯里兰卡也发掘了大量的旧时代石器—&/b&—&br&&img src=&/2f2f5b9d3dac6f2bfc111_b.jpg& data-rawwidth=&2959& data-rawheight=&2145& class=&origin_image zh-lightbox-thumb& width=&2959& data-original=&/2f2f5b9d3dac6f2bfc111_r.jpg&&&img src=&/970912cfd878f19cf34a64f_b.png& data-rawwidth=&1280& data-rawheight=&960& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&/970912cfd878f19cf34a64f_r.png&&&br&&br&&b&M130（粉红色，C型）5万年前出现在南亚，然后他们沿着&u&海上高速公路&/u&飞驰。&/b&&br&M130在5万年前沿着阿拉伯半岛、印度次大陆、印尼到达了澳洲大陆。&b&有考古证据吗？有。&/b&斯里兰卡岛上有4万年前的石窟痕迹，澳大利亚的石窟也在5万年前。然而大部分海滩上的痕迹已经沉入海底，气候变暖使得海平面上升了100m，而海岸线可能变化了几十公里，这使得海岸线上的考古格外困难，然而我们还有我们的办法——分析现代人的DNA。&br&&br&为了证明上面这幅图的正确性，我要放大招了，从之前给出的Y染色体世界地图中抠出下面这张澳洲Y染色体地图————&br&&img src=&/f1b0a240b9fec925a17e_b.png& data-rawwidth=&1113& data-rawheight=&748& class=&origin_image zh-lightbox-thumb& width=&1113& data-original=&/f1b0a240b9fec925a17e_r.png&&&br&注意图中的粉红色，也就是M130（C型），你会发现澳洲土著中C型的比例如此之高。他们就是第一批走出非洲的探险者。&br&我们仔细读一下这张图，可以得到非常多有趣的信息:&br&1.首先C型是第一批移民，他们在5万年前就到达了澳洲大陆。&br&2.然后4万年前在伊朗出现了K型，他们中的一部分也紧跟着慢慢迁徙到了澳洲。&br&3.O型是K型中分化出来的一部分（M9→M175），在亚洲东部或者中部，之后O型也开始向东南亚扩散，途中的婆罗洲就有很高的比例。&br&4.最年轻的M型出现在1万年前，他们也是K型的后裔，M型主要出现在婆罗洲——苏门答腊地区。M型也随着水稻在各个海岛上传播，当时中国和中东的农业正在发生。大约4000年前，水稻技术传播到婆罗洲——苏门答腊地区，然后这里的群体携带着大量的淡水和水稻，航行到太平洋上的各个岛屿并定居下来。&br&&br&&br&咦，好像蒙古人（MO），布里亚特蒙古人（BU）,哈萨克斯坦人（KZ）中M130也出奇的高嘛！没错，DNA分析的结果就是如此。可以假想一下，当初蒙古人也是第一批到达东亚的M130，不过后来被汉人赶到更北的地方去了，这一点咱们之后再聊。&br&&br&&b&总之，澳洲土著五万年前出非洲，而且是出非洲并且存活至今的“&u&第一批”&/u&。&/b&&br&&br&&b&请注意C型是第一批成功的殖民者，实际上除了沿着海上高速公路前进，他们也会停下来向陆地扩散，因此他们也是东亚第一批成功的移民，只不过后来被新的移民O型抢去了地盘。&/b&&br&&br&&br&&br&&br&&br&&br&&br&&b&【8】欧洲人的祖先——夏娃的七个女儿&/b&&br&97%的欧洲人的血统，全部来自7个母系先祖。这是线粒体DNA的研究结果，由牛津大学教授布莱恩·赛克斯发表。也就是说，绝大多数欧洲人的线粒体DNA都可以归入7个类型，对应几万年前的7个母系先祖。&br&&img src=&/5726ced1fc6f163bc84912_b.jpg& data-rawwidth=&2368& data-rawheight=&2652& class=&origin_image zh-lightbox-thumb& width=&2368& data-original=&/5726ced1fc6f163bc84912_r.jpg&&&br&上面是线粒体DNA氏族，下面为了简单起见我们从Y染色体类型来看——&br&&img src=&/634e346bbac3af8d407ce73bf6ff3c97_b.png& data-rawwidth=&960& data-rawheight=&720& class=&origin_image zh-lightbox-thumb& width=&960& data-original=&/634e346bbac3af8d407ce73bf6ff3c97_r.png&&&img src=&/4ac8fdff2a_b.jpg& data-rawwidth=&963& data-rawheight=&761& class=&origin_image zh-lightbox-thumb& width=&963& data-original=&/4ac8fdff2a_r.jpg&&仔细看上面两张图可以得到非常多的信息。&br&首先第一张图是欧洲的Y染色体类型分布，为了简单起见，我们仅仅关注E3b、I、J、R1a、R1b这5种类型，因为他们占了绝大多数。&br&从名字上就可以看出，I与J很接近，R1a与R1b更接近，而E3b（YAP矮黑人种的一个分支）很早就跟他们分开了。&br&下图我就画出了这4种（R1a与R1b合并记为R1）的迁徙路线（颜色仍与上图相对应）。&br&&b&&br&R1a(红色)与R1b（黄色）：Adam→M168→M89→M9→M45→M207→M173&/b&，是占据最大比例的类型，R1出现在&b&3.5万年前&/b&。R1a与R1b的分化可以看做是东欧与西欧的分化，这种分化在3万年前。需要注意的是，&u&东欧人的R1a也是印度人的主要成分约35%。&/u&&b&这可以算是第一批成功到达欧洲腹地的现代人，注意他们都是从中欧草原过去的，必经之地就是伊朗高原和哈萨克斯坦。这个时候巴尔干半岛和小亚细亚并不容易通过或者说那边没有什么吸引人的东西。&/b&&br&&br&&b&I（粉红色）：Adam→M168→M89→M170&/b&，出现于&b&3万年前&/b&，也是&b&中东氏族M89&/b&的一部分，后来向巴尔干迁移直至扩散到欧洲的中部，在2.1万——2.8万年前，这些群体在欧洲的西部创造了格拉维特文化（Gravettian Culture）。冰河期结束之后，I的后裔在重新殖民欧洲时期担任了重要角色。&br&&br&&b&E3b（亮蓝色）：Adam→M168→YAP→M96→M35&/b&，&b&2万年前&/b&出现在中东。冰河期结束，气候变暖之后，人类从游牧向定居农业转变。8000年前，这个农业团体开始向欧洲扩散。&br&&br&&b&J（绿色）：Adam→M168→M89→M304&/b&，&b&1.5万年前&/b&J诞生于新月沃土，这个地区包括以色列、约旦、黎巴嫩、叙利亚、伊拉克。现在J最高频率的地区包括中东、北非、埃塞俄比亚。在欧洲，J原先只分布在地中海附近，农业出现后人口激增，J开始扩散。&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&b&【9】日本人的来源&/b&&br&那种侮辱性的3000童男童女的说法我就不吐槽了，咱们讲证据是吧。&br&先放上这张图，【8】中提到当年海平面低100米时的日本岛与欧亚大陆相连，本身日本四岛也是相连的，所以当时不存在跨海的问题。&br&&img src=&/4f925a3ebbeee73ad74f7_b.jpg& data-rawwidth=&585& data-rawheight=&487& class=&origin_image zh-lightbox-thumb& width=&585& data-original=&/4f925a3ebbeee73ad74f7_r.jpg&&&br&&img src=&/c7c7d9edf9155bb63ebd78_b.png& data-rawwidth=&1401& data-rawheight=&728& class=&origin_image zh-lightbox-thumb& width=&1401& data-original=&/c7c7d9edf9155bb63ebd78_r.png&&M130也就是C型，之前用来分析了澳洲土著的路线，&b&实际上D型和C型一样老，当初C和D基本同时沿着同样的海上高速公路前进。&/b&&br&我们再关注上图蓝色路线，你会发现除了去往澳洲大陆，还有&b&&u&像北进发&/u&&/b&的路线。&br&讲澳洲土著的时候已经提到，&b&第一批到达东亚的移民就是他们——C型和D型。&/b&&br&然后我们再将Y染色体类型分布图放大一下，看一下日本（JP，Japan）和西藏（TB，Tibet）。&img src=&/546b61aaec448bcea62f87_b.png& data-rawwidth=&1333& data-rawheight=&780& class=&origin_image zh-lightbox-thumb& width=&1333& data-original=&/546b61aaec448bcea62f87_r.png&&注意一下这张图里的浅黄色，浅黄色的是&b&D型（也称为YAP型，矮黑人种）&/b&，D型的古老程度（5万年）仅次于非洲人A型B型和澳洲土著的C型，当年他们和C型同时出非洲（5万年）。&br&你会发现日本人和西藏人的D型基因占了几乎一半，而后才有更年轻的、新的移民O型混血其中。&br&&br&&b&C型和D型作为第一批出非洲的探险家，他们在3万年前就到达了日本。&/b&&br&&b&之后O型作为更年轻的殖民者，在2000多年前开始也从朝鲜半岛登录到日本岛，开始新一波的混血。&/b&&br&&br&&b&现代日本人是由日本列岛的原始土著绳文人（3万年前到达的C型和D型）和来自东亚大陆的弥生人（2000前到达的O型）混血形成的&/b&。&br&&br&在这一点上，Y-DNA的分析结果和日本考古史不谋而合，说服力就更强了。&br&然而日本人现在并不矮，更不黑。说明肤色变浅的速度很快，平均身高随着经济发展也会快速增长。&br&&br&&br&&br&&b&【10】日本和西藏的渊源&/b&&br&在上面日本人来源的部分我们发现日本人和西藏人中有非常高的&b&D型（也称为YAP型，矮黑人种）&/b&比例，超过了50%。除此之外，还有一个神奇的地方——安达曼群岛，他们D型占了100%。&br&&img src=&/29b1b4cc78f5571ffc6e_b.png& data-rawwidth=&1526& data-rawheight=&879& class=&origin_image zh-lightbox-thumb& width=&1526& data-original=&/29b1b4cc78f5571ffc6e_r.png&&&br&所以说，日本和西藏人群中D型的成分是沿着上图路线迁徙的。&br&但是，如果再将D型仔细划分的话，能够发现日本和西藏分化的也很早，&b&可能在3万年前就在东南亚分道扬镳了&/b&。&br&&img src=&/a1ba313eaf4be132b39f2_b.png& data-rawwidth=&986& data-rawheight=&834& class=&origin_image zh-lightbox-thumb& width=&986& data-original=&/a1ba313eaf4be132b39f2_r.png&&这个图细节很复杂，但是呢，粗略读一下也很容易。我们就把它当成一棵&u&&b&family tree&/b&&/u&。&br&另外上图里也有一些苗瑶族、傣族、汉族、藏缅族的信息。&br&&b&虽然日本和西藏中都有很高的D型，但是实际上西藏是D1、D3和D*，日本是D2。并且他们分化之后（3万年前）很少再有基因的交流（地理上也隔得很远）。&/b&&br&&br&&br&&b&【11】古人类化石&/b&&br&首先，世界各地都有古人类化石，但是相当多的都是不是我们的祖先，我们中国人最了解的就是北京猿人，1927年北京猿人刚被发现时中国人格外自豪，因为北京猿人和爪哇直立人在当时是相当古老并且轰动全世界的。&br&然而随着东非以及南部非洲一批批更古的人猿化石出土，300万年前的南方古猿（发现于南非），180万年前的能人（发现于塔桑尼亚），还有各种直立人（北京猿人实际上应叫做北京直立人），北京猿人的名气也就没那么大了。&br&&img src=&/bce13d334fbaf9b_b.jpg& data-rawwidth=&1082& data-rawheight=&1500& class=&origin_image zh-lightbox-thumb& width=&1082& data-original=&/bce13d334fbaf9b_r.jpg&&&br&事实上，几百万年以来就有一批一批的直立人从非洲走向全世界，然而他们中的全部都，注意是全部，灭绝了，除了现代人类这只奇葩。&br&灭绝最晚而且曾经分布而且很有名的尼安德特人呢，三万年前也灭绝了。为什么呢？并不是因为现代人的屠杀（三万年前现代人已经到达欧洲），可能是疾病，更有可能是气候的变化。&br&来自德国、美国、克罗地亚个和芬兰的科学家，利用高通量454测序技术，得到了一个尼安德特个体完整线粒体DNA基因组序列，相关研究成果发表在日的《细胞》（cell）杂志上。&br&而人类自身，也并非一帆风顺，前段时间一篇文献就指出，人类历史上人口最少时甚至只有 200 人，也就是说地球60亿人都只是这200人的后代，可见你我之间，白人黑人之间的联系是多紧密。&br&&br&&br&&br&&br&&br&&b&【12】欧亚大陆只是非洲的一个省？&/b&&br&是的，从人种上来说，是的。欧亚人的多样性（从基因上来说），只有非洲的1%。、&br&&b&打个比方，20万年前非洲大陆上有100个现代人类愉快地窜这窜那，其中1个人跑出了非洲大陆。然后这1个人繁衍成50亿欧亚人，而另外99个繁衍成10亿非洲人&/b&。&br&而我们简单粗暴地把非洲人因为肤色稍深就归成一类——黑人。而实际上我们欧亚人才是占少数的民族，我们是非非洲人。&br&非洲的体育天才很多，臃肿肥胖各种病的人也多。&br&马拉松冠军是丹尼斯·基米托，100m冠军是博尔特。这两个运动有多大区别不用我说了吧？&br&&img data-rawwidth=&1082& data-rawheight=&1500& src=&/c3ced067b08fcd70baf7fa_b.jpeg& class=&origin_image zh-lightbox-thumb& width=&1082& data-original=&/c3ced067b08fcd70baf7fa_r.jpeg&&他俩都是黑人，但是他俩像吗？除了皮肤偏黑，但其他地方真的不太像。&br&马赛人平均身高1.9米，桑人平均身高1.5米，他们都生活在非洲。&br&&img data-rawwidth=&1082& data-rawheight=&1500& src=&/2bac3f2c2fc_b.jpeg& class=&origin_image zh-lightbox-thumb& width=&1082& data-original=&/2bac3f2c2fc_r.jpeg&&桑人（San）是最古老的人类，他们没那么黑？的确，非洲人本来就没那么黑，桑人似乎跟我们也差不多嘛。&br&总之，黑人的多样性非常丰富。&br&&br&&br&&br&&br&&br&&b&【13】黑人为什么这么黑？&/b&&br&首先，非洲人没那么黑。&br&我们对非洲人的印象大概是这样的————&br&&img src=&/583cabcc81f6d_b.jpg& data-rawwidth=&497& data-rawheight=&330& class=&origin_image zh-lightbox-thumb& width=&497& data-original=&/583cabcc81f6d_r.jpg&&然而曾经占绝大多数比例的桑人是这样的————&br&&img src=&/1c327cb59ae7de3460caf485a9d94845_b.jpg& data-rawwidth=&636& data-rawheight=&456& class=&origin_image zh-lightbox-thumb& width=&636& data-original=&/1c327cb59ae7de3460caf485a9d94845_r.jpg&&&b&请允许我再一次放上这张图片表达我的敬意，对这个最最古老的民族——桑人&/b&。&br&&b&他们是最最接近我们祖先的那一支&/b&，尽管他们现在已经被迫从东非迁移到南部非洲的一隅。&br&他们有最最独特的语言，许多发音靠舌尖与口腔唇齿摩擦而成，也可以说，桑人的语言是世界上最早产生的语言之一。&br&言归正传，20万年前人类生活在非洲的时候，赤道附近紫外线很强，因此皮肤中的黑色素有利于吸收紫外线。&br&但是当人类往北迁徙的时候，问题来了，人体钙的吸收需要维生素D，而维生素D的合成需要晒太阳。黑人奴隶最早被运往北美的时候，黑人女性就容易缺钙而导致盆骨发育不足，最终难产的概率非常高。当然现在人类已经可以从食物中获取足够的维生素D。&b&因此往北迁徙的人类迫切需要肤色变浅，这些都是自然选择、生物适应的结果。&/b&&br&鼻形也是如此。生活在热带森林的人，鼻孔一般是宽阔的。这里的气候温暖湿润，鼻子的温暖湿润空气的功能不很重要。而生活在高纬度的白人有较长而突的鼻子，可以帮助暖化和湿润进入肺部的空气。黄种人的内眦赘皮可能与亚洲中部风沙地带的气候有关；扁平的脸型和半满的脂肪层能够保护脸部不受冻伤。&br&其实肤色变浅的速度非常快，之前在某直播平台看到一个布里亚特蒙古人妹子卡佳身高178CM，49KG，腿长109CM，她长这样子——&br&&img src=&/f7cbc5fbc5_b.jpg& data-rawwidth=&440& data-rawheight=&615& class=&origin_image zh-lightbox-thumb& width=&440& data-original=&/f7cbc5fbc5_r.jpg&&&b&布里亚特蒙古人有60%的C型基因，与澳洲土著一样！！&/b&请问她矮吗？黑吗？&br&&img src=&/725b16e791e04e4fb569b24cde762982_b.jpg& data-rawwidth=&702& data-rawheight=&561& class=&origin_image zh-lightbox-thumb& width=&702& data-original=&/725b16e791e04e4fb569b24cde762982_r.jpg&&&u&从上图可以看出其实肤色只是简单的随纬度分布而已，与人种关系不大。实际上大部分中国人都比西班牙人、意大利人、希腊人更白。&/u&&br&&u&&b&人类迁徙过程中肤色变化，身高变化都比我们想象的快的多。&/b&&br&&/u&&br&&b&&u&我们对于非洲人肤色黑的刻板印象也不准确，班图语系群体（3亿人）的确特别黑，我们的黑人印象主要来自他们，然而最早的在非洲人类只是像桑人那般浅浅的棕色而已！&/u&&br&&/b&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&b&【14】尼安德特人&/b&&br&首先说一下为什么尼安德特人这么有名。其实不仅仅是中国人，即使是&u&欧洲人从感情上也不愿意承认自己的祖先在非洲&/u&，所以就像中国的北京直立人一样，尼安德特人自发掘出那一天起就被默认为欧洲人的先祖。&br&然而真相总是打人脸，尼安德特人并非欧洲人的祖先，欧洲人也发源于非洲。&br&&br&尼安德特人跟现代人有共同的先祖，分化时间在五十万年前左右，与现代人很可能没有生殖隔离。&br&&img src=&/cfedbc2f24f1_b.png& data-rawwidth=&804& data-rawheight=&612& class=&origin_image zh-lightbox-thumb& width=&804& data-original=&/cfedbc2f24f1_r.png&&&img src=&/314ccc3cce69512ddf99dac_b.jpg& data-rawwidth=&924& data-rawheight=&600& class=&origin_image zh-lightbox-thumb& width=&924& data-original=&/314ccc3cce69512ddf99dac_r.jpg&&&img src=&/48665eaff8e_b.png& data-rawwidth=&800& data-rawheight=&382& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/48665eaff8e_r.png&&&br&（图片来自维基百科）&br&&br&尼安德特人从12万年前开始统治欧洲、北非、西亚，4-5万年前克罗马农人（现代欧洲人先祖）到达欧洲，又过了至少1.5万年，也就是2.8万年前，尼安德特人消失了。&br&（之前普遍的看法是尼安德特人彻底消失，但2010年有一篇文章说现代人有1%至4%的尼安德特人基因，不过未被完全认可。）&br&尼安德特人身高约 1.5－1.6 米，颅骨容量约 1,200－1,750 cm?（现代人约 1,400－1,600 cm?）。身体特征：额头平扁（眉弓到发际线的距离比现代人短得多）、下颌角圆滑，下巴不如现代人前突。骨骼强健，身体耐寒。其具体特征是肱骨、尺骨、桡骨之间的比例，和股骨、胫骨、腓骨之间的比例大于现代人。此为适应寒冷气候的典型。（摘自维基百科）&br&&b&实际上尼安德特人从体型、脑容量上来说，并不比现代人差。他们甚至更高大强壮，拥有更大的脑容量。&/b&然而事实就是他们消失了，我仅猜测分析原因：&br&1.现代人的屠戮。我认为这个不成立。首先尼安德特人与克罗马农人共存了1.5万年，当时并没有什么社会组织，顶多就是小部落聚集在一起，不存在文明社会时期的种族屠杀行为。另外就是现代人很早就不再食用自己人的尸体，但是尼安德特人通常会吃自己人的尸体（骨头有啃食的痕迹），所以说现代人并没有直接的需求去捕杀尼安德特人，最多只是竞争对手而已。&br&2.流行病。也不成立。致命的传染病基本都是农业时代的产物，猎人的人口密度很低，传播不了流行病。&br&3.没有语言。尼安德特人能不能说话还没有定论，如果尼安德特人没有语言的话，这将是他们最硬的硬伤。如果没有语言，哪怕再进化几百万年，他们的智力成果也无法传播，他们也永远是渔猎采集。&b&也许，现代人类最大的优势，就是语言。&/b&&br&4.恶劣的气候。尼安德特人生活的时代气温比现在低很多，他们的生存也艰难许多。也许是一次延续几年的严寒，也许是赖以生存某些食物的消失导致尼安德特人的消失。&br&&br&&b&人很脆弱，也许尼安德特人的消失是常态，而现代人类的存活是万幸中的万幸。&/b&&br&&br&&br&&br&&br&&b&&br&【15】农民的冲击&/b&&br&农业，人类历史上最重要的发明，没有之一。&br&当然，也许用发明这两个字也不合适，毕竟农业的形成也是缓慢的，肯定不是一蹴而就的，也不只是哪一个人的独有的贡献。&br&农业意味着什么呢？&b&农业意味着更高的人口密度，足够高的人口密度才能诞生文明。&/b&&br&很明显，相比于猎人，农民可以用更少的土地养活更多的人。人类其实是很大只的动物了，又不能像牛啊羊啊吃草长大，这就导致渔猎时代的人类的人口密度很小，可能平均方圆几公里上才能养活一个人。&br&你可以想象一下，渔猎时代的人类在低人口密度情况下之间的交流是多么少，这是非常不利于文明的传播的。直接点说，&b&&u&有了农业，才可能有文明。&/u&&/b&&br&&img src=&/17d7fd0c1125_b.jpg& data-rawwidth=&2965& data-rawheight=&2207& class=&origin_image zh-lightbox-thumb& width=&2965& data-original=&/17d7fd0c1125_r.jpg&&（上图拍自《夏娃的七个女儿》，侵删）&br&&u&不得不说，新月沃土是老天爷偏爱的地方，最早的驯化的农业植物和最早驯化的动物都源自新月沃土。&/u&&br&无论农业产生的细节如何，农业的影响是巨大的。这种先进的“科技”在当时的统治力远远超过现在的核武器。&br&&b&问题又来了：既然农业在当时是伟大的无敌的，那么，是农民取代了猎人，还是农业技术取代了渔猎技术？也就是说，是农民杀光了猎人，还是农业技术的传播让猎人改行当了农民？&/b&&br&好的，这又是一个遗传学可以解决的有争议的难题。&br&我们再回头读一下第八部分&b&【8】欧洲人的祖先——夏娃的七个女儿&/b&，可以得出结论：&b&大部分欧洲人的先祖远远超过新石器时代，可以追溯到旧石器时代的狩猎采集者，包括取代尼安德特人的第一批克罗马农人。毫无疑问，新石器时代的中东农民们也进入了欧洲，但是他们并没有取得压倒性优势，最多只占到了20%。&br&&/b&&br&&br&&br&&br&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&【16】汉族的形成&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&b&★&/b&&br&这是一个很严肃的话题。&br&&u&这一部分我是引用复旦大学副校长金力教授的博士生蔡晓云的博士论文。关于金力教授的权威性可以自行百度。&br&&/u&&b&在传统上，对于东亚现代人的起源、迁徙和进化的研究主要依靠考古学、古人类学和语言学等学科的证据。但是现在我们又有了非常无敌的武器——染色体谱系。&/b&&br&&br&&u&16.1考古学&/u&&br&&img src=&/ae1d8d0fdced1aacf257be_b.png& data-rawwidth=&1779& data-rawheight=&1890& class=&origin_image zh-lightbox-thumb& width=&1779& data-original=&/ae1d8d0fdced1aacf257be_r.png&&&br&这个5万年的断层还是很支持非洲起源说的。&br&&br&&u&16.2 气候学&br&&/u&在过去的240万年历史中，地球上一共经历了17次冰川高峰期。上面所提及的距今4—10万年前的化石断层与当时第四纪冰川期在该地区存在时间大体相符，是的这一时期包括中国大陆在内的东亚地区大量的生物种类难以存活，因而东亚大陆在这一时期大量的生物物种灭绝造成了这种断层。&br&&img src=&/e776b7c0a4d37b8f8ce2e8_b.png& data-rawwidth=&815& data-rawheight=&747& class=&origin_image zh-lightbox-thumb& width=&815& data-original=&/e776b7c0a4d37b8f8ce2e8_r.png&&观察近十万年的气温变化，1.7万年之前气温比最近1万年低接近10摄氏度。当时的人类的生存十分困难，而人类的农业也是在1万年前诞生的。&br&&br&&u&16.3 语言学&/u&&br&分子人类学研究人类谱系达到一个比较精细的程度时，就会发现对复杂的群体很难找到头绪。然而，语言以其稳定的纹饰标记功能，往往成为区分人群的重要工具。&br&东亚地区的人群主要分属6个语系：南亚语系、苗瑶语系、汉藏语系、侗台语系、南岛语系以及阿尔泰语系。&br&&img src=&/7685dbe0d6a69ed1f66361_b.jpg& data-rawwidth=&1321& data-rawheight=&1540& class=&origin_image zh-lightbox-thumb& width=&1321& data-original=&/7685dbe0d6a69ed1f66361_r.jpg&&&br&&br&&br&&u&16.4 Y染色体谱系&/u&&br&人群的起源虽然涉及到其文化的来源、语言的产生等方方面面人群特征的形成,但最根本的是人自身血缘的来历,这就要依靠遗传学的研究方法。&br&&img src=&/7db8ebd7a67e14fd67e9_b.jpg& data-rawwidth=&1749& data-rawheight=&1387& class=&origin_image zh-lightbox-thumb& width=&1749& data-original=&/7db8ebd7a67e14fd67e9_r.jpg&&&br&&br&&u&16.5 东亚现代人迁徙路线简介&/u&&br&现代人走出非洲后,其中的一支在距今大约6万~1.8万年前,经南亚迁徙至东南亚,然后逐渐北上扩散至东亚大陆,有一部分继续北上经白令海峡迁移到美洲,还有一小部分则沿东南沿海从东南亚向东进入太平洋群岛;在现代人走出非洲后,有研究人员认为在较晚的时期可能有部分中亚人群从西向东迁移并与东亚人群交汇,还有一小部分则沿东北亚经白令海峡进入美洲大陆。&br&&img src=&/b2db0e063d31_b.jpg& data-rawwidth=&1185& data-rawheight=&1295& class=&origin_image zh-lightbox-thumb& width=&1185& data-original=&/b2db0e063d31_r.jpg&&&br&&br&&u&16.6东亚主要Y染色体单倍群的迁徙路线&/u&&br&&img src=&/546b61aaec448bcea62f87_b.png& data-rawwidth=&1333& data-rawheight=&780& class=&origin_image zh-lightbox-thumb& width=&1333& data-original=&/546b61aaec448bcea62f87_r.png&&这张图我们在分析日本的时候用到，现在我们再拿出来分析一下。&br&很明显，O型占了汉族人口非常大的比例。但为了得到更加详细的细节，我们需要将O型进行更仔细的划分。&b&O3，O2和O1就是O型的主要的三个分支。&br&&/b&&br&&b&C型（M130）&/b&&br&前文已经概述过单倍群C在亚洲、大洋洲有着广泛的分布,在欧洲和美洲的频率则较低,在非洲的群体中却完全观察不到。因此C型（M130）应该可以为搜寻走出非洲后人群的迁徙踪迹提供大量的信息。前人的研究认为大约在四万五到五万年前单倍群C借道北线和南线进入东亚。还有人认为中亚的C型（M130）来源于蒙古国的扩张。&br&其他研究进展表明,东南亚人群中的单倍群C具有最高的多样性。该单倍群经由印度次大陆到达东南亚大陆本土,后来又沿着中国大陆本土的海岸线向北扩张,到达西伯利亚,最终朝美洲而去。&br&因此我们可以将C型（M130）的线路概述为:沿着海岸出发,从阿拉伯半岛一伊朗一印度一中南半岛,随后,这批C型（M130）的子孙分为两支系,其中一支系向北进入西伯利亚,并最终进入了北美地区;另一支系向南进入澳大利亚,并扩散到太平洋诸岛。&br&&br&&b&D型（M174）&/b&&br&在东亚,几乎所有的YAP样本都属于单倍群D。东亚特有的Y染色体单倍群D型（M174）仅高频分布于西藏、日本和安达曼群岛。安达曼群岛居民中D*的发现,似乎是对走出非洲的“南方沿海路线”的有力支持。&br&新近围绕D型（M174）展开的研究更进一步指出,D型（M174）是东亚地区现代人的极其古老的支系,在南北人群观察到了深度的分化;该研究认为D型（M174）起源于南方,然后在约60,000年前向北方扩散,这一扩散早于东亚其他单倍群的扩散。&br&&br&&b&O1a型（M119）&/b&&br&O1a型（M119）在东亚主要分布在侗台和南岛语系人群中,在南方汉族人群中也能观察得到。在地理上,该单倍群多分布于东部沿海。&br&该单倍群在南方非常广泛的分布,并且其频率远远高于北方,同时下游的O1a2型（M110）仅在南方人群中存在,提示着两个谱系可能起源于南方。根据相关研究,O1a型（M119）很可能是两万年前孕育于北部湾一带,因而出现在沿海群体中,随着沿海岸迁徙扩张开来,并且向西的迁徙发生的较为晚近。&br&&br&&br&&b&O2a型（M95）&/b&&br&携带M95突变的人群主要分布于东南亚的中南半岛和印度。根据以前的研究结果,也同样是因为M95在南方有非常广泛的分布,以及远远高于北方的频率,再加上其下游的O2a型（M95）仅在南方人群中存在,提示这个谱系可能起源于东南亚。&br&后来有研究通过对单倍群O2a型（M95）的多样性分析发现,南亚语系的分支一印度的蒙达语族群体多样性远远大于东南亚的另一个分支孟高棉语族群体,因此南亚语系群体可能起源于印度。此项研究得出的迁徙路线为:蒙达语地区(6.5万年前）一印度东北(5.7万年前)一东南亚(3万年前)一尼科巴群岛(1.7万年前)。&br&&br&&br&&b&O3型（M122）&/b&&br&O3型（M122）在这三大单倍群中是地理分布最广的一个,在东亚人群中占有优势地位,是南方来源族群的普遍类型,平均频率可以达到44.3%。&br&东亚南部的O3型（M122）多样性要高于东亚北部,表明该单倍群很有可能起源于南方;并且在大约两万五到三万年前开始在东亚向北迁徙,这与化石证据相当吻合。&br&在O3型（M122）的下游还有很多关乎东亚人群起源和迁徙的单倍群,比如说O3a3b型（M7）。前者曾被发现在苗瑶族群里分布比较广泛,而在其他人群中非常罕见;并有报道认为O3a3b型（M7）很可能在苗瑶族群的祖先人群中发生,并由该单倍群的数据估计苗瑶族群至少在1一1.7万年前从“汉藏一苗瑶共同祖先”人群中分化并形成统一体。&br&&br&&br&&br&&u&16.7东亚主要Y染色体谱系分布图&/u&&br&2006年Genetics Society of America杂志上发表了一篇文章，作者测试了以下地点的Y染色体组成——&br&&img src=&/e52e6bbbca353cfcb04f76dea42fc751_b.png& data-rawwidth=&1032& data-rawheight=&776& class=&origin_image zh-lightbox-thumb& width=&1032& data-original=&/e52e6bbbca353cfcb04f76dea42fc751_r.png&&&br&&br&我们已经知道O型是从东南亚进入中国的，看一下东亚O型的分布——&br&&img src=&/f68bf68ae3eef5e235b1d_b.png& data-rawwidth=&686& data-rawheight=&518& class=&origin_image zh-lightbox-thumb& width=&686& data-original=&/f68bf68ae3eef5e235b1d_r.png&&O型占了非常非常大的比例啊~~&b&我们暂且把O型看做是黄种人（不包括蒙古人和日本土著）。&/b&&br&黄种人的到来严重冲击了更早到达东亚的蒙古人C型，于是他们被迫向北迁徙（也有可能他们为了猎杀猛犸象自行向北迁徙）——&br&&img src=&/fe2b0c7cfffac855e593a_b.png& data-rawwidth=&691& data-rawheight=&517& class=&origin_image zh-lightbox-thumb& width=&691& data-original=&/fe2b0c7cfffac855e593a_r.png&&C型在北方占了非常大的比重~~&b&我们暂且把这些人C型和N型看作是蒙古人。&/b&&br&这里说明一下N型是1万年前出现在西伯利亚，他的后裔成为乌拉尔语系群体，现在分布在亚洲北部和斯堪的纳维亚南部，N型也是渔猎牧民族，在蒙古人中也占很高比例。&br&虽然蒙古人被迫向北迁徙，但是汉族中不可避免还是有一些蒙古人的血统。&br&&br&&br&&b&所以简单的说，6万年前非洲开始有现代人一批一批地向外扩散，其中有一批一批的人来到东亚。最早到达的是C型（蒙古人）（四万五到五万年前），之后O型（黄种人）（两万五到三万年前）到达后占据了优势并且逐渐扩大地盘，C型（蒙古人）被迫向北迁徙。&/b&&br&&br&&br&当然这个结论非常粗略，我们可以再深入仔细分析来得到更多的结论。&br&&br&&br&&br&&br&&br&&b&【17】人与人的差距能有多大？&/b&&br&&br&&br&&b&首先我要强调，地球上60亿人之间的差别真的特别小。&/b&&br&&br&&br&&b&&u&人类的基因有50％与香蕉一样，90%与老鼠一样，98%与猩猩一样，0.2%与别人不一样。&/u&&/b&&br&&br&&br&&br&其实呢，如果只是比较两个人的差别并不太好判断，但是呢如果比较A、B之间的差距和B、C之间的差距，就更容易并且更有意义。&br&打个比方，中国人和日本人的差距相对于他们对非洲人的差距来说就太小了。&br&&img src=&/61f5ab297e402a1eb397_b.png& data-rawwidth=&1140& data-rawheight=&920& class=&origin_image zh-lightbox-thumb& width=&1140& data-original=&/61f5ab297e402a1eb397_r.png&&先解释一下这张图——&br&1.横轴纵轴是某两个统计量。打个比方，横轴可以是Y染色体某个区域鸟嘌呤的个数，纵轴可以是Y染色体另外一个区域的胞嘧啶的个数；&br&2.图上的点代表不同的人群。点离得越近，说明这两个点在横纵两个维度上都比较接近，说明这两个人群比较接近。&br&&br&好，这样我们可以来仔细读这张图了，我们可以得到非常多的信息——&br&1.日本人和汉族非常接近，图中右上角那一坨都靠在一起；&br&2.印度人跟欧洲人比较接近；&br&3.美国黑人与非洲黑人基因上必定分布在一个区域；&br&4.非洲的点分的比较开，不像汉族聚在一起，说明非洲人的基因多样性远超过汉族和欧洲人；&br&5.墨西哥人多样性也很丰富，不过这是因为他们混血太多，西班牙人、印第安人、非洲人；&br&&br&&br&好，我们把上图局部放大一下——&br&&img src=&/e3bdc365d030a55bed0b96d9ed6ab38e_b.png& data-rawwidth=&1074& data-rawheight=&918& class=&origin_image zh-lightbox-thumb& width=&1074& data-original=&/e3bdc365d030a55bed0b96d9ed6ab38e_r.png&&从这张图中就能看出日本人和汉族之间的差异，所以并不能把日本看成中国的一个省哟~~&br&&br&&br&&br&&b&【18】中国人的3个超级先祖&/b&&br&先看结论：&b&&u&40%的中国人是3个超级先祖的子孙。&/u&&/b&&br&这是金力团队里严实博士2014年发表的文章。&br&&img src=&/4ffacab024e1_b.png& data-rawwidth=&1157& data-rawheight=&844& class=&origin_image zh-lightbox-thumb& width=&1157& data-original=&/4ffacab024e1_r.png&&&img src=&/1f8dbc449d8dd3cba1118f_b.png& data-rawwidth=&1092& data-rawheight=&564& class=&origin_image zh-lightbox-thumb& width=&1092& data-original=&/1f8dbc449d8dd3cba1118f_r.png&&&br&仔细读一下这张图：&br&&b&1. 这是欧亚Y染色体谱系，就像一个大的family tree，红色数字代表多少千年前；&br&2. “欧亚先祖”在54.1千年前出非洲，C和D是第一批；&br&3. 35.8千年前中东出现F型（M89），这是90%欧亚人的先祖；&br&4. F型中的一部分人留在中东，其余的继续前进，33.0千年前出现K型（M9），即为欧洲和东亚的先祖；&br&5. 24.7千年前O型（M175）在东南亚出现，即为东亚人的先祖；&/b&&br&&b&&br&&u&6. 现在40%的中国人可以归入O型的三个分支Oα、Oβ、Oγ中，他们的时间分别为5.4千年前、6.5千年前、6.8千年前。&/u&&br&&u&&br&原来汉族是一个非常年轻的氏族。&/u&&/b&&br&&br&联系一下人口历史，汉族现在有12亿人口，而3700年前的商朝人口不会超过500万。至于6000年前、7000年前的人口只会更少。&br&&br&&b&虽然汉族现在人口这么庞大，但是汉族中相当大的部分是当年生活在关中平原、山西盆地里的华夏部落的后裔，这一点得到了证实。&/b&&br&&br&插播一段：&br&&a href=&/question//answer/?from=profile_answer_card& class=&internal&&中国现在有哪些值得骄傲的方面？ - 超级无敌摩托车的回答&/a&&br&从人类迁徙的角度来看汉族是个很年轻的民族，但是呢，我们的文化传承的&b&最好（&/b&注意是“最好”&b&）&/b&，汉字就是很重要的一个元素。&br&&b&&br&【19】汉族由北向南的扩张&/b&&br&虽然汉族最早是从东南亚走到的中国（由南向北），但是2000多年前的时候汉族的中心在北方，因为当时最重要的农作物小麦（慢慢占据主力）抗旱抗寒能力很强，因此人口大多在河南平原、山西盆地、关中平原等地，但是随着历史的发展，水稻的作用越来越大，北方人口由于各种原因也开始向南方迁徙。&br&金力在2004年发表在Nature主刊上的文章就从遗传角度研究了这个问题——&br&&img src=&/dde392fcf3e1ffbc9ce35f715c066d60_b.png& data-rawwidth=&1365& data-rawheight=&822& class=&origin_image zh-lightbox-thumb& width=&1365& data-original=&/dde392fcf3e1ffbc9ce35f715c066d60_r.png&&那么问题来了，有人觉得汉族由北向南的扩张只是文化的传播，包括汉语的传播；又有人觉得汉族的扩张是人口的扩张，就是说汉人实实在在跑到南方去繁衍后代了。&br&&br&&b&父系方面，南方汉族与北方汉族的Y 染色体单倍群频率分布非常相近；母系方面，北方汉族与南方汉族的线粒体单倍群分布非常不同。这表明南方汉族的群体混合过程有很强的性别偏向。&/b&&br&说的直白残暴一点，很多扩张和所谓的融合，都是留女不留男。当然我们无法评判这种历史，这也绝不仅仅是汉族才会这样做。&br&&br&不管具体的扩张过程有多血腥残暴，民族的融合仍是必然结果。&br&&br&&br&&br&&b&【0】写在最后&/b&&br&1. 全世界所有人都是亲戚，谁都没有基因上的优势！20万年对于人类的进化来说太短暂了，根本不可能进化出多么先进的东西；&br&&br&2. 人类的基因有50％与香蕉一样，90%与老鼠一样，98%与猩猩一样，0.2%与别人不一样。科学家们研究这0.2%的不一样不是为了让你有什么种族优越感！如果你非要有一点优越感的话，我给你100分，给其他人100-0.2=99.8分；&br&&br&3.汉族从东南亚分化出来的时间很短，也许某些人要欢呼了：“汉族血统最纯！”。好，我同意你&br&——汉人杰宝一致的小，汉人腿一致的短，汉人脸一致的大——你看，纯种地多么一致！种族主义者们高潮了吗？&br&&br&4.生物学家们用分析DNA的办法来研究人类迁徙不是为了让种族主义者高潮，而是用这种先进的、强大的、科学的办法来分析人口组成，你不觉得分析分析现代人的DNA就能得到古人类的迁徙很伟大吗？而这些技术进一步是可以用来分析癌症等有切实价值的问题；&br&&br&5.再强调一遍，人种无优劣，各个人群的特征都是适应环境的结果。你把一个非洲古老部落的小孩从小在英国接受绅士教育，他绝对可以非常绅士；你把汉人小孩放在非洲古老部落从小学打猎，他照样可以生存地很好。&br&&br&6.现在人群的划分已经不再单单是血统的问题，信仰、文化、经济等诸多因素都有影响。信仰安拉的人们无论人种都可以团结在一起，海峡那边的大爷们才分离了区区几代就不认你这老表了，你又能如何？&br&&br&&b&7.汉族虽然很年轻，但是汉族的文化非常伟大，古老并且从没有间断！这才应该是我们每个汉族人最应该珍惜和最自豪的东西。&/b&&br&&br&&br&&br&&br&&br&&br&&br&参考文献：&br&&img src=&/40bdf991b43fac6f77cc3fcf_b.png& data-rawwidth=&1184& data-rawheight=&293& class=&origin_image zh-lightbox-thumb& width=&1184& data-original=&/40bdf991b43fac6f77cc3fcf_r.png&&&br&&br&~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*~*&br&完
20万年前，人类起源于非洲。 6万年前，人类一批一批走出非洲。 4万年前，人类遍布世界每一个角落。 1万年前，人类开始进入农业时代，人口爆炸。我读的这些是从DNA的角度分析人类迁徙。不得不说，生物科技的发展不断地给我们惊喜，我们居然可以从基因的角度…
&img src=&/50/v2-fcdef7f98f6bcd0c9cdb92_b.jpg& data-rawwidth=&800& data-rawheight=&269& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&/50/v2-fcdef7f98f6bcd0c9cdb92_r.jpg&&&h2&博客论坛&/h2&&p&——————————————————————————
&/p&&p&1 [RNA-Seq blog](&a href=&/?target=http%3A//www./& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&)
学习转录组必看，工作日每天更新。
&/p&&p&2 [omictools](&a href=&/?target=http%3A//& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&)
组学软件集合，要做什么分析，不知道用什么软件到这里找。
&/p&&p&3 [biostars](&a href=&/?target=https%3A//www.biostars.org/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://www.&/span&&span class=&visible&&biostars.org/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&)
生物信息的问答社区，相信你遇到的问题，别人应该也遇到过，大多可以在这里找到答案。一些文章作者、软件开发者会亲自回答问题。
&/p&&p&4 [seqanswers](&a href=&/?target=http%3A///& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&)
功能同 BioStars，很老牌的社区，界面太丑，个人很少用了。
&/p&&p&5 [stackoverflow](&a href=&/?target=https%3A///& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&)
其实不是生信社区，是IT问答社区，但是你遇到的 Linux，Python，R， ggplot，等语言的问题通常都可以在这里找到答案。
&/p&&p&6 [plob](&a href=&/?target=https%3A//www.plob.org/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://www.&/span&&span class=&visible&&plob.org/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&)
前几年还不错，现在好像更新的少了，不过还是沉淀了很多优秀的文章。
&/p&&p&7 [tiramisutes](&a href=&/?target=http%3A//tiramisutes.github.io/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&tiramisutes.github.io/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&)
不知道谁的个人博客，很小清新。
&/p&&p&&br&&/p&&h2&知乎专栏&/h2&&p&————————————————————————————&/p&&p&8 [学习*持续输出](&a href=&/c_& class=&internal&&&span class=&invisible&&https://&/span&&span class=&visible&&/c_67&/span&&span class=&invisible&&761129&/span&&span class=&ellipsis&&&/span&&/a&)
网名青山屋主（也是基因课学员）的专栏，更新比较频繁，推荐。
&/p&&p&9 [高通量测序技术](&a href=&/ngs-learning& class=&internal&&&span class=&invisible&&https://&/span&&span class=&visible&&/ngs-&/span&&span class=&invisible&&learning&/span&&span class=&ellipsis&&&/span&&/a&)
作者孟浩巍，写的不错。很多思想非常认同。
&/p&&h2&公众号&/h2&&p&————————————————————————————
&/p&&p&公众号还是适合看些新闻、八卦、情怀。教程，尤其是代码太累了。
&/p&&p&10 基因慧、基因慧Pro
这两个号我也分不清什么区别。
原药明康德的汪亮做的、也是原华大的同事。经常请些大牛论道。也跟进相关会议。&/p&&p&
11 生物信息互助平台
原华大HR徐建，人称健哥做的。经常有招聘信息。
&/p&&p&12 BioData
WeGene 创始人的公众号。更新不频繁，单总有新鲜的，在别处看不到的东西。
&/p&&p&13 biobabble
clusterProfiler 作者 Y叔的公众号，当然他还开发过很多其他的 R 包，我目前还只用过这个。
&/p&&p&14 生信人、生信技能树
分享生物信息相关的教程，更新比较频繁。
不知道有没有人用即刻APP看新闻，我创建了一个主题，把以上专栏、公众号都订阅了。&a href=&/?target=https%3A///topics/58dc9ede84f5%3Fusername%3Db4efa02-c95dae16& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/topics/58d&/span&&span class=&invisible&&c9ede84f5?username=b4efa02-c95dae16&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&
博客论坛——————————————————————————
1 [RNA-Seq blog]()
学习转录组必看，工作日每天更新。
2 [omictools]()
组学软件集合，要做什么分析，不知道用什么软件到这里找。
3 [biostars](…
&img src=&/50/v2-dcf4da7fdeacb287a3c08577_b.jpg& data-rawwidth=&506& data-rawheight=&648& class=&origin_image zh-lightbox-thumb& width=&506& data-original=&/50/v2-dcf4da7fdeacb287a3c08577_r.jpg&&&a href=&/?target=http%3A///share/s/3XK4IC0cm4CL22pU-r1HPcQQ079KTH0H0QfP2_4Aye31Hjuk& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/shar&/span&&span class=&invisible&&e/s/3XK4IC0cm4CL22pU-r1HPcQQ079KTH0H0QfP2_4Aye31Hjuk&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&h1&系统环境&/h1&&p&CentOS 7.0&/p&&h1&软件安装&/h1&&p&anaconda的安装请参考： &br&&a href=&/p/& class=&internal&&使用Bioconda管理Linux系统中的生物信息软件 - 知乎专栏&/a& &br&&a href=&/?target=http%3A///86236/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Anaconda使用总结 - Python - 伯乐在线&i class=&icon-external&&&/i&&/a& &br&需要安装的软件包括 sratoolkit,fastqc,hisats,samtools,htseq-count,R,Rstudio&/p&&h2&sratoolkit&/h2&&p&介绍： sratoolkit的主要用途还是把NCBI SRA（Sequence Read Archive）数据库中的NGS序列数据从 sra 格式转换到 fastq 格式，以便于后续的数据分析。 &br&官网主页：&a href=&/?target=https%3A//trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi%3Fview%3Dsoftware& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Software : Sequence Read Archive : NCBI/NLM/NIH&i class=&icon-external&&&/i&&/a& &br&中文相关介绍一篇：&a href=&/?target=http%3A///OA-maque/p/4799074.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&sra-tools 的安装与简单使用&i class=&icon-external&&&/i&&/a& &br&安装与测试：&/p&&br&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&#直接用anaconda安装 @沈梦园提供
conda install -c jfear sratoolkit
#或者手动安装：
cd Downloads
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.8.2-1/sratoolkit.2.8.2-1-centos_linux64.tar.gz
#下载已经编译好的适合CentOS 64位系统的版本
tar -zxvf sratoolkit.2.8.2-1-centos_linux64.tar.gz #解包解压
mv sratoolkit.2.8.2-1-centos_linux64.tar.gz ~/biosoft #移动到专门安装生物信息软件的目录下边
# 加入环境变量
echo 'PATH=$PATH:~/biosoft/sratoolkit.2.8.2-1-centos_linux64.tar.gz/bin' && ~/.bashrc
source ~/.bashrc
prefetch -v
# 下载测试文件SRR390728，默认存放在家目录下的ncbi文件夹中
prefetch -c SRR390728
&/code&&/pre&&/div&&h2&fastqc&/h2&&p&介绍：二代测序数据质量分析软件 &br&官网主页：&a href=&/?target=http%3A//www.bioinformatics.babraham.ac.uk/projects/fastqc/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&FastQC A Quality Control tool for High Throughput Sequence Data&i class=&icon-external&&&/i&&/a& &br&中文相关介绍一篇：&a href=&/p/& class=&internal&& 测序分析--使用 FastQC 做质控&/a& &br&安装与测试：&/p&&br&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&conda install fastqc
#测试是否能正常打开该软件
&/code&&/pre&&/div&&h2&hisat2&/h2&&p&简介：将测序结果比对到人类参考基因组上。HISAT2是TopHat2/Bowti2的继任者，使用改进的BWT算法，实现了更快的速度和更少的资源占用。 &br&官网主页：&a href=&/?target=http%3A//ccb.jhu.edu/software/hisat2/index.shtml& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&HISAT2&i class=&icon-external&&&/i&&/a& &br&中文相关介绍：&a href=&/?target=https%3A//www.plob.org/article/10380.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Public Library of Bioinformatics&i class=&icon-external&&&/i&&/a& &br&安装与测试：&/p&&br&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&conda install hisat2
&/code&&/pre&&/div&&br&&h2&samtools&/h2&&p&简介：一种处理SAM、BAM文件的工具软件。BAM格式文件是存放高通量测序中比对结果的标准格式文件。 &br&官网主页：旧主页&a href=&/?target=http%3A//samtools.sourceforge.net/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&SAMtools&i class=&icon-external&&&/i&&/a& 新主页&a href=&/?target=http%3A//www.htslib.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Samtools&i class=&icon-external&&&/i&&/a& &br&中文相关介绍：&a href=&/?target=http%3A///OA-maque/p/4827146.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&samtools 的使用 - OA_maque - 博客园&i class=&icon-external&&&/i&&/a& &br&安装与测试：&/p&&br&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&conda install samtools
&/code&&/pre&&/div&&h2&htseq-count&/h2&&p&简介：htseq-count 是一款用于reads计数的软件，他能对位于基因组上的一些单位的reads数进行统计，这里所说的单位主要是指染色体上的一组位置区间（我们常见的就是gene exon） &br&官网主页：&a href=&/?target=http%3A//www-huber.embl.de/users/anders/HTSeq/doc/install.html%23installation-on-linux& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Prequisites and installation&i class=&icon-external&&&/i&&/a& &br&中文相关介绍：&a href=&/?target=http%3A//yangl.net//htseq-count_manual/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&htseq-count的用法-Bluesky's blog&i class=&icon-external&&&/i&&/a& &br&&a href=&/?target=http%3A///OA-maque/p/4835033.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&HTSeq 的安装 - OA_maque - 博客园&i class=&icon-external&&&/i&&/a& &br&安装与测试：&/p&&br&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&#anaconda 只能安装0.7.2版没有最新版
conda install -c bioconda htseq
#手动安装ubuntu
sudo apt-get install build-essential python2.7-dev python-numpy python-matplotlib
#Redhat系列包括CentOS
sudo yum install python-devel numpy python-matplotlib
#下载HTSeq
wget https://pypi.python.org/packages/de/e4/a4c46b571babb074ce3ff91cf220bed26502b69dccd3a2fda3/HTSeq-0.8.0.tar.gz
tar -zxvf HTSeq-0.8.0.tar.gz
mv HTSeq-0.8.0 Biosoft
#移动到Biosoft文件夹中
cd HTSeq-0.8.0
#进入该文件夹
python setup.py install –user
在非HTSeq-0.8.0文件夹下进行
&&&import HTSeq
#能够在python中导入HTSeq这个包，说明安装成功。
&/code&&/pre&&/div&&h2&R&/h2&&p&简介：一种常用语统计分析的编程语言，在生物信息分析中用于数据分析和绘图 &br&官网主页：&a href=&/?target=https%3A//www.r-project.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&The R Project for Statistical Computing&i class=&icon-external&&&/i&&/a& &br&中文相关介绍：&a href=&/?target=http%3A//www.oschina.net/p/r-language& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&R语言首页、文档和下载 - 编程语言 - 开源中国社区&i class=&icon-external&&&/i&&/a& &br&安装与测试：&/p&&br&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&sudo yum install epel-release
sudo yum install r
&/code&&/pre&&/div&&h2&Rstudio&/h2&&p&简介：Rstudio是R的集成开发环境 &br&官网主页：&a href=&/?target=https%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Home&i class=&icon-external&&&/i&&/a& &br&中文相关介绍：&a href=&/?target=http%3A///article/a17d98c8f21c.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/artic&/span&&span class=&invisible&&le/a17d98c8f21c.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& &br&安装与测试：&/p&&br&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&conda install rstudio
rstudio #测试
&/code&&/pre&&/div&
系统环境CentOS 7.0软件安装anaconda的安装请参考：
需要安装的软件包括 sratoolkit,fastqc,hisats,samtools,htseq-count,R,Rstudiosrato…
蛋白质序列的比较很是常见，可用的工具也有很多，可以参考我们早前的文章。当两条蛋白质序列的相似度大于30%时，他们的三级结构以及生物学功能也可推测为很接近的。然而，当序列的相似性低于30%时，我们就很难只依靠序列比对获取有效的信息了[1]。此时，三维结构的比较以及功能位点的比对会有利于推断蛋白质之间的进化关系。 &p&结构比对（structure alignment）并非单纯的将两个蛋白质重叠（superposition）在一起。将两个蛋白质重叠的前提条件是已知了两个结构中一些位置相互对应的氨基酸，而结构比对不需要任何类似的信息。因此，结构比对是非常有价值的分析手段，能够用来推测同源性很低的两个蛋白质之间的进化关系。&/p&&p&&strong&结构比对的输出数据&/strong&&/p&&p&对两个蛋白质的三级结构进行比对，能够获得最直接的结果是二者相互重叠的一系列三维坐标。二者重叠的结构能够用来计算RMSD（root mean square deviation）值以及其他更复杂的一些相似性指标，比如global distance test （GDT）[2]。RMSD值衡量的是两个结构之间的区别程度。为了给大家一个比较直观的认识，这里给出一个RMSD的参考值。两个序列相似度在50%以上的蛋白质，结构相差大约在1 ?（?是距离单位，1? = 0.1 nm）。比对的结果中也会包括一个序列比对文件，根据这个文件可以计算两个输入结构中一致的氨基酸的比例，即可用来检测两条序列的相似度。&/p&&p&&strong&结构比对的方法&/strong&&/p&&p&有很多可以用来进行结构比对的软件以及数据库，例如DaLI，combinational extention （CE），SSAP，FATCAT，FLEXPROT等等, 每种工具的特性以及原理可以参考PROTEOPEDIA数据库[3]。这里我们就不详细介绍这些工具的计算原理以及分析方法了（其实我也不懂，惭愧脸），只给大家举个栗子。&/p&&p&RCSB PDB的网站上有一个蛋白质结构比较的工具，与其说这是个工具，不如说是个平台，因为在这里你可以选择多种我们上面说过的方法，主页在这里&a href=&/?target=http%3A//www.rcsb.org/pdb/workbench/workbench.do& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&RCSB PDB - Comparison Tool&i class=&icon-external&&&/i&&/a&&br&点击进入后是这个样子的：&/p&&img src=&/v2-fffd04c57b60294befadf_b.png& data-rawwidth=&1021& data-rawheight=&577& class=&origin_image zh-lightbox-thumb& width=&1021& data-original=&/v2-fffd04c57b60294befadf_r.png&&&p&在ID1，2两个框内输入你想进行比对的两个结构的PDB ID。我们以依赖辅助因子ThDP家族的转酮醇酶（transketolase）和丙酮酸脱羧酶（pyruvate decarboxylase）作为例子。这两个酶的序列同源性只有15%，但属于同一家族，同时都需要依赖ThDP作为辅助因子才能发挥功能。&/p&&p&然后我们选择一个方法：&/p&&img src=&/v2-2dd1e374aed08a3695703_b.png& data-rawwidth=&1016& data-rawheight=&580& class=&origin_image zh-lightbox-thumb& width=&1016& data-original=&/v2-2dd1e374aed08a3695703_r.png&&&p&从图中可以看到，这些方法分为两类：第一类是用来进行一级序列比较的方法；第二类是用来进行结构比较的方法。可供选择的方法有那么多，我们使用一个比较常用的方法jCE Cicular Permutation进行结构比较（注：CE与CE Circular permutation是有区别，其区别之处形象地说是，CE Circular permutation可以用一个蛋白质的N端去和另一个蛋白质的C端进行比较，而CE算不可以）。然后点击Compare, 即会得到下面的两部分结果。&/p&&p&1、&strong&基本数据部分&/strong&&/p&&img src=&/v2-27e64d7e0cf154a28c8b4_b.png& data-rawwidth=&596& data-rawheight=&279& class=&origin_image zh-lightbox-thumb& width=&596& data-original=&/v2-27e64d7e0cf154a28c8b4_r.png&&&p&首先是一些基础数据，这些数据的意义如下：&/p&&p&&strong&第一行&/strong&：进行比对的蛋白质结构的基本信息。&/p&&p&&strong&第二行&/strong&：P值, 指的是本次结构比对中得分可能到score以上的概率。Score的意义见第六行。&/p&&p&&strong&第三行&/strong&：twists指的是并非将蛋白质当作刚性的不可变的结构，而是允许蛋白质不同的区域进行不同的结构转化以便两个蛋白质能够进行比较，这充分反应了蛋白质的灵活性。&/p&&p&&strong&第四行&/strong&：Equ指的是两个蛋白质结构上相互对应的氨基酸数量。&/p&&p&&strong&第五行&/strong&：两个结构之间的RMSD值，也就是位置差距的多少。&/p&&p&&strong&第六行&/strong&：Score指的Raw alignment score，也是用来衡量两对比序列相似程度的标准，分值越大两序列相似性越大。其计算过程会考虑到两条序列的一致，相似，不同，空位等信息。具体可见下面例子：&/p&&img src=&/v2-da4e26da372ab5828ccc36eb3af40070_b.png& data-rawwidth=&780& data-rawheight=&217& class=&origin_image zh-lightbox-thumb& width=&780& data-original=&/v2-da4e26da372ab5828ccc36eb3af40070_r.png&&&p&&strong&第七行&/strong&：进行比对的氨基酸的长度。&/p&&p&&strong&第八行&/strong&：TM-Score是用来检测两个蛋白质结构相似性的指标，这个指标主要考虑的是整体折叠情况的相似性，而非局部结构的相似性。TM-Score在0到1之间，1意味着二者完全的一致。当score低于0.17时，意味着二者是随机选择的两个结构，没有关系。当score大约0.5时，意味着二者有相似的折叠情况[4]。&/p&&p&&strong&第九行&/strong&：整个比对过程出现的gap的数量，以及其占整个蛋白质的百分比。&/p&&p&&strong&第十行&/strong&：位置相互对应且一致的氨基酸的百分比。&/p&&p&&strong&第十一行&/strong&：位置相互对应且相似的氨基酸的百分比。&/p&&p&2、&strong&序列对比文件部分&/strong&&/p&&img src=&/v2-4fee29f40c07b04f759dd77d1ace213c_b.png& data-rawwidth=&597& data-rawheight=&697& class=&origin_image zh-lightbox-thumb& width=&597& data-original=&/v2-4fee29f40c07b04f759dd77d1ace213c_r.png&&&p&第二部分是两条互相对应的序列，图中的符号的意思如下：&/p&&p&| = 结构上相对应，且一致的残基&/p&&p&: = 结构上相对应，且相似的残基&/p&&p&. = 结构上相对应，但是二者不相似的残基&/p&&p&通过这个序列，我们就能够知道两个蛋白质中哪些氨基酸的位置是相互对应的，尽管这些氨基酸可能是不同的。&/p&&p&作为入门级读物，有关蛋白质三级结构比对以及软件的使用情况就先介绍到这里了，具体细节需要大家实践来看，欢迎留言讨论。&/p&&p&&strong&References&/strong&&/p&&p&[1] Chung SY, Subbiah S (1996) A structural explanation for the twilight zone of protein sequence homology. Structure 4:&/p&&p&[2] &a href=&/?target=https%3A//en.wikipedia.org/wiki/Global_distance_test& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Global distance test&i class=&icon-external&&&/i&&/a&&/p&&p&[3] Andreas P Spencer B Peter W. R Wolfgang F. B Chris B Adam G Philip E. Bourne (2010) Pre-calculated protein structure alignments at the RCSB PDB website Bioinformatics 26:
&a href=&/?target=http%3A//proteopedia.org/wiki/index.php/Structural_alignment_tools& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Structural alignment tools&i class=&icon-external&&&/i&&/a&&/p&&p&[4] &a href=&/?target=http%3A//zhanglab.ccmb.med.umich.edu/TM-score/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Quantitative assessment of similarity between protein structures&i class=&icon-external&&&/i&&/a&&/p&
蛋白质序列的比较很是常见，可用的工具也有很多，可以参考我们早前的文章。当两条蛋白质序列的相似度大于30%时，他们的三级结构以及生物学功能也可推测为很接近的。然而，当序列的相似性低于30%时，我们就很难只依靠序列比对获取有效的信息了[1]。此时，三…
&img src=&/50/v2-de5f2bf47e25a43b5ff53a3d8300525e_b.jpg& data-rawwidth=&500& data-rawheight=&261& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/50/v2-de5f2bf47e25a43b5ff53a3d8300525e_r.jpg&&&p&几乎所有人在上小学的时候都见过历史课本中北京猿人的照片，我也不例外，那时老师会满带着自豪的口吻告诉在座的每一个人，我们是北京猿人的后代。即使照片上的北京猿人眉嵴前突，颧骨高耸，还龅牙的样子并不好看，我依然对他印象深刻，并为此感到自豪，陶醉于对祖先们的归属感，同时也为已经知悉了自己的来源感到满足，长大后再也没有深究过“我们的祖先到底从哪儿来”问题的答案。&br&&/p&&p&&img src=&/50/v2-8b34c3c1e89f3753bfb97713f90acac5_b.jpg& data-rawwidth=&500& data-rawheight=&553& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/50/v2-8b34c3c1e89f3753bfb97713f90acac5_r.jpg&&（课本上的北京猿人长这样）&/p&&p&直到最近，我在《自然》杂志上读到《中国正在改写人类起源学说》的文章，题目就一语中的给我敲了一闷棍，过去的教育给我建立起来自豪变感成了耻辱感，可想而知我的震惊程度。文章告诉我，中国人压根就不是什么猿人的后代，而源于一位共同的幸运的非洲老祖母。&br&&/p&&p&1、&strong&中国人的祖先是北京猿人的说法从哪来&/strong&&/p&&br&&p&北京猿人，出自北京市西南郊周口店附近的一处洞穴堆积中。这处堆积是1921年发现的，1927年起进行发掘。万万没想到的是，考古学家从毫不起眼的周口店陆续挖掘出石器、用火的遗迹到完整的猿人头盖骨。在此之前，考古学家已经发现了欧洲的史前人类——13万年前的尼安德特人的头骨和四肢骨骼，北京猿人大发现把人类的历史往前延伸了50万年，因此全世界都震惊了。&br&&/p&&img src=&/50/v2-e47da4dc3_b.jpg& data-rawwidth=&600& data-rawheight=&400& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&/50/v2-e47da4dc3_r.jpg&&&p&（北京周口店北京猿人遗址，目前已被联合国教科文组织列为非物质文化遗产）&br&&/p&&p&更为骄傲的是中国人自己，几乎每个人都倍感荣耀。那时候的中国人正处在一段屈辱的历史中，急切需要民族认同感来增强自信。应该说中国人的起源在二十世纪前半叶不止是作为探求人类奥秘的科学任务而出现的，还伴随着浓郁的政治色彩。&br&&/p&&p&晚清时，昏庸无能的封建统治气数已尽，在西方列强大举入侵中国，民不聊生的情况下，中国人“西来说”十分受欢迎，一是法国汉学家拉克伯里的观点——古巴比伦是世界文明发源地，中国人种和文明也都来自于此；二是有贺长雄等日本学者提出的，中国人种来自帕米尔—昆仑山。一方面革命斗士正在迫切推翻满人统治下的清王朝，同时生活在穷困潦倒中的老百姓对政府的懦弱感到愤懑，而高大的西方人正代表着强大、先进的生产力，中国人“西来说”恰好符合了时代的需求。东、西文明都来自西方，中国同洋人一样都是战斗民族，“排满”建立工业化的国家是顺理成章。&/p&&img src=&/50/v2-001ac4b0cba7bf9bc688_b.jpg& data-rawwidth=&480& data-rawheight=&333& class=&origin_image zh-lightbox-thumb& width=&480& data-original=&/50/v2-001ac4b0cba7bf9bc688_r.jpg&&&p&（古巴比伦遗址位于巴格达西南90公里处，是世界著名的古城遗址，盛传的“空中花园”被列为古代世界七大奇迹之一）&br&&/p&&p&北京猿人的发现使得“土著说”彻底取代了“西来说”，这不仅得利于中国陷入了抗日战争，需要有归属感的民族精神来支撑整个风雨飘摇的社会，还有原本十分流行的“古巴比伦-昆仑山”起源的观点存在诸多瑕疵，受到了西方学者的猛烈抨击。自然而然的“土著说”成为了主流，难以否认的是它既是当时科学背景下的产物，也十分贴合历史需要。&br&&/p&&br&&p&2、&strong&有趣的分子钟&/strong&&/p&&p&我们是北京猿人后代的说法在中国经久不衰，一代又一代人为此感到自豪，然而这个信仰的乌托邦在一次技术革新后趋于瓦解。&br&&/p&&p&上世纪60年代，全世界的考古学界基本还处于化石和石器研究占主流的阶段，美国加州伯克利大学的艾伦·威尔逊率先提出了蛋白质生物钟模型——他认为每个蛋白质都是一个生物钟，只要测出两种动物体内的同源蛋白质分子差异，就能推断出两者分开的确切时间。在这个模型下，威尔逊测出了人和黑猩猩分开的时间是500万年前分家的，这与当时以化石为参考的考古学家的2000万年前分开的结论严重不符，因此威尔逊受到了猛烈地抨击。但他并没有气馁，蛋白质的确存在一些瑕疵，他坚信不是蛋白质，也一定有别的充当着分子钟的角色——那就是DNA。&/p&&img src=&/50/v2-1f1abb0e0b319a401e871_b.png& data-rawwidth=&916& data-rawheight=&518& class=&origin_image zh-lightbox-thumb& width=&916& data-original=&/50/v2-1f1abb0e0b319a401e871_r.png&&&p&（五万年前的丹尼索瓦人小指骨，可以使科学家绘出整个基因图谱，仅需要50毫克骨碎片，就可以测出中国人的古DNA）&/p&&p&DNA，遗传物质，人类正是依靠DNA才将自己的性状一代代流传了下来，一般来说，DNA复制非常精准，但是难免也会出一些随机的错误，如果错误恰好被自然环境选中就会保留下来，这也正是达尔文进化论的精髓所在。精妙的地是，DNA出错的概率在一个生物中是相对恒定的，并不受生理、生存环境的影响。因此已知两个生物的DNA差异，每一代恒定的出错率和生育年龄（例如25岁），就很容易算出生物间的时间差，并且DNA比蛋白质更稳定，不受过多环境影响，这正是威尔逊求之不得的生物钟。事实证明，经过DNA验证，黑猩猩距离现代人600-700万，威尔逊的蛋白质方法测出的时间是差异最小的。&br&&/p&&p&3、&strong&我们都有一位非洲老祖母&/strong&&/p&&p&有DNA技术的加持，所有的问题都变得迎刃而解了，1987年，三位美国的科学家对各地现代人群的线粒体DNA进行分析后，提出“非洲起源说”（也称“替代说”、“夏娃理论”），即所有现代人都是20万年前非洲一位女性（被称为“非洲老祖母）的后代，而这一支系之外的其他古人类都在进化过程中灭绝了。自然地，北京猿人也灭绝了，我们当然也不会是北京猿人的后代。&br&&/p&&p&如今的研究显示，现代人的历史约为20万年，然而早期的人类演变成我们这样可远远不止20万年，最终成为我们祖先的智人，是历经了千辛万苦地打怪升级才最终站在了食物链顶端。前文提到的欧洲人的史前人类，尼安德特人便是被}

我爱游戏网