【干货】李雪明:冷冻电子显微技术的分辨率革命与未来发展
作者:互联网
本讲座选自清华大学生命科学学院李雪明研究员于2015年11月26日在 RONG v2.0---图形图像处理与大数据技术论坛上所做的题为《冷冻电子显微技术的分辨率革命与未来发展》的演讲。
李雪明:首先感谢RONG系列交流会的组织者邀请我来这里做一个报告。我们现在做冷冻电子显微学的技术,大家通过电视上的报道也看过一些,今后几年跟这个技术相关的诺贝尔奖也会出现。包括将来生物制药这一块,将来都会有非常大的应用前景。我今天讲的东西不涉及太多生物学的东西,更多讲技术层面上的。我们现在的技术,冷冻电子显微技术是从上世纪八十年代真正发展起来,现在发展了三十多年。今天想来给大家介绍一下,希望大家能够针对我今天讲的东西产生一些想法,将来能够促成一些合作,或者希望在座的各位同学们有机会愿意可以加入到我们这边来。我们现在也得到了非常多的支持,包括前一段我们刚拿到一个高精尖的项目,北京市也会给我们大力的支持。我们也开始了一些招聘工作,在我们的学院网站和学校网站上,目前在招两类人:一类是卓越学者,其实是博士后的项目,这个项目提供很好的待遇。也招高级技术员,年薪不会比大部分的公司差。
首先跟大家介绍一下冷冻电子显微技术,它的基本原理是什么,未来我们的技术会做成什么样子,我们基于现在的目标,以及对于这些大家可以来贡献一些什么样的事情。
首先介绍一下我们想看一个什么样的东西,大家长期以来想看非常微观的东西,想看一个很细微的。组成世界最小的是原子,目前对材料功能上来讲,限制在原子水平上。我们想知道任何一个物质原子是怎么排列起来的,一旦知道他的原子排列,我们用计算、分析可以从本质上来理解这个东西。大家最常见的是光学的,这里面的细胞器,根据它的强度、不同特征标注出来。光学显微镜有一个最大的问题,分辨率是受制于可见光的波长。可见光的波长在几百个纳米的尺度,最好的分辨率可能就是这个波长的一半,再高就超过它衍射的极限了,所以它的分辨率大概在零点几微米的尺度。而原子的尺度是在0.1纳米的水平上,为了看到更精细的我们需要做一些别的显微镜来看到这个东西。
一个生物体里面80%~90%是水,除了水之外,大量的生物体和人,大量的干物质都是蛋白质。所有信号的传导、各种功能的实现,各种疾病、不同的行为都是跟蛋白质相关的。所以我们把蛋白质称为分子的机器。它可以动、可以产生一些功能。如果我们知道它的结构是什么样,可以做一些药物的设计,对这些蛋白质想一些办法来影响他的结构发生变化,从而实现一个疾病的治愈或者一个生物学最基本原理的研究。
所以我们希望看到里面的这些蛋白质是怎么样的一个结构,跟蛋白有最直接联系的是它的DNA序列。蛋白质基本的组成成分是氨基酸,组成人体的氨基酸只有二十种,通过不同氨基酸排列组合形成各种蛋白质。蛋白质还有更高级的结构,通过在空间中借助分子动力学相互作用,来折叠出某些特定的形状,实现特定的功能。为了看到这个东西,我们需要更高的分辨率,需要把光的波长降下来,需要有更小的波长才能达到更高的理论分辨率。科学家们找了很多,第一个比较小波长的就是X光,但是X光很难对它做聚焦,很难找到一个玻璃对X光产生折射。更好的光,1931年德伯罗易提出的,是电子束。
电子是带电的,可以用电场和磁场来改变它的运动。每个电子的能量是几百KEV的尺度,在这个尺度上对应的电子束的波长是0.002纳米。它的理论分辨率能够达到零点零几个埃的分辨率,实际比这差的非常远,是因为其他的因素。
电子显微镜经常工作的倍数在几万到几十万倍。光学显微镜最大的倍数大概是1500倍。对于冷冻电子显微镜可以达到几十万倍。现在我们用电镜,选择比较中等的电压,在两三百千伏的水平。这是我们常用的显微镜,这个显微镜的高度是两层楼那么高,其他的显微镜还有120千伏、200千伏的电压。显微镜的成本比较高,每一台都在几千万的水平。
下面讲一下电镜的基本原理。这边是一个电镜的结构图,电子显微镜和光学显微镜的结构非常像。光学显微镜是玻璃来透光,电子显微镜是用磁场实现电子光的折射,发生会聚,结构跟普通光学显微镜很像。上面是一个光源产生一个光,从样品上照一下,穿下来底下有一组物镜成像,下面再放一个探测器,把光探测,就是一个相机,我就可以看到生物样品的图像。生物样品放在纳米厚度的非常薄的冰片里面,可以看出不同生物的样品,样品沿入射方向投影的图像,细胞里面的亚结构。如果蛋白质是已经从细胞里面提纯好的话,也可以看到单个蛋白质。如果蛋白质有序的排列起来,可以形成一个蛋白的晶体,也可以看到晶体的像。有了这个像之后我们有一套算法,把一大批二维的图像通过图像处理的方法重构出一个三维的图像来,基于这一套东西我们可以对生物体成像。
这是5纳米的分辨率,基本上可以看到细胞器的轮廓、结构,到了十几个A,可以看到蛋白里面相对精细的结构,可以看到一些结构域的结构。更高到了三点几A分辨率,近原子的分辨率,可以看到每一个分子轮廓。再结合氨基酸结构的信息,可以把结构在原子水平上重构出来。冷冻电镜发展几十年也形成了很多的技术,有看单个细胞的,有看蛋白的。生物的电镜目前能做到两三个A,还是差一点。我们为了能够把分辨率升上去,看细胞、蛋白的结构更加的精细一些。
我们最近就有突破,这个突破发生在2013年,这一年上出了几个突破,我在中间也参与了非常大的一部分。之前我们看的东西的分辨率大概在10个A左右,只能看一些大概轮廓和粗略结构的东西。有了这些突破之后,我们突然能够看到接近于原子水平上的结构了。这是头一个小蛋白,膜蛋白,这是当时我在的实验室刚刚做出来的,稍微小一些的蛋白,这个蛋白的功能就是在人体里面感受温度和辣,你吃辣椒感觉非常辣,为什么你能感觉到辣呢?就是靠这个蛋白,蛋白结合辣椒素产生一个电信号让你感受到辣椒的存在,这个工作可能将来是下一个诺贝尔奖。
电镜在今年初的时候又更进了一步,到了2.2A,这里面就有很多氨基酸的轮廓在里面,外面灰色的是通过电镜给他解析出来的一个电子的结构图。中间是搭出来的原子模型,整个蛋白的结构是怎么出来的我们就清楚了,通过这个我们解释它的功能。如果想让这个结构发生什么样的变化,应该用什么样的小分子结合在什么地方,可以反复设计药物。比如说通过这个药物来为我改变蛋白的功能,这在将来的市场前景会非常大,也会促成非常多相关领域的创业。
我们如何把一个二维图象重构成三维的呢?这涉及到图像的处理。
首先说样品怎么做出来,上面先铺一层碳膜,把溶液滴上去,用滤纸吸掉,小孔形成一个膜,跟大家吹肥皂泡差不多。蛋白在薄膜里面,液氮罐里面有一个液态乙烷杯,乙烷吸热比较快,冷却的速度可以达到每秒钟几百万度,足够快让水分子没有时间结冰,就把它冻起来了。所以蛋白也固化起来了,就可以把它放在电镜里面拍照片。这就是用一束电子束照这个样品,下面就会出来图象,蛋白就在里面。
这都是二维的图象,如何算出一个三维的结构来?这个图是一个经典的画,有一个兔子,一个羊,投影看到的就像一个手,我们看到的是这个图象,如何把原先的物体还原出来,他们的特征差别非常大,这个怎么做?
这就是我们面临的问题,如果到更真实的电镜图象,这上面是一个照片,这里面是蛋白酶,在细胞里面降解没有用的蛋白质。有的蛋白质细胞用完了,有些蛋白质破坏掉了,我需要分解掉它,分解完了又出来氨基酸了,可以重复利用。蛋白可以起这样一个作用。我们拍了一个蛋白的照片,我们的做法是把这些小的蛋白从照片里面抠出来,要抠几万到几十万张小图片,来做三维重构。看照片,什么都看不出来,这是一个非常大的蛋白,里面小的细节,照相都看不出来,这是冷冻电镜很大的问题,它的信噪比低。电子的能量很高,电子一打蛋白就破坏掉了,所以我们必须要在蛋白破坏之前把它拍出来。所以信噪比非常弱。
下面说一下三维重构的原理,大家最常见的CT,生病到医院里做一个CT,躺在一个大机器里面,一个X光围绕你转一圈,他为了方便显示,显示了非常多的截面在里面,他其实是做了一个三维重构。我们学了几个概念,一个是投影,电子束的光一定要把物体穿透,而不是从表面反射的光。我们通过这种办法来重构,我们投影的傅里叶变换是我们要做的三维物体变换的截面,我们通过傅里叶变换得到三维物体很多的傅里叶空间截面,拿到很多截面,在傅里叶空间就把空间重构出来了,我再反傅里叶变换,就把三维结构重构出来了。
现在我们需要做的是测算每个蛋白空间取向是多少,每一个取向有平移、旋转,加上空间取向角,一共是五个参数,每个图像有五个参数才能把三维结构重构出来。把每个都确定一个方向,用前面的办法重构。但是一开始没有初始模型,我先随便给他一个模型,先不管这个东西对不对,投一个影,比一下,再重构。再作为下一轮的初始模型,反复迭代下去。我们认为这个东西是会收敛的。用迭代的办法做一个三维的重构,通过迭代的过程提高了我们的计算量。
生物有一些活性,他的结构是会发生变化的。我们必须要做一个分类,把不同的分开,这样才能提高分辨率。这是我们真实的图象,信号很弱,想提高它的信噪比,把很多相同的图象叠加起来,最后得到一个比较高信噪比的东西了。可以做一些分析,利用这个进一步做三维重构,信噪比就改善一些。电镜里面要解决结构的柔性和低信噪比的问题,结合在一块。这是我们蛋白分类的办法。这是一个核糖体,人体内合成蛋白质的机器,把不同的状态重构出来。
总的来说电镜的方法有几个,第一,样品制备,有了样品之后放在电镜里面采集图像。然后再做三维重构,最后把电子密度图计算出来,再拿到一个三维的模型。
过去我们一直是这样一个流程,但是分辨率上不去,数据采集图像质量不高。三维重构的精度不太好。下面几个突破把这两个问题解决掉,我们的分辨率才能得到一个很大幅度的提高。一个技术,我们做了一款相机,这个相机解决两个问题,一个是样品会动,如果样品不停的抖动的话,我看不清楚,另外,相机不好,相机拍的照片把高频的信号丢失掉了,为了解决这个我们做了一个相机,相机就是你可以探测单个的电子。现在这个相机每秒钟拍400帧,把入射电子中心位置确立下来,把模拟信号变成中心位置的数字信号,把样品漂移的问题和图象模糊的问题全解决掉。
给大家看一个差别,这是我们之前的相机,以前外部都是空的,用了新的技术以后,高分辨率的信号都保留下来了,样品的振动可以通过计算的办法拍很多帧把它保存下来。
再一个突破是怎么来找三维的取向,用贝叶斯统计的办法来做,找到每一张照片可能的取向,每一个取向上的概率是多少,通过这个做更精确的三维重构,贝叶斯方法的引入给我们计算的精度有了非常大的提高。
目前我们的电镜有一个问题,今天我们是叫大数据,其实是数据大,我们一台电镜一天产生几个T的数据,大量的图像数据,我们要为它做一些数据的大量分析,一是要计算的快,二是计算的精度要提高上去。这是我们现在面临的挑战,如何把图像的比较做的更好,有什么更好的算法和思路引入进来。第二,并行计算、GPU的使用也是问题。
前面讲的单个蛋白,将来冷冻电镜长远的发展是我们希望直接看到细胞里面的蛋白结构,现在是提纯出来,提纯出来不一定是原始的状态了,我们需要在细胞里面直接看。下一个技术,我们能够直接在细胞里看某一个分子结构的状态是什么。这是一个鞭毛虫,他通过旋转来获得前进的动力,这是我们把这个虫子放大,可以看到里面大分子的机器是这样,他上面有边毛,驱动虫子往前走。有了这个事,制药,比如说这个虫子不跑了,什么原因,我通过这个电镜来看,再做一个药放进去让他继续转。大概对人也是同样的问题。
标签:重构,电镜,一个,分辨率,李雪明,干货,电子显微,我们,蛋白 来源: https://blog.51cto.com/u_15127682/2827685