用作疫苗的肺炎球菌胆碱结合蛋白衍生物的制作方法-ag尊龙凯时

文档序号：3551480来源：国知局

导航：ag尊龙凯时-人生就是博尊龙ag旗舰厅> 最新专利>有机化学装置的制造及其处理,应用技术

专利名称：用作疫苗的肺炎球菌胆碱结合蛋白衍生物的制作方法
本申请要求对1998年5月15日申请的美国临时专利申请序号60/085,743以及1998年4月7日申请的美国临时专利申请序号60/080,878的权益。
本发明一般涉及细菌抗原以及其应用的领域，例如在人和动物体内用作免疫原剂以刺激免疫反应。更准确地说，本发明涉及用多肽接种哺乳动物物种，以作为刺激保护疫苗接受者免受致病细菌物种感染的抗体产生的机制，其中所述多肽包含由胆碱结合多肽获得的形成α-螺旋的多肽。此外，关于诊断和治疗这样的肺炎球菌感染，本发明涉及在诊断和被动免疫治疗中使用的针对这样的多肽的抗体和拮抗剂。
在一个具体的方面，本发明涉及预防和治疗由肺炎球菌细菌引起的肺炎球菌感染，如中耳感染、鼻咽感染、肺和支气管区域的感染、血液感染、csf感染等等。在这一方面，某些肺炎链球菌(streptococcus pneumoniae)类型特别有意义。
肺炎链球菌是格兰氏阳性细菌，是动物和人体内侵袭性感染(如脓毒、脑膜炎、中耳炎和大叶性肺炎)的主要病原体(tuomanen等人，nejm 322:1280-1284(1995))。作为感染过程的一部分，肺炎球菌通过以凝集素样的方式结合真核生物的多糖而容易地结合到上呼吸道和下呼吸道的非炎症人体上皮细胞上(cundell等人，micro.path.17:361-374(1994))。结合的细菌转化为侵袭性肺炎球菌感染可能涉及炎症因子的局部产生，其中所述炎症因子可激活上皮细胞以改变在它们表面受体数目和类型(cundell等人，nature,377:435-438(1995))。显然，肺炎球菌细菌结合一种这样的受体，即血小板活化因子(paf)，并在paf出现后非常短的时间内(几分钟)，肺炎球菌显示急剧增强的粘附并侵袭组织。已经显示某些可溶性受体类似物阻止肺炎球菌感染的进程(idanpaan-heikkila等人，j.inf.dis.,176:704-712(1997))。
在肺炎球菌的表面存在非共价结合磷酸胆碱的胆碱结合蛋白(cbp)家族，并且该家族的胆碱结合蛋白非共价地结合磷壁酸或脂磷壁酸质。该家族的一个例子是胆碱结合蛋白a(cbpa)，即一种分子量约75kd类型的cbp，该蛋白包括一个单一n端结构域、一个脯氨酸丰富区以及一个包含负责结合胆碱的多20氨基酸重复的c端结构域。cbpa蛋白类的n端部分的一个区段形成作为该蛋白三维结构一部分的α-螺旋。
因此，本发明目的是提供对肺炎球菌感染有广泛保护的多肽。
定义为便于理解下面的描述以及随后的实施例，将描述某些经常出现的方法和/或术语。
“质粒”用前面和/或后面带有大写字母和/或数字的小写字母p表示。本文的起始质粒或者是商业上可得到的、或者是在无限制的基础上可作为公共物品得到、或者是根据已公开的方法可以由可得到的质粒构建。此外，与所述这些质粒同等的质粒是本领域内已知的，并且对于一般熟练技术人员是显而易见的。
dna的“消化”是指用仅作用于dna上某些序列的限制酶来酶促切割所述dna。本文所用的各种限制酶是商业上可得到的，并且它们的反应条件、辅因子和其它要求按照一般熟练技术人员所知道的使用。为分析目的，通常在约20μl缓冲液中将1μg质粒或dna片段与约2单位酶使用。为分离dna片段以构建质粒的目的，通常在更大的体积中用20到250单位酶消化5到50μg dna。对于具体限制酶的合适缓冲液和底物量由生产厂家指定。通常使用在37℃中约1小时的温育时间，但可以根据供应商的说明而有所变化。消化之后，直接将反应产物在聚丙烯酰胺凝胶上电泳分离所需片段。
如goeddel,d.等人，nucleic acids res.,8:4057(1980)所述，使用8％聚丙烯酰胺凝胶进行切割片段的大小分离。
“寡核苷酸”是指可以是化学合成的或者单链多脱氧核苷酸，或者两条互补的多脱氧核苷酸链。这样的合成寡核苷酸没有5’磷酸，因此在没有用atp在激酶存在下加入磷酸时，不能连接到另一个寡核苷酸上。合成的寡核苷酸将连接到没有去磷酸化的片段上。
“连接”指在两个双链核酸片段间形成磷酸二酯键的过程(maniatis,t.等人，同上，第146页)。除非特别指出，否则使用已知的缓冲液和条件，以及10单位t4 dna连接酶(“连接酶”)每0.5μg约等摩尔量的要连接的dna片段完成连接。
如本文所用，“hps部分”指如seq id no:2所陈述的肺炎球菌的胆碱结合蛋白(“cbp”)中的氨基酸序列，该序列可能位于就这样的cbp的总体氨基酸序列的富含脯氨酸部分的氨基端。
本申请中所用的术语“同一性”、“％同一性”或“百分同一性”指两个连续序列间的差异计算结果，所述两个序列已经根据“最适合”进行序列对比(以提供匹配的相同对应序列元件的最大数目，其中元件或者是核苷酸，或者是氨基酸)，并且所有个体差异都被认为是关于同一性的个体差异。在这一方面，在计算两序列间的总差异数目时，在参考序列长度上的所有个体元件缺口(由起始序列(“参考序列”)的插入或缺失引起)以及不同元件的个别取代(就参考序列的个别元件而言)都被认为是个体差异。当已经改变起始序列(参考序列)以获得变异序列(比较序列)，或当仅将新序列(比较序列)与这样的参考序列进行序列匹配和比较时，可以比较两序列间的个体差异。当比较两个匹配的序列时，为同一性的目的，在两个序列上由在参考序列的长度上进行“最适合”匹配引起的所有个别缺口都被认为是个体差异。假如存在满足所陈述的最小同一性的匹配，那么该序列就与参考序列具有所陈述的最小同一性。例如，下面是两个各具有100个元件的序列就最适合进行匹配的假设比较，其中一个序列被当作“参考序列”，而另一个作为比较序列。在参考序列的长度上计数两个序列上所有个别匹配缺口，并将这个数目加到比较序列上个别元件取代变化(不同的匹配元件)的数目上，得出元件差异的总数。差异总数(例如7个缺口和3个取代)除以参考序列长度上元件的总数(100个元件)，得到“差异百分比”(10/100)。将得到的差异百分比(10％)从100％同一性中减去，得到“％同一性”为90％同一性。为计算同一性，在两个进行最适合序列比较的序列的不连续比较长度上(参考序列的长度)研究两个序列上的所有个别差异以确定同一性。因此，这样的同一性计算不需要算法。
在本发明的范围内，“分离的”就多肽和/或多核苷酸而言是指所述材料从它的原始环境(如，假如它是天然存在的话，就是指自然环境)中取出。例如，存在于活的生物体内的天然出现的多核苷酸或多肽不是分离的，但与天然系统中部分或所有共存在的材料分开的同样的多核苷酸或多肽是分离的。这样的多核苷酸可以是载体的一部分和/或这样的多核苷酸或多肽可以是组合物的一部分，并且由于这样的载体或组合物不是其天然环境中的一部分，这样的多核苷酸或多肽仍然是分离的。本发明的多肽和多核苷酸最好以分离的形式提供，并且最好纯化到同质性。
发明概述在一个方面，本发明涉及用于治疗或预防肺炎球菌细菌感染的疫苗，该疫苗利用肺炎球菌表面结合蛋白、类似物或变异体的至少一种多肽截短物作为免疫原，其中所述多肽截短物具有就不同肺炎球菌细菌类型而言高度保守的免疫原性α-螺旋部分(一般相当于seqid no:1中所示的“共有”氨基酸序列)，并且所述多肽并不包含胆碱结合部分。这样的多肽最好缺失c端胆碱结合部分。更优选的是这样的多肽在所述多肽中还缺失hps氨基酸序列。甚至更优选的是这样的多肽在所述多肽中一般对应于seq id no:1中陈述的“共有”氨基酸序列的高度保守免疫原性α-螺旋部分还一般相当于seq idno:19中陈述的氨基酸序列(seq id no:19的氨基酸1到103与seqid no:1的氨基酸1到103相同)。此外，优选作为疫苗的是缺失hps部分以及胆碱结合部分的重组产生的分离的多肽。
更优选作为疫苗的是肺炎球菌表面结合蛋白、类似物或变异体的一种或多种多肽截短物，其中所述多肽截短物包括单个就不同肺炎球菌细菌类型而言高度保守的α-螺旋免疫原性部分，并且所述多肽并不包含c端胆碱结合部分。更加优选的是具有这样结构的分离的重组产生的多肽。另外优选的是这样的多肽该多肽不包括c端胆碱结合部分或者不包括hps部分。
本发明还提供了包括多肽的疫苗，所述多肽包含能够形成α-螺旋的免疫原性部分，其中所述多肽包括与seq id no:1的氨基酸序列有至少85％同一性、最好至少87％同一性的序列，其中所述分离的多肽不包含c端胆碱结合部分。还优选的是这样的多肽该多肽包含与依照seq id no:19的氨基酸序列有至少85％同一性、最好至少87％同一性的多肽序列。所述分离多肽的序列最好既不包含hps部分(seq id no:2)，也不包含c端胆碱结合部分。另外优选的是具有这样结构的分离的重组产生的多肽。尤其设想了对应于不同肺炎链球菌类型的α-螺旋结构的这样的多肽。尤其优选的是这样的肺炎链球菌细菌的血清型1-5、6a、6b、7f、8、9n、9v、10a、11a、12f、14、15b、17f、18c、19f、19a、20、22f、23f和33f。这样的细菌血清型的例子可以容易地从标准atcc目录得到。
另一方面，本发明还提供了对抗肺炎链球菌的疫苗，该疫苗包括具有多种α-螺旋部分的合成或重组的多肽，其中每一个α-螺旋部分都得自不同的天然出现的肺炎链球菌胆碱结合多肽，其中这样的α-螺旋部分与seq id no:1的氨基酸序列有至少85％的同一性，并且其中所述分离的多肽不包含胆碱结合部分。更优选的是那些其中α-螺旋区域的氨基酸序列与seq id no:19的氨基酸序列至少85％相同的多肽。这样的合成多肽最好既不包含hps部分，也不包含c端胆碱结合部分。本发明也考虑和利用了这样的链结构多肽的类似物和变异体，其中这样的α-螺旋部分可以是合成的变异体氨基酸序列(或者可以是天然出现的序列和变异体序列的混合物)。在一个优选的方面，提供了具有至少十种不同的对应于肺炎链球菌血清型1-5、6a、6b、7f、8、9n、9v、10a、11a、12f、14、15b、17f、18c、19f、19a、20、22f、23f和33f的α-螺旋结构的链疫苗多肽(chain vaccinepolypeptides)。更优选的是包括至少十五种这样的α-螺旋结构的多肽，更优选包括至少20种这样的α-螺旋结构的多肽，更优选的是包括至少一种对应于肺炎链球菌血清型1-5、6a、6b、7f、8、9n、9v、10a、11a、12f、14、15b、17f、18c、19f、19a、20、22f、23f和33f中每一种的α-螺旋结构的多肽。另一个优选的多肽包括得自对应于seq id no:1的seq id nos:3-18的氨基酸序列的每一种α-螺旋结构。
在另一方面，本发明涉及由抗多肽的抗体配制的被动免疫疫苗，所述多肽包括就不同肺炎球菌细菌类型而言高度保守的免疫原性部分，所述部分能够形成与seq id no:1的氨基酸序列有前面所述同一性的α-螺旋，所述多肽不包含c端胆碱结合部分，其中所述抗体将结合至少一种肺炎链球菌物种。如果这样的多肽是天然肺炎球菌表面结合蛋白的截短物，那么这样的多肽最好缺失它的hps部分(如果可应用)以及它的胆碱结合部分。可以利用这样的被动免疫疫苗在无免疫应答的患者、具有不成熟免疫系统的患者(如年轻的儿童)或正感染的患者中预防和/或治疗肺炎球菌感染。如此，依照本发明的另一方面，可以由合成或重组的多肽产生疫苗，其中所述多肽包括两种或更多种不同的肺炎链球菌胆碱结合多肽的保守α-螺旋部分。
本发明还一般涉及使用分离的多肽在非人类哺乳动物物种内产生抗体以用于，例如，诊断试剂和疫苗，所述多肽具有就不同肺炎球菌细菌类型而言高度保守、能够形成α-螺旋(一般对应于seq id no:1或seq id no:19)的免疫原性部分，其中所述分离的多肽不包括胆碱结合部分。
在又一个方面，本发明涉及产生多肽的方法，所述多肽具有就不同肺炎球菌细菌类型而言高度保守的能够形成α-螺旋的免疫原性部分，该部分的序列一般对应于seq id no:1或seq id no:19的氨基酸序列，其中所述分离的多肽不包括胆碱结合部分。这样的重组产生最好具有截短的天然肺炎球菌表面结合多肽，其中所述多肽同时缺失hps部分(如果可应用)以及胆碱结合部分。
在再一方面，本发明提供了分离的胆碱结合多肽，其中这样的多肽的非胆碱结合区与天然出现的肺炎球菌胆碱结合蛋白的对应氨基酸序列部分有至少90％的同一性，其中所述天然出现的肺炎球菌胆碱结合蛋白的对应氨基酸序列部分是由seq id nos:3-18选出的一员。本发明涉及这样的多肽的片段，所述片段至少包括一般对应于seq id no:1的保守α-螺旋部分，并与其有至少85％的同一性，其中所述分离的多肽最好缺失胆碱结合区。
在另一方面，本发明提供了分离的多肽，所述多肽包含与由seqid nos:3-18选出的其中一种氨基酸序列有至少90％同一性的氨基酸序列。这样的分离多肽最好包含与由seq id nos:3-18选出的其中一种氨基酸序列有至少95％同一性、更优选有至少97％同一性的氨基酸序列。本发明还涉及这样的多肽的片段。
在又一方面，本发明提供了由多核苷酸编码的肺炎链球菌cbp多肽，其中所述多核苷酸能够在高严格条件下与编码具有由seq idnos:1和3-18选出的氨基酸的多肽的多核苷酸的互补物杂交。尤其优选的是这样的多肽所述多肽包含与seq id no:1的氨基酸序列至少90％相同的氨基酸序列区段。更优选的是这样的多肽所述多肽包含就seq id no:1的氨基酸序列而言有至少95％同一性的连续氨基酸序列。甚至更优选的是这样的多肽所述多肽包含就seq idno:1的氨基酸序列而言有至少97％同一性的氨基酸序列。
在另一方面，本发明提供了编码上面描述的本发明的多肽的多核苷酸。本发明的多核苷酸可以是rna形式或dna形式，其中dna包括cdna、基因组dna和合成的dna。所述dna可以是双链或单链的，如果是单链的话可以是编码链或非编码链(反义链)。所述编码包括seq id nos:3-18中至少一种氨基酸序列的多肽(或与这样的多肽的氨基酸序列有至少90％同一性的多肽)的多核苷酸可以是seqid nos:20-35所示编码序列的其中一种，或者由于遗传密码的丰余性和简并性，是编码序列与seq id nos:20-35的dna编码同样多肽的不同编码序列。
编码seq id nos:3-18的多肽的多核苷酸可以包括仅是所述多肽的编码序列；所述多肽的编码序列(可选地可以是添加的编码序列)以及非编码序列，如内含子或所述多肽的编码序列的5’和/或3’的非编码序列。所编码的多肽可以仅包括单个α-螺旋部分或包括多个α-螺旋部分，并且可以单独或共同包括这样的α-螺旋区域5’的n端序列和/或对应于“x”结构或脯氨酸丰富区域的序列(例如，如

图1所陈述)。
本发明还涉及这样的多核苷酸所述多核苷酸包含与编码包含seq id nos:3-18的多肽中的一种的多核苷酸有至少95％的同一性，最好有至少97％的同一性多核苷酸序列。本发明还涉及这样的多核苷酸的片段所述片段至少包括编码对应于seq id no:1的多肽序列的多核苷酸部分。
因此，术语“编码多肽的多核苷酸”包含仅包括所述多肽的编码序列的多核苷酸，以及包括额外的编码序列和/或非编码序列的多核苷酸。所述多肽尤其可以包括图1中图解陈述的任何一种结构类型或所有结构类型。
本发明还涉及上面所述多核苷酸的变异体，其中所述多核苷酸编码包括seq id nos:3-18的氨基酸序列的多肽的片段、类似物和衍生物。所述多核苷酸的变异体可以是所述多核苷酸天然出现的等位变异体或所述多核苷酸的非天然出现的变异体。可以利用这样的编码多核苷酸的互补物分离编码同样或相似多肽的多核苷酸。这样的方法尤其用于获得来自不同肺炎球菌血清型的α-螺旋编码区段，其中所述编码区段在产生包含多种α-螺旋区段的“链”多肽疫苗中特别有用。
因此，本发明包括编码多肽的多核苷酸，所述多肽包括如序列表中seq id nos:3-18所示的同样多肽，本发明还包括这样的多核苷酸的变异体，其中所述变异体编码seq id nos:3-18的多肽的片段、衍生物或类似物。这样的核苷酸变异体包括缺失变异体、取代变异体以及添加或插入变异体。
如上文所指出的，所述多核苷酸可以包含编码序列，其中所述编码序列是序列表中seq id nos:20-35所示的编码序列的天然出现的等位变异体。如本领域内已知的，等位变异体是多核苷酸序列的另一种形式，所述形式可能具有一个或多个核苷酸的取代、缺失或添加，并且基本不改变所编码多肽的功能。
本发明的多核苷酸还可以具有符合读框地融合到标记序列的编码序列，其中所述标记序列使得能够纯化本发明的多肽。所述标记序列可以是，例如由pqe-9载体提供的六组氨酸标记，以提供在使用细菌宿主的情况下纯化融合到所述标记的成熟多肽，或者，例如当使用哺乳动物宿主(如cos-7细胞)时，所述标记序列可以是血凝素(ha)标记。所述血凝素标记对应于得自流感血凝素蛋白的表位(wilson,i.等人，cell,37:767(1984))。
本发明还涉及与上文所述序列的互补物杂交的多核苷酸(杂交靶序列)，假如在靶序列和与靶序列杂交的序列的互补物之间有至少70％、优选至少80％、最好至少85％同一性。更优选的是这样的序列在靶序列和与靶序列杂交的多核苷酸的互补物序列之间有至少90％、优选至少95％、最好至少97％同一性。本发明还涉及这两种靶序列的互补物以及编码选自seq id nos:3到18的氨基酸序列的多核苷酸序列的互补物。本发明尤其涉及在高严格条件下与上文所述多核苷酸的互补物以及那些互补物。本文所用术语“严格条件”是指只有在靶序列和它要杂交的多核苷酸的互补物的序列间有至少95％、最好97％的同一性时，杂交才随着多核苷酸以及对应序列的互补而发生。在一个优选的实施方案中，与上文所述多核苷酸的互补物杂交的多核苷酸编码保留了与抗体交叉反应的免疫原性部分的多肽，其中所述抗体针对具有依照seq id nos:3-18的序列的多肽的至少其中一种，或针对所包括的氨基酸序列与seq id no:1的氨基酸序列有至少85％同一性的多肽。
进一方面，本发明提供了产生如上文所陈述的具有组氨酸标记(或其它合适标记)的多肽和疫苗，其中所述组氨酸标记使得以上所讨论的全长蛋白、截短物、类似物或变异体能够由于它们的标记而得到分离。
在另一方面，本发明涉及预防和/或治疗由带有表面结合cbp蛋白的肺炎球菌细菌介导的疾病的方法。本发明尤其涉及预防和/或治疗由肺炎链球菌介导的感染性疾病的方法，其中所述肺炎链球菌具有形成α-螺旋的cbp表面结合蛋白(包括与seq id no:1的氨基酸序列有至少85％同一性的序列)。在又一优选的方面，本发明涉及在人类中预防和/或治疗这样的感染的方法。
在再一方面，本发明涉及使用一种或多种针对如上文所述本发明的多肽的抗体(单克隆抗体、多克隆抗体或血清抗体)来预防或治疗由具有cbp表面结合蛋白的肺炎球菌细菌介导的疾病的方法。本发明尤其涉及预防和/或治疗由肺炎链球菌cbp蛋白介导的感染性疾病的方法，其中所述cbp蛋白包含与seq id no:1的共有序列具有上文所述同一性的α-螺旋部分。在又一更优选的方面，本发明涉及在人类中利用针对如上文所述包含α-螺旋的免疫原性本发明多肽的抗体预防和/或治疗中耳炎、鼻咽感染、支气管感染等的方法。
附图简述图1是分别从n端到c端显示的肺炎球菌cbp蛋白的示意图，(a)n端序列，(b)其中一个可能的形成α-螺旋区域的保守区段(r1)，该区段可能在一些cbp多肽中不存在，(c)桥接两个保守的α-螺旋区段的可选的小桥接氨基酸序列(x),(d)与第一个共有序列(对应于seqid no:1)相关的第二个可能的形成α-螺旋区域的共有序列(r2),(e)脯氨酸丰富区域序列，(f)胆碱结合重复区域，以及(e)c端尾序列。在相关时，可选的hps序列可以天然存在脯氨酸丰富序列的5’以及r1、x和/或r2区域的3’。
图2报道了抗1600 cfu毒性肺炎链球菌6b血清型sp317(在小鼠中)的被动免疫保护的结果，其中所述被动免疫保护由在31天给予针对肺炎球菌cbp截短多肽nr1xr2(截短物缺失脯氨酸区域和胆碱结合区域，但包括两个保守的α-螺旋区域r1和r2)的兔抗血清而提供。百分之八十在攻击前用截短物抗血清免疫的小鼠在14天观察期存活下来。与此相比，所有用对照血清(免疫前的兔血清)免疫的小鼠在第7天死去。
图3报道了抗3450 cfu毒性肺炎链球菌6b血清型sp317(在小鼠中)的被动免疫保护的结果，其中所述被动免疫保护由在52天给予针对肺炎球菌cbp截短多肽nr1xr2(截短物缺失脯氨酸区域和胆碱结合区域，但包括两个保守的α-螺旋区域r1和r2)的兔抗血清而提供。百分之百在攻击前用截短物抗血清免疫的小鼠在10天观察期存活下来。与此相比，百分之九十用对照血清(免疫前的兔血清)免疫的小鼠在第10天死去。
图4报道了抗580 cfu毒性肺炎链球菌6b血清型spsj2(在小鼠中)的被动免疫保护的结果，其中所述被动免疫保护由在31天给予针对肺炎球菌cbp截短多肽nr1xr2(截短物缺失脯氨酸区域和胆碱结合区域，但包括两个保守的α-螺旋区域r1和r2)的兔抗血清而提供。百分之五十在攻击前用截短物抗血清免疫的小鼠在10天观察期存活下来。与此相比，所有用对照血清(免疫前的兔血清)免疫的小鼠在第8天死去。
图5报道了抗560 cfu毒性肺炎链球菌6b血清型spsj2(在小鼠中)的主动免疫保护的结果，其中所述主动免疫保护由给予肺炎球菌cbp截短多肽nr1x(截短物缺失第二个保守α-螺旋区域r2以及脯氨酸区域和胆碱结合区域)免疫接种而提供。百分之八十在攻击前用nr1x cbp截短物主动免疫的小鼠在14天观察期存活下来。与此相比，所有用pbs和佐剂的对照(假给予小鼠(sham mice))免疫的小鼠在第8天死去。
图6报道了抗680 cfu毒性肺炎链球菌6b血清型spsj2(在小鼠中)的主动免疫保护的结果，其中所述主动免疫保护由免疫接种肺炎球菌cbp截短多肽nr1xr2(截短物缺失脯氨酸区域和胆碱结合区域，但包括两个保守的α-螺旋区域r1和r2)而提供。百分之五十在攻击前用nr1xr2 cbp截短物主动免疫的小鼠在14天观察期存活下来。与此相比，所有用对照(sp90)蛋白和佐剂免疫的小鼠在第9天死去。
图7是来自不同肺炎球菌类型的cbp多肽的氨基端的序列比较报道，在比较的每一阵列(整套行)顶部报道了共有序列。比较用的共有序列列为“主要”序列(seq id no:36)。使用一个字母编码代表与“最合适”比较匹配的序列，其中序列中的虚线代表连续序列中的间隔缺口。
图8显示了图7描述的氨基酸序列的序列对距离(sequence pairdistance)并陈述于其中。使用了用同一性残基比重表的clustal方法。报道了对图7中陈述的氨基酸序列进行这样的比较的相似性百分比。
图9是来自不同肺炎球菌类型的cbp多肽的氨基酸序列中第一个螺旋区的序列比较报道，在比较的每一阵列(整套行)顶部报道了共有序列。比较的共有序列列出为“主要”序列(seq id no:38)。使用一个字母编码代表与“最合适”比较匹配的序列，其中序列中的虚线代表连续序列中的间隔缺口。
图10显示了图9描述的氨基酸序列的序列对距离并阐明于其中。使用了用同一性残基比重表的clustal方法。报道了对图9中陈述的氨基酸序列的这样的比较的相似性百分比。
图11是来自不同肺炎球菌类型的cbp多肽的氨基酸序列中x区的序列比较报道，在比较的每一阵列(整套行)顶部报道了序列。比较用共有序列列为“主要”序列(seq id no:37)。使用一个字母编码代表与“最合适”比较匹配的序列，其中序列中的虚线代表连续序列中的间隔缺口。
图12显示了图11描述的氨基酸序列的序列对距离并阐明于其中。使用了用同一性残基比重表的clustal方法。报道了对图11中陈述的氨基酸序列的这样的比较的相似性百分比。
图13是来自不同肺炎球菌类型的cbp多肽的氨基酸序列中第二个螺旋区a的序列比较报道，在比较的每一阵列(整套行)顶部报道了共有序列。比较的共有序列列为“主要”序列(seq id no:1)。使用一个字母编码代表与“最合适”比较匹配的序列，其中序列中的虚线代表连续序列中的间隔缺口。
图14显示了图13描述氨基酸序列的序列对距离并阐明于其中。使用了带同一性残基比重表的clustal方法。报道了对图13中陈述的氨基酸序列的这样的比较的相似性百分比。
图15是来自不同肺炎球菌类型的cbp多肽的氨基酸序列中第二个螺旋区b的序列比较报道，在比较的每一阵列(整套行)顶部报道了共有序列。比较的共有序列列出为“主要”序列(seq id no:19)。使用一个字母编码代表与“最合适”比较匹配的序列，其中序列中的虚线代表连续序列中的间隔缺口。
图16显示了图15描述的氨基酸序列的序列对距离并阐明于其中。使用了带同一性残基比重表的clustal方法。报道了对图15中陈述的氨基酸序列的这样的比较的相似性百分比。
发明详述按照本发明的一个方面，提供了对肺炎链球菌感染产生保护反应的疫苗，所述疫苗使用包括由以下选出的其中之一的多肽(a)产生α-螺旋结构、与seq id no:1的氨基酸序列至少85％相同并且缺失胆碱结合区的氨基酸序列，以及(b)天然出现的肺炎链球菌多肽的分离的截短物，所述截短物包括与seq id no:1的氨基酸序列有至少85％同一性的α-螺旋部分并且缺失胆碱结合区，(c)天然出现的肺炎链球菌多肽的分离的截短物，所述截短物包括与seq id no:19的氨基酸序列有至少90％同一性的α-螺旋部分并且缺失胆碱结合区。在一个优选的方面，这样的分离的截短物多肽是由seq id nos:3-18选出的其中之一，并且所述分离多肽缺失胆碱结合区以及(如果有关的话)hps区；或者是所述多肽的至少包括对应于seq id no:1的共有序列的α-螺旋区段的片段。尤其优选的是利用具有至少这样的α-螺旋区域的截短物多肽的疫苗或利用包含至少两种这样的α-螺旋区段的重组免疫原多肽的疫苗。这样的多肽可以是包含来自一个或多个截短物的多个α-螺旋区域的重组多肽。更优选的是包括至少两种α-螺旋区域的重组免疫原多肽，其中所述α-螺旋区域对应于来自不同肺炎球菌细菌类型的两种或多种截短物的α-螺旋区域。这样的多肽可以是包含来自一种或多种不同肺炎球菌细菌类型的多种α-螺旋区域的重组多肽。
按照本发明，提供了包含截短的来自肺炎链球菌的表面结合多肽的分离的多肽，所述分离的多肽包含氨基酸序列一般对应于seq idno:1的α-螺旋区域，但缺失了胆碱结合区域。所述分离的多肽最好还缺失任何天然出现的α-螺旋形成区域的重复并且缺失可能存在的任何hps氨基酸序列。
本发明的一个目的是利用包含免疫原性多肽的免疫原性组合物作疫苗(或用于产生用于诊断或被动疫苗的抗体)，其中所述免疫原性多肽包含带有α-螺旋部分并且缺失胆碱结合区的肺炎球菌表面结合蛋白。在一个实施方案中，设想了来自肺炎链球菌细菌的这样的截短的蛋白(天然出现或重组产生，或者是功能类似物)。甚至更进一步的是，设想了缺失出现的任何hps区域以及天然蛋白的胆碱结合区域、具有单个α-螺旋部分的肺炎链球菌多肽。
这样的免疫原性组合物的尤其优选的实施方案是用作疫苗(或用作产生用于诊断或疫苗的抗体的免疫原)，其中所述免疫原性组合物的活性成分是包含选自以下其中至少一种的分离的多肽(a)选自seq id nos:3-19的氨基酸序列，(b)与(a)有至少90％同一性、优选至少95％同一性、更优选至少97％同一性的多肽，或(c)(a)或(b)的片段，其中这样的片段包括至少一种对应于共有序列(即seq id no:1)的α-螺旋部分，并且所述片段不包含胆碱结合区。这样的疫苗最好利用这样的多肽所述多肽既不包含在天然蛋白中作为氨基酸序列的一部分出现的胆碱结合区，也不包含在天然蛋白中作为氨基酸序列的一部分出现的hps区。
在另一个优选的实施方案中，提供包括至少一种分离的多肽的疫苗，所述多肽包括与seq id no:1有至少85％同一性(优选87％同一性、更优选至少90％同一性)的氨基酸序列，所述分离的多肽不具有胆碱结合部分，并且在可应用时，最好也不包括hps部分。优选的多肽还可以包括一个或多个位于多肽的α-螺旋区域5’的n端序列，其中所述多肽具有由seq id nos:3-18等选出的氨基酸序列。所述多肽截短物还可以包括一个或多个脯氨酸区(图1中的“p”区)和/或跨越区(图1中的“x”区)。
在本发明的另一方面，可以利用这样的免疫原性组合物来产生诊断肺炎球菌感染的抗体，或产生预防和/或治疗这样的肺炎球菌感染的疫苗、以及维持抗所述免疫原性组合物的免疫原的高滴度抗体的强化疫苗。
虽然已经设想了产生用于诊断和用于预防和/或治疗肺炎球菌感染的抗体的其它抗原，但需要改良或更有效的疫苗。这样的疫苗应该对预防由带有表面结合多肽的肺炎球菌介导的细菌感染有改善或增强的效应。此外，为避免不必要的支出并提供对一定范围肺炎球菌血清型的广泛保护，有对包含免疫原性氨基酸序列的多肽的需要，其中所述免疫原性多肽对应于肺炎球菌表面结合多肽在不同肺炎球菌类型中高度保守的部分。这样的多肽最好避免包括对应于天然多肽的其它部分的氨基酸序列，如胆碱结合区和/或hps区的氨基酸序列。
有对包含多肽的高度保守部分的改良抗原性组合物的需要，其中所述多肽的高度保守部分结合肺炎球菌细菌的表面、刺激高滴度特异性抗血清的产生以提供对致病性肺炎球菌细菌感染的保护并可用作诊断试剂。
在这样的方面，本发明的截短的多肽、功能性变异体类似物以及重组产生的截短多肽可用作制备疫苗组合物的免疫原，其中所述疫苗组合物刺激能赋予对致病细菌物种的免疫性的抗体的产生。此外，制备包含纯化的蛋白作为抗原性成分的疫苗也是本领域内所熟知的。
一般来说，将疫苗以水溶液或悬浮物的形式制备成可注射剂。油基(oil base)疫苗也众所周知用于例如吸入。也可以配制在使用前溶解或悬浮的固体形式。通常加入与活性成分相容并且药学使用接受的药用载体。这样的载体的例子包括但不限于水、盐溶液、葡萄糖或甘油。也可以使用载体的组合。
疫苗组合物可以另外加入用于改善疫苗有效性的添加物质以稳定ph，或作为佐剂、润湿剂或乳化剂起作用。
通常为肠胃外给予配制疫苗并或者皮下注射、或者肌内注射。也可以使用本领域内已知的方法，作为栓剂或为口服给予配制这样的疫苗。
通过本领域内技术人员所熟知的方法，确定足以赋予对致病细菌的免疫性的疫苗的量。这个量将根据疫苗接受者的特性和所需免疫水平而确定。通常要给予的疫苗的量将根据熟练医师的判断而确定。当通过皮下注射或肌内注射给予疫苗时，可以给予50到500μg范围内的纯化蛋白。
术语“需要它的患者”指感染或可能感染、将感染产生cbpa的致病肺炎球菌细菌等等、最好是肺炎链球菌细菌感染的人(然而，在某些情况下可以使用小鼠模型模拟这样的患者)。
除用作疫苗外，本发明的多肽可用作刺激抗体产生的免疫原，其中所述抗体用于被动免疫疗法、用作诊断试剂以及用作在其它方法如亲和层析中的试剂。
编码上述免疫原多肽的多核苷酸也可以具有符合读框地融合到标记序列的编码序列，其中所述标记序列使得能够纯化本发明的多肽。所述标记序列可以是，例如，由pqe-9载体提供的六组氨酸标记，以提供在使用细菌宿主的情况下纯化融合到所述标记的成熟多肽，或者，例如当使用哺乳动物宿主(如cos-7细胞)时，所述标记序列可以是血凝素(ha)标记。所述血凝素标记对应于得自流感血凝素蛋白的表位(wilson,i.等人，cell,37:767(1984))。
可以根据脯氨酸丰富区相互之间的定位鉴定依照本发明的肺炎链球菌多肽中α-螺旋氨基酸区段的多螺旋结构。此外，可选地位于两个或多个α-螺旋结构间的“x”区域可能在螺旋结构内螺旋的形成中起作用。可以利用标准三维蛋白建模确定这样的结构的相对形状。berger等人在proc.natl.acad.of sci.(usa),92:8259-8263(1995年8月)中描述了用于这样的三维蛋白建模的计算机程序的一个例子，即paircoil scoring form program(“paircoil程序”)。据描述，paircoil程序是利用数学算法预测氨基酸序列中卷曲螺旋区的位置的计算机程序。wolf等人，protein science 6:1179-1189(1997年6月)描述了这样的计算机程序的另一个例子，该程序称为multicoil scoring formprogram(“multicoil程序”)。multicoil程序基于paircoil算法，用于定位二聚和三聚的卷曲螺旋。
在一个优选的方面，本发明提供了在除肺炎链球菌物种宿主外的宿主细菌细胞内重组产生这样的多肽，以避免包含具有胆碱结合区的天然表面结合多肽。优选的宿主是这样的细菌物种所述细菌能够在本发明的多肽分泌出细胞的条件下培养。
本发明还涉及包括编码本发明的一种或多种多肽的多核苷酸的载体、用本发明的载体遗传工程化的宿主细胞以及通过重组技术以分离的和确实具有免疫原性的纯净形式产生这样的免疫原性多肽，其中所述多肽包括高度保守的α-螺旋氨基酸序列并缺失编码胆碱结合氨基酸序列的区域。
用本发明的载体遗传工程化(转导或转化或转染)宿主细胞，所述载体可以是，例如克隆载体或表达载体，其中所述载体包含编码包括本发明的高度保守的α-螺旋区但不具有胆碱结合区等的多肽的多核苷酸。所述载体可以是，例如质粒、病毒颗粒、噬菌体等形式。可以在根据适于激活启动子、选择转化子或扩增编码所述多肽的多核苷酸而改良的常规营养培养基中培养所述工程化的宿主细胞。培养条件，如温度、ph等等是以前为表达而选择宿主细胞所用的条件，所述条件将对于一般熟练技术人员是显而易见的。
载体包括染色体dna序列、非染色体dna序列以及合成的dna序列，如sv40的衍生物；细菌质粒；噬菌体dna；杆状病毒；酵母质粒；由质粒和噬菌体dna的组合衍生的载体、病毒dna如牛痘、腺病毒、禽痘病毒以及假狂犬病。然而，可以使用任何其它载体，只要所述载体在所述宿主中可复制并且有活力。
可以通过多种程序将合适的dna序列插入所述载体。一般来说，通过本领域内已知的程序将所述dna序列插入合适的限制酶位点。相信这样的程序以及其它程序处于那些本领域内技术人员的范围内。
所述表达载体中的dna序列操作性地连接到指导mrna合成的合适表达控制序列(启动子)。作为这样的启动子的有代表性的例子，可以提到ltr或sv40启动子、大肠杆菌lac或trp、噬菌体λpl启动子以及其它已知在原核细胞或真核细胞或它们的病毒中控制基因表达的启动子。所述表达载体也包含为翻译起始的核糖体结合位点以及转录终止子。所述载体也可以包括为扩增表达的合适序列。
此外，所述表达载体最好包含一个或多个可选择的标记基因来为转化宿主细胞的选择提供表型性状，所述表型性状例如用于真核细胞培养的二氢叶酸还原酶或新霉素抗性，或在大肠杆菌中的如四环素抗性或氨苄青霉素抗性。
可以使用包含如上文所述的合适dna序列以及合适的启动子或控制序列的载体来转化合适的宿主以允许所述宿主表达所述蛋白。
作为合适宿主的有代表性的例子，可以提到细菌细胞，如大肠杆菌(e.coli)、链霉菌属(streptomyces)、鼠伤寒沙门氏杆菌(salmonella typhimurium)；真菌细胞，如酵母；昆虫细胞，如果蝇属s2(drosophila s2)和spodoptera sf9；动物细胞如cho、cos或bowes黑素瘤；腺病毒；植物细胞等。相信根据本文的指导，对合适细胞的选择处于本领域内熟练技术人员的范围内。
更具体地说，本发明还包括重组构建物，所述重组构建物包含一种或多种如上文广义描述的序列。所述构建物包括已经将本发明的序列以正向或反向取向插入其中的载体，如质粒或病毒载体。在该实施方案的一个优选方面，所述构建物还包含可操作地连接到所述序列的调节序列，所述调节序列包括，例如启动子。大量合适的载体和启动子是本领域内的技术人员已知的，并可以在商业上得到。为了举例而提供以下载体。细菌pqe70、pqe60、pqe-9(qiagen,inc.)、pbs、pd10、phagescript、psix174、pbluescript sk、pbsks、pnh8a、pnh16a、pnh18a、pnh46a(stratagene)；ptrc99a、pkk223-3、pkk233-3、pdr540、prit5(pharmacia)。真核细胞pwlneo、psv2cat、pog44、pxt1、psg(stratagene)psvk3、pbpv、pmsg、psvl(pharmacia)。然而，可以使用任何其它质粒或载体，只要它们在所述宿主中可复制并且有活力。
可以使用cat(氯霉素转移酶)载体或其它带有选择标记的载体从任何所需基因选出启动子区。两个合适的载体是pkk232-8和pcm7。具体有名的启动子包括laci、lacz、t3、t7、gpt、λpr、pl和trp。真核生物的启动子包括cmv立即早期启动子、hsv胸苷激酶启动子、早期和晚期sv40启动子、来自逆转录病毒的ltr以及小鼠金属硫蛋白ⅰ启动子。合适载体和启动子的选择处于本领域内一般技术人员的水平内。
在另一个实施方案中，本发明涉及包含上述构建物的宿主细胞。所述宿主细胞可以是高等真核细胞，如哺乳动物细胞，或低等真核细胞，如酵母细胞，或者所述宿主细胞也可以是原核细胞，如细菌细胞。可以通过磷酸钙转染、deae-葡聚糖介导的转染或电穿孔实现将所述构建物引入所述宿主细胞(davis,l.,dibner,m.,battery,ⅰ.,basic methods in molecular biology,(1986))。
可以以常规方法使用宿主细胞中的构建物以产生由所述重组序列编码的基因产物。或者，可以通过常规肽合成仪合成产生本发明的多肽。
可以在合适启动子的控制下，在哺乳动物细胞、酵母、细菌或其它细胞中表达成熟蛋白。也可以使用无细胞翻译系统，用由本发明的dna构建物得到的rna产生这样的蛋白。用于原核宿主和真核宿主的合适克隆和表达载体由sambrook等人，molecular cloning:alaboratory manual,second edition,cold spring harbor,n.y.,(1989)中描述，特此将该文献所公开的内容通过引用结合到本文中。
通过在所述载体中插入增强子序列，增加高等真核细胞对编码本发明的多肽的dna的转录。增强子是dna的顺式作用元件，通常约从10到300bp，作用于启动子以增强它的转录。例子包括位于复制起点后侧(late side)第100到270bp的sv40增强子、巨细胞病毒早期启动子增强子、位于复制起点后侧的多形瘤增强子以及腺病毒增强子。
一般来说，重组表达载体将包括复制起点和允许宿主细胞转化的可选择标记、以及得自高表达基因的用于指导下游结构序列转录的启动子，其中所述选择标记如大肠杆菌的氨苄青霉素抗性基因以及啤酒酵母(s.cerevisiae)trpl基因。这样的启动子可以得自编码糖酵解酶的操纵子，其中所述糖酵解酶尤其是如3-磷酸甘油酸激酶(pgk)、α-因子、酸性磷酸酶或热激蛋白。将异源结构序列以合适的相与翻译起始和终止序列装配。所述异源序列可以可选地编码包括赋予所需特性的n端鉴定肽的融合蛋白，其中所述所需特性如所表达的重组产物的稳定化或简化纯化。
通过将编码所需蛋白的结构dna序列以及合适的转录起始和终止信号以可操作的可读相插入有功能的启动子，构建有用的应用于细菌的表达载体。所述载体将包括一个或多个表型可选择标记以及复制起点，以保证所述载体的维持并在需要时在宿主内提供扩增。虽然可以可选地使用其它物种，但用于转化的合适原核宿主包括大肠杆菌、枯草芽孢杆菌(bacillus subtilis)、鼠伤寒沙门氏菌以及假单胞菌属(pseudomonas)、链霉菌属以及葡萄球菌属(staphylococcus)等属内的不同物种。
作为有代表性但非限制性的例子，应用于细菌的有用的表达载体可以包括可选择的标记以及由商业上可得到的质粒得到的细菌复制起点，其中包括众所周知的克隆载体pbr322(atcc 37017)的遗传元件。这样的商业化载体包括，例如，pkk223-3(pharmacia finechemicals,uppsala,sweden)和gem1(progema biotec,madison,wi,usa)。将这些pbr322“主链”部分与合适启动子以及要表达的结构序列组合。
在转化合适的宿主株并将所述宿主株培养到合适细胞浓度后，通过合适方法诱导所选启动子的表达(如变温或化学诱导)并继续培养细胞一段时间。
通常通过离心收获细胞，用物理或化学方法破碎，并留存得到的粗提物以进一步纯化。
可以通过任何适当方法破碎在表达蛋白中使用的微生物细胞，所述方法包括冷冻-融化循环、超声处理、弗氏压碎器(french press)、机械破碎、或使用细胞裂解剂，这样的方法对于本领域内的技术人员是熟知的。然而，优选的是分泌本发明的多肽并允许从培养基中回收所述多肽的宿主细胞。
也可以使用各种哺乳动物细胞培养系统来表达重组蛋白。哺乳动物表达系统的例子包括猴肾成纤维细胞的cos-7系(如gluzman,cell,23:175(1981)所述)以及其它能够表达相容质粒的细胞系，例如，c127、3t3、cho、hela和bhk细胞系。哺乳动物表达载体将包括复制起点、合适的启动子和增强子，并且还包括任何需要的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列以及5’侧翼非转录序列。可以使用得自sv40剪接物的dna序列以及聚腺苷酸化位点以提供所需的非转录遗传元件。
可以通过众所周知的蛋白回收和纯化方法从重组细胞培养物回收和/或纯化所述多肽。这样的方法可以包括硫酸铵或乙醇沉淀、酸提取法、阴离子交换层析或阳离子交换层析、磷酸纤维素层析、疏水作用层析法、亲和层析、羟基磷灰石层析以及凝集素层析。如果需要可以在完成成熟蛋白的构型中使用蛋白重折叠步骤。在这一方面，在这样的重折叠程序中可以使用陪伴分子。最后，可以使用高效液相层析(hplc)进行最后的纯化步骤。
在本发明中用作免疫原的多肽可以是天然纯化的产品、或化学合成程序的产品、或通过重组技术由原核或真核宿主(例如由培养中的细菌、酵母、高等植物、昆虫以及哺乳动物细胞)产生。根据重组生产程序中使用的宿主，本发明的多肽可以是糖基化的或未糖基化的。尤其优选的免疫原是包含单个高度保守的α-螺旋区域、但不包含胆碱结合区或hps区的截短的肺炎球菌多肽。因此，抗这样的多肽的抗体应该结合其它肺炎球菌细菌物种(除产生这样的多肽的肺炎链球菌物种之外)，并且抗这样的肺炎链球菌的疫苗应当产生对其它肺炎球菌细菌感染的保护。
分离所述包含各自表达的α-螺旋的多肽的程序可以是本领域内熟知的重组表达/分离方法。这样分离的典型的例子利用针对所述蛋白保守区的抗体，或利用针对作为所述蛋白结构的一部分表达的his标记或可切割前导物或尾的抗体。
可以使用所述多肽、它们的片段或其它衍生物、或其类似物、或表达它们的细胞作为产生其抗体的免疫原。这些抗体可以是，例如多克隆抗体或单克隆抗体。本发明还包括嵌合抗体、单链抗体和人源化抗体以及fab片段，或fab表达库的产物。可以使用本领域内已知的各种方法产生这样的抗体和片段。
可以通过将对应于本发明的序列的多肽直接注射入动物或将所述多肽给予动物(最好不是人类)，获得由针对所述多肽而产生的抗体。这样获得的抗体随后将结合所述多肽本身。照这样，甚至可以用仅编码所述多肽一个片段的序列来产生结合整个天然多肽的抗体。
为制备单克隆抗体，可以使用任何提供由连续细胞系培养物产生的抗体的技术。例子包括杂交瘤技术(kohler和milstein,1975,nature256:495-497)、三形瘤(trioma)技术、人类b细胞杂交瘤技术(kozbor等人，1983,immunology today 4:72)以及产生人类单克隆抗体的ebv-杂交瘤技术(cole等人，1985，载于monoclonal antibodies and cancertherapy,alan r.liss,inc.，第77-96页)。
可以采用描述用于产生单链抗体的技术(美国专利4,946,778)以产生针对本发明的免疫原性多肽产品的单链抗体。同样，也可以使用表达针对本发明的免疫原性多肽产品的人源化抗体的转基因小鼠。
为便利理解上面的描述以及下面的实施例，以及同此包括的图，下面的表1给出seq id nos:3-18的多肽以及编码它们的多核苷酸(分别是seq id nos:20-35)的细菌来源。详细说明了细菌的名称和/或类型并指出了供方(credit)或来源。由于利用如本文所述的探针和/或引物，仅使用本领域内的常规技术就可以容易地获得相似类型的其它序列，因此来自这样细菌类型的序列仅为说明性的目的。
表1
本发明将参考下面的实施例进一步进行描述；然而，应当理解本发明并不限于这样的实施例。除非另外指出，否则所有部分或量都按重量计算。
实施例1cbpa截短物蛋白的载体的产生a．全长cbpa(nr1xr2pc)的载体使用毒性肺炎球菌4血清型菌株norway 4(得自ⅰ.aaberge,national instute of public health,oslo,norway)作为扩增编码全长cbpa的多核苷酸的基因组dna模板来源。用下面描述的pcr引物sj533和sj537扩增全长的cbpa。
简并正向引物sj533根据由h.r.masure提供的cbpa的n端序列xeneg(st.jude children’s research hospital,memphis,tn)设计。所述sj533引物=5’ggc gga tcc atg ga(a,g)aa(c,t)ga(a,g)gg 3’。它加入了bamhⅰ和ncoⅰ限制位点以及atg起始密码子。
3’反向引物sj537=5’gcc gtc gac tta gtt tac cca ttcacc att ggc 3’。
该引物为克隆目的加入了salⅰ限制位点,并加入了来自cbpa的天然终止密码子，并且是基于内部产生的4型和r6x型序列。
用bamhⅰ和salⅰ消化由具有sj533和sj537的基因组dna模板产生的pcr产物，并将其克隆进用bamhⅰ、xbaⅰ和smaⅰ消化的pqe30表达载体(qiagen,inc.)。r6x型模板产生全长的pmi581载体，而4型模板dna产生全长的载体pmi580。
b.cbpa截短蛋白(nr1xr2)的载体利用位于第二个氨基酸重复末端的天然出现的pvuⅱ位点(4型序列的第1228核酸)以产生cbpa的截短形式，所述截短形式仅包含所述基因的氨基末端。为产生所述截短物的克隆，用pvuⅱ和xbaⅰ消化全长的克隆pmi580(4型)或pmi581(r6x)，并根据大小在琼脂糖凝胶上分离所述氨基端以及所述表达载体的一部分。用xbaⅰ和smaⅰ消化pqe30，并也在琼脂糖凝胶上根据大小选出对应于所述载体另外一半的带。连接这两个半边，通过限制性消化鉴定克隆，然后表达所述克隆。在这种情况下，所利用的终止密码子位于所述表达载体内，因此由于在克隆位点5’末端和3’末端的额外氨基酸，所表达的蛋白比预计的大小要大。
c.cbpa截短蛋白(nr1x)的载体使用相似策略表达仅cbpa的第一个氨基酸重复。在此利用了位于两个氨基酸重复之间的天然出现的xmnⅰ位点(4型序列的第856核酸)。用xmnⅰ和aatⅱ消化cbpa全长克隆pmi580。用aatⅱ和smaⅰ消化表达载体pqe30。再一次连接两个根据大小分离的片段，通过限制性消化筛选克隆并表达所述克隆。
实施例2从表达载体表达cbpa截短的蛋白在qia expressionist系统(qiagen)中，用大肠杆菌表达载体pqe30从实施例1a-1c所述的载体中表达所有的蛋白，并使用抗组氨酸抗体以及基因特异性抗体通过蛋白质印迹分析检测氨基末端his6标记的蛋白。
如下纯化所表达的cbp截短物。
从包含所述重组质粒的在平板上生长的细菌挑取单菌落，并在6.0ml含50ug/ml卡那霉素以及100ug/ml氨苄青霉素的lb缓冲液中37℃培养过夜。将该6.0ml培养物加入含有上述浓度抗生素的1l lb中。将所述培养物在37℃振荡培养直到a600=约0.400。在所述1l培养物中加入1m iptg以达到1mm的终浓度。然后将所述培养物在37℃振荡培养3-4小时。将所述1l培养物装在250ml圆锥管内，在j-6b型离心机中4000rpm离心15分钟。弃去上清，将沉淀保存在-20℃备用。
将所述1l的沉淀重悬浮于25ml 50mm nah2po4,10mm tris,6mgucl,300mm nacl,ph8.0(缓冲液a)中。然后将该混合物在室温下搅拌30分钟。然后使用微端(microtip)超声处理(vibracell sonicator,sonics and materials,inc.,danbury,ct)所述混合物两次，每次30秒钟，其中使用50％duty cycle并且输出设定是7。将所述混合物在ja20转子中10k下离心5分钟，取出上清并弃去沉淀。将上清液加载到依附于gradifrac系统(pharmacia biotech,upsala,sweden)的10mltalon(clonetech,palo alto,ca)树脂柱。用100ml缓冲液a平衡柱子并用200ml该缓中液洗柱。以用100％50mm nah2po4,8m尿素，20mmmes,ph6.0(缓冲液b)作为最终靶缓冲液的基于体积的ph梯度液洗脱，总体积为100ml。蛋白在约30％缓冲液b时洗脱。收集洗脱峰并汇集它们。
为进行重折叠，在室温用2l体积pbs进行透析约3小时，其中使用截止分子量为14,000的透析管。然后将样品在2l pbs中4℃下透析过夜。在使用centriprep-30离心柱浓缩所述蛋白的过程中，在离心残留物中加入pbs并再次离心，实现额外缓冲液的置换。使用bca蛋白分析确定蛋白浓度，并使用考马斯亮蓝染色的4-20％sds-page凝胶使纯度可见。
实施例3用抗cbpa截短物nr1xr2抗血清的被动保护a．兔免疫血清的产生在covance(denver,pa)产生抗cbpa截短物的兔免疫血清。收集免疫前血清之后，用在完全弗氏佐剂中的250μg cbpa截短物nr1xr2(包含由483:58制备的α-螺旋ⅰ和α-螺旋ⅱ氨基酸n末端重复)免疫new zealand白兔(#me101)。在第21天给予白兔不完全弗氏佐剂中的125μg cbpa截短物的强化，并在第31天和第52天从白兔取血。
b．小鼠中的被动免疫保护用100μl无菌pbs中的兔血清(免疫前血清或第31天的免疫血清)的1∶2稀释物腹膜内被动免疫c3h/hej小鼠(5小鼠/组)。给予血清一小时后，用1600cfu毒性肺炎球菌6b血清型sp317株(得自h.r.masure)攻击小鼠。监测小鼠14天以确定存活率。
百分之八十用由抗cbpa截短物nr1xr2蛋白产生的兔免疫血清免疫的小鼠在攻击后存活14天(图2)。所有用免疫前兔血清免疫的小鼠都在第7天死亡。
c．小鼠中的被动免疫保护(更高攻击剂量)用100μl无菌pbs中的兔血清(免疫前血清或第52天的免疫血清)的1∶2稀释物腹膜内被动免疫c3h/hej小鼠(10小鼠/组)。给予血清一小时后，用3450 cfu毒性肺炎球菌6b血清型sp317株攻击小鼠。监测小鼠10天以确定存活率。
百分之百用由抗cbpa截短物nr1xr2蛋白产生的兔免疫血清免疫的小鼠在攻击后存活十天(图3)。90％用免疫前兔血清免疫的小鼠都在第10天死亡。
d．小鼠中的被动免疫保护(对高毒性)用100μl无菌pbs中的兔血清(免疫前血清或第52天的免疫血清)的1∶2稀释物腹膜内被动免疫c3h/hej小鼠(10小鼠/组)。给予血清一小时后，用580 cfu毒性肺炎球菌6b血清型spsj2株(由p.flynn,st.jude children’s research hospital,memphis,tn提供)攻击小鼠。监测小鼠10天以确定存活率。
百分之五十用抗cbpa截短物nr1xr2蛋白产生的兔免疫血清免疫的小鼠在攻击后存活10天(图4)。所有用免疫前血清免疫的小鼠都在第8天死亡。
这些数据显示对cbpa特异性的抗体对系统性肺炎球菌感染有保护作用。由于对缺失胆碱结合重复的截短的蛋白nr1xr2特异性的抗体对于保护是足够的，因此这些数据进一步指出胆碱结合区对于保护不是必需的。此外，针对基于4血清型序列的重组cbpa蛋白的抗血清仍然对6b血清型的两种不同株的攻击有保护作用。
实施例4用抗cbpa截短物nr1x和nr1xr2的主动免疫保护a．用nr1x截短物接种的主动保护用cbpa截短物蛋白(在50μl pbs中有15μg，加50μl完全弗氏佐剂)nr1x腹膜内免疫c3h/hej小鼠(10小鼠/组)。一组10只假免疫的小鼠接受pbs和佐剂。四周后用不完全弗氏佐剂中的15μg蛋白(假免疫组接受pbs和ifa)腹膜内给予第二次免疫。在第3、6和9周取血(眼框后(retro-orbital)取血)以分析免疫应答。在第9周得自10只cbpa免疫小鼠的汇集的血清中elisa终点抗cbpa截短物滴度是4,096,000。在来自假免疫小鼠的血清中没有检测到抗体。在第10周用560 cfu肺炎球菌6b血清型spsj2株攻击小鼠。检测小鼠14天以确定存活率。
百分之八十用cbpa截短物蛋白nr1x免疫的小鼠在攻击后存活14天(结果显示于图5)。所有假免疫小鼠都在第8天死亡。
b．用nr1xr2截短物接种的主动保护用cbpa截短物蛋白nr1xr2(在50μl pbs中有15μg，加50μl完全弗氏佐剂)腹膜内免疫c3h/hej小鼠(10小鼠/组)。一组10只对照免疫小鼠接受肺炎球菌重组蛋白sp90和佐剂。四周后用不完全弗氏佐剂中的15μg蛋白腹膜内给予第二次免疫。在第3、6和9周取血(眼框后取血)以分析免疫应答。在第9周得自10只cbpa免疫小鼠的汇集的血清中elisa终点抗cbpa截短物滴度是4,096,000。在第10周用680 cfu肺炎球菌6b血清型spsj2株攻击小鼠。监测小鼠14天以确定存活率。
百分之五十用cbpa截短物蛋白nr1xr2免疫的小鼠在攻击后存活14天(结果显示于图6)。所有对照免疫小鼠都在第9天死亡。
这些数据证实用重组cbpa截短物蛋白免疫引发能够对系统性肺炎球菌感染和死亡产生保护的特异性抗体的产生。由于免疫原是截短的蛋白nr1x和nr1xr2，因此这些数据进一步指出胆碱结合区对于保护不是必需的。此外，结果指出单个氨基末端重复对于引发保护性应答是足够的。由于所述重组肺炎球菌蛋白基于4血清型dna序列产生，并且用6b血清型分离物攻击后观察到保护，因此证实了交叉保护。
按照上面的指导，本发明的多种修改和变化是可能的，因此，在附加的权利要求的范围内，可以用除具体描述以外的其它方法实践本发明。
序列表<110>wizemann,theresa mkoenig,scottjohnson,leslie s<120>用作疫苗的胆碱结合蛋白衍生物<130>469201-364<140><141><150>us 60/085,743<151>1998-05-15<160>38<170>ms-word(dos text)<210>1<211>103<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>1lys lys val ala glu ala glu lys lys val glu glu ala lys lys lys1 5 10 15ala glu asp gln lys glu glu asp arg arg asn tyr pro thr asn thr20 25 30tyr lys thr leu glu leu glu ile ala glu ser asp val glu val lys35 40 45lys ala glu leu glu leu val lys glu glu ala lys glu ser arg asn50 55 60glu glu lys ile lys gln ala lys ala lys val glu ser lys lys ala65 70 75 80glu ala thr arg leu glu lys ile lys thr asp arg lys lys ala glu85 90 95glu glu ala lys arg lys ala100<210>2<211>141<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>2glu ala lys arg lys ala glu glu ser glu lys lys ala ala glu ala1 5 10 15lys gln lys val asp ala glu glu tyr ala leu glu ala lys ile ala20 25 30glu leu glu tyr glu val gln arg leu glu lys glu leu lys glu ile35 40 45asp glu ser asp ser glu asp tyr leu lys glu gly leu arg ala pro50 55 60leu gln ser lys leu asp thr lys lys ala lys leu ser lys leu glu65 70 75 80glu leu ser asp lys ile asp glu leu asp ala glu ile ala lys leu85 90 95glu val gln leu lys asp ala glu gly asn asn asn val glu ala tyr100 105 110phe lys glu gly leu glu lys thr thr ala glu lys lys ala glu leu115 120 125glu lys ala glu ala asp leu lys lys ala val asp glu130 135 140<210>3<211>431<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>3thr glu lys glu val thr thr pro val ala thr ser ser asn lys ala1 5 10 15asn lys ser gln thr glu his met lys ala ala glu gln val asp glu20 25 30tyr ile asn lys met ile gln leu asp lys arg lys his thr gln asn35 40 45leu ala leu asn ile lys leu ser ala ile lys thr lys tyr leu arg50 55 60glu leu asn val leu glu glu lys ser lys lys glu glu leu thr ser65 70 75 80lys thr lys lys glu ile asp ala ala phe glu gln phe asn lys asp85 90 95thr leu lys pro gly glu lys val glu glu ala glu lys lys val glu100 105 110glu ala glu lys lys ala lys asp gln lys glu glu asp his arg asn115 120 125tyr pro thr ile thr tyr lys thr leu glu leu glu ile ala glu ser130 135 140asp val glu val lys lys ala glu leu glu leu val lys glu glu ala145 150 155 160lys gly ser arg asn glu glu lys ile lys lys ala lys ala glu val165 170 175glu ser lys lys ala glu ala thr lys leu glu glu ile lys thr glul80 185 190arg lys lys ala glu glu glu ala lys arg lys ala glu ala glu glu195 200 205glu val lys asn lys leu lys lys arg thr lys arg gly ala phe gly210 215 220glu pro ala thr pro asp lys lys glu asn asp ala lys ser ser asp225 230 235 240ser ser val val lys lys ser ser lys pro lle leu lys ser glu lys245 250 255lys val ala glu ala glu lys lys val ala glu ala glu lys lys val260 265 270ala glu ala glu lys lys ala lys asp gln lys glu glu asp arg arg275 280 285asn tyr pro thr asn thr tyr lys thr leu glu leu glu ile ala glu290 295 300ser asp val lys val lys glu ala glu leu glu leu val lys glu glu305 310 315 320ala lys glu pro gln asn glu glu lys ile lys gln ala lys ala lys325 330 335val glu ser lys lys ala glu ala thr arg leu glu lys ile lys thr340 345 350asp arg lys lys ala glu glu ala lys arg lys val ala glu glu asp355 360 365lys val lye glu lys pro ala glu gln pro gln pro ala pro ala pro370 375 380lys pro ala pro ala pro gln pro glu lys pro ala glu gln pro lys385 390 395 400ala glu lys pro ala asp gln gln ala glu glu asp tyr ala arg arg405 410 415ser glu glu glu tyr asn pro leu asp leu thr ala pro ala lys420 425 430<210>4<211>251<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>4thr glu asn glu gly ser thr gln ala ala thr ser ser asn met ala1 5 10 15lys thr glu his arg lys ala ala lys gln val val asp glu tyr ile20 25 30glu lys met leu arg glu ile gln leu asp arg arg lys his thr gln35 40 45asn val ala leu asn ile lys leu ser ala ile lys thr lys tyr leu50 55 60arg glu leu asn val leu glu glu lys ser lys asp glu leu pro ser65 70 75 80glu ile lys ala lys leu asp ala ala phe glu lys phe lys lys asp85 90 95thr leu lys pro gly glu lys val ala glu ala lys lys lys val glu100 105 110glu ala lys lys lys ala glu asp gln lys glu glu asp arg arg asn115 120 125tyr pro thr asn thr tyr lys thr leu glu leu glu ile ala glu phe130 135 140asp val lys val lys glu ala glu leu glu leu val lys glu glu ala145 150 155 160lys glu ser arg asn glu gly thr ile lys gln ala lys glu lys val165 170 175glu ser lys lys ala glu a la thr arg leu glu asn ile lys thr asp180 185 190arg lys lys ala glu glu glu ala lys arg lys ala ala glu glu asp195 200 205lys val lys glu lys pro ala glu gln pro gln pro ala pro ala thr210 215 220gln pro glu lys pro ala pro lys pro glu lys pro ala glu gln pro225 230 235 240lys ala glu lys thr asp asp gln gln ala glu245 250<210>5<211>413<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>5thr glu lys glu val thr thr gln val pro thr tyr ser asn met ala1 5 10 15lys thr glu his arg lys ala ala lys gln val val asp glu thr ile20 25 30glu lys met leu arg glu ile gln leu asp arg arg lys his thr gln35 40 45asn phe ala phe asn mer lys leu ser ala ile lys thr glu tyr leu50 55 60tyr gly leu lys glu lys ser glu ala glu leu pro ser glu val lys65 70 75 80ala lys leu asp ala ala phe glu gln phe lys lya asp thr leu lys85 90 95pro gly glu lys val ala glu ala lys lys lys val ala glu ala glu100 105 110lys lys ala lys ala gln lys glu glu asp arg arg asn tyr pro thr115 120 125asn thr tyr lys thr leu glu leu glu ile ala glu ser asp val glu130 135 140val lys lys ala glu leu glu leu leu lys glu glu ala lys thr arg145 150 155 160asn glu asp thr ile asn gln ala lys ala lys val glu ser lys lys165 170 175ala glu ala thr leu lys glu glu ile lys thr asp arg lys lys ala180 185 190glu glu glu ala lys arg lys ala glu ala glu glu asp lys val lys195 200 205asp lys leu lys arg arg thr lys arg ala val pro gly glu pro ala210 215 220thr phe phe lys lys glu asn asp ala lys ser ser asp ser ser val225 230 235 240gly glu glu thr leu pro ser pro ser leu lys ser gly lys lys val245 250 255ala glu ala glu lys lys val ala glu ala glu lys lys ala lys asp260 265 270gln lya glu glu asp arg arg asn tyr pro thr asn thr thr lys thr275 280 285leu asp leu glu ile ala glu ser asp val lys val lys glu ala glu290 295 300leu glu leu val lys glu glu ala lys gly ser arg asn glu glu lys305 310 315 320ile asn gln ala lys ala glu val glu ser lys lys ala glu ala thr325 330 335arg leu glu lys thr lys thr asp arg lys lys ala glu glu glu ala340 345 350lys arg lys ala ala glu glu asp lys val lys glu lys pro ala glu355 360 365gln pro gln pro ala pro ala pro gln pro glu lys pro thr glu glu370 375 380pro glu asn pro ala pro ala pro lys pro glu lys pro ala glu gln385 390 395 400pro lys ala glu lys thr asp asp gln gln ala glu glu405 410<210>6<211>446<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>6thr glu asn glu gly ala thr gln val pro thr ser ser asn arg ala1 5 10 15asn glu ser gln ala glu gln gly glu gln pro lys lys leu asp ser20 25 30glu arg asp lys ala arg lys glu val glu glu tyr val lys lya ile35 40 45val gly glu ser tyr ala lys ser thr lys lys arg his thr ile thr50 55 60val ala leu val asn glu leu asn asn ile lys asn glu tyr leu asn65 70 75 80lys ile val glu ser thr ser glu ser gln leu gln ile leu met met85 90 95glu ser arg ser lys val asp glu ala val ser lys phe glu lys asp100 105 110ser ser ser ser ser ser ser asp ser ser thr lys pro glu ala ser115 120 125asp thr ala lys pro asn lys pro thr glu pro gly glu lys val ala130 135 140glu ala lys lys lys val glu glu val glu lys lys ala lys asp gln145 150 155 160lys glu glu asp arg arg asn tyr pro thr ile thr tyr lys thr leu165 170 175glu leu glu ile ala glu ser asp val glu val lys lys ala glu leu180 185 190glu leu val lys val lys ala asn glu pro arg asp lys gln lys ile195 200 205lys gln ala glu ala glu val glu ser lys gln ala glu ala thr arg210 215 220leu lys lys ile lys thr asp arg glu glu ala glu glu glu ala lys225 230 235 240arg arg ala asp ala lys glu gln gly lys pro lys gly arg pro lys245 250 255arg gly val pro gly glu leu ala thr pro asp lys lys glu asn asp260 265 270ala lys ser ser asp ser ser val gly glu glu thr leu pro ser pro275 280 285ser leu lys pro glu lys lys val ala glu ala glu lys lys val glu190 295 300glu ala lys lys lys ala glu asp gln lys glu glu asp arg arg asn305 310 315 320tyr pro thr asn thr tyr lys thr leu glu leu glu ile ala glu ser325 330 335asp val glu val lys lys ala glu leu glu leu val lys glu glu ala340 345 350lys glu pro arg asn glu glu lys val lys gln ala lys ala glu val355 360 365glu ser lys lys ala glu ala thr arg leu glu lys ile lys thr asp370 375 380arg lys lys ala glu glu glu ala lys arg lys ala ala glu glu asp385 390 395 400lye val lys glu lys pro ala glu gln pro gln pro ala pro ala pro405 410 415lys thr glu lys pro ala pro ala pro lys pro glu asn pro ala glu420 425 430gln pro lys ala glu lys pro ala asp gln gln ala glu glu435 440 445<210>7<211>428<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>7glu gly val arg ser gly asn asn ser thr val thr ser ser gly gln1 5 10 15asp ile ser lys lys tyr ala asp glu val glu ser his leu gln ser20 25 30ile leu lys asp val asn lys asn leu lys lys val gln his thr gln35 40 45asn ala asp phe asn lys lys leu ser lys ile lys thr lys tyr leu50 55 60tyr glu leu asn val leu glu glu lys ser glu ala glu leu thr ser65 70 75 80lys thr lys glu thr lys glu glu leu thr ala ala phe glu gln phe85 90 95lys lys asp thr leu ser thr glu pro glu lys lys val ala glu ala100 105 110lys lys lys val glu glu ala lys lys lys ala glu asp gln lys glu115 120 125lys asp arg arg asn tyr pro thr ile thr tyr lys thr leu glu leu130 135 140glu ile ala glu ser asp val glu val lys lys ala glu leu glu leu145 150 155 160val lys val lys ala asn glu pro arg asp glu glu lys ile lys gln165 170 175ala glu ala lys val glu ser lys gln ala glu ala thr arg leu lys180 185 190lys ile lys thr asp arg glu gln ala glu ala thr arg leu glu asn195 200 205ile lys thr asp arg glu gln ala glu glu glu ala lys val lys asp210 215 220glu pro lys lys arg thr lys arg gly val leu gly glu pro ala thr225 230 235 240pro asp lys lys glu asn asp ala lys ser ser asp ser ser val gly245 250 255glu glu thr leu pro ser pro ser leu lys pro glu lys lys val ala260 265 270glu ala glu lys lys val glu glu ala lys lys lys ala glu asp gln275 280 285lys glu glu asp arg arg asn tyr pro thr asn thr tyr lys thr leu290 295 300glu leu glu ile ala glu ser asp val glu val lys lys ala glu leu305 310 315 320glu leu val lys glu glu ala lys glu pro arg asn glu glu lys val
325 330 335lys gln ala lys ala glu val glu ser lys gln ala glu ala thr arg340 345 350leu glu asn ile lys thr asp arg lys lys ala glu glu glu ala lys355 360 365arg lys ala ala glu glu asp lys val lys glu lys pro ala glu gln370 375 380pro gln pro ala pro ala pro gln pro glu lys pro ala pro lys asp385 390 395 400glu lys pro ala pro ala pro lys pro glu asn pro ala glu gln pro405 410 415lys ala glu lys pro ala asp gln gln ala glu glu420 425<210>8<211>219<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>8glu gly val arg ser gly asn asn ser thr val thr ser ser gly gln1 5 10 15asp ile ser lys lys tyr ala asp glu val glu ser his leu gln ser20 25 30lle leu lys asp val asn lys asn leu lys lys val gln his thr gln35 40 45asn ala asp phe asn lys lys leu ser lys ile lys pro lys tyr leu50 55 60tyr glu leu lys cys leu glu glu lys ser glu ala glu leu thr ser65 70 75 80lys pro lys asn lys arg arg val thr ala ala phe glu gln phe lys85 90 95lys asp thr leu ser thr glu pro glu lys lys val ala glu ala lys100 105 110lys lys val glu glu ala lys lys lys ala glu asp gln lya glu lys115 120 125asp arg arg asn tyr pro thr ile thr tyr lys thr leu glu leu glu130 135 140ile ala glu ser asp val glu val lys lys ala glu leu glu leu val145 150 155 160lys glu glu ala lys glu pro arg asn glu glu lys val lys gln ala
165 170 175lys ala glu val glu ser lys gln ala glu ala thr arg leu glu lys180 185 190ile lys thr asp arg lys lys ala glu glu glu ala lys arg lys ala195 200 205ala glu glu asp lys val lys glu lys pro ala210 215<210>9<211>446<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>9thr glu asn glu gly ala thr gln val pro ihr ser ser asn arg ala1 5 10 15asn glu ser gln ala glu gln gly glu gln pro lys lys leu asp ser20 25 30glu ars asp lys ala ars lys glu val glu glu tyr val lys lys ile35 40 45val gly glu ser tyr ala lys ser thr lys lys arg his thr ile thr50 55 60val ala leu val asn glu leu asn asn ile lys asn glu tyr leu asn65 70 75 80lys lle val glu ser thr ser glu ser gln leu gln ile leu met met85 90 95glu ser arg ser lys val asp glu ala val ser lys phe glu lys asp100 105 110ser ser ser ser ser ser ser asp ser ser thr lys pro glu ala ser115 120 125asp thr ala lys pro asn lys pro thr glu pro gly glu lys val ala130 135 140glu ala lys lys lys val glu glu ala glu lys lys ala lys asp gln145 150 155 160lys glu glu asp arg arg asn tyr pro thr ile thr tyr lys thr leu165 170 175glu leu glu ile ale glu ser asp val glu val lys lys ala glu leu180 185 190glu leu val lys val lys ala asn glu pro arg asp glu gln lys ile195 200 205lys gln ala glu ala glu val glu ser lys gln ala glu ala thr arg
210 215 220leu lys lys ile lys thr asp arg glu glu ala glu glu glu ala lys225 230 235 240arg arg ala asp ala lys glu gln gly lys pro lys gly arg ala lys245 250 255arg gly val pro gly glu leu ala thr pro asp lys lys glu asn asp260 265 270ala lys ser ser asp ser ser val gly glu glu thr leu pro ser pro275 280 285ser leu lys pro glu lys lys val ala glu ala glu lys lys val glu290 295 300glu ala lys lys lys ala glu asp gln lys glu glu asp arg arg asn305 310 315320tyr pro thr asn thr tyr lys thr leu glu leu glu ile ala glu ser325 330 335asp val glu val lys lys ala glu leu glu leu val lys glu glu ala340 345 350lys glu pro arg asn glu glu lys val lys gln ala lys ala glu val355 360 365glu ser lys lys ala glu ala thr arg leu glu lys ile lys thr asp370 375 380arg lys lys ala glu glu glu ala lys arg lys ala ala glu glu asp385 390 395 400lys val lys glu lys pro ala glu gln pro gln pro ala pro ala pro405 410 415lys ala glu lys pro ala pro ala pro lys pro glu asn pro ala glu420 425 430gln pro lys ala glulys pro ala asp gln gln ala glu glu435440 445<210>10<211>414<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>10thr g1u asn glu gly ser thr gln ala ala thr ser ser asn met ala1 5 10 15lys thr glu his arg lys ala ala lys gln val val asp glu tyr ile20 25 30glu lys met leu arg glu ile gln leu asp arg arg lys his thr gln
35 40 45asn val ala leu asn ile lys leu ser ala ile lys thr lys tyr leu50 55 60arg glu leu asn val leu glu glu lys ser lys asp glu leu pro ser65 70 75 80glu ile lys ala lys leu asp ala ala phe glu lys phe lys lys asp85 90 95thr leu lys pro gly glu lys val ala glu ala lys lys lys val glu100 105 110glu ala lys lys lys ala glu asp gln lys glu glu asp arg arg asn115 120 125tyr pro thr asn thr tyr lys thr leu glu leu glu ile ala glu phe130 135 140asp val lys val lys glu ala glu leu glu leu val lys glu glu ala145 150 155 160lys glu ser arg asn glu gly thr ile lys gln ala lys glu lys val165 170 175glu ser lys lys ala glu ala thr arg leu glu asn ile lys thr asp180 185 190arg lys lys ala glu glu glu ala lys arg lys ala asp ala lys leu195 200 205lys glu ala asn val ala thr ser asp gln gly lys pro lys gly arg210 215 220ala lys arg gly val pro gly glu leu ala thr pro asp lys lys glu225 230 235 240asn asp ala lys ser ser asp ser ser val gly glu glu thr leu pro245 250 255ser ser ser leu lys ser gly lys lys val ala glu ala glu lys lys260 265 270val glu glu ala glu lys lys ala lys asp gln lys glu glu asp arg275 280 285arg asn tyr pro thr asn thr tyr lys thr leu asp leu glu ile ala290 295 300glu ser asp val lys val lys glu ala glu leu glu leu val lys glu305 310 315 320glu ala lys glu pro arg asp glu glu lys ile lys gln ala lys ala325 330 335lys val glu ser lys lys ala glu ala thr arg leu glu asn ile lys340 345 350thr asp arg asp asp ala glu glu glu ala lys arg lys ala ala glu355 360 365glu asp lys val lys glu lys pro ala glu gln pro gln pro ala pro370 375 380ala thr gln pro glu lys pro ala pro lys pro glu lys pro ala glu385 390 395 400gln pro lys ala glu lys thr asp asp gln gln ala glu glu405410<210>11<211>425<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>11thr glu lys glu val thr thr gln val ala thr ser ser asn arg ala1 5 10 15asn glu ser gln ala gly his arg lys ala ala glu gln phe asp glu20 25 30tyr ile lys thr met lle gln leu asp arg arg lys his thr gln asn35 40 45phe ala leu asn ile lys leu ser arg ile lys thr glu tyr leu arg50 55 60lys leu asn val leu glu glu lys ser lys ala glu leu pro ser glu65 70 75 80thr lys lys glu ile asp ala ala phe glu gln phe lys lys asp thr85 90 95asn arg thr lys lys thr val ala glu ala glu lys lys val glu glu100 105 110ala lys lys lys ala lys ala gln lys glu glu asp his arg asn tyr115 120 125pro thr asn thr tyr lys thr leu glu leu glu ile ala glu ser asp130 135 140val glu val lys lys ala glu leu glu leu val lys glu glu ala lys145 150 155 160glu ser arg asp asp glu lys ile lys gln ala glu ala lys val glu165 170 175ser lys lys ala glu ala thr arg leu glu asn ile lys thr asp arg180 185 190glu lys ala glu glu glu ala lys arg arg ala glu ala lys leu lys195 200 205glu ala val glu lys asn val ala thr ser glu gln asp lys pro lys210 215 220gly arg arg lys arg gly val pro gly glu gln ala thr pro asp lys225 230 235 240lys glu asn asp ala lys ser ser asp ser ser val gly glu glu ala245 250 255leu pro ser pro ser leu lys pro glu lys lys val ala glu ala glu260 265 270lys lys val ala glu ala glu lys lys ala lys ala gln lys glu glu275 280 285asp arg arg asn tyr pro thr asn thr tyr lys thr leu glu leu glu290 295 300ile ala glu ser asp val lys val lys glu ser glu leu glu leu val305 310 315 320lys glu glu ala lys glu ser arg asn glu glu lys val asn gln ala325 330 335lys ala lys val glu ser lys lys ala glu ala thr arg leu glu lys340 345 350ile lys thr asp arg lys lys ala glu glu glu ala lys arg lys ala355 360 365ala glu glu asp lys val lys glu lys pro ala glu gln pro gln pro370 375 380ala pro ala pro gln pro glu lys pro thr glu glu pro glu asn pro385 390 395 400ala pro ala pro lys pro glu lys pro ala glu gln pro lys ala glu405 410 415lys thr asp asp gln gln ala glu glu420 425<210>12<211>426<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>12thr glu lys glu val thr thr gln val ala thr ser ser asn lys ala1 5 10 15asn lys ser gln thr glu his met lys ala ala lys gln val asp glu20 25 30tyr ile lys lys lys ile gln leu asp arg arg lys his thr gln asn35 40 45val gly leu leu thr lys leu gly val ile lys thr glu tyr leu his50 55 60gly leu ser val ser lys lys lys ser glu ala glu leu pro ser glu65 70 75 80ile lys ala lys leu asp ala ala phe glu gln phe lys lys asp thr85 90 95leu pro thr glu pro gly lys lys val ala glu ala glu lys lys val100 105 110glu glu ala lys lys lys ala glu asp gln lys glu lys asp leu arg115 120 125asn tyr pro thr asn thr tyr lys thr leu glu leu asp ile ala glu130 135 140ser asp val glu val lys lys ala glu leu glu leu val lys glu glu145 150 155 160ala lys glu ser arg asp glu lys lys ile asn gln ala lys ala lys165 170 175val glu asn lys lys ala glu ala thr arg leu lys asn ile lys thr180 185 190asp arg glu lys ala glu glu ala lys arg arg ala asp ala lys leu195 200 205gln glu ala asn val ala thr ser glu gln asp lys ser lys arg arg210 215 220ala lys arg glu val leu gly glu leu ala thr pro asp lys lys glu225 230 235 240asn asp ala lys ser ser asp ser ser val gly glu glu thr leu thr245 250 255ser pro ser leu lys pro glu lys lys val ala glu ala glu lys lys260 265 270val glu glu ala lys lys lys ala glu asp gln lys glu glu asp arg275 280 285arg asn tyr pro thr asn thr tyr lys thr leu glu leu glu ile ala290 295 300glu ser asp val glu val lys lys ala glu leu glu leu val lys glu305 310 315 320glu ala lys glu ser arg asn glu glu lys ile lys gln val lys ala325 330 335lys val glu ser lys lys ala glu ala thr arg leu glu asn ile lys340 345 350thr asp arg lys lys ala glu glu glu glu ala lys arg arg ala ala355 360 365glu glu asp lys val lys glu lys pro ala glu gln pro gln pro ala370 375 380pro ala pro gln pro glu lys pro thr glu glu pro glu asn pro ala385 390 395 400pro ala pro ala pro lys pro glu asn pro ala glu lys pro lys ala405 410 415glu lys pro ala asp gln gln ala glu glu420 425<210>13<211>425<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>13thr glu lys glu val thr thr gln val ala thr ser ser asn lys ala1 5 10 15asn lys ser gln thr glu his met lys ala ala lys gln val asp glu20 25 30tyr ile lys lys lys leu gln leu asp arg arg lys his thr gln asn35 40 45val gly leu leu thr lys leu gly val ile lys thr glu tyr leu his50 55 60gly leu ser val ser lys lys lys ser glu ala glu leu pro ser glu65 70 75 80ile lys ala lys leu asp ala ala phe glu gln phe lys lys asp thr85 90 95leu pro thr glu pro gly lys lys val ala glu ala glu lys lys va1100 105 110glu glu ala lys lys lys ala glu asp gln lys glu lys asp leu arg115 120 125asn tyr pro thr asn thr tyr lys thr leu glu leu asp ile ala glu130 135 140ser asp val glu val lys lys ala glu leu glu leu val lys glu glu145 150 155 160ala lys glu ser arg asp glu lys lys ile asn gln ala lys ala lys165 170 175val gluasn lys lys ala glu ala thr arg leu lys asn ile lys thr180 185 190asp arg glu lys ala glu glu ala lys arg arg ala asp ala lys leu195 200 205gln glu ala asn val ala thr ser glu gln asp lys ser lys arg arg210 215 220ala lys arg glu val phe gly glu leu ala thr pro asp lys lys glu225 230 235 240asn asp ala lys ser ser asp ser ser val gly glu glu thr leu thr245 250 255ser pro ser leu lys pro glu lys lys val ala glu ala glu lys lys-260 265 270val glu glu ala lys lys lys ala glu asp gln lys glu glu asp arg275 280 285arg asn tyr pro thr asn thr tyr lys thr leu glu leu glu ile ala290 295 300glu ser asp val glu val lys lys ala glu leu glu leu val lys glu305 310 315 320glu ala lys glu ser arg asn glu glu lys ile lys gln val lys ala325 330 335lys val glu ser lys lys ala glu ala thr arg leu glu asn ile lys340 345 350thr asp arg lys lys ala glu glu glu glu ala lys arg arg ala ala355 360 365glu glu asp lys val lys glu lys pro ala glu gln pro gln pro ala370 375 380pro ala pro gln pro glu lys pro thr glu glu pro glu asn pro ala385 390 395 400pro ala pro ala pro lys pro glu asn pro ala glu lys pro lys ala405 410 415glu lys pro ala asp gln gln ala glu420 425<210>14<211>424<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>14thr glu lys glu val thr thr gln val ala thr ser ser asn arg ala1 5 10 15asn lys ser gln thr glu his met lys ala ala lys gln val asp glu20 25 30tyr ile lys lys lys leu gln leu asp arg arg lys his thr gln asn35 40 45val gly leu leu thr lys leu gly val ile lys thr glu tyr leu his50 55 60gly leu ser val ser lys lys lys ser glu ala glu lau pro ser glu65 70 75 80ile lys ala lys leu asp ala ala phe glu gln phe lys lys asp thr85 90 95leu pro thr glu pro gly lys lys val ala glu ala glu lys lys val-100 105 110glu glu ala lys lys lys ala glu asp gln lys glu lys asp leu arg115 120 125asn tyr pro thr asn thr tyr lys thr leu glu leu asp ile ala glu130 135 140ser asp val glu val lys lys ala glu leu glu leu val lys glu glu145 150 155 160ala lys glu ser arg asp glu lys lys ile asn gln ala lys ala lys165 170 175val glu asn lys lysala glu ala thr arg leu lys asn ile lys thr180185 190asp arg glu lys ala glu glu ala lys arg arg ala asp ala lys leu195 200 205gln glu ala asn val ala thr ser glu gln asp lys ser lys arg arg210 215 220ala lys arg glu val leu gly glu leu ala thr pro asp lys lys glu225 230 235 240asn asp ala lys ser ser asp ser ser val gly glu glu thr leu thr245 250 255ser pro ser leu lys pro glu lys lys val ala glu ala glu lys lys260 265 270val glu glu ala lys lys lys ala glu asp gln lys glu glu asp arg275 280 285arg asn tyr pro thr asn thr tyr lys thr leu glu leu glu ile ala290 295 300glu ser asp val glu val lys lys ala glu leu glu leu val lys glu305 310 315 320glu ala lys glu ser arg asn glu glu lys ile lys gln val lys ala325 330 335lys val glu ser lys lys ala glu ala thr arg leu glu asn ile lys340 345 350thr asp arg lys lys ala glu glu glu glu ala lys arg arg ala ala355 360 365glu glu asp lys val lys glu lys pro ala glu gln pro gln pro ala370 375 380pro ala pro gln pro glu lys pro thr glu glu pro glu asn pro ala385 390 395 400pro ala pro ala pro lys pro glu asn pro ala glu lys pro lys ala
405410415glu lys pro ala asp gln gln ala420<210>15<211>419<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>15thr glu asn glu arg thr thr gln val pro thr ser ser asn arg gly1 5 10 15lys pro glu arg arg lys ala ala glu gln phe asp glu tyr ile asn20 25 30lys met ile gln leu asp lys arg lys his thr gln asn leu ala phe35 40 45asn ile gln leu ser arg ile lys thr glu tyr leu asn gly leu lys50 55 60glu lys ser glu ala glu leu pro ser lys ile lys ala glu leu asp65 70 75 80ala ala phe lys gln phe lys lys asp thr leu pro thr glu pro glu85 90 95lys lys val ala glu ala glu lys lys val glu glu ala glu lys lys100 105 110val ala glu ala lys lys lys ala lys ala gln lys glu glu asp his115 120 125arg asn tyr pro thr ile thr tyr lys thr leu asp leu glu ile ala130 135 140glu phe asp val lys val lys glu ala glu leu glu leu val lys lys145 150 155 160glu ala asp glu ser arg asn glu gly thr ile asn gln ala lys ala165 170 175lys val glu ser glu lys ala glu ala thr arg leu lys lys ile lys180 185 190thr asp arg glu lys ala glu glu glu glu ala lys arg arg ala asp195 200 205ala lys glu gln asp glu ser lys arg arg lys ser arg gly lys arg210 215 220gly ala leu gly glu gln ala thr pro asp lys lys glu asn asp ala225 230 235 240lys ser ser asp ser ser val gly glu glu thr leu pro ser pro ser
245 250 255leu lys pro gly lys lys val ala glu ala glu lys lys val glu glu260 265 27oala asp lys lys ala lys ala gln lys glu glu asp arg arg asn tyr275 280 285pro thr asn thr tyr lys thr leu glu leu glu ile ala glu ser asp290 295 300val lys val lys glu ala glu leu glu leu val lys glu glu a la lys305 310 315 320glu ser arg asn glu glu lys ile lys gln ala lys ala lys val glu325 330 335ser lys lys ala glu ala thr arg leu glu lys ile lys thr asp arg340 345 350lys lys ala glu glu glu ala lys arg lys ala ala glu glu asp lys355 360 365val lys glu lys pro ala glu gln pro gln pro ala pro ala pro gln370 375 380pro glu lys pro ala glu glu pro glu asn pro val pro ala pro lys385 390 395 400pro glu asn pro ala glu gln pro lys ala glu lys pro ala asp gln405 410 415gln ala glu<210>16<211>414<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>16thr glu asn glu gly ser thr gln ala ala thr ser ser asn met ala1 5 10 15lys thr glu his arg lys ala ala lys gln val val asp glu tyr ile20 25 30glu lys met leu arg glu ile gln leu asp arg arg lys his thr gln35 40 45asn val ala leu asn ile lys leu ser ala ile lys thr lys tyr leu50 55 60arg glu leu asn val leu glu glu lys ser lys asp glu leu pro ser65 70 75 80glu ile lys ala lys leu asp ala ala phe glu lys glu lys lys asp
85 90 95thr leu lys pro gly glu lys val ala glu ala lys lys lys val glu100 105 110glu ala lys lys lys ala glu asp gln lys glu glu asp arg arg asn115 120 125tyr pro thr asn thr tyr lys thr leu glu leu glu ile alaglu phe130 135 140asp val lys val lys glu ala glu leu glu leu val lys glu glu ala145 150 155 160lys glu ser arg asn glu gly thr ile lys gln ala lys glu lys val165 170 175glu ser lys lys ala glu ala thr arg leu glu asn ile lys thr asp180 185 190arg lys lys ala glu glu glu ala lys arg lys ala asp ala lys leu195 200 205lys glu ala asn val ala thr ser asp gln gly lys pro lys gly arg210 215 220ala lys arg gly val pro gly glu leu ala thr pro asp lys lys glu225 230 235 240asn asp ala lys ser ser asp ser ser val gly glu glu thr leu pro245 250 255ser ser ser leu lys ser gly lys lys val ala glu ala glu lys lys260 265 270val glu glu ala glu lys lys ala lys asp gln lys glu glu asp arg275 280 285arg asn tyr pro thr asn thr tyr lys thr leu asp leu glu ile ala290 295 300glu ser asp val lys val lys glu ala glu leu glu leu val lys glu305 310 315 320glu ala lys glu pro arg asp glu glu lys ile lys gln ala lys ala325 330 335lys val glu ser lys lys ala glu ala thr arg leu glu asn ile lys340 345 350thr asp arg lys lys ala glu glu glu ala lys arg lys ala ala glu355 360 365glu asp lys val lys glu lys pro ala glu gln pro gln pro ala pro370 375 380ala thr gln pro glu lys pro ala pro lys pro glu lys pro ala glu385 390 395 400gln pro lys ala glu lys thr asp asp gln gln ala glu glu405 410<210>17<211>412<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>17glu gly val arg ser glu asn asn pro thr val thr ser ser gly gln1 5 10 15asp ile ser lys lys tyr ala asp glu val lys ser his leu glu lys20 25 30ile leu ser glu ile gln thr asn leu asp arg ser lys his ile lys35 40 45thr val asn leu ile asn lys leu gln asp ile lys arg thr tyr leu50 55 60tyr glu leu a5n val leu glu asp lys ser lys ala glu leu pro ser65 70 75 80lys ile lys ala glu leu asp ala ala phe glu gln phe lys lys asp85 90 95thr leu pro thr glu pro gly lys lys val ala glu ala lys lys lys100 105 110val glu glu ala glu lys lys ala lys ala gln lys glu glu asp tyr115 120 125arg asn tyr pro thr ile thr tyr lys thr leu glu leu glu ile ala130 135 140glu ser asp val lys val lys glu ala glu leu glu leu val lys lys145 150 155 160glu ala asp glu ser arg asn glu gly thr ile asn gln ala lys ala165 170 175lys val glu ser glu gln ala glu ala thr arg leu lys lys ile lys190 185 190thr asp arg glu lys ala glu glu glu ala lys arg arg ala asp ala195 200 205lys glu gln asp glu ser lys arg arg lys ser arg val lys arg gly210 215 220asp phe gly glu pro ala thr pro asp lys lys glu asn asp ala lys225 230 235 240ser ser asp ser ser val gly glu glu thr leu pro ser pro ser leu245 250 255lys pro gly lys lys val ala glu ala glu lys lys val glu glu ala260 265 270glu lys lys ala lys asp gln lys glu glu asp his arg asn tyr pro275 280 285thr ile thr tyr lys thr leu glu leu glu ile ala glu ser asp val290 295 300glu val lys lys ala glu leu glu leu val lys glu glu ala lys gly305 310 315 320ser arg asn glu glu lys val lys gln ala lys ala glu val glu ser325 330 335lys lys ala glu ala thr arg leu glu lys ile lys thr asp arg lys340 345 350lys ala glu glu glu ala lys arg lys ala ala glu glu asp lys val355 360 365lys glu lys pro ala glu gln pro gln pro ala pro ala pro gln pro370 375 380glu lys pro ala pro ala pro lys pro glu asn pro ala glu gln pro385 390 395 400lys ala glu lys pro ala asp gln gln ala glu glu405 410<210>18<211>406<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>18thr glu asn glu gly thr thr gln ala pro thr ser ser asn arg gly1 5 10 15asn glu ser gln ala glu his met lys ala ala lys gln val asp glu20 25 30tyr ile glu lys met leu gln leu asp arg arg lys his thr gln asn35 40 45val gly leu leu thr lys leu gly ala ile lys thr glu tyr leu arg50 55 60gly leu ser val ser lys glu lys ser thr ala glu leu pro ser glu65 70 75 80ile lys glu lys leu thr ala ala phe lys gln phe lys lys asp thr85 90 95leu lys pro glu lys lys val ala glu ala glu lys lys vai ala glu100 105 110ala lys lys lys ala glu asp gln lys glu glu asp arg arg asn tyr115 120 125pro thr lle thr tyr lys thr leu glu leu glu ile ala glu ser asp130 135 140val glu val lys lys ala glu leu glu leu val lys val lys ala asn145 150 155 160glu pro arg asp glu glu lys ile lys gln ala glu ala glu val glu165 170 175ser lys lys ala glu ala thr arg leu lys lys ile lys thr asp argl80 185 190glu lys ala glu glu glu ala lys arg arg val asp ala lys glu gln195 200 205asp glu ser ser lys arg arg lys ser arg val lys arg gly asp leu210 115 220gly glu gln ala thr pro asp lys lys glu asn asp ala lys ser ser225 230 235 240asp ser ser val gly glu glu thr leu pro ser pro ser leu lys pro245 250 255gly lys lys val ala glu ala glu lys lys val glu glu ala asp lys260 265 270lys ala lys ala gln lys glu glu asp arg arg asn tyr pro thr asn275 280 285thr tyr lys thr leu glu leu glu ile ala glu ser asp val glu val290 295 300lys lys ala glu leu glu leu val lys glu glu ala lys glu pro arg305 310 315 320asn glu glu lys val lys gln ala lys ala glu val glu ser lys lys325 330 335ala glu ala thr arg leu glu lys ile lys thr asp arg lys lys ala340 345 350glu glu glu ala lys arg lys ala ala glu glu asp lys val lys glu355 360 365lys pro ala glu gln pro lys pro ala pro ala pro gln pro glu lys370 375 380pro ala pro lys pro glu asn pro ala glu gln pro lys ala glu lys385 390 395 400pro ala asp gln gln ala405<210>19<211>114<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌的基因组的cdna衍生出的氨基酸序列<400>19lys lys val ala glu ala glu lys lys val glu glu ala lys lys lys1 5 10 15ala glu asp gln lys glu glu asp arg arg asn tyr pro thr asn thr20 25 30tyr lys thr leu glu leu glu ile ala glu ser asp val glu val lys35 40 45lys ala glu leu glu leu val lys glu glu ala lys glu ser arg asn50 55 60glu glu lys lle lys gln lla lys ala lys val glu ser lys lys ala65 70 75 80glu ala thr arg leu glu lys ile hys thr asp arg lys lys ala glu85 90 95glu glu ala lys arg lys ala ala glu glu asp lys val lys glu lys100 105 110pro ala<210>20<211>1295<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna<400>20acagagaagg aggtaactac cccagtagcc acttcttcta ataaggcaaa taaaagtcag 60acagaacata tgaaagctgc tgaacaagtc gatgaatata taaacaaaat gatccaatta 120gataaaagaa aacataccca aaatcccgcc ttaaacataa agttgagcgc aattaaaacg 180aagtatttgc gcgaattaaa tgtcttagaa gagaagtcga aaaaagaaga gttgacgtca 240aaaacaaaaa aagagataga cgcagctttt gagcagttta acaaagacac attgaaacca 300ggagaaaagg ttgaagaagc tgagaagaag gttgaagaag ctgagaaaaa agccaaggat 360caaaaagaag aagatcaccg taactaccca accattactt acaaaacgct tgaacttgaa 420attgctgagt ccgatgtgga agttaaaaaa gcggagcttg aactagtaaa agaggaagct 480aagggatctc gaaacgagga aaaaattaag aaagcaaaag cggaagttga gagtaaaaaa 540gctgaggcta caaagttaga agaaatcaag acagaacgta aaaaagcaga agaagaagct 600aaacgaaaag cagaagcaga agaagaagtt aaaaataaac caaagaagcg gacaaaacga 660ggagcttttg gagagccagc aacacctgat aaaaaagaaa atgatgcgaa gtcttcagat 720tctagcgtgg tgaagaaatc tcccaagccc atcctgaaat cagaaaaaaa agtagcagaa 780gctgagaaga aggttgcaga agccgagaag aaggttgcag aagctgagaa aaaagccaag 840gatcaaaaag aagaagatcg ccgcaactac ccaaccaata cttacaaaac gcttgaactt 900gaaattgctg agtccgatgt gaaagttaaa gaagcggagc ctgaactagt aaaagaggaa 960gctaaggaac ctcaaaacga ggaaaaaatt aagcaagcaa aagcgaaagt tgagagtaaa1020aaagccgagg ctacaaggtt agaaaaaatc aagacagatc gtaaaaaagc agaagaagct1080aaacgaaaag tagcagaaga agataaagtt aaagaaaaac cagctgaaca accacaacca1140gctcctgcac caaaaccagc gccggctcct caaccagaaa aaccagctga acaaccaaaa1200gcagaaaaac cagctgatca acaagctgaa gaagactatg ctcgtagatc agaagaagaa1260tataacccgc ttgacttaac agcaccggca aaagc 1295<210>21<211>755<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的cdna<400>21acagagaacg agggaagtac ccaagcagcc acttcttcta atatggcaaa gacagaacat 60aggaaagctg ctaaacaagt cgtcgatgaa tatatagaaa aaatgttgag ggagattcaa 120ctagatagaa gaaaacatac ccaaaatgtc gccttaaaca taaagttgag cgcaattaaa 180acgaagtatt tgcgtgaatt aaatgtttta gaagagaagt cgaaagatga gttgccgtca 240gaaataaaag caaagttaga cgcagctttt gagaagttta aaaaagatac attgaaacca 300ggagaaaagg tagcagaagc taagaagaag gttgaagaag ctaagaaaaa agccgaggat 360caaaaagaag aagatcgtcg taactaccca accaatactt acaaaacgct tgaacttgaa 420attgctgagt tcgatgtgaa agttaaagaa gcggagcttg aactagtaaa agaggaagcc 480aaagaatctc gaaacgaggg cacaattaag caagcaaaag agaaagttga gagtaaaaaa 540gctgaggcta caaggttaga aaacatcaag acagatcgta aaaaagcaga agaagaagct 600aaacgaaaag cagcagaaga agataaagtt aaagaaaaac cagctgaaca accacaacca 660gcgccggcta ctcaaccaga aaaaccagct ccaaaaccag agaagccagc tgaacaacca 720aaagcagaaa aaacagatga tcaacaagct gaaga755<210>22<211>1239<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的cdna<400>22acagagaagg aggtaactac ccaagtaccc acttattcta atatggcaaa gacagaacat 60aggaaagctg ctaaacaagt cgtcgatgaa tatatagaaa aaatgttgag ggagattcaa 120ttagatagaa gaaaacatac ccaaaatttc gccttcaaca tgaagttgag cgcaattaaa 180acggagtatt tgtatggatt aaaagagaag tcggaagctg agttgccgtc agaagtaaaa 240gcaaagttag acgcagcttt tgagcagttt aaaaaagata cattgaaact aggagaaaag 300gtagcagaag ctgagaagaa ggttgcagaa gctgagaaaa aagccaaggc tcaaaaagaa 360gaagatcgcc gtaactaccc aaccaatact tacaaaacgc ttgaacttga aattgctgag 420tccgatgtgg aagttaaaaa agcggagctt gaactartga aagaggaagc taaaactcga 480aacgaggaca caatraacca agcaaaagcg aaagttgaga gtaaaaaagc tgaggctaca 540aagttagaag aaatcaagac agatcgtaaa aaagcagaag aagaagctaa acgaaaagca 600gaagcagaag aagataaagt taaagataaa ctaaagaggc ggacaaaacg agcagttcct 660ggagagccag caacacctga taaaaaagaa aatgatgcga agtcttcaga ttctagcgta 720ggtgaagaaa ctcttccaag cccatccctg aaatcaggaa aaaaggtagc agaagctgag 780aagaaggttg cagaagctga gaaaaaagcc aaggatcaaa aagaagaaga tcgccgtaac 840tacccaacca atacttacaa aacgcttgac cttgaaattg ctgagtccga tgtgaaagtt 900aaagaagcgg agcttgaact agtaaaagag gaagctaagg gatctcgaaa cgaggaaaaa 960attaaccaag caaaagcgga agttgagagt aaaaaagctg aggctacaag gctagaaaaa1020atcaagacag atcgtaaaaa agcagaagaa gaagctaaac gaaaagcagc agaagaagat1080aaagttaaag aaaaaccagc tgaacaacca caaccagcgc cggctcctca accagaaaaa1140ccaactgaag agcctgagaa tccagcccca gctccaaaac cagagaagcc agctgaacaa1200ccaaaagcag aaaaaacaga cgaccaacaa gctgaagaa 1239<210>23<211>1338<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的cdna<400>23acagagaacg agggagctac ccaagtaccc acttcttcta atagggcaaa tgaaagtcag 60gcagaacaag gagaacaacc caaaaaactc gattcagaac gagataaggc aaggaaagag 120gtcgaggaat atgtaaaaaa aatagtgggt gagagctatg caaaatcaac taaaaagcga 180catacaatta ctgtagctct agttaacgag ttgaacaaca ttaagaacga gtatttgaac 240aaaatagttg aatcaacctc agaaagccaa ctacagatac tgatgatgga gagtcgatca 300aaagtagatg aagctgtgtc taagtttgaa aaggactcat cttcttcgtc aagttcagac 360tcttccacta aaccggaagc ttcagataca gcgaagccaa acaagccgac agaaccagga 420gaaaaggtag cagaagctaa gaagaaggtt gaagaagttg agaaaaaagc caaggactaa 480aaagaagaag atcgtcgtaa ctacccaacc aattacttac aaacgcttga acttgaaatt 540gctgagtccg atgtggaagt taaaaaagcg gagcttgaac tagtaaaagt gaaagctaac 600gaacctcgag acaagcaaaa aattaagcaa gcagaagcgg aagttgagag taaacaagct 660gaggctacaa ggttaaaaaa aatcaagaca gatcgtgaag aagcagaaga agaagctaaa 720cgaagagcag atgctaaaga gcaaggtaaa ccaaaggggc ggccaaaacg aggagttcct 780ggagagctag caacacctga taaaaaagaa aatgatgcga agtcttcaga ttctagcgta 840ggtgaagaaa ctcttccaag cccatccctg aaaccagaaa aaaaggtagc agaagctgag 900aagaaggttg aagaagctaa gaaaaaagcc gaggatcaaa aagaagaaga tcgccgtaac 960tacccaacca atacttacaa aacgcttgaa cttgaaattg ctgagtccga tgtggaagtt1020aaaaaagcgg agcttgaact agraaaagag gaagctaagg aacctcgaaa cgaggaaaaa1080gttaagcaag caaaagcgga agttgagagt aaaaaagctg aggctacaag gttagaaaaa1140atcaagacag atcgcaaaaa agcagaagaa gaagctaaac gaaaagcagc agaagaagat1200aaagttaaag aaaaaccagc tgaacaacca caaccagcgc cggctccaaa aacagaaaaa1260ccagccccag ctccaaaacc agagaatcca gctgaacaac caaaagcaga aaaaccagct1320gatcaacaag ctgaagaa 1338<210>24<211>1284<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna<400>24gaaggggtta gaagtgggaa taactccacg gttacatcta gtgggcaaga tatatcgaag 60aagtatgctg atgaagtcga gtcgcatcta caaagtatat tgaaggatgt caataaaaat 120ttgaagaaag ttcaacatac ccaaaatgcc gacttcaaca aaaagttgag caaaattaaa 180acgaagtatt tgtatgaatt aaatgtttta gaagagaagt cggaagctga gttgacgtca 240aaaacaaaag aaacaaaaga agagttaacc gcagcttttg agcagtttaa aaaagataca 300ttatcaacag aaccagaaaa aaaggtagca gaagctaaga agaaggttga agaagctaag 360aaaaaagccg aggatcaaaa agaaaaagat cgccgtaact acccaaccat tacttacaaa 420acgcttgaac ttgaaactgc tgagcccgat gcggaagtta aaaaagcgga gctcgaacta 480gtaaaagtga aagccaacga acctcgagac gaggaaaaaa ttaagcaagc agaagcgaaa 540gttgagagta aacaagctga ggctacaagg ttaaaaaaaa tcaagacaga tcgtgaacaa 600gctgaggcta caaggttaga aaacatcaag acagatcgtg aacaagcaga agaagaagct 660aaagtaaag atgaaccaaa gaagcggaca aaacgaggag ttcttggaga gccagcaaca 720cctgataaaa aagaaaatga tgcgaagtct tcagattcta gcgtaggtga agaaactctt 780ccaagcccat ccctgaaacc agaaaaaaag gttgcagaag ctgagaagaa ggttgaagaa 840gctaagaaaa aagccgagga tcaaaaagaa gaagatcgtc gtaactaccc aaccaatact 900tacaaaacgc ttgaacttga aattgctgag tccgatgtgg aagttaaaaa agcggagctt 960gaactagtaa aagaggaagc taaggaacct cgaaacgagg aaaaagttaa gcaagcaaaa1020gcggaagttg agagtaaaca agctgaggct acaaggttag aaaacatcaa gacagatcgt1080aaaaaagcag aagaagaagc taaacgaaaa gcagcagaag aagataaagt taaagaaaaa1140ccagctgaac aaccacaacc agcgccggct ccccaaccag aaaaaccagc tccaaaacca1200gaaaaaccag ctccagctcc aaaaccagag aatccagctg aacaaccaaa agcagaaaaa1260ccagctgatc aacaagctga agaa 1284<210>25<211>658<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna<400>25gaaggggtta gaagtgggaa taactccacg gttacatcta gtgggcaaga tatatcgaag 60aagtatgctg atgaagtcga gtcgcatcta caaagtatat tgaaggatgt caataaaaat 120ttgaaaaaag ttcaacatac ccaaaatgcc gacttcaaca aaaagttgag caaaattaaa 180ccgaagtatt tgtatgaatt aaagtgttta gaagagaagt cggaagccga gttgacgtca 240aaaccaaaga acaaaagaag agttaccgca gcttttgagc agtttaaaaa agacacatca 300tcaacagaac cagaaaaaaa ggtagcagaa gctaagaaga aggttgaaga agctaagaaa 360aaagccgagg atcaaaaaga aaaagatcgc cgtaactacc caaccattac ttacaaaacg 420cttgaacttg aaattgctga gtccgatgtg gaagttaaaa aagcggagct tgaactagta 480aaagaggaag ctaaggaacc tcgaaacgag gaaaaagtta agcaagcaaa agcggaagtt 540gagagtaaac aagctgaggc tacaaggtta gaaaaaatca agacagatcg taaaaaagca 600gaagaagaag ctaaacgaaa agcagcagaa gaagataaag ttaaagaaaa accagctg 658<210>26<211>1338<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna<400>26acagagaacg agggagctac ccaagtaccc acttcttcta atagggcaaa tgaaagtcag 60gcagaacaag gagaacaacc taaaaaactc gattcagaac gagataaggc aaggaaagag 120gtcgaggaat atgtaaaaaa aatagtgggt gagagctatg caaaatcaac taaaaagcga 180catacaatta ctgtagctct agttaacgag ttgaacaaca ttaagaacga gtattcgaat 240aaaatagttg aatcaacctc agaaagccaa ctacagatac tgatgatgga gagtcgatca 300aaagtagatg aagctgtgtc taagtttgaa aaggactcat cttcttcgtc aagttcagac 360tcttccacta aaccggaagc ttcagataca gcgaagccaa acaagccgac agaaccagga 420gaaaaggtag cagaagctaa gaagaaggtt gaagaagctg agaaaaaagc caaggatcaa 480aaagaagaag atcgtcgtaa ccacccaacc attacttaca aaacgcttga acttgaaatt 540gctgagtccg atgtggaagt taaaaaagcg gagcttgaac tagtaaaayt gaaagctaac 600gaacctcgag acgagcaaaa aattaagcaa gcagaagcgg aagttgagag taaacaagct 660gaggctacaa ggttaaaaaa aatcaagaca gatcgtgaag aagcagaaga agaagctaaa 720cgaagagcag atgctaaaga gcaaggtaaa ccaaaggggc gggcaaaacg aggagttcct 780ggagagctag caacacctga taaaaaagaa aatgatgcga agtcttcaga ttctagcgta 840ggtgaagaaa ctcttccaag cccatccctg aaaccagaaa aaaaggtagc agaagctgag 900aagaaggttg aagaagctaa gaaaaaagcc gaggaccaaa aagaagaaga tcgccgtaac 960taccctacca atacttscaa aacgcttgaa cttgaaattg ctgagtccga cgtggaagtt1020aaaaaagcgg agcttgaact agtaaaagag gaagctaagg aacctcgaaa cgaggaaaa 1080gttaagcaag caaaagcgga agttgagagt aaaaaagctg aggctacaag gttagaaaaa1140atcaagacag atcgtaaaaa agcagaagaa gaagctaaac gaaaagcagc agaagaagat1200aaagttaaag aaaaaccagc tgaacaacca caaccagcgc cggctccaaa agcagaaaaa1260ccagctccag ctccaaaacc agagaatcca gctgaacaac caaaagcaga aaaaccagct1320gatcaacaag ctgaagaa 1338<210>27<211>1242<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna<400>27acagaaaacg aaggaagcac ccaagcagcc acttctccta atatggcaaa gacagaacat 60aggaaagctg ctaaacaagt cgtcgatgaa tatatagaaa aaatgttgag ggagattcaa 120ctagatagaa gaaaacatac ccaaaatgtc gccttaaaca taaagttgag cgcaattaaa 180acgaagtatt tgcgtgaatc aaatgtttta gaagagaagt cgaaagatga gttgccgtca 240gaaataaaag caaagttaga cgcagctttt gagaagttta aaaaagatac attgaaacca 300ggagaaaagg tagcagaagc taagaagaag gttgaagaag ctaagaaaaa agccgaggat 360caaaaagaag aagatcgtcg taactaccca acctatactt acaaaacgct tgaacttgaa 420attgctgagt tcgatgtgaa agttaaagaa gcggagcttg aactagtaaa agaggaagct 480aaagaatctc gaaacgaggg cacaactaag caagcaaaag agaaagttga gagtaaaaaa 540gccgaggcta caaggttaga aaacatcaag acagatcgta aaaaagcaga agaagaagct 600aaacgaaaag cagatgctaa gttgaaggaa gctaacgtag cgacttcaga tcaaggtaaa 660ccaaaggggc gggcaaaacg aggagttcct ggagagctag caacacctga taaaaaagaa 720aatgatgcga agtcttcaga ttctagcgta ggtgaagaaa ctcttccaag ctcatccctg 780aaatcaggaa aaaaggtagc agaagctgag aagaaggttg aagaagctga gaaaaaagcc 840aaggatcaaa aagaagaaga tcgccgtaac tacccaacca atacttacaa aacgcttgac 900cttgaaattg ctgagtccga tgtgaaagtt aaagaagcgg agcttgaact agtaaaagag 960gaagctaagg aacctcgaga cgaggaaaaa attaagcaag caaaagcgaa agttgagagt1020aaaaaagctg aggctacaag gttagaaaac arcaagacag atcgtaaaaa agcagaagaa1080gaagctaaac gaaaagcagc agaagaagar aaagttaaag aaaaaccagc tgaacaacca1140caaccagcgc cggctactca accagaaaaa ccagctccaa aaccagagaa gccagctgaa1200caaccaaaag cagaaaaaac agatgatcaa caagctgaag aa 1242<210>28<211>1275<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna<400>28acagagaagg aggtaactac ccaagtagcc acttcttcta atagggcaaa tgaaagtcag 60gcaggacata ggaaagctgc tgaacaattc gatgaatata taaaaacaat gatccaatta 120gatagaagaa aacataccca aaatttcgcc ttaaacataa agttgagcag aattaaaacg 180gagtatttgc gtaaattaaa tgttttagaa gagaagtcga aagctgagtt gccgtcagaa 240acaaaaaaag agatagacgc agcttttgag cagtttaaaa aagataccaa cagaaccaaa 300aaaacggtag cagaagctga gaagaaggtt gaagaagcta agaaaaaagc caaggctcaa 360aaagaagaag accaccgtaa ctacccaacc aatacttaca aaacgctcga acttgaaatt 420gctgagtccg atgtggaagt taaaaaagcg gagcttgaac tagtaaaaga ggaagctaag 480gaatctcgag acgatgaaaa aattaagcaa gcagaagcga aagttgagag taaaaaagct 540gaggctacaa ggttagaaaa catcaagaca gatcgtgaaa aagcagaaga agaagctaaa 600cgaagagcag aagctaagtt gaaggaagct gttgaaaaga atgtagcgac ttcagagcaa 660gataaaccaa aggggcggag aaaacgagga gttcctggag agcaagcaac acctgataaa 720aaagaaaatg atgcgaagtc ttcagattct agcgtaggtg aagaagctct cccaagccca 780tccctgaaac cagaaaaaaa ggttgcagaa gctgagaaga aggttgcaga agctgagaaa 840aaagccaagg ctcaaaaaga agaagaccgc cgtaactacc caaccaatac ttacaaaacg 900cttgaacttg aaattgctga gtccgatgtg aaagttaaag aagcggagct tgaactagta 960aaagaggaag ctaaggaatc tcgaaacgag gaaaaagtta atcaagcaaa agcgaaagtt1020gagagtaaaa aagctgaggc tacaaggtta gaaaaaatca agacagatcg taaaaaagca1080gaagaagaag ctaaacgaaa agcagcagaa gaagataaag ttaaagaaaa accagctgaa1140caaccacaac cagcgccggc tcctcaacca gaaaaaccaa ccgaagagec tgagaatcca1200gctcccgcac caaaaccaga gaagccagct gaacaaccaa aagcagaaaa aacagatgat1260caacaagctg aagaa 1275<210>29<211>1278<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna<400>29acagagaagg aggtaaccac ccaagtagcc acttcttcta ataaggcaaa taaaagtcag 60acagaacata tgaaagctgc taaacaagtc gacgaatata taaaaaaaaa gctccaatta 120gatagaagaa aacataccca aaatgtcggc ttactcacaa agttgggcgt aattaaaacg 180gagtatttgc atggattaag tgtttcaaaa aagaagtcgg aagctgagtt gccgtcagaa 240ataaaagcaa agttagacgc agcttttgag cagtttaaaa aagatacatt accaacagaa 300ccaggaaaaa aggtagcaga agctgagaag aaggttgaag aagctaagaa aaaagccgag 360gatcaaaaag aaaaagatct ccgtaactac ccaaccaata cttacaaaac gcttgaactt 420gacattgctg agtccgatgt ggaagttaaa aaagcggagc ttgaatgagt aaaagaggaa 480gctaaggaat cccgagacga gaaaaaaatt aatcaagcaa aagcgaaagt tgagaataaa 540aaagctgagg ctacaaggtt aaaaaacatc aagacagatc gtgaaaaagc agaagaagct 600aaacgaagag cagatgctaa gttgcaggaa gctaatgtag cgacttcaga gcaagataaa 660tcaaagaggc gggcaaaacg agaagttctt ggagagctag caacacctga taaaaaagaa 720aatgatgcga agtcttcaga ttctagcgta ggtgaagaaa ctcttacaag cccatccctg 780aaaccagaaa aaaaggtagc agaagctgag aagaaggttg aagaagctaa gaaaaaagcc 840gaggatcaaa aagaagaaga tcgtcgtaac tacccaacca atacttacaa aacgcttgaa 900cttgaaattg ctgagtccga tgtggaagtt aaaaaagcgg agcttgaact agtaaaagag 960gaagctaagg aacctcgaaa cgaggaaaaa attaagcaag taaaagcgaa agttgagagt1020aaaaaagctg aggctacaag gctagaaaac atcaagacag atcgtaaaaa agcagaagaa1080gaagaagcta aacgaagagc agcagaagaa gataaagtta aagaaaaacc agctgaacaa1140ccacaaccag cgccggctcc tcaaccagaa aaaccaactg aagagcctga gaatccagcc1200ccagctccag ctccaaaacc agagaatcca gctgaaaaac caaaagcaga aaagccagct1260gatcaacaag ctgaagaa 1278<210>30<211>1276<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna<400>30acagagaagg aggtaaccac ccaagtagcc acttcttcta ataaggcaaa taaaagtcag 60acagaacata tgaaagctgc taaacaagtc gatgaatata taaaaaaaaa gctccaatta 120gatagaagaa aacataccca aaatgtcggc ttactcacaa agttgggcgt aattaaaacg 180gagtatttgc atggattaag tgtttcaaaa aagaagtcgg aagctgagtt gccgtcagaa 240ataaaagcaa agttagacgc agcttttgag cagtttaaaa aagatacatt accaacagaa 300ccaggaaaaa aggtagcaga agctgagaag aaggctgaag aagctaagaa aaaagccgag 360gatcaaaaag aaaaagatct ccgtaactac ccaaccaata cttacaaaac gcttgaactt 420gacattgctg agtccgatgt ggaagttaaa aaagcggagc ttgaactagt aaaagaggaa 480gctaaggaat ctcgagacga gaaaaaaatt aatcaagcaa aagcgaaagt tgagaataaa 540aaagctgagg ctacaaggtt aaaaaacatc aagacagatc gtgaaaaagc agaagaagct 600aaacgaagag cagatgctaa gttgcaggaa gctaatgtag cgacttcaga gcaagataaa 660tcaaagaggc gggcaaaacg agaagttttt ggagagctag caacacctga taaaaaagaa 720aatgatgcga agtcttcaga ttctagcgta ggtgaagaaa ctcttacaag cccatccctg 780aaaccagaaa aaaaggtagc agaagctgag aagaaggttg aagasgctaa gaaaaaagcc 840gaggatcaaa aagaagaaga tcgtcgtaac tacccaacca atacttacaa aacgcttgaa 900cttgaaattg ctgagtccga tgtggaagtt aaaaaagcgg agcttgaact agtaaaagag 960gaagctaagg aatctcgaaa cgaggaaaaa attaagcaag taaaagcgaa agttgagagt1020aaaaaagctg aggctacaag gctagaaaac atcaagacag atcgtaaaaa agcagaagaa1080gaagaagcta aacgaagagc agcagaagaa gataaagtta aagaaaaacc agctgaacaa1140ccacaaccag cgccggcgcc tcaaccagaa aaaccaactg aagagcctga gaatccagct1200ccagctccag ctccaaaacc agagaatcca gctgaaaaac caaaagcaga aaagccagct1260gatcaacaag ctgaag1278<210>31<211>1272<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna<400>31acagagaagg aggtaactac ccaagtagcc acttcttcta atagggcaaa taaaagtcag 60acagaacaca tgaaagctgc taaacaagtc gatgaatata taaaaaaaaa gctccaatta 120gatagaagaa aacataccca aaatgtcggc tcactcacaa agttgggcgt aattaaaacg 180gagtatttgc acggattaag tgtttcaaaa aagaagtcgg aagctgagtt gccgccagaa 240ataaaagcaa agttagacgc agcttttgag cagtttaaaa aagatacatt accaacagaa 300ccaggtaaaa aggtagcaga agctgagaag aaggttgaag aagctaagaa aaaagccgag 360gatcaaaaag aaaaagatct ccgtaactac ccaaccaata cttacaaaac gcttgaactt 420gacattgctg agtccgatgt ggaagttaaa aaagcggagc ttgaactagt aaaagaggaa 480gctaaggaac cccgagacga gaaaaaaatt aaccaagcaa aagcgaaagc tgagaataaa 540aaagctgagg ctacaaggtt aaaaaacatc aagacagatc gtgaaaaagc agaagaagct 600aaacgaagag cagacgctaa gttgcaggaa gctaatgtag cgacttcaga gcaagataaa 660tcaaagaggc gggcaaaacg agaagttctt ggagagctag caacacctga taaaaaagaa 720aatgacgcga agtctccaga ttctagcgta ggtgaagaaa ctcttacaag cccatccccg 780aaaccagaaa aaaaggtagc agaagctgag aagaaggttg aagaagctaa gaaaaaagcc 840gaggatcaaa aagaagaaga tcgtcgtaac cacccaacca atacttacaa aacgcctgaa 900cttgaaattg ccgagtccga cgtggaagtt aaaaaagcgg agcttgaacc agcaaaagag 960gaagctaagg aatctcgaaa cgaggaaaaa attaagcaag taaaagcgaa agtcgagagt1020aaaaaagctg aggctacaag gctagaaaac atcaagacag atcgtaaaaa agcagaagaa1080gaagaagcta aacgaagagc agcagaagaa gataaagtta aagaaaaacc agctgaacaa1140ccacaaccag cgccggctcc ccaaccagaa aaaccaactg aagagcctga gaatccagct1200ccagctccag ctccaaaacc agagaaccca gctgaaaaac caaaagcaga aaagccagct 1260gatcaacaag ct1272<210>32<211>1258<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna的编码链<400>32acagagaacg agagaactac ccaagtaccc acctcttcta ataggggaaa gccagaacgt 60aggaaagctg ctgaacaact cgatgaatac ataaacaaaa tgatccaatt agaraaaaga 120aaacataccc aaaatttagc tttcaacaca cagttgagca gaattaaaac ggagtacttg 180aatggattaa aagagaagtc ggaagctgag ttgccgtcaa aaataaaagc agagttagac 240gcagctttta agcagtttaa aaaagataca tcaccaacag aaccagaaaa aaaagtagca 300gaagctgaga agaaggttga agaagctgag aagaaggtag cagaagctaa gaaaaaagcc 360aaggctcaaa aagaagaaga tcaccgtaac tacccaacca ttacttacaa aacgcttgac 420cttgaaattg ctgagtccga tgcgaaagtt aaagaagcgg agcttgaactagtaaaaaag 480gaagctgacg aatctcgaaa cgagggcaca attaaccaag caaaagcgaa agttgagagt 540gaaaaagctg aggctacaag gttaaaaaaa atcaagacag accgcgaaaa agcagaagaa 600gaagaagcta aacgaagagc agatgctaaa gagcaagatg aatcaaagag gcgaaagagt 660cggggaaaac gaggagctct tggagagcaa gcaacacctg ataaaaaaga aaatgatgcg 720aagccttcag attctagcgt aggtgaagaa actcttccaa gcccatccct gaaaccagga 780aaaaaggtag cagaagctga gaagaaggtt gaagaagctg ataaaaaagc caaggctcaa 840aaagaagaag atcgccgtaa ccacccaacc aatacttaca aaacgcccga acttgaaatt 900gctgagtccg atgtgaaagt taaagaagcg gagcttgaac tagtaaaaga ggaagctaag 960gaatctcgaa acgaggaaaa aattaagcaa gcaaaagcga aagccgagag taaaaaagct1020gaggctacaa ggttagaaaa aatcaagaca gatcgtaaaa aagcagaaga agaagctaaa1080cgaaaagcag cagaagaaga taaagttaaa gaaaaaccag ctgaacaacc acaaccagcg1140ccggctcctc aaccagaaaa accagctgaa gagcctgaga atccagtccc agctccaaaa1200ccagagaarc cagctgaaca accaaaagca gaaaaaccag ctgatcaaca agctgaag 1258<210>33<211>1242<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna的编码链<400>33acagagaacg agggaagtac ccaagcagcc acttcttcta atatggcaaa gacagaacat 60aggaaagctg ctaaacaagt cgtcgatgaa tatatagaaa aaacgttgag ggagactcaa 120ctagatagaa gaaaacatac ccaaaatgtc gccttaaaca taaagttgag cgcaattaaa 180acgaagtatt tgcgtgaatt taatgtttta gaagagaagt cgaaggatga gttgccgtca 240gaaataaaag caaagttaga cgcagctttt gagaagttta aaaaagatac attgaaacca 300ggagaaaagg tagcagaagc taagaagaag gttgaagaag ctaagaaaaa agccgaggat 360caaaaagaag aagaccgtcg taactaccca accaatactt acaaaacgct tgaacttgaa 420attgctgagt tcgatgcgaa agttaaagaa gcggagcttg aactagtaaa agaggaagct 480aaagaatctc gaaacgaggg cacaattaag caagcaaaag agaaagttga gagtaaaaaa 540gctgaggcta caaggttaga aaacatcaag acagatcgta aaaaagcaga agaagaagct 600aaacgaaaag cagatgctaa gttgaaggaa gctaatgtag cgacttcaga tcaaggtaaa 660ccaaaggggc gggcaaaacg aggagttcct ggagagctag caacacctga taaaaaagaa 720aatgatgcga agtcttcaga ttctagcgta ggtgaagaaa ctcttccaag ctcatccccg 780aaaccaggaa aaaaggtagc agaagctgag aagaaggttg aagaagctga gaaaaaagcc 840aaggatcaaa aagaagaaga tcgccgtaac tacccaacca atacttacaa aacgcttgac 900cttgaaattg ctgagtccga tgtgaaagtt aaagaagcgg agcttgaact agtaaaagag 960gaagctaagg aacctcgaga cgaggaaaaa attaagcaag caaaagcgaa agttgagagt1020aaaaaagctg aggctacaag gttagaaaac atcaagacag atcgtaaaaa agcagaagaa1080gaagctaaac gaaaagcagc agaagaagat aaagttaaag aaaaaccagc tgaacaacca1140caaccagcgc cggctactca accagaaaaa ccagctccaa aaccagagaa gccagctgaa1200caaccaaaag cagaaaaaac agatgatcaa caagctgaag aa 1242<210>34<211>1236<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna的编码链<400>34gaaggggtta gaagtgagaa taaccccacg gttacatcta gtgggcaaga tatatcgaag 60aagtatgttg atgaagtcaa gtcacatcta gaaaaaatat tgagtgagat ccaaacaaat120ttagatagaa gtaaacatat caaaactgta aatctaatta acaaattgca agacattaag180agaacgtatt tgtatgaatt aaatgtttta gaagataagt cgaaagctga gttgccgtca240aaaataaaag cagagttaga cgcagctttt gagcagttta aaaaagatac attaccaaca300gaaccaggaa aaaaggtagc agaagctaag aagaaggttg aagaagctga gaaaaaagcc360aaggctcaaa aagaagaaga ttaccgtaac tacccaacca ctacttacaa aacgcctgaa420cttgaaattg ctgagtccga tgtgaaagtt aaagaagcgg agcttgaact agtaaaaaag480gaagctgacg aatctcgaaa cgagggcaca attaaccaag caaaagcgaa agttgagagt540gaacaagctg aggctacaag gttaaaaaaa atcaagacag accgcgaaaa agcagaagaa600gaagctaaac gaagagcaga tgctaaagag caagatgaat caaagaggcg aaagagtcgg660gtaaaacgag gagattttgg agagccagca acacctgata aaaaagaaaa tgatgcgaag720tcttcagatt ctagcgtagg tgaagaaact cttccaagcc catccctgaa accaggaaaa780aaggtagcag aagctgagaa gaaggttgaa gaagctgaga aaaaagccaa ggatcaaaaa940gaagaagatc accgtaacta cccaaccatt acttacaaaa cgcttgaact tgaaattgct900gagtccgatg tggaagttaa aaaagcggag cttgaactag taaaagagga agctaaggga960tctcgaaacg aggaaaaagt taagcaagca aaagcggaag ttgagagtaa aaaagctgag 1020gctacaaggt cagaaaaaat caagacagat cgtaaaaaag cagaagaaga agccaaacga1080aaagcagcag aagaagataa agttaaagaa aaaccagctg aacaaccaca accagcgccg1140gcccctcaac cagaaaaacc agctccagct ccaaaaccag agaatccagc tgaacaacca1200aaagcagaaa aaccagctga tcaacaagcc gaagaa 1236<210>35<211>1218<212>dna<213>人工序列<220><223>描述得自肺炎链球菌的基因组的cdna的编码链<400>35acagagaacg agggaactac ccaagcaccc acttcttcta ataggggaaa tgaaagtcag 60gcagaacata tgaaagctgc taaacaagtc gatgaatata tagaaaaaat gctccaatta 120gatagaagaa aacataccca aaatgtcggc ttacrcacaa agttgggcgc aattaaaacg 180gagtatttgc gtggattaag tgtttcaaaa gagaagtcga cagctgagtt gccgtcagaa 240ataaaagaaa agttaaccgc agcttttaag cagtttaaaa aagatacatt gaaaccagaa 300aaaaaggtag cagaagctga gaagaaggta gcagaagcta agaaaaaagc cgaggatcaa 360aaagaagaag atcgtcgtaa ctacccaacc attacttaca aaacgcttga acttgaaatt 420gctgagtccg atgtggaagt taaaaaagcg gagcttgaac tagtaaaagt gaaagccaac 480gaacctcgag acgaggaaaa aatcaagcaa gcagaagcgg aagttgagag taaaaaagct 540gaggctacaa ggttaaaaaa aatcaagaca gatcgtgaaa aagcagaaga agaagctaaa 600cgaagagtag atgctaaaga gcaagatgaa tcatcaaaga ggcgaaagag tcgggtaaaa 660cgaggagatc ttggagagca agcaacacct gataaaaaag aaaatgatgc gaagtcttca 720gattctagcg taggtgaaga aactcctcca agcccatccc tgaaaccagg aaaaaaggta 780gcagaagctg agaagaaggt tgaagaagct gacaaaaaag ccaaggctca aaaagaagaa 840gatcggggta actacccaac caatacttac aaaacgcttg aacttgaaat tgctgagtcc 900gatgtggaag ttaaaaaagc ggagcttgaa ctagtaaaag aggaagctaa ggaacctcga 960aacgaggaaa aagttaagca agcaaaagcg gaagttgaga gtaaaaaagc tgaggctaca1020aggttagaaa aaatcaagac agaccgcaaa aaagcagaag aagaagctaa acgaaaagca1080gcagaagaag ataaagttaa agaaaaacca gctgaacaac caaaaccagc gccggctcct1140caaccagaaa aaccagctcc aaaaccagag aatccagctg aacaaccaaa agcagaaaaa1200ccagctgatc aacaagct 1218<210>36<211>102<212>prt<213>人工序列<220><223>描述得自共有cdna序列的氨基酸序列<400>36thr glu asn glu gly thr thr gln val ala thr ser ser asn arg ala1 5 10 15asn gln thr glu his arg lys ala ala lys gln val val asp glu tyr20 25 30ile lys lys met leu glu gln leu asp arg arg lys his thr gln asn35 40 45val ala leu asn ile lys leu ser ala ile lys thr glu tyr leu arg50 55 60glu leu asn val leu glu glu lys ser lys ala glu leu pro ser glu65 70 75 80ile lys ala lys leu asp ala ala phe glu gln phe lys lys asp thr85 90 95leu lys thr glu pro gly-100<210>37<211>55<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌基因组的cdna共有序列衍生出的氨基酸序列<400>37asp ala lys leu glu ala thr ser glu gln asp hys pro lys g1y arg1 5 10 15ala lys arg gly val pro gly glu leu a la thr pro asp lys lys g1u20 25 30asn asp ala lys ser ser asp ser ser val gly glu glu thr leu pro35 40 45ser pro ser leu lys pro glu50 55<210>38<211>103<212>prt<213>人工序列<220><223>描述由得自肺炎链球菌基因组的cdna共有序列衍生出的氨基酸序列<400>38lys lys val ala glu ala glu lys lys val glu glu ala lys lys lys1 5 10 15ala lys asp gln lys glu glu asp arg arg asn tyr pro thr ile thr20 25 30tyr lys thr leu glu leu glu ile ala glu ser asp val glu val lys35 40 45lys ala glu leu glu leu val lys glu glu ala lys glu ser arg asp50 55 60glu gly lys ile lys gln ala lys ala lys val glu ser lys lys ala65 70 75 80glu ala thr arg leu lys lys ile lys thr asp arg glu lys ala glu85 90 95glu glu ala lys arg arg ala100
权利要求
1．抗细菌感染的疫苗，所述疫苗包括肺炎球菌表面结合蛋白、类似物或变异体的多肽截短物作为免疫原，其中所述多肽截短物具有就不同肺炎球菌细菌类型而言高度保守的免疫原性α-螺旋部分，并且所述多肽并不包含胆碱结合部分。
2．依照权利要求1的疫苗，其中所述α-螺旋部分的氨基酸序列相对于seq id no:1的氨基酸序列有至少75％同一性。
3．依照权利要求1的疫苗，其中所述α-螺旋部分的氨基酸序列相对于seq id no:1的氨基酸序列有至少85％同一性。
4．依照权利要求1的疫苗，其中所述α-螺旋部分的氨基酸序列相对于由以下选出的一种氨基酸序列有至少90％同一性(a)seq id no:1的氨基酸序列，和(b)seq id no:19的氨基酸序列。
5．依照权利要求1的疫苗，其中所述α-螺旋部分的氨基酸序列相对于由以下选出的一种氨基酸序列有至少95％同一性(a)seq id no:1的氨基酸序列，和(b)seq id no:19的氨基酸序列。
6．依照权利要求1的疫苗，其中所述疫苗用于预防或治疗中耳炎、脓毒病、脑膜炎以及大叶性肺炎感染。
7．依照权利要求6的疫苗，其中所述疫苗针对侵袭性感染。
8．依照权利要求6的疫苗，其中所述疫苗针对由肺炎链球菌引起的中耳炎感染。
9．依照权利要求1的疫苗，其中所述多肽截短物包括与由seq idno:3到18的每一种的氨基酸序列选出的一种有至少90％同一性的氨基酸序列。
10．依照权利要求1的疫苗，其中所述多肽截短物包括与由seqid no:3到18的每一种的氨基酸序列选出的一种有至少95％同一性的氨基酸序列。
11．针对免疫原产生的抗体，所述免疫原是肺炎球菌表面结合蛋白、类似物或变异体的多肽截短物，其中所述多肽截短物具有就不同肺炎球菌细菌类型而言高度保守的免疫原性α-螺旋部分，并且所述多肽并不包含胆碱结合部分。
12．依照权利要求11的抗体，其中述α螺旋部分的氨基酸序列相对于seq id no:1的氨基酸序列有至少85％同一性。
13．依照权利要求11的疫苗，其中所述α-螺旋部分的氨基酸序列相对于由以下选出的一种的氨基酸序列有至少90％同一性(a)seq id no:1的氨基酸序列，和(b)seq id no:19的氨基酸序列。
14．依照权利要求11的抗体，其中所述α-螺旋部分的氨基酸序列相对于由以下选出的一种的氨基酸序列有至少95％同一性(a)seq id no:1的氨基酸序列，和(b)seq id no:19的氨基酸序列。
15．依照权利要求11的抗体，其中所述多肽截短物包括与由seqid no:3到18的每一种的氨基酸序列选出的一种有至少95％同一性的氨基酸序列。
16．依照权利要求11的抗体，其中所述抗体是可以检测肺炎链球菌感染的抗体。
17．依照权利要求15的抗体，其中所述抗体对预防和/或治疗肺炎链球菌感染有效。
18．依照权利要求15的抗体，其中所述抗体对预防和/或治疗由肺炎球菌细菌1-5、6a、6b、7f、8、9n、9v、10a、11a、12f、14、15b、17f、18c、19f、19a、20、22f、23f和33f型引起的肺炎球菌感染有效。
19．预防和/或治疗宿主中肺炎球菌感染的方法，该方法包括用由以下选出的一种免疫所述宿主(a)依照权利要求2的疫苗，以及(b)针对免疫原产生的至少一种抗体，所述抗原是肺炎球菌表面结合蛋白、类似物或变异体的多肽截短物，所述多肽截短物包括与由seq id no:3到18选出的一种的氨基酸序列有至少90％的同一性的氨基酸序列，其中所述多肽不包括胆碱结合部分。
20．一种多肽，该多肽包括相对于由seq id no:3到18的每一种的氨基酸序列选出的一种有至少90％同一性的氨基酸序列。
21．一种分离的多核苷酸，该多核苷酸包括与由以下选出的一种有至少90％同一性的多核苷酸序列(a)编码多肽的多核苷酸编码序列，所述多肽包括由seq id no:3到18的每一种的氨基酸序列选出的一种，以及(b)(a)的互补物。
全文摘要
本发明提供用于给予人类和人类以外动物以刺激免疫应答的细菌性免疫原剂。本发明特别涉及用肺炎球菌来源的多肽免疫接种哺乳动物物种,所述免疫接种的作用机制是刺激产生保护所述疫苗接种接受者免遭各种致病菌感染的抗体,其中所述多肽含有α螺旋但是不含胆碱结合区。另一方面,本发明提供针对这样的蛋白和蛋白复合物的抗体,该抗体可用作各种致病菌的诊断试剂和/或保护/治疗剂。
文档编号c07k16/12gk1315870sq99807022
公开日2001年10月3日申请日期1999年4月6日优先权日1998年4月7日
发明者t·m·维泽曼, s·科尼格, l·s·约翰逊申请人:免疫医疗公司