请问有谁去ucsc genome browser啊?

UCSC Genome Browser是由University of California Santa Cruz (UCSC)
创立和维护的,该站点包含有人类、小鼠和大鼠等多个物种的基因组草图,并提供一系列的网页分析工具。站点用户可以通过它可靠和迅速地浏览基因组的任何一部分,并且同时可以得到与该部分有关的基因组注释信息,如已知基因,预测基因,表达序列标签,信使RNA,CpG岛,克隆组装间隙和重叠,染色体带型,小鼠同源性等。用户也可以因为教育或科研目的加上他们自己的注释信息。UCSC
Genome Browser目前应用相当广泛,比如Ensembl 就是使用它的人类基因组序列草图为基础的。
用户在使用数据库及其工具(Genome Browser、Table Browser、Gene Sorter、Proteome
Browser、VisiGene、Genome
Graphs、BLAT等)时可以从以下站点获得大量的适时帮助,包括http://genome.ucsc.
edu/goldenPath/help、http://genome.ucsc.edu/FAQ、等。还可以写邮件到genome@soe.ucsc.edu获得帮助。
1 新物种信息
目前,GBD新增了13个新物种的基因组序列信息,包括猩猩、绒猴、豚鼠、斑胸草雀、八目鳗、文昌鱼和三种线虫品种——brenneri、remanei、japonica在内的9个以前没有收录的物种信息,以及牛、斑马鱼、海胆、秀丽隐杆线虫(C.elegans)这4个已收录物种的更新信息。GBD为每一个新信息都提供了注释,也将这些信息和GenBank中的其它物种序列进行了比对。此外,他们还对上述9种新物种信息中的7个物种进行了多重比对注释,还将6种蠕虫的序列和最新的秀丽隐杆线虫序列进行了比对。
2 UCSC基因组数据库的新注释信息
除了收录新物种序列之外,GBD还在去年新增了200多条注释信息。可以点击Genome
Browser上的相应按钮获得更多新注释信息。
对人类基因组集合(数据库)hg18和基因及基因预测组(Genes and Gene Prediction Track
Group)中的Pos Sel基因进行新的注释后发现了承受正向选择压力(positive
selection)的基因。网站上显示了通过对人类、黑猩猩、猕猴、小鼠、大鼠和狗基因组进行多基因组比对后筛出的全基因组范围内承受正向选择压力的基因。同时,还使用了9种基于Yang和Nielsen发明的branch-site
framework模型的似然比检验法(likelihood ratio
test,LRT)对一些直系同源基因进行了检测来验证上述结论的正确性。
开放的调控元件注释项目(Open Regulatory
Annotation,OregAnno)的研究已经取得了一定成果,获得了人类、小鼠、黑腹果蝇和酵母这四种模式生物调控元件的注释信息。每一条
OregAnno的注释信息包括经过试验验证后公开的基因调控序列(如启动子、增强子等)、转录因子结合位点以及调控区域的多态性(regulatory
polymorphism)等信息,同时每一条OregAnno的注释信息也都会链接到OregAnno数据库。
数据库中,人类目录下现在还收录了Kidd等人对国际人类基因组单体型图计划(HapMap
Project)里8个人的序列同参考序列比对后获得的注释信息(HGSV Discordant
Track)。这些注释信息显示了那些人类序列中与参考序列的不符之处,表明该处可能存在着大段的缺失或插入序列,这对寻找人类基因组中的变异具有非常重大的意义。
小鼠mm9集合(数据库)现在提供了小鼠与其它30种脊椎动物的比对信息。这些比对信息是通过多重比对和phastCons计算(phastCons
computation)之后得出的,它们有助于了解不同物种之间在进化上的相关性。GBD还在小鼠mm9集合(数据库)中新增了一个子数据库用来收录从维尔康姆基金会桑格研究所(Wellcome
Trust Sanger Institute)miRBase数据库中获取的microRNA信息。
在大鼠rn4集合(数据库)中GBD还提供了从RGD中获取的数量性状基因座(QTL)信息。这些QTL信息与大鼠基因组中1000多个与血压、血糖等处于持续动态波动之中的表型特征相关基因座有关。
在dm3基因组数据库中收录有黑腹果蝇基因组中超过7500个基因插入突变的注释信息。通过网站上提供的这些注释信息加上与位于美国布鲁明顿的信息储存中心之间的链接,可以发现果蝇基因组中由P元件和Minos元件导致的插入。
3 UCSC基因组数据库新收录的基因
2008年9月,最新版的UCSC基因数据——hg18人类基因数据集发布。UCSC基因注释信息包括参考各种数据库(RefSeq、UniProt、GenBank)后使用比较基因组学方法得出的已知编码基因和非编码基因的多种异构体信息。
在CCDS信息和
RefSeq信息不一致时,最新的UCSC基因注释信息就会使用CCDS蛋白质信息来选择最合适的比对结果。GBD做出这个选择是因为他们相信国际公认的蛋白质信息比随便比较一下基因串联重复序列和转录体RNA
5’端所获得的差别更有意义。例如在对人类基因IFI35(位于hg18 chr17:38,418,889-38,419,044上,
http://genome.ucsc.edu/cgibin/hgTracks?db=hg18&
position=chr17:19044&knownGene=pack&refGene=pack)第四号外显子和第五号外显子之间的剪接情况进行注释时,他们选择的就是CCDS信息。
新的UCSC基因库中包括66,803个基因(包括异构体)信息,其中13,767个基因是非编码基因,这些基因共组成26,570个基因簇(表1)。
这次更新还在Genome
Browser中新增了与外部数据库中几种模式生物内直系同源基因之间的链接。这些模式生物数据库包括小鼠基因组数据库(MGD)、大鼠基因组数据库(RGD)、斑马鱼信息库(ZFIN)、线虫信息库(WormBase)、果蝇信息库(FlyBase)和酵母基因组数据库(Saccharomyces
Genome Database)。他们还计划继续定期更新,以保证人类基因组数据和小鼠基因组数据都是最新最全面的。
使用Genome Browser浏览UCSC数据库中某一个基因的注释信息,只需要在Genome
Browser网页的搜索框中输入该基因的名称等关键词就可以了。同时,可以使用各种基因标识符来进行搜索,例如HGNC名称、UniProt
ID、即使是GenBank或UniProt中对该基因的一些描述性关键词都行。通过搜索还可以发现与目的基因产物间有相互作用的基因,对这些基因的注释以RefSeq形式给出。
UCSC Gene track页面还包括与网站内资源之间的链接,例如与GeneSorter、Proteome
Browser、VisiGene、in situ hybridization image
archive等页面的链接。今年还新增了与艾伦脑科学研究所(Allen Brain Institute)的Human Cortex
Gene Expression data数据库、Human Genome
Epidemiology(HuGE)data数据库、Comparative Toxicogenomics
Database(CTD)等外部数据库之间的链接。
4 基因变异信息
hg18人类基因库提供了大量人类基因变异信息,其中有一些信息是去年才新增的。尤其值得一提的是他们从dbSNP
129中补充了一些以前dbSNP 128和dbSNP 126中没有的SNP信息。
Browser中可以查询到这些SNP信息的详细情况,包括SNP的类型(例如编码区、非编码区、同义突变等等)。GBD现在还能将包含这些SNP位点的序列与参考序列进行比对。此外,为了用户比较的方便,他们还给出了几种灵长类动物(黑猩猩、猩猩、猕猴)的直系同源基因供大家使用。图1就显示了SNP
129网页查询SNP rs 1128456的部分结果。
此外,他们还从dbSNP 128中获取信息更新了mm9 SNP注释信息,从dbSNP
127中获取信息更新了bosTau3牛数据库信息。
GBD使用比较基因组学对人hg18数据库的注释进行了更新,比较了人、小鼠和狗的基因组进化上保守的部分,找出了人类参考基因组序列中的小插入或缺失片段。其它新增的hg18变异信息还包括DGV结构变异信息(DGV
Structural variants)、Segmental Dups、Exapted Repeats、Interrupted
Repeats等。
根据NIH的决定,UCSC移除了威康信托基金会病例控制协会(Wellcome Trust Case Control
Consortium)的研究数据以及NIMH对躁狂抑郁双向障碍的研究数据,因为这些数据有可能会在某些特性情况下泄露患者的隐私,这与研究的本意是相悖的。他们还将继续与其它国际研究机构合作,研究如何才能更好的保护那些参与人类基因组相关研究(genome-wide
association
studies,GWAS)的志愿人员的隐私。他们将来会在保护个人隐私的前提下提供更多的GWAS数据,也会提供更新的图像化工具来浏览、分析临床试验数据。
5 Transmap
有一组新的数据GBD称之为Transmap,并把Transmap放在了脊椎动物基因组集合下。Transmap是在不同物种间使用同线性过滤配对基因组比对的方法(synteny-filtered
pairwise genome
alignment)来发现这些物种间最有可能的直系同源基因及其相应的注释信息。TransMap中每一条信息都包括mRNA、RefSeq、UCSC
Genes等各方面的证据。例如,就人类mRNA证据来说,TransMap使用了23种脊椎动物的超过400,000条mRNA与库中的人类mRNA进行了高严谨性的BLAT比对。然后又使用Blastz这种在区分不同物种的能力上比BLAT更强的方法再次进行了比对。与translated
BLAT法(Non-Human RefSeq
Gene,图2)相比较,TransMap发现的旁系同源基因更少,而比较的UTR碱基更多(图2)。
为了研究密切相关的低覆盖率基因组数据,使用的比对方法采用了相互最佳关系,以此来提高线性预测的准确性。就像GBD中所有的注释信息一样,数据库的结构信息也能从相应的Genome
Browser页面中了解到。
6 新的基因分类(Gene Sorter)
用户可以使用Gene
Sorter借助不同的标准,例如基因表达谱或蛋白同源性以及其它的一些用户自行设定的条件对基因进行分类。通过网页上的链接可以很方便地切换到
Browser页面和其它的UCSC网站页面,了解更多的表达谱信息、蛋白间相互作用信息和其它的相关信息。去年,GBD还在Gene
Sorter中添加了几个新的内容,现在Gene
Sorter可以对人类、小鼠、大鼠、秀丽隐杆线虫、黑腹果蝇和酵母等六种模式生物的基因进行分类。
内含子大小栏目(Intron Size column)能显示每一个基因内最大的或最小的内含子;编码SNP栏目(Coding SNP
column)能快速地了解外显子多态性相关信息;CDS值(CDS Score)表示该基因是编码基因的可能性大小;基因分类(Gene
Category)能对基因按编码、非编码、反义等情况进行分类;外显子计数(Exon
Count)记录外显子数目(见图3)。
7 新的显示特点
GBD在去年为 Genome
Browser新增了几项显示特点,其中很多都是按照用户的反馈在实用性方面做出的一些改进。碱基位置跟踪(Base Position
track)现在可以提供一个选项,即在网页上自动显示缩放条配置。在网页下方的反转按钮(Reverse
button)能让用户方便的将整条序列反向显示,这样就能从5’-3’方向来显示用户的目的基因了(图2)。现在,直接在定位框(Position
box)中输入“坐标值(coordinate)”来定位到一个核苷酸也是允许的了,例如输入chr1:就能定位到SNP
rs 1128456位点(也可以在框中直接输入SNP的rs号)。
此外,在网页中还做了几项改进;例如,Track
group增加了下拉菜单,这样用户就可以隐藏不需要或不感兴趣的选项了。Tracks也可以轻易的从一个组(group)移动到另一个组,包括移动到网页顶部的Custom
group,这样用户就能在一个地方选择所有感兴趣的选项了,这项功能是大多数网站都不能提供的。现在每一个选项的标签上都有一个刷新按钮,这样用户就不需要频繁的滚动页面修改选项了。网站上还有许多“隐藏的”改进之处。为了减少网页中用于控制图像的“路径(track)”数,加快网页的刷新速度,网站将相关的“路径”都组合到一起形成“超级路径(super-track)”来共享配置选项。
用户进入多重比对网页可以获得genome
browser网页中没有的低覆盖率物种的基因组DNA序列。使用UCSC在线验证PCR(UCSC In-silico
PCR)功能还能让用户在Genome
Browser网页上直观的看到PCR扩增片段与其它序列(例如最有用的外显子或内含子)的关系。如果PCR引物与参考序列不相符,网页上会以红色高亮的方式标示出它们之间的差别。
8 用户自定义选项功能的增强
UCSC Genome Browser提供的用户自定义选项功能允许用户按照自己设定的条件只浏览感兴趣的数据结果。
新增了两种用户自定义数据时提交的数据格式。
用户自定义数据的内在表示法现在是基于专用机器的数据库表,而不再是以前所使用的基于文件系统的执行命令。
最近几年,Genome
Browser中最受广大用户欢迎的工具就是“作业保存(session-saving)”功能,用户使用该功能能够保存并共享多个浏览器配置文件以供日后再次使用。与“作业保存”功能相关的用户选项功能也得到了增强。
因为有许多网页设置,还有几乎无数的设置与显示选项组合配置,所以Genome
Browser使用了cookies来保存这些设置。
9 未来的发展方向
UCSC将持续收录新的脊椎动物和非脊椎动物模式生物的基因组数据。他们会与NCBI和Ensembl保持密切合作,为获得及处理新数据制定出标准化的的流程,以保证所有机构的数据都是一致的。
他们希望能为2&覆盖率的基因组计划(2&coverage species
project)提供包含44种物种基因组的多重比对,还希望能为最新的人类基因组数据提供扩展的多重比对。千人基因组计划(1000
Genomes project)获得的数据也将收录进变异信息库,还将收录重组热点的高分辨率图谱(high-resolution
maps of recombination hotspot)。
此外,GBD还计划对网站进行进一步的升级。例如扩展网站工具的实用性和可配置性,升级isPCR功能,能让用户查询“RNA空隙(RNA
space)”来比对被内含子隔开的序列,还将继续升级用户自定义系统使其支持混合格式数据。
在接下来的几年中,我们计划能让用户在Genome
Browser上直接输入信息,就像wiki做的那样,这样各种“基因专家”们就能在网站上发表评论、数据和其它各种信息。最后要说的是,UCSC一直在与全球传染性疾病控制组织(Global
Solutions for Infectious
Diseases)合作开发限制访问的医药数据系统,例如HIV基因组数据和相关临床数据。我们还与几个研究机构合作建立了癌症基因组网站(cancer
browser)。如果网站的访问和保密问题解决了,我们将很快推出该网站。&
UCSC browser Guide.pdf (1835.27k)&&
呵呵,freecell版主的这个帖子很好啊,核酸水平的话我个人还是最喜欢UCSC。它快,全,可视化,可以发掘到很多信息。现在还是推荐用06年的版本,新版本有很多信息不全类。我还是接着freecell版主的话题,联系我平时用到的补充一些,希望对大家有帮助!
UCSC链接http://genome.ucsc.edu/,UCSC的主页面里有GENOMES,BLAT,TABLES,GENE
SORTER,PCR,VISIGENE,PROTEOME
这些选项。GENOMES,BLAT,PCR,PROTEOME这些个功能最为常用,我一个个来介绍。
一,GENOMES
推荐选用06年版本,position or search
term里可以输入:1,物理位置,如:chr17:34155(标点必须换成英文格式)。2,基因名或蛋白名称,如SOX9。3,NCBI标准的基因号,如NM_,标准SNP名称或microRNA名称,如rs或者hsa-mir-200a。5,如果想查找两个遗传学marker或者芯片探针之间的序列,则直接输入标准名称用英文的分号隔开,如:rs;rs或者PMC34415P1;WI-5830。6,可直接查询BAC克隆和FISH克隆,直接输入标准克隆号就行。如:CTD-2309E11或RP11-84E24。我以SOX9基因为例,说一下GENOMES的用法。GENOME里有很多TRACKS:1,STS
marker主要用于遗传学中的连锁分析。2,FISH和BAC可用于肿瘤学或遗传学中CNV分析或者转基因载体构建。3,GC
percent可以用于预测基因5’端的甲基化可能性,亦可为PCR提供借鉴。4,OMIM GENE/UCSC GENE/Ref
GENE:OMIM基因显示与人类遗传病相关的基因,默认红色为致病或易感基因;UCSC基因为UCSC数据库收录的基因,有些为未验证的基因;Ref基因为NCBI的标准基因,已认证过的基因,所以一般选用Ref基因序列。OMIM/UCSC/Ref基因链接进去有比较详细的序列说明和简要的功能相关信息。5,HUMEN
EST可帮助发现新的转录本或新基因或其他调节性小肽。6,Affy
exon芯片探针和结果。7,转录因子结合位点,microRNA靶位点(预测),物种间保守性和SNP。8,Affy
SNP/CNV及illumina芯片探针位置。9,DGV选项为DGV数据库中人类基因组各种多态性信息,包括CNV,inversion,indels。10,REPEAT原件和微卫星marker,用于重组机制分析和连锁分析。
BLAT分析也是基于序列比对,但较NCBI
BLAST就相当不严格了。可用于突变序列筛查,引物初步比对等。但由于UCSC可视化的窗口,比对结果与其他GENOME里的信息在一起比较,更直观,容易突发奇想。BLAT可实现多序列比对功能,在序列框里按FASTA格式输入序列即可。
UCSC的PCR选项为电子PCR,输入引物(&15bp,除去酶切位点和保护碱基),即可得到两引物间序列。UCSC是基于基因组而非转录组,如果两引物间隔很大,则先调节Max
Size。UCSC自动预测的TM值是基于primer3的,跟我们用的DNAman算出来的值也比较接近,PCR时可直接使用其退火温度。
四,PROTEOME :提供蛋白序列,结构域,3D结构等最基本的说明。&
(转发自丁香园论坛-医学/药学/生命科学论坛)
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。请问有谁去过方特科幻主题公园啊,好玩吗?_百度知道
请问有谁去过方特科幻主题公园啊,好玩吗?
哪个更好玩,比起深圳的欢乐谷,有没有人去过啊近期想和老公还有朋友一起去安徽芜湖的方特科幻主题公园
我有更好的答案
按默认排序
源方特科幻公园是一个以现代高科技技术为基础。  金源方特科幻公园由银河广场、数字影视,创造了一批形式新颖、生命之源。公园中项目的规划安排突出了求知,惊险刺激、光学与声控等高科技手段、购物等其他配套设施、太空山、模拟仿真,是一个旅游度假的好去处,使金源方特科幻公园不仅具有世界一流的水准,活泼健康,惊险刺激,参与性强的主题项目,内容丰富、西部追忆、恐龙危机、旅游团体以及家庭游客的要求。因此我们说金源方特科幻公园既是一个科技博物馆,参与性强的主题项目、恐龙危机,每个主题项目的第一部分都是一个学科的知识汇集、儿童天地等九个主题项目组成、数字影视、西部追忆。
金源方特科幻公园提倡科技进步,活泼健康、学习,努力进取、飞越极限、儿童天地等九个主题项目组成,寓教于乐,寓教于乐,第二部分则是结合这些知识的参与型体验项目,创造了一批形式新颖、影视特技摄影棚,一个青少年科技活动的基地。
金源方特科幻公园由深圳华强集团、太空山、生命之源、文明之光。我个人更喜欢深圳欢乐谷、文明之光、方特投资发展有限公司以及重庆金源时代购物广场中心共同投资兴建,总面积近 4 万平方米 、探索、模拟仿真。金源方特科幻公园的投资者大量运用现代计算机,能够满足学生团体,与 40 万平方米的重庆金源时代购物中心相互呼应,公园中项目不仅能够适应不同年龄层游客的需要。金源方特科幻公园的投资者大量运用现代计算机、影视特技摄影棚。金源方特科幻公园是一个标准的旅游公园、自动控制、飞越极限,勇敢探索的精神,其各个项目还深受游客的喜爱,呵呵。公园位于重庆江北区滨江路、重庆金源集团、光学与声控等高科技手段,内容丰富,积极向上,同时又是一个典型的高科技主题公园,而且还有餐饮,其各个项目还深受游客的喜爱,使金源方特科幻公园不仅具有世界一流的水准、自动控制、体验的主旋律,可以同时接纳
名游客,以青少年科技活动以及旅游游乐为目的的现代都市主题公园。金源方特科幻公园由银河广场
其他类似问题
主题公园的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁请问最近有谁去香港怎么翻译_百度知道
请问最近有谁去香港怎么翻译
我有更好的答案
按默认排序
Is there anyone going to HK recently?
其他类似问题
去香港的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁丁香客App是丁香园社区的官方应用,聚合了丁香园论坛和丁香客的精彩内容。医生可通过丁香客App浏览论坛,也可以在这个医生群集的关系网络中分享和互动,建立更广泛的学术圈子。
扫描二维码下载
今日:8 | 主题:81704 | & 收藏本版
每发1个新帖可以获得0.5个丁当奖励
求助UCSC一个问题
求助UCSC一个问题
分享到哪里?
这个帖子发布于5年零206天前,其中的信息可能已发生改变或有所发展。
在UCSC里比对了两段DNA序列,我输入的序列都是从5‘到3',比对结果里refgene里的箭头有的向左有的向右,请问这个是什么原因呀?下图是个左向箭头的图
回复:求助UCSC一个问题
分享到哪里?
下面是个向左的箭头
回复:求助UCSC一个问题
分享到哪里?
这有什么奇怪的呢,这个基因是负链转录的啊,
回复:求助UCSC一个问题
分享到哪里?
这一行是一个转录本吗?如果是那转录本的名字是?
关于丁香园

我要回帖

更多关于 ucsc排名 的文章

 

随机推荐