橡胶树基因组数据库HeveaDB功能简介

热科院橡胶所程汉

<h3>  近些年来,随着基因组测序技术的进步,已有四个国家(马来西亚、泰国、中国和日本)独立绘制并公开发表了橡胶树基因组草图,其中由中国热带农业科学院橡胶研究所完成的草图版本质量最高。同时还产生了大量转录组数据。这些数据亟需一个整合的数据平台来储存、分发和共享,并进行二次挖掘利用。2017年在雅加达召开的IRC2017国际橡胶会议上提出来要搭建橡胶树基因组数据中心的计划。在IRRDB理事会上中国热科院代表经过争取,获得了牵头搭建橡胶树数据中心的任务。经过几个月的努力,橡胶树基因组数据库HeveaDB初期版本在4月底终于上线试运行。<br>  HeveaDB数据库主要储存了4个版本的基因组、1个遗传图谱、142个转录组数据、49235条EST序列、30200个基因注释、12个基因家族的信息,以及5049个IRRDB 1981’野生种质资源材料和18328个魏克汉材料信息。并对中国热科院橡胶研究所完成CATAS7-33-97品种的基因组数据为参考基因组,进行了二次挖掘和分析,进行可视化展示。主要特色功能有:基因组Gbrowse和Jbrowse可视化浏览、表达谱的heatmap展示和检索、共表达网络展示等。下面对这些功能进行详细介绍。<br></h3> <h3><b>1、 网址和访问</b><br>打开http://hevea.catas.cn,可以看到HeveaDB的首页(如下图),数据库全部功能都在首页菜单栏里。大家可以用鼠标移至各菜单上面去看看都有哪些子菜单。<br><br></h3> <h3><b>2、 基因信息页面</b><br></h3><h3> 每条基因信息页面均可通过网站中的各个链接打开,页面主要提供以下信息:</h3><h3> 名称、基因组位置信息、基因结构信息、表达谱信息、共表达网络、基因序列(包括基因组序列、转录本序列、CDS序列和推测的多肽序列)、基因注释信息等。在基因组序列框(图中红色方框)内,可以通过输入上下游位置截取相应的启动子等基因组序列。</h3><br> <h3><b>3、 检索</b><br> 检索是HeveaDB获取数据信息的主要方式。主要有基因检索、Marker检索、共表达网络检索、种质资源检索和实验方法检索等。<br><b>基因检索</b><br> 打开基因检索页面,如下图所示。在红色方框内选取检索字段类型:基因的ID、蛋白的ID和注释文本信息检索。在绿色方框内输入检索内容,如选择基因ID检索则输入基因的ID(如scaffold0001_403263),如果选择注释文本信息检索,则输入需要检索的基因注释字段(如WRKY等),然后点击search进行检索。<br><br></h3> <h3>  如果检索结果唯一,则直接跳转至详细的注释页面。如果有多个匹配则以列表的形式给出,然后根据需要点击每条基因链接进入其注释页面。该检索结果还可以通过选择数据库和重新输入关键词的方式重新检索。</h3> <h3><br></h3> <h3></h3><h3> 基因检索还有另外一个入口Data——Annotation。</h3><h3><br></h3><h3><b>Marker检索</b><br> HeveaDB收录了泰国Pootakham等2015年发表的遗传图谱,在Search——Marker页面输入marker名称即可进行检索。也可以在Data——Marker页面点击各连锁群进行浏览。<br><br></h3> <h3><b>共表达网络检索</b></h3><h3><h3>(http://hevea.catas.cn/coexpression/v1/toCoexpression)</h3> 共表达网络是基于142个转录组表达数据构建,Weight阈值设定为0.3。在Search——Network页面输入基因ID号,最多可输入100个ID号。<br><br></h3> <h3><b>种质资源检索</b><br>数据库收集了5049个IRRDB 1981’野生种质资源材料和18328个魏克汉材料信息,可以分别在Search页面下的Wickham Germplasm和Wild germplasms页面进行检索。输入相应的种质资源名称即可查询到相应种质资源的信息。支持模糊检索。<br><br></h3> <h3><b>4、 表达谱浏览</b><br> 打开Tools——Expression visualization页面,在红色方框的表单内输入基因ID号,多个ID间用逗号或空格分开,在绿色方框的复选框内选择需要查看的样品、组织、处理等。然后点击Display Expression Heatmap,即可查看这些基因的表达信息。<br><br></h3> <h3>  结果如下图所示。每行为一个基因(红色方框)每一列为每个样品,样品信息在绿色方框内,也可以将鼠标移至热图上,浮动框显示样品信息。如果想查看FPKM数值,则点击蓝色方框内的Display FPKM查看。</h3> <h3><b>5、 数据下载</b><br>数据库提供数据下载功能,在download页面提供各种原始数据下载。<br><br></h3> <h3><b>6、 比对和序列获取</b><br> 数据库提供Tools——Blast和Tools——Blat两种序列比对方式。在各自页面输入待比对序列,和目标数据库进行比对。<br><br></h3> <h3>  可以在红色方框里选取需要比对的基因组版本,或者改变其他比对参数。</h3> <h3>  Blat结果以列表的形式展示,点击进入感兴趣的比对区域进行查看。</h3> <h3><b>7、 注册和登入</b><br> HeveaDB使用不受限制,但我们还是强烈建议注册自己的用户名。有些高级功能可能需要通过登入才能使用。点击首页右上角的login即可进入登入和注册页面。注册和使用都是免费的哦。<br><br></h3> <h3>  好了,HeveaDB的主要功能就简单介绍到这里,其实数据库中还有其他的功能没介绍到的,还等大家去使用发掘。目前该版本的数据库只是第一版,后面还会继续开发新的功能,大家需要什么样的功能,不妨告诉我们,也许在下一个升级版本中就能实现了呢。</h3>