首页

DNA条形码 我国动物药材DNA条形码数据库

点击:0时间:2025-10-20 04:53:56

石林春+姚辉+谢丽芳+朱英杰+宋经元+张辉+陈士林

[摘要]课题组联合相关研讨者展开动物药材DNA条形码分子断定研讨,并结合剖析GenBank序列,选用BLAST剖析防错、体系树剖析防错和Barcoding Gap查验防错等办法核验序列的可靠性,构建了我国动物药材DNA条形码数据库。该库由样品数据库、序列数据库和文献数据库组成,包括800余种动物药材和很多动物药材混伪品及密切相关物种。我国动物药材DNA条形码数据库可以经过中药材DNA条形码断定体系(www.tcmbarcode.cn)进行网络拜访并完成不知道动物样本的DNA条形码断定。该研讨初次构建一致的我国动物药材DNA条形码数据库,对动物药材断定、资源可持续运用和濒危物种维护均有重要意义。

[关键词]动物药材;数据库;COI;断定

DNA条形码技能是动物药材断定的新东西[1],国家药典委员会已评论经过在《我国药典》增补本中列入中药材DNA条形码分子断定辅导准则[2]。本课题组联合相关研讨者展开了很多的动物药材DNA条形码分子断定研讨工作。鄢丹等对包括羚羊角、鹿角的传统角类药材进行DNA条形码研讨[3],并以此为根底提出了濒危动物药材的交易监控和替代品寻觅战略[4]。张辉等对《我国药典》45种动物药材及其混伪品进行DNA条形码研讨,成果表明45种动物药材的正品来历与其混伪品均可彼此区别[5]。崔丽娜等运用COI序列对金钱白花蛇及其常见混伪品进行DNA条形码辨别研讨,成果表明,金钱白花蛇COI序列可以明确地与混伪品区别开[6]。胡嵘等对海马、海龙及其混伪品共14个种20份样品的COI条形码序列进行研讨,成果表明运用COI序列可以精确断定海马、海龙的基原动物及其混伪品[7]。此外,还展开了龟甲、鳖甲、鹿茸以及蛤壳等的DNA条形码研讨工作[8-11]。动物DNA条形码分子断定研讨工作的很多展开,为构建我国动物药材DNA条形码数据库奠定了根底。

DNA条形码数据库不仅是存储样品信息和DNA条形码序列的东西,并且是DNA条形码研讨和物种断定剖析的生物信息学渠道,对推进DNA条形码研讨展开具有重要意义[12]。第一个世界DNA条形码数据体系(BOLD)由世界生命条形码联盟(CBOL)于2007年树立[13]。此外,世界上还有多个针对特定动物类群的条形码数据库,如:Fish Barcode of Life Campaign (FISH-BOL,http://www.fishbol.org/),Lepidoptera Barcode of Life(http://lepbarcoding.org/),Mammalia Barcode of Life Campaign(http://www.mammaliabol.org/)。此外,邵鹏柱等开始构建了传统药物DNA条形码数据库(http://137.189.42.34/mherbsdb/),包括1 661个物种,36 679条序列[14]。当时,我国没有构建一致的动物药材DNA条形码数据库,限制了DNA条形码技能在动物药材断定、资源可持续运用和濒危物种维护中的进一步运用。

1 资料

我国动物药材DNA条形码数据库中的序列来自于课题组联合相关研讨者所展开的动物药材DNA条形码分子断定研讨及GenBank,包括800余种动物药材和很多动物药材混伪品及密切相关物种(表1)。

2 办法

对包括测序峰图的样品,依据Q值进行单碱基和序列质量检测。对不包括测序峰图的样品,运用EMBOSS Transeq将核酸序列翻译为蛋白序列,运用隐马尔可夫模型(hidden Markov model,HMM)进行COI条形码区域核验[13]。选用BLAST剖析防错、体系树剖析防错和Barcoding Gap查验防错等核验COI序列的可靠性[2],运用Muscle 3.8 进行多序列比对[15],运用Paup 4.0进行遗传间隔核算[16],运用MEGA 6.0构建NJ(邻接法)体系聚类树[17]。运用BLAST办法进行物种断定剖析,运用MySQL进行数据库办理,经过MySQLdb衔接MySQL数据库。

3 成果与评论

3.1 数据库构成 我国动物药材DNA条形码数据库由样品数据库、序列数据库和文献数据库构成。样品数据库包括完好的样品搜集和断定信息,即:样品编号、分类信息、凭据信息、搜集者、搜集地、断定者、1张到数张样品及生境相片等。从GenBank中下载GB格式文件,运用BioPython进行解析。仅保存物种分类位置明晰,拉丁名不包括“sp.”,“spp.”等字符的Record。提取Record注释中基因名称为“COI”或“CO1”区域的序列,如Record来自于已宣布的文献,搜集该文献的PubMed ID、标题、作者、期刊、摘要等信息构成文献数据库。此外,文献数据库还包括本课题组联合相关研讨者所展开的动物药材DNA条形码分子断定研讨文献。我国动物药材DNA条形码数据库包括2010年版《我国药典》[18]和《我国药用动物志》(第2版)[19]所载800余种动物药材和很多动物药材的混伪品和密切相关物种的COI序列。此外,我国动物药材DNA条形码数据库还包括样品搜集、样品处理、DNA提取、PCR 扩增、测序、序列拼接及成果断定等的规范操作办法和技能流程(图1)。

3.2 数据库动态办理 我国动物药材DNA条形码数据库每6个月更新1次。新添加样品如包括测序峰图,则按照中药材DNA条形码分子断定辅导准则去除测序峰图两头的低质量区域[2],即:以20 bp的窗口分别从序列5′端和3′端进行滑动,假如窗口内有多于2个碱基的Q值<20,则删去1个碱基,窗口持续滑动1个碱基;假如窗口内碱基Q值小于20的数目≤2,窗口中止滑动。测序峰图的剩下部分须≥300 bp,均匀Q值≥30。拼接成果长度须大于500 bp,Q值小于20的碱基数须≤1%,均匀Q值须≥40。新添加样品如不包括测序峰图,运用EMBOSS Transeq将新添加COI序列翻译为蛋白序列,运用隐马尔可夫模型进行COI条形码区域核验,序列中COI条形码区域的长度须≥500 bp,且Ns≤1%。最终将序列与已有参阅数据库进行比对,去除或许的外源污染,例如螨虫、人等的COI序列。endprint

相关资讯
最新新闻
关闭