GenomeData

GenomeData["gene"]

给出人类参考基因组上指定基因的 DNA 序列.

GenomeData["gene","property"]

给出人类基因 gene 的指定属性值.

GenomeData[{"chr",{n1,n2}}]

给出人类参考基因组的染色体 chr 上,从位置 n1n2 的序列.

更多信息

  • 基因通过诸如 "BRCA1" 等标准名称指定.
  • GenomeData[] 给出人类基因列表.
  • 人类染色体可以用 "Chromosome1""ChromosomeX""Mitochondrion" 等指定,或用整数 122"X""Y""MT" 指定.
  • GenomeData[{{"chr",+1},{n1,n2}}] 给出染色体 chr 顶链上位置 n1n2 的 5' 到 3' 序列. 序列的位置是相对顶链的5' 端的.
  • GenomeData[{{"chr",-1},{m1,m2}}] 给出染色体 chr 底链上位置 m1m2 的 5' 到 3' 序列. 序列的位置是相对底链的5' 端的.
  • 基因序列属性包括:
  • "FullSequence"基因的完全序列
    "FullSequencePosition"基因的起始位置和末端位置
    "SequenceLength"基因的长度(单位为碱基对)
  • 基因位置属性包括:
  • "Chromosome"基因所在的染色体
    "LocusList"列表形式基因座
    "LocusString"字符串形式的基因座
    "Orientation"向前 (5' 到 3') 或向后 (3' 到 5') 分别为 +1 或 -1
  • 蛋白质和转录属性包括:
  • "CodingSequenceLists"基因的编码序列列表
    "CodingSequencePositions"每个编码序列的区域位置列表
    "CodingSequences"基因编码序列的变形
    "ExonSequences"基因外显子序列的列表
    "IntronSequences"基因内含子序列的列表
    "ProteinNames"根据基因编码的蛋白质名称
    "UTRSequences"基因未转换终端区域的序列列表
  • 功能属性包括:
  • "BiologicalProcesses"与基因产物相关的生物过程
    "CellularComponents"找到基因产物的细胞成分
    "InteractingGenes"与该基因或它的产物相互作用的基因
    "MolecularFunctions"基因产物的分子功能
  • 基因识别属性包括:
  • "AlternateNames"同义词
    "GenBankIndices"GenBank 指标字符串
    "GeneID"GeneID 号码字符串
    "GeneOntologyIDs"Gene Ontology ID 字符串
    "MIMNumbers"人类孟德尔遗传(Mendelian Inheritance in Man)指标数字符串
    "Name"通用英文名称
    "NCBIAccessions"NCBI 存取号字符串
    "ProteinGenBankIndices"蛋白质产物的 GenBank 指标数字符串
    "ProteinNCBIAccessions"蛋白质产物的 NCBI 存取号字符串
    "UnitsStandardName"标准 Wolfram 语言名称
    "TranscriptGenBankIndices"RNA 产物的 GenBank 指标数字符串
    "TranscriptNCBIAccessions"RNA 产物的 NCBI 存取号字符串
    "UniProtAccessions"UniProt 存取号字符串
  • 染色体的整体属性包括:
  • "SequenceLength"以碱基对为单位的染色体的长度
    "UnsequencedPositions"未知序列的起始位置和末端位置
  • 与染色体带相关的属性包括:
  • "GBandLocusStrings"G-带基因座的名称
    "GBandScaledPositions"所有 G-带标度化的起始位置和末端位置
    "GBandStainingCodes"所有 G-带细胞基因染色密码
    "GBandStainingLevels"所有 G-带相对染色程度
  • GenomeData[gene,"prop","ann"] 给出与属性相关的各种注解. 通常注解包括:
  • "Name"通用英文名称
    "UnitsStandardName"标准 Wolfram 语言名称
    "Units"给出值的单位

范例

打开所有单元关闭所有单元

基本范例  (5)

获取人类基因组中一个基因的完全DNA序列:

获取一个染色体的部分 DNA 序列:

获取染色体的基因列表:

获取基因所在染色体的 Wolfram 语言标准名称:

获取一个基因的染色体位置:

范围  (9)

名称和类型  (5)

获得基因名称的列表:

找出一个基因的英文名称:

获得基因类型的列表:

获得信号转导中的基因列表:

获得一个基因所属类型的列表:

测试一个基因是否属于一个类型:

基因和染色体序列  (4)

获得一个基因的 DNA 序列:

获得一个基因的染色体位置:

获得基因所在染色体的 Wolfram 语言标准名称:

获得染色体上基因的方向:

获得底链上部分染色体的 DNA 序列:

获得一个基因的密码序列的位置:

应用  (4)

制作一个人类染色体的长度分布的对数图:

制作一个人类22号染色体基因长度的对数图:

绘制一个平均编码序列长度相对于基因长度的图形:

以图像形式显示一个基因:

显示 12 号染色体上前 20 个基因:

属性和关系  (2)

获得 1 号染色体顶链的序列:

获得底链的互补序列:

这里表明底链与顶链互补:

GenomeData 提取 GenomeLookup 找到的序列:

巧妙范例  (1)

求出人类基因中的最短的 5 个基因:

Wolfram Research (2008),GenomeData,Wolfram 语言函数,https://reference.wolfram.com/language/ref/GenomeData.html.

文本

Wolfram Research (2008),GenomeData,Wolfram 语言函数,https://reference.wolfram.com/language/ref/GenomeData.html.

CMS

Wolfram 语言. 2008. "GenomeData." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/GenomeData.html.

APA

Wolfram 语言. (2008). GenomeData. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/GenomeData.html 年

BibTeX

@misc{reference.wolfram_2024_genomedata, author="Wolfram Research", title="{GenomeData}", year="2008", howpublished="\url{https://reference.wolfram.com/language/ref/GenomeData.html}", note=[Accessed: 22-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_genomedata, organization={Wolfram Research}, title={GenomeData}, year={2008}, url={https://reference.wolfram.com/language/ref/GenomeData.html}, note=[Accessed: 22-November-2024 ]}