• menu1
  • menu2
  • menu3
  • menu4
LOGIN

Home > 표준게놈데이터 > 단염기다형성


한국인 단염기 다형성 데이터


SNP ID:
(예: rs55998931, chr1:10492)


검색 결과가 없습니다.




1) # Chr은 해당 allele을 가지는 염색체의 개수입니다. 상염색체의 경우, 한 사람 당 같은 종류의 염색체가 2개씩 있습니다. # Chr를 셈 할 때, 한 사람의 genotype이 -/A와 같이 결정되었을 경우, 한 개(A) 만이 사용되었습니다. "-"는 allele이 결정되지 않았음을 의미합니다.
2) # Individual은 해당 genotype을 가지는 한국인의 수를 의미합니다. # Individual을 셈 할 때, 한 사람의 genotype이 -/A와 같이 결정되었을 경우, 이 genotype은 사용되지 않았습니다. "-"는 allele이 결정되지 않았음을 의미합니다.







한국인 변이체 참조표준 데이터 다운로드
 
KoVariome.1.3 (Reference : Hg38, 한국인 350명)
국가참조표준센터
 
한국인 변이체 참조표준 데이터 바로가기
한국인 변이체 참조표준 데이터 생산절차서
 
다운로드





한국인 변이체 참조표준 데이터 파일 설명

 

 

한국인 일반군 단염기 다형성 정보 (유효참조표준)
Standard_Reference_Data/snp/variomeData.snp.allSite.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단염기.
SNP (SNP allele) : 한국인 표본집단에서의 단염기.
SUM (Total number of monoploids) : 한국인 표본집단에서 단염기 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the SNP allele) : 한국인 표본집단에서 해당 단염기(SNP allele)가  발굴된 일배체 수.
FREQ (SNP allele frequency) : 한국인 표본집단에서의 해당 단염기의 빈도.
KSID (SNP id) : 표준게놈데이터센터에서 지정한 단염기 다형성 아이디.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
KPGP-00001 (Genotype of KPGP-00001) : KPGP-00001 한국인의 유전형. 유전형이 결정되지 않은 경우 -/-로 표시.
 
한국인 일반군 단염기 다형성 통계 정보 (참조데이터)
Supplementary_Data/snp_pvalue/variomeData.snp.allSite.{CHR_NAME}.pvalue.txt.gz
CHROM (Chromosome) : 단염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단염기.
SNP (SNP allele) : 한국인 표본집단에서의 단염기.
SUM (Total number of monoploids) : 한국인 표본집단에서 단염기 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the alternative allele) : 한국인 표본집단에서 해당 단염기(SNP allele)가 발굴된 일배체 수.
FREQ (SNP allele frequency) : 한국인 표본집단에서의 해당 단염기의 빈도.
SUM_HiSeq2000 (Total number of monoploids of each sequencer) : 표본 내 HiSeq2000 해독기로 해독된 집단에서 유전형이 결정된 전체 일배체의 수.
NUM_HiSeq2000 (No. of SNP allele of each sequencer) : 표본 내 HiSeq2000 해독기로 해독된 집단에서 각 단염기 별 유전형이 발굴된 일배체의 수.
PVAL_HiSeq2000 (P-value of SNP allele enrichment test of each sequencer) : 표본 내 HiSeq2000 해독기로 해독된 집단에서 각 단염기 발굴의 편향성에 대한 p-value.
 
한국인 일반군 단염기 변이의 기능 예측 정보 (참조데이터)
Supplementary_Data/snp_annotation/variomeData.snpAnnotation.varSite.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단염기.
KSID (SNP id) : 표준게놈데이터센터에서 지정한 단염기 다형성 아이디.
ALT (Alternative allele) : 단염기 변이형.
SUM (Total number of monoploids) : 한국인 표본집단에서 단염기 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the alternative allele) : 한국인 표본집단에서 해당 단염기 변이형이 발굴된 일배체 수.
FREQ (Alternative allele frequency) : 한국인 표본집단에서의 해당 단염기 변이형의 빈도.
GENE (Gene name) : 단염기 변이가 위치한 유전자의 이름 [BRCA]. Intergenic 영역에 위치하는 경우 -로 표시.
RNA (RNA id) : 단염기 변이가 위치한 RNA의 아이디.
FUNC (Function) : 단염기 변이의 기능적 위치 정보 [intergenic, intronic, splice-site, exonic, 5'UTR, 3'UTR, synonymous, non-synonymous].
 
한국인 일반군 개체 별 단염기 유전형 정보 (참조데이터)
Supplementary_Data/genotype/{INDIVIDUAL_ID}/variomeData.genotype.allSite.{INDIVIDUAL_ID}.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단염기.
GT (Genotype) : 한국인 표본에서의 유전형 [A/G].
GTDP (Genotype depth) : 한국인 표본에서의 유전형의 해독된 DNA 개수 [10/10].
GTEDP (Effective coverage) : 한국인 표본에서의 유전형의 해독된 DNA의 실질적 개수 [9.00/9.00]. 해당영역에서 해독된 DNA의 개수에 해독 및 매핑 품질을 반영하여 산출.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
 
한국인 일반군 삽입결실 다형성 정보 (참조데이터)
Supplementary_Data/indel/variomeData.indel.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 삽입결실 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 삽입결실 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 서열.
INDEL (Indel allele) : 한국인 표본집단에서의 삽입결실.
SUM (Total number of monoploids) : 한국인 표본집단에서 삽입결실 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the indel alleles) : 한국인 표본집단에서 해당 삽입결실(indel allele)이 발굴된 일배체 수.
FREQ (Indel allele frequency) : 한국인 표본집단에서의 해당 삽입결실의 빈도.
KIID (Indel id) : 표준게놈데이터센터에서 지정한 삽입결실 다형성 아이디.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
KPGP-00001 (Genotype of KPGP-00001) : KPGP-00001 샘플의 유전형. 유전형이 결정되지 않은 경우 -/-으로 표시.
 
한국인 일반군 삽입결실 변이의 기능 예측 정보 (참조데이터)
Supplementary_Data/indel_annotation/variomeData.indelAnnotation.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 삽입결실 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 삽입결실 변이의 염색체 상의 위치.
TYPE (Type) : 삽입결실 종류 [INS, DEL].
REF (Reference allele) : 인간표준게놈지도에서의 서열.
ALT (Alternative allele) : 삽입결실 변이형.
SUM (Total number of monoploids) : 한국인 표본집단에서 삽입결실 확인에 성공한 전체 일배체 수.
NUM (No. of monoploids of the alternative allele) : 한국인 표본집단에서 해당 삽입결실 변이형이 발굴된 일배체 수.
FREQ (Alternative allele frequency) : 한국인 표본집단에서의 해당 삽입결실 변이형의 빈도.
GENE (Gene name) : 삽입결실 변이가 위치한 유전자의 이름 [BRCA]. Intergenic 영역에 위치하는 경우 -로 표시.
RNA (RNA id) : 삽입결실 변이가 위치한 RNA의 아이디.
FUNC (Function) : 삽입결실 변이의 기능적 위치 정보 [INTERGENIC, INTRONIC, SPLICE-SITE, EXONIC, 5'UTR, 3'UTR, CODON_CHANGE, FRAME_SHIFT].
 
한국인 일반군 게놈배수 변이 정보 (참조데이터)
Supplementary_Data/cnv/{INDIVIDUAL_ID}.cnv.cnvnator.tsv
CNV_type (CNV type) : 게놈배수 변이의 종류 [deletion, duplication].
coordinates (Coordinate) : 게놈배수 변이의 염색체 상의 위치 [chr1:10001-11000].
CNV_size (CNV size) : 게놈배수 변이의 크기 [1000].
normalized_RD (Normalized read depth) : 정규화 된 게놈배수 값 [0.5].
e-val1 (E-value 1) : E-value 1.
e-val2 (E-value 2) : E-value 2.
e-val3 (E-value 3) : E-value 3.
e-val4 (E-value 4) : E-value 4.
q0 (Rate of zero mapping quality reads) : 게놈배수 변이 영역에 매핑된 단서열 중 매핑 점수가 0인 단서열의 비율 [0.1].
 
한국인 일반군 표본 정보 (참조데이터)
Supplementary_Data/sample_information/sample_information.tsv
SAMPLE (Sample id) : 표본 등록번호.
COUNTRY (Country code) : 국적 (한국의 경우 KR).
ETHNICITY (Ethnicity) : 인족 (순수 한국인의 경우 KR).
GENDER (Gender) : 성별 [1=male(남성), 2=female(여성)].
AGE (Age) : 나이.
SEQUENCER (Sequencer) : 해독기 기종.
 
한국인 일반군 확장표본 단염기 다형성 정보 (참조데이터)
Supplementary_Data/extension_set/snp/variomeData.extensionSet.snp.allSite.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단염기.
SNP (SNP allele) : 한국인 표본집단에서의 단염기.
SUM (Total number of monoploids) : 한국인 표본집단에서 단염기 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the SNP allele) : 한국인 표본집단에서 해당 단염기(SNP allele)가  발굴된 일배체 수.
FREQ (SNP allele frequency) : 한국인 표본집단에서의 해당 단염기의 빈도.
KSID (SNP id) : 표준게놈데이터센터에서 지정한 단염기 다형성 아이디.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
 
한국인 일반군 확장표본 단염기 변이의 기능 예측 정보 (참조데이터)
Supplementary_Data/extension_set/snp_annotation/variomeData.extensionSet.snpAnnotation.varSite.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 단염기 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 단염기 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 단염기.
KSID (SNP id) : 표준게놈데이터센터에서 지정한 단염기 다형성 아이디.
ALT (Alternative allele) : 단염기 변이형.
SUM (Total number of monoploids) : 한국인 확장 표본집단에서 단염기 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the alternative allele) : 한국인 확장 표본집단에서 해당 단염기 변이형이 발굴된 일배체 수.
FREQ (Alternative allele frequency) : 한국인 확장 표본집단에서의 해당 단염기 변이형의 빈도.
GENE (Gene name) : 단염기 변이가 위치한 유전자의 이름 [BRCA]. Intergenic 영역에 위치하는 경우 -로 표시.
RNA (RNA id) : 단염기 변이가 위치한 RNA의 아이디.
FUNC (Function) : 단염기 변이의 기능적 위치 정보 [intergenic, intronic, splice-site, exonic, 5'UTR, 3'UTR, synonymous, non-synonymous].
 
한국인 일반군 확장표본 삽입결실 다형성 정보 (참조데이터)
Supplementary_Data/extension_set/indel/variomeData.extensionSet.indel.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 삽입결실 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 삽입결실 변이의 염색체 상의 위치.
REF (Reference allele) : 인간표준게놈지도에서의 서열.
INDEL (Indel allele) : 한국인 확장 표본집단에서의 삽입결실.
SUM (Total number of monoploids) : 한국인 확장 표본집단에서 삽입결실 발굴에 성공한 전체 일배체 수.
NUM (No. of monoploids of the indel alleles) : 한국인 확장 표본집단에서 해당 삽입결실(indel allele)이 발굴된 일배체 수.
FREQ (Indel allele frequency) : 한국인 확장 표본집단에서의 해당 삽입결실의 빈도.
KIID (Indel id) : 표준게놈데이터센터에서 지정한 삽입결실 다형성 아이디.
RSID (dbSNP rs id) : dbSNP에서 제공되는 rs id.
 
한국인 일반군 확장표본 삽입결실 변이의 기능 예측 정보 (참조데이터)
Supplementary_Data/extension_set/indel_annotation/variomeData.extensionSet.indelAnnotation.{CHR_NAME}.txt.gz
CHROM (Chromosome) : 삽입결실 변이가 존재하는 염색체 번호 [chr1].
POS (Chromosomal position) : 삽입결실 변이의 염색체 상의 위치.
TYPE (Type) : 삽입결실 종류 [INS, DEL].
REF (Reference allele) : 인간표준게놈지도에서의 서열.
ALT (Alternative allele) : 삽입결실 변이형.
SUM (Total number of monoploids) : 한국인 확장 표본집단에서 삽입결실 확인에 성공한 전체 일배체 수.
NUM (No. of monoploids of the alternative allele) : 한국인 확장 표본집단에서 해당 삽입결실 변이형이 발굴된 일배체 수.
FREQ (Alternative allele frequency) : 한국인 확장 표본집단에서의 해당 삽입결실 변이형의 빈도.
GENE (Gene name) : 삽입결실 변이가 위치한 유전자의 이름 [BRCA]. Intergenic 영역에 위치하는 경우 -로 표시.
RNA (RNA id) : 삽입결실 변이가 위치한 RNA의 아이디.
FUNC (Function) : 삽입결실 변이의 기능적 위치 정보 [INTERGENIC, INTRONIC, SPLICE-SITE, EXONIC, 5'UTR, 3'UTR, CODON_CHANGE, FRAME_SHIFT].

 

* 확장표본은 유전정보 공개에 동의한 한국인 일반군 표본(한국인 200명)에 유전정보 공개에 동의하지 않은 한국인이 추가되어 구성된 표본입니다. 확장표본으로부터 제작된 데이터에는 개체 별 유전형 정보가 포함되어 있지 않습니다.