GRC

Home > 관련사이트

가. 미국 NCBI (Nation Center for Biotechnology Information)

NCBI는 2002년경부터 NCBI Molecular Biology DataModel에 대한 XML 포맷을 개발하여 사용하여 오고 있다. 기존의 Abstract Syntax Notation 1 (ASN.1) 자동화된 표준화 XML 툴킷을 통하여 DTD (document type definition)가 적용된 XML 문서로 변환되어 사용자에게 제공되고 있다. NCBI에서는 2가지 형태로 XML을 제공한다(<그림 3.1>). 첫 번째로는 NCBI 안에서 제공되는 모든 데이터 필드를 XML 포맷으로 바꿔서 제공해 준다. 다른 형태로는 DTD가 적용된 XML 문서로 변환되어 사용자한테 제공해 주고 있다. 생물학 데이터 구조적 데이터로 표준화하여 다양한 종류의 컴퓨터와 소프트웨어에서 신뢰성 있게 호환이 가능하며 생물정보학 검색 시스템과 데이터베이스의 원천이 되었다. XML 포맷을 위한 DTD는 현재 데이터베이스 별로 약 124개가 제정되어 있다(http://www.ncbi.nlm.nih.gov/dtd/).

나. 유럽 EBI (European Bioinformatics Institute)

세계 주요 바이오정보 데이터베이스 중의 하나인 EBI의 EMBL(European Molecular Biology Laboratory Nucleotide Sequence Database) 는 XML이 개발자와 설계자 사이에서 데이터 교환의 표준으로 자리 잡게 되자 EMBL 데이터를 XML 형태의 문서로 배포하고 있다(http://www.ebi.ac.uk/embl/xml/). 현재 사용 중인 DTD는 EMBL/DDBJ/Genbank가 공동 개발한 INSDseq와 자체 개발한 EMBLxml을 사용하고 있다. INSDseq의 DTD(http://www.ebi.ac.uk/embl/Documentation/DTD/INSDSeq_v1.3.dtd.txt)는 EMBL/DDBJ/Genbank의 세 데이터베이스 검색 엔진에 의해 모두 서비스되고 있다. 문서중심의 XML 기술은 대규모 유전체정보의 문서중심 통합을 가능하게 하는 기술로 평가되고 있다. 유전체정보 특히 의료정보의 많은 부분은 진료차트와 같은 의학적, 법률적 효력을 갖는 문서형식으로 생성되어서 기존의 RDB 기반의 자료관리 시스템으로 처리하기에는 근본적인 한계가 있다. 요즘 유전체정보(생명정보) 분야에서는 XML 전용 데이터베이스를 구축해서 문서전체가 한곳에 저장되어 여러 테이블에 저장되는 RDB에 비해서 검색속도가 향상되었다.

다. 다국적 Hapmap 프로젝트

HapMap 프로젝트는 인간 유전체(human genome)의 일배체 지도(haplotype map; HapMap)를 구축하기 위해 형성된 컨소시엄이다. HapMap 연구 사업은 질병을 야기할 수 있는 유전자나 유전적 변이(genetic variation)를 탐색하는 것을 도울 수 있는 유전자 지도를 구축하는데 목적을 두고 있다. HapMap 프로젝트는 캐나다, 중국, 일본, 나이지리아, 영국, 그리고 미국의 과학자들과 투자회사들이 만든 프로젝트다. 인간은 23쌍의 염색체를 가진다. 염기서열 분석결과 30억 개의 염기로 구성되어 있음을 밝혀냈다. 인간의 게놈서열은 거의 동일하지만, 평균 1200개 염기 당 한 개의 비율로 염기차이가 존재한다. 다른 염기로의 치환, 결손, 삽입 등의 변이가 존재하며 이를 단일염기다형성(SNP)이라고 한다. 대략 천만 개 정도의 SNP가 존재할 것으로 예상한다. 보통의 연구에서는 유전체에서 개인 간 유전적 차이를 일으키는 SNP같은 변이를 찾을 때 HapMap에서 제공하는 표준 유전체를 사용하고 있다. HapMap Public Release #27버전이 2009년 2월 6일 날 나왔다. Phase II, III의 유전자형과 빈도 데이터는 NCBI (dbSNP build 126)와 연결되어 있다. 데이터는 (http://ftp.hapmap.org/genotypes/) 다운로드 받을 수 있다.

라. HUPO(Human Proteome Organization)

인간 질병을 이해하기 위해 단백질체 연구의 전문가로 구성된 HUPO에서는 단백질체 표준화 기구로서 2002년에 Proteomics Standards Initiative(HUPO-PSI)를 조직하였다. 6개의 워크그룹을 선두로 하여 표준화 작업을 하고 있다(http://www.psidev.info).

Gel Electrophoresis(GEL)
Mass Spectrometry(MS)
Molecular Interactions(MI)
Protein Modifications(MOD)
Proteomics Informatics(PI)
Sample Processing(SP)

그 중에서 MI그룹은 빠른 진행 사항을 보여주고 있다. 개발 내역을 보면 Molecular Interaction experiment에 관한 최소한의 정보를 제공해 주는 MIMIx, MI의 사용자 지정 XML 포맷인 PSI- MI XML(2005년 12월에 발표한 2.5버전), PSI-MI XML 포맷을 가진 데이터를 손쉽게 사용하기 위해 용어집인 PSI-MI CVs등이 있다.

마. 한국생명공학연구원 국가생물정보관리센터

2008년 12월 4일 공동연구협력을 통해 한국인 유전체의 전체 염기서열 지도를 완성했다(http://koreagenome.org). 유전체 분석에는 이길여암당뇨연구원 김성진 원장의 유전체가 사용됐으며 이번 연구를 통하여 한국인 표준 유전체 구축을 위한 것으로 개인 유전체 분석에 질병 관련 유전인자 등을 검색할 때 기준이 되는 유전의학, 맞춤의학, 예방의학 실현을 위해서 꼭 필요하다. 국가생물자원정보관리센터에서는 한국인 표준화된 유전체 지도화와 변이에 대한 분석이 끝난 후 생명정보분석이 가능하다. 예를 들면, 단백질에 변이가 있는지, 질병과의 연관도를 다각도로 계산한다든지, 각종 약물에 이 유전체의 소유자가 어떤 체질적 특성을 가지는지, 면역학상 어떤 특이가 있는지를 다양하게 알아 볼 수 있다. 이러한 분석의 대용량 처리를 원한다면 국가생물자원정보관리센터에 요청을 하면, 적절한 절차를 거쳐 공동해석 서비스를 받을 수 있다.

바. KHUPO(Korean Human Proteome Organization)

인간게놈프로젝트와 같은 글로벌 프로테옴프로젝트 연구를 효율적으로 수행하기 위해 산학연공동협력체를 2001년 7월 24일에 결성됐다. 고급 프로테옴분석정보와 분석 도구의 공유를 통한 비용절감, 연구결과의 산업화 및 DB 표준화를 통한세계적인 인간프로테옴 Index화에 국내연구결과 공유를 목표로 한다. 공식 일정 및 진행사항은 홈페이지 http://www.khupo.org/를 통해서 알아 볼 수 있다.