Introduction

19101711296933970

1990년에 시작된 인간유전체사업(Human Genome Project, HGP)의 결과로 당초 예상보다 빨리 2001년 2월 인간유전체 서열지도의 초안이 발표되었으며, 2003년 4월 인간유전체 서열 해독이 완료되었다. 인간유전체 서열정보의 해독을 통하여, 유전자의 기능을 규명, 환자와 정상인과의 유전체정보 비교 및 개인간·인종간의 생체기능 차이의 원인 등을 연구할 수 있는 토대가 마련되었다. 이 연구 결과는 앞으로 암과 같은 질병의 유전적 원인을 찾아내거나, 새로운 진단방법과 치료약 개발 및 개개인의 특성을 고려한 최적의 치료법을 찾는 등의 의·약학 분야에 많은 기여를 할 수 있을 것으로 기대된다. 서열분석이 완료된 후 유전체의 기능을 밝히려는 기능유전체학(functional genomics) 연구가 활발하게 진행되고 있다.

DNA 마이크로어레이(또는 DNA 칩)는 기능유전체학의 주요 도구 중 하나로써 염기서열을 알고 있는 DNA 분자를 소형 기판위에 고밀도로 배열해 놓은 것이다. 마이크로어레이의 장점은 대량의 유전자 발현 상황을 총체적으로 탐색할 수 있다는 것이다. 이전의 기술로는 한 두 개의 유전자 기능만을 탐색할 수 있었으나, 화학과 분자생물학을 비롯한 기계공학, 전자공학 등의 여러 분야가 융합되어 만들어진 마이크로어레이 기술은 생명현상과 관련된 유전체 수준의 연구를 가능하게 하였다.

이 책에서는 마이크로어레이 자료를 분석하기위한 다양한 통계 방법들을 설명하였다. 먼저 1장에서는 생물학적인 배경이 부족한 독자들을 위하여 생물학의 기본 개념들을 정리하였고 마이크로어레이의 제작과정과 그 특징들을 자세히 설명하였다. 2장에서는 마이크로어레이로부터 통계분석에 필요한 숫자를 뽑기 위한 이미지분석에 대하여 설명하였고, 3장에서는 마이크로어레이 실험을 하기위한 실험 계획을 소개하였다. 4장부터 8장까지는 본격적인 통계분석 과정을 단계별로 자세히 설명하였다. 부록 A에서는 기본적인 통계 개념을 소개하였다. 부록 B에서는 통계 소프트웨어인 R의 기본 내용을 소개하였다.

각 장의 마지막 부분에서는 실제 자료를 분석하기 위한 R 프로그램을 같이 첨부하였다. 현재 다양한 종류의 마이크로어레이 분석 프로그램들이 개발되었고 통계 소프트웨어 R에 기초한 Bioconductor가 가장 핵심적인 역할을 하고 있기 때문에 이 책에서는 R 중심으로 기술하였다. 이 책에 소개된 모든 자료들과 R 프로그램은 서울대 통계학과의 국가지정연구실(NRL)인 생물정보통계연구실 (Bioinformatics and Biostatistics, BIBS Lab)의 홈페이지 http://biostats.snu.ac.kr 에서 다운받을 수 있다.

이 책을 처음 저술하기 시작한지 벌써 2년이 되어간다. 이 책의 저술 작업을 처음 시작했을 때에는 외국에서도 이 분야와 관련된 저서가 거의 없었다. 저술 작업 중에 처음으로 Speed 교수의 Statistical Analysis of Microarray Data와 Parmigiani, Garrett, Irizarry, and Zeger 교수의 The Analysis of Gene Expression Data 의 발간을 보게 되었다. 그러나 두 책 내용 모두 이 분야의 초보자가 쉽게 읽고 이해할 수 있도록 잘 정리가 되어 있지 않았다. 이 책에서는 가능하면 이 분야의 초보자도 쉽게 개념을 이해하고 분석 방법을 사용할 수 있도록 저술하고자 노력하였다.

최근 들어 외국의 여러 통계학자들에 의해 다양한 종류의 마이크로어레이 분석 관련 책들이 출간되는 것을 보면서 더 이상 이 책의 출간을 미룰 수는 없다는 생각이 들었다. 또한 저술 작업을 시작한 이후로 그동안 새로운 분석 방법들이 계속 나왔고 가능하면 그 모든 내용들을 다 반영하고자 노력했으나 그렇게 할수록 계속 출간 날짜가 더 늦춰질 것같아 부족한 면이 많지만 부득불 현재 상태에서 출간하기로 결정하였다.

이 책은 여러 명의 저자들이 각 분야별로 나누어 저술한 것이다. 모든 저자들은 서울대 통계학과의 생물정보통계연구실에 속해 있으며 통계학 전공자와 생물정보학 전공자들이다. 한 저자가 처음부터 끝까지 차분하게 정리하면서 저술한 내용이 아니라 곳곳에 용어와 기호가 일치하지 않는 부분이 있고 서술방식에도 약간의 차이가 있을 것이다. 이와 같이 여러 부분에서 부족한 것이 많음에도 불구하고 이 책이 마이크로어레이 자료의 통계 분석에 관한 국내 최초의 저서라는 점에 자부심을 갖는다.

끝으로, 이 책이 나오기까지 수고를 아끼지 않은 생물정보통계학연구실의 모든 학생들에게 감사를 전하고 출간되도록 도와주신 자유아카데미의 여러분께도 감사를 드린다.

2005년 5월

저자 일동

답글 남기기