ISSN : 2287-3317(Online)
소 유전체에서의 CNV(Copy Number Variation) 연구현황(총설)
Current Status of Copy Number Variation Research in Cattle Genome
Abstract
- I. 서론
- II. 본론
- 1. Microarray에 기반한 분석
- 2. NGS short read를 이용한 방식
- 3. 국내 재래종 소에서의 CNV 연구 현황
- Ⅲ. 결론
- Ⅳ. 요약
- 사사
I. 서론
기존의 가축 개량은 양적 유전학(quantitative genetics) 이론을 바탕으로 관찰이 가능한 표현형 자료(phenotypic data) 및 계통(pedigree) 자료를 이용한 선발(selection) 및 교배(mating)를 통해 육우 및 유우에서 지난세기 비약적인 경제형질(economically important traits) 생산성의 향상을 가져왔다. 그러나 이러한 성공에도 불구하고, 기존의 육종 방식은 전통적으로 다세대에 걸쳐 오랜 시간이 소요되며 또한 막대한 비용이 든다는데 그 문제점이 지목 되어져 왔다. 이러한 기존 육종에서 대두 되어진 문제점은 최근 소의 전장유전체 해독완료로(Elsik 등, 2009) 인하여 파생되어지는 전장유전체 유전마커(genome-wide genetic marker)의 발굴, 개발 및 그의 이용으로 기존의 육종방법에서 제기된 문제점들을 보완할 주요한 수단으로 기대되어 지고 있다. 특히 이러한 유전마커의 응용은 유전력이 낮은 형질이나 도체 형질 혹은 기타 측정이 어려운 형질 등에 대해 보다 그 유용성이 클 것으로 사료되어 지고있으며(Dekkers 2004; Goddard, 2009), 실제 일부 유전마커는(GeneSTAR Quality Grade, GeneSTAR Tenderness, Igenity Tender-GENE) 현장 축산 분야에서 유전마커 보조 선발(Marker Assisted Selection)의 형태로서 사용 되어 지고 있다(Eenennaam 등, 2007). 더 나아가 최근 개발된 고밀도의 유전 마커를 이용 전장유전체에 대한 스캔이 가능해짐에 따라 새롭게 대두 되어지는 유전체 선발법(genomic selection)에 실질적인 적용이 가능하게 되었으며, 이는 실제 유우 육종산업 에서 성공적으로 적용되어 지고 있는 중이다 (Hayes 등, 2009).
이렇게 소 전장유전체 해독이후 유전체에서의 대다수의 유전적 변이는 단일염기 다형성(single nucleotide polymorphisms, SNPs)의 대규모 발굴에 집중되어져 왔으며(Tassell 등, 2008; Gibbs 등, 2009), 이는 최근 차세대 시퀀싱인 NGS(next generation sequencing) 플랫폼의 개발로 더욱 더 가속화 되어졌다(Eck 등, 2009; Stothard 등, 2011). 이들 발굴된 대량의 SNP 정보는 상용화된 고밀도 전장유전체 SNP 마커칩의 개발로 까지 이어졌으며(Matukumalli 등, 2009), 이러한 고밀도 SNP 마커칩은 전장유전체에서의 선발신호(genome-wide signatures of selection) 발굴 및 전장 유전체 연관분석(genome-wide association study: GWAS)을 통한 경제형질 관련 SNP 발굴 등에 즉각적인 파급 효과를 가져왔다(Qanbari 등, 2010; Sherman 등, 2010; Jiang 등, 2010). 이렇듯 소 유전체에서 유전적 변이에 대한 연구는 대부분 SNP이라는 유전적 다형성 발굴과 이들의 경제 형질과의 연관성 연구 등 이었으나, 최근 또 다른 형태의 유전적 다형성 형태인 전장유전체에서의 카피 수 변이(copy number variation, CNV)가 소 유전체학에서 본격적으로 발굴 및 연구가 진행되어지고 있다. 전장 유전체에서의 본격적으로 체계적인 CNV 발굴 및 연구는 인간 전장유전체 해독 이후 사람 유전체에서 시작 되었으며, 이로 인해 CNV는 일부 예외적인 구조적 유전다형성이 아닌 전장유전체 전반에 걸쳐 광범위하게 분포하고 있음이 밝혀졌으며(Iafrate 등, 2004; Sebat 등, 2004; Redon 등, 2006), 더 나아가 이러한 현상은 사람뿐만이 아닌 침팬지(Perry 등, 2006), 초파리 (Dopman 등, 2007), 꼬마선충(Maydan 등, 2007) 및 개(Chen 등, 2009), 돼지(Fadista 등, 2008), 소 등(Liu 등, 2010; Stothard 등, 2011) 가축에서도 보고되어지고 있다. 이러한 전장 유전에 해독에 힘입어 발굴 되어지는 CNV 정의는 우선적으로 표준 유전체(reference sequence assembly)와 비교하여 복제(duplication) 혹은 삭제(deletion) 등에 의해 복제수의 차이를 보이는 1 kb 이상의 DNA 분절(DNA segment)을 칭하게 되었다 (Feuk 등, 2006). 그러나 이러한 기존의 정의는 최근 CNV 발굴을 위한 보다 고집적된 칩의 개발과 NGS 등의 기술적 진보 등으로 인하여 현재 50 bp 이상 크기의 복제수 변이를 보이는 DNA 조각까지 포함 그 범위가 보다 넓어지게 되었으며, 반드시 표준 유전체와 비교하여 복제수 변이를 보이는 것이 아닌 자체적인 2개체 이상의 비
교 개체 사이에서의 복제수 차이까지 통칭하게 되었다 (Alkan 등, 2011).
현재 널리 알려진 유전체상에서 CNV를 생성하는 주요기작은 non-allelic homologous recombination(NAHR)과 non-homologous end joining(NHEJ)으로 알려져 있으며 (Lupski, 2007), 이렇게 발굴된 CNV 들은 인간 유전체 연구에서 다양한 질병들과의 연관 관계가 보고되어지고 있다 (McCarroll 등, 2007; Zhang 등, 2009). 이렇게 사람에서 다양한 연구 결과들이 보고되어지는 것과는 달리 소 유전체에서의 체계적인 CNV 발굴 및 이에 대한 기능적 연구는 최근 소 전장유전체 해독이후 본격적으로 시작되어지고 있으나 현재까지 상당히 제한된 수로 그 보고가 이루어지고 있으며, 그나마 이렇게 발굴된 CNV와 소에서의 주요 관심 경제형질과의 연관 연구는 거의 전무한 실정이라 할 수 있다. 이에 주요 경제형질 동물인 소, 특히 국내 축산의 관점에서 한우 등 한반도 고유 소 품종의 개량에 사용될 수 있는 유전 다형성의 주요 정보로서 사용될 수 있는 CNV 연구의 시급성은 무시되어 질 수 없을 것이다. 본 총설에서는 현재까지 이루어지고 있는 소에서의 전장유전체 CNV 연구 동향을 소개하며, 덧붙여 국내 축산에서 앞으로 이루어져야 할 CNV 연구 방향에 대해 논의 해보고자 한다.
II. 본론
현재까지 소에서의 전장유전체 CNV 발굴에 사용 되어진 분석 방법은 크게 두 가지로 나누어 볼 수 있다. 그 하나가 microarray chip을 이용 그로부터 생산된 교잡 강도(hybridization intensity)를 분석하여 이루어지는 CNV 발굴이며, 두번째가 시퀀싱에서 생산되는 정보, 특히 최근 NGS의 등장으로 인하여 이들 플랫폼에서 생산되는 대량의 short reads를 이용하는 발굴법이라 할 수 있다. 엄밀하게 의미에서 전통적으로 CNV는 현미경에 의한 관찰(e.g. trisomy 21) 혹은 fluorescent in situ hybridization (FISH) 및 quantitative PCR 등의 방법들에 의해 특정 CNV가 발견되어 질 수 있으나, 최근 활발히 연구되고 있는 전장유전체에 산재한 다수의 CNV를 발견 한다는 측면에서 이는 현실적으로 적용되기 불가능한 방법이기에 이들 방법들은 이곳에서 논외로 하고자 한다. 특히 소에서 이러한 전장유전체에서의 CNV 연구는 상용화된 microarray chip의 등장과 최근 NGS 플랫폼의 기술적 향상과 대폭적인 가격 인하에 의하여 가능하게 되었다고 볼 수 있으며 현재까지 소 유전체 연구에 실질적으로 사용된 플랫폼은 크게 3가지로 나누어 볼 수 있는데 이는 i) bovine 50K SNP chip, ii) array comparative genomic hybridization(aCGH), 그리고 iii) NGS에서 생성 되어지는 short reads의 이용이 그것들 이며 본 절에서는 각각의 분석 플랫폼을 이용 소 유전체에 적용되었던 분석에 대해 논해 보고자 한다.
1. Microarray에 기반한 분석
Microarray 기술을 기반으로 한 현재까지의 소 유전체에서의 CNV 분석에 사용된 플랫폼은 Bovine 50K SNP BeadChip과 aCGH 이며 이들 방법들은 기본적으로 교잡(hybridization) 및 그로 인해 생성되는 교잡 강도를 분석하여 전장유전체에 걸친 복제수 차이를 판별해 내었다. 소 전장유전체 해독이후 대규모의 SNP 발굴에 힘입어 개발(Matukumalli 등, 2009) 및 상용화된 고밀도 전장유전체 SNP 마커칩인 Illumina 社의 Bovine SNP50 BeadChip(54,001 markers)은 특히 최근 2~3년간 소에서의 주요 관심형질과 유전자형(Genotype)간의 연관분석 등의 연구에 널리 사용되며 그 유용성을 인정 받아오고 있다. 이에 Bae 등(2010)은 265두의 한우(Korean Brown Cattle) 개체에 대하여 Bovine SNP50 BeadChip 으로 Genotyping 수행 및 분석을 통해 전장유전체에 걸친 368개의 CNVR(Copy Number Variation Region)을 발굴 하였으며, 이들 발굴된 CNVR의 크기의 범위는 ~25.4 kb에서 ~967.2 kb에 걸쳐 있으며, 이들에 대한 평균값과 중간값은 각각 171.5 kb와 128.3 kb에 이르렀다. 다만 이러한 성공적인 전장유전체에서의 CNV의 발굴에도 불구하고, 기본적으로 실험에 사용된 SNP chip 자체의 한계성이 지적되어 질 수 있는데 즉 일반적으로 SNP 패널 개발 시 하디-와인버그 평형이 깨어지는 genotyping의 마커들은 SNP칩 구성에서 제외되는 경향이 있으며 이로 인해 다수의 잠재적인 CNV가 칩 자체의 디자인에 의해 발견되어 질 수 없는 내재적인 한계가 존재하며 추후 이를 보완할 수 있는 소에서의 CNV 발견에 특화된 SNP 칩의 개발의 필요성을 시사해 주고 있다.
현재 소 유전체를 포함 전장유전체에서의 CNV 발굴 및 연구에 있어서 가장 널리 사용되어지고 있는 aCGH 방법은 Pinkel 등에 의해 개발 및 적용 되었으며(Pinkel 등, 1998), 이는 기본적으로 DNA칩 기술을 접목시킨 마이크로 어레이를 이용한 각기 다른 색깔로 염색된 test와 reference DNA 조각 간의 경쟁적 교잡(competitive hybridization)을 통해 반복 횟수의 차이를 보이는 부분을 교잡 강도 (hybridization intensity) 분석을 통해 선별해 내는 것이다. 즉 마이크로 어레이상에 심어진 각 탐침(probe)에 대해 test 와 reference 조각의 염색되어진 fluorescences의 강도의 차이를 분석하여 CNV가 발굴 되어지는 원리인 것이다. 현재 aCGH를 이용한 소에 대한 CNV 연구는 대표적인 결과로서 3편이 발표가 되어있는 상태이며, 그 대표적인 첫번째는 Liu 등의 11 품종의 Bos taurus, 3 품종의 Bos indicus 및 3품종의 교잡종을 아우르는 17 품종, 90 개체의 소에 대한 연구였으며 전체 약 ~25 Mbp에 해당하는 163 개의 CNVR(Xchromosome과 unchromosome 제외 시)을 발견 하였다(Liu 등, 2010). 이는 사실상 소에서 이루어진 최초의 체계적이고 광범위한 CNV 연구였으며, 385,000개의 프로브로 이루어진 약 6 kb의 밀도로 이루어진 Roche사의 Nimblegen CGHarrary(Roche Nimblegene, Madison, WI)가 사용되어 졌으며, Kijas 등은 상기 실험에서 사용된 동일한 aCGH 플랫폼을 Bos taurus(3 Angus), Bos indicus(6 Brahman) 및 교잡종(1 composite animal)을 아우르는 9 개체에 적용하여 약 14Mb에 해당하는 51개의 CNV를 발견하였다(Kijas 등, 2011). 또한 Fadista 등(2010)은 유우(14 Holsteins, 2 Red Danish) 및 육우(3 Simmental, 1 Hereford)에 해당하는 전체 4 품종, 20 개체에 대하여 고밀도의(약 6.3백만 프로브) aCGH 를 적용하여 약 16 Mbp에 해당하는 254개(X and unknown chromosome 및 mitochondiral 제외)의 CNVR을 성공적으로 발견 하였다.
이렇게 소 유전체에서의 CNV 연구를 통해 발견된 CNVR의 평균 크기들은 ~171 kb(Bae 등, 2010), ~154 kb(Liu 등, 2010), ~275 kb(Kijas 등, 2011), ~62 kb(Fadista 등 2010)이며, 이러한 비교를 통해 고밀도의 마커 혹은 프로브 집적도의 증가가 발견되어지는 CNVR의 resolution의 향상에 직접적으로 영향을 끼친다는 것을 알 수 있다. 또한 이는 발굴되어지는 각 CNV(R)에 대한 경계확정(breakpoint)에 직접적으로 관련이 있으며, 추후 보다 정밀한 CNV의 발견을 위해 적정 마커밀도 혹은 프로브의 집적도에 대한 연구의 필요성을 시사해 주고 있다. 또 한가지 유념해야 할 점은 타 CNV 연구와의 비교 및 추후 기능적 분석의 용이함 때문에 상기 상술된 연구들은 Btau4 sequence assembly에 기반 하였으나, 이는 보다 정확한 소 유전체sequence assembly로 평가받는 UMD3의 사용 여부의 필요성에 대한 고찰을 남겨두었다. 상술되었듯 제한적인 수에서 이러한 연구 성과에도 불구하고 hybridization에 기반한 방법은 기본적으로 분석에 사용되어진 플랫폼 의존 특성에 따라 상당한 제약이 따라올 수 있다. 대표적인 예로서 언급되었듯 칩에 집적 되어진 프로브나 마커의 집적도(density)에 따라 발견되어질 수 있는 CNV의 크기에 제약이 생길 수 있다는 점인데 즉 상대적으로 크기가 작은 CNV 발굴에 상당한 제약이 가해질 수 있으며, 이미 발견된 CNV의 경우도 예측 되어지는 각 CNV의 크기에 대해 overestimation이 되는 편향(bias)이 발생할 수 있다는 문제점이 역시 존재한다. 덧붙여 각 프로프나 마커에 대한 교잡에 대한 그 효율이 다양하며, 칩에 집적되어지지 않은 부위에 대해서는 분석이 불가능한 내재적인 한계점이 있다. 이러한 한계점에도 불구하고, 위의 방법들이 아직까지 주목받고 있는 이유는 분석의 상대적인 용이함과 더불어 분석비용 자체가 아직까지는 전장 유전체 해독보다 저렴하기에 이는 동일 비용으로 다개체 다품종에 대한 연구를 보다 용이하게 해 줄 수 있다는데 그 장점이 있다 할 수 있겠다.
2. NGS short read를 이용한 방식
최근 NGS의 플랫폼의 정확성 향상 및 지속적인 가격의 하락에 힘입어 전장유전체에서 생성 되어지는 대량의 short reads 정보를 이용한 CNV 발굴이 각 개별 실험실에서까지 분석이 가능하게 되었다. 현재까지 소 유전체에서의 CNV 연구에 사용된 NGS 플랫폼은 발표된 2편의 연구결과에 대한 2 종류이며, 이는 일루미나사(Illumina, San Diego, CA)의 Genome Analyzer와 라이프 테크놀로지스사(Life Technologies Corporation, CA)의 SOLiD 플랫폼이 그것이다. 특히 현재까지 NGS의 short reads를 이용한 소에서의 CNV 발굴에 사용된 방법은 read depth 차이의 분석에 기반한 방법이 이용되었으며, 이로 인해 기존의 Bovine SNP50 BeadChip이나 aCGH에 의하여 발굴된 CNV보다 향상된 resolution의 CNV 발굴이 가능하게 해주었다. 이러한 read deapth에 기반한 방법의 개요는 기본적으로 NGS 에서 생성된 대용량의 short reads를 reference sequence assembly를 이용한 맵핑작업 수행 후, 이 맵핑된 short reads를 이용 전장유전체를 스캔하여 통계적으로 유의한short reads 수의 차이를 보이는 지역을 발굴하는 것이다.
첫번째 예로서, Stothard 등(2011)은 북미 및 전 세계적으로 널리 사육되는 육우인 Black Angus와 유우인 Holstein의 전장 유전체를 SOLiD(ver 3. chemistry) 플랫폼으로 해독, 이에 생성된 Btau4.0 Bovine sequence assembly에 기반하여 맵핑된 short reads를 이용하여 전장 유전체에 걸친 790 CNVRs을 발견하였다(X chromosome 제외). 발견된 CNVR의 평균 크기는 약 4.2 kb로 기존 Bovine 50K SNP 칩의 결과 및 aCGH로 발견된 평균값보다 월등히 향상된 resolution의 CNVR을 발견 하였다. 특이한 점은 이 결과는 reference sequence와 비교하여 CNVR를 발견한 것이 아닌 육우와 유우를 대표하는 각 품종간의 유전해독 정보의 직접적인 비교를 통해 발굴이 이루어 졌으며, 그로인해 발굴된 CNVR중 특히 지난 40년간 강력한 유전적 선발 및 개량이 이루어졌던 Holstein에서 유량 및 유성분에 관련된 유전자 및 양적 형질좌위(quantitative trait loci, QTL) 지역에서 다수의 CNVR이 발굴 되었다(Fig. 1). 이 연구에 이어 발표된 Derek 등(2012)의 결과는 Illumina사의 Genome Analyzer IIx 플랫폼을 이용 Angus와 Holstein 및 Bos indicus 품종인 Nelore에 포함한 4개체에 대한 전장유전체 해독을 통해 약 55.6 Mbp에 해당하는 1,265개의 CNVR을 발견하였다. 특히 이 연구결과는 절대 복제수 숫자(absolute copy numbers)를 추정한 것과 더불어 Sanger 유전체 해독법에 기반한 Bovine reference sequence에 사용된 기존의 Hereford Dominette의 시뮬레이션을 통해 재가공 분석에 사용 되었다는데 이 연구의 특이성이 있다 할 수 있다. 이 연구에서 발굴된 CNVR의 평균크기는 49.1 kb로서 이역시 기존 hybridization에 기반한 방법보다 resolution이 보다 향상되었음을 보여주고 있다.
Fig. 1. An example of CNVs overlapping with genes in BTA 9.The upper part of this plot represents Log2 ratio plot showing more abudance of short reads in Holstein than Black Angus. The lower part shows RAET1G, ULBP17, and ULBP21 gene region visualized by UCSC Genome Browser. The genome assembly used to generate this plot is Btau4.0 assembly. * This plot was regenerated using publicly available CNVR results by Stothard et al., 2011.
이러한 다양한 크기 및 종류의 CNV의 발견 및 SNP chip 등에서 흔히 발생하는 빈도의 편향의 위험성이 적다는 장점에도 불구하고, 현재까지 NGS를 이용한 CNV 분석은 몇 가지 중요한 기술적 제한요소가 잔존하고 있는 실정이다. 대표적인 예로서 발굴 되어진 CNVR에 대해 단일실험을 통해 정확한 경계(breakpoint)를 잡기가 아직까지 어려우며, CNV 발굴시 false positive를 줄이기 위하여 적용되는 엄격한 p-value 및 log2 값은 CNV(R) 갯수의 overestimation에 영향을 미칠수 있다는 점이다. 즉 발견된 CNVR의 갯수가 부풀려지는 위험이 있으며, 이런 위험요소는 각각의 CNVR 크기 등을 면밀히 분석하여 잘못된 해석을 피하도록 하여야 할 것이다. 또한 Fig. 2. 에서 보여지 듯 맵핑에서 사용된 reference assembly의 차이 역시 이러한 overestimation에 영향을 미칠 수 있다는 점은 추후 연구에서 assembly의 선택이 신중하게 고려되어져야 한다는 점을 보여주고 있다. 상기 기술적인 문제점들과 더불어 추가로 고려되어야 할 제한사항 으로서는 전장유전체해독의 비용과 생성된 데이터들의 관리 및 분석능력을 들 수가 있다. 즉 NGS의 가격이 비록 지속적으로 하락하고 있다지만, 다개체, 다품종에 혹은 집단수준 에서의 전장유전체 해독은 SNP marker나 aCGH 등의 방법들에 비해 가격 경쟁력 측면에서 아직까지 개별 연구자들이 독립적으로 행하기에 어려운 점이 있으며, 또한 단순히 전장유전체의 실험적 해독비용에 묻혀 종종 간과 되어지는 NGS에서 생성된 대용량 데이터의 저장 및 분석에 수반되는 비용 그리고 적정 필요 연구 인력의 부족 역시 대표적인 제한요소가 되어 지고 있다. 최근 이러한 문제점을 해결하기 위해 클라우딩 컴퓨팅 등의 방법 및 사용자 편의가 대폭 향상된 분석툴이 대안으로 제시되어지고 있는 현실이지만 아직까지 많은 연구자들이 데이터 관리 및 분석 등에 어려움을 겪고 있는 실정이다. 이러한 어려움은 사람유전체 혹은 기타 모델생물들 유전체 연구와 비교하여 소 유전체 연구에서 보다 가중되어 질 수 있는데, 그 이유로서 상당수의 분석툴이 인간유전체 및 모델생물들 연구에 최적화되어 있으며, 상대적으로 작은 연구자 community에 기인한 정보의 부족을 들 수 있다. 추가로 주목할 점은 bovine reference sequence assembly 그 자체가 사람에 비해 상대적으로 부정확하며, 이에 따른 맵핑 수율 역시 상대적으로 낮은(70~80%) 것으로 알려져 있다는 점도분석에 어려움을 가중시키는 원인이 되고 있다.
Fig. 2. CNVs exhibiting effects of using different Bovine sequence assembly for the CNVR region at BTA 6.The upper plot shows putative CNVRs using short reads based on UMD3 bovine sequence assembly, while the bottom one shows CNVRs based short reads mapped by Btau_4.0 sequence assembly in the same region. * This plot was regenerated partly using publicly available CNVR results by Stothard et al., 2011.
3. 국내 재래종 소에서의 CNV 연구 현황
현재 한반도내 육우로서 사육 되어지는 재래소(Korean native cattle) 품종은 널리 알려진 한우(Korean brown cattle) 외에 유엔 식량 농업기구(Food and Agriculture Organization of the United Nations, FAO)에 등록된 추가의 재래소 품종들이 있는데, 칡소(Korean brindle cattle), 흑소(Korean black cattle), 및 제주흑우(Jeju black cattle)가 이에 해당 된다. 특히 한우를 제외한 이들 나머지 3개 품종은 FAO가 정한 멸종위기 품종 기준에 해당하는 것으로 알려져 있으며, 이는 유전자원 보존과 종다양성 유지 및 우리 고유의 품종에 대한 새로운 축산물의 수요를 창출한다는 측면에서 최근에서야 그 중요성이 부각되어지고 있지만 아직까지 이들 품종들에 대한 체계적인 전장유전체 연구 및 이의 유전 다형성의 발굴 자체가 거의 전무한 실정이라 할 수 있다. 이들 한반도 재래소 품종에 대한 체계적인 CNV 연구는 상술 되었듯 Bovine 50K SNP BeadChip을 이용한 한우에서의 전장 유전체 CNV 발굴 결과가 현재까지 유일하게 발표 되었으며(Bae 등, 2010), 최근 농촌진흥청 축산과학원과 캐나다 Livestock Genetec과의 국제 공동연구를 통한 한우에 대한 전장유전체 해독에 힘입어 한우 전장유전체에서의 CNV연구결과가 발표될 예정에 있다(Choi 등, 2012). 이전 연구에서 보여졌듯(Stothard 등, 2011), Choi 등(2012)은 NGS에서 생성된 기존의 Btau4 seqeunce assembly에 맵핑된 Black Angus와 Holstein의 short reads를 UMD3 sequence assembly로 재가공하여 이를 한우 NGS 데이터와 비교 분석하여 기존 SNP chip과 aCGH의 결과보다 resolution이 향상된 다수의 CNV를 전장유전체에 걸쳐 발견할 수 있었다. 이렇듯, 국내 재래소에 대한 CNV 연구는 매우 제한적인 수로 시행됐으며, 소에서의 주요 경제형질과 관련된 유전자 혹은 유전체 지역의 연관성을 찾기 위하여 SNP과 더불어 CNV에 대한 그 중요성이 부각되고 있는 시점에서 이러한 연구에 대한 필요성이 시급하다 할 수 있겠다. 이에 대한 중요성은 축산대국이라 일컬어지는 미국, 캐나다, 호주뿐만이 아닌 일본, 브라질 등에서도 자국 내 소에 대한 유전체 해독 및 분석이 완료 혹은 진행 중에 있으며(Eck 등, 2009; Kawahara-Miki 등, 2011; Stothard 등, 2011; Canavez 등, 2012), 이를 이용 보다 광범위한 유전다형성의 발굴 및 그의 분석에 박차를 가하고 있다는 점에서 잘 뒷받침되어지고 있다. 특히 한반도 재래종의 경우 한우를 제외한 전장유전체 해독마저 되지 않은 타 3 품종에 대한 연구는 우선적으로 전장유전체 해독이 이루어져야 하며 이를 통해 대량의 SNP 발굴과 병행하여 CNV의 연구가 수행 되어져야 한다.
Ⅲ. 결론
소 전장유전체 해독이후 전장유전체에 걸친 유전다형성 정보를 이용하여 가축 주요경제형질과 연관된 유전자 혹은 유전체 지역을 밝히는 연구가 활발히 진행되어져 오고 있다. 이러한 소에서의 주요 관심형질의 변이를 설명할 수 있는 유전체 변이로서 SNP과 더불어 최근 복제수변이, CNV 에 대한 관심이 급격히 높아지게 되었다. 다양한 방식의 플랫폼들이 소 전장유전체에서의 CNV 발굴에 사용 되어졌으며, 대표적으로 Bovine 50K BeadChip, aCGH 및 차세대 유전체 해독법인, NGS등의 방법이 사용되어 졌다. 이들 플랫폼들은 각각의 장단점과 특성을 가지고 있으며 이러한 차이에도 불구하고 소에서 적용된 이들 방법들은 전장유전체에 걸친 광범위한 CNV 발굴을 해내었다. 특히 최근 차세대 전장유전체 해독의 비약적인 발전으로 인한 대폭적인 비용 하락 및 정확도의 향상에 의해 NGS를 이용한 CNV 발굴이 주목받기 시작하였으며 이는 보다 정밀한 수준의 CNV 발굴이 가능함을 보여주었다. 결과적으로 이러한 NGS를 이용한 CNV 발굴이 기존 SNP chip이나 aCGH를 대체할 것이라는 전망이 나오고 있지만, 현존하는 비용, 분석 등의 난해함 및 실험의 용이성 등으로 인해 광범위한 CNV 발굴 및 validation을 거쳐 이들 CNV를 예측할 수 있는SNP chip이나 aCGH 개발 역시 다개체, 다품종 및 집단수준의 연구를 위해 용이한 수단이 될 것이라 사료되어진다. 더불어 한반도 재래종에 대한 CNV의 연구는 매우 제한적으로 이루어져 왔으며, 특히 전장유전체 해독마저 되지 않은 소수 재래종에 대해서는 whole-resequencing 등을 통한 전장유전체에 산재된 SNP 및 InDel 등을 포함한 유전적 다형성들을 시급히 발견하여 궁극적으로 이를 소에서의 주요 경제형질과 관련된 유전자 동정(혹은 유전체 지역), 유전체 선발(genomic selection) 및 가축화 기원 등의 연구 등에 사용될 유용한 자료로서 이용 되어져야 할 것이다.
Ⅳ. 요약
2009년 국제 소유전체 및 반수체 프로젝트 발표 후, 전장 유전체에 걸쳐 광범위하게 존재하는 유전다형성 특히 대량의 단일염기다형성인 SNP이 널리 발굴 되어오고 있으며, 최근 또 다른 형태의 구조적 유전다형성인 복제수변이 (CNV)가 소유전체에서 광범위하게 존재함이 밝혀졌다. 특히 사람 및 모델생물의 연구결과에서 이러한 CNV가 질병 및 다양한 phenotype에 관련이 있음이 밝혀지고 있으며, 이는 소 유전체 연구에서 SNP과 더불어 CNV가 주요경제형질 관련 유전자(지역)과의 연관관계를 규명하는데 있어 주요한 수단이 될 것이라 사료되어지고 있다. 현재까지 소 유전체에의 CNV 연구는 제한적인 수로 수행 되어져 왔으며, microarray를 이용한 교잡 및 NGS에서 생성되는 데이터 분석에 기반한 분석법이 대표적으로 사용 되어져 왔다. 전장유전체에서의 CNV 발굴에 있어 이들 두 방법들 간에 분명한 차이에도 불구하고, 현재까지 수행되어진 연구들은 성공적으로 전장유전체에 걸쳐 광범위하게 퍼져있는 CNV를 발견할 수 있었다. 이러한 성공에도 불구하고, 보다 정밀한 수준의 CNV 발굴 및 분석을 위해 아직까지 사용된 각 플랫폼들에 대해 기술적인 문제점들이 상존하고 있으며, 이러한문제점들을 극복해 나가며 추후 다개체 다품종에 대한 CNV 분석을 통해 아직까지 발견되어지지 않은 CNV들의 지속적인 발굴이 필요한 상태이다. 또한 이러한 CNV 발굴에서 더 나아가 소 유전체에서 이들의 생물학적 기능에 대한 연구가 극히 한정되어 있는 현실이며, 발굴된 CNV가 소유전체에서 어떠한 식으로 작용하는지 그리고 관심경제형질과 어떻게 관련이 있는지 보다 정확한 답을 얻기 위해 이러한 발굴된 CNV에 대한 기능학적 연구 역시 추가적으로 수행 되어져야 할 것이다.
사사
본 연구는 강원도 농업기술원 특화작목연구개발과제(과제번호: 120110184)와 농촌진흥청 차세대 바이오그린21 사업(과제번호 PJ008196)으로 이루어 졌으며 이에 감사드립니다.
Reference
2.Bickhart, D. M., Hou, Y., Schroeder, S. G., Alkan, C., Cardon, M. F., Matukumalli, L. K., Song, J., Schnabel, R. D., Ventura, M., Taylor, J. F., Garcia, J. F., Van Tassell, C. P., Sonstegard, T. S., Eichler, E. E., Liu, G. E. 2012. Copy number variation of individual cattle genomes using next-generation sequencing. Genome Res. 22:778-790.
3.Canavez, F. C., Luche, D. D., Stothard, P., Leite, K. R. M., Sousa-Canavez, J. M., Plastow, G., Meidanis, J., Souza, M. A., Feijao, P., Moore, S. S., Camara-Lopes, L. H. 2012. Genome sequence and assembly of Bos indicus. J. Hered. 103:342-348.
4.Chen, W.-K., Swartz, J. D., Rush, L. J., Alvarez, C. E. 2009. Mapping DNA structural variation in dogs. Genome Res. 19:500-509.
5.Choi, J., Lee, K., Liao, X., Stothard, P., An, H., Ahn, S., Lee, S., Lee, S., Moore, S. S., Kim, T. 2012. Identification of genome-wide copy number variation by resequencing Hanwoo and its comparison with Black Angus and Holstein sequencing data. Mammalian Genome. Submitted.
6.Eck, S. H., Benet-Pagès, A., Flisikowski, K., Meitinger, T., Fries, R., Strom, T. M. 2009. Whole genome sequencing of a single Bos taurus animal for single nucleotide polymorphism discovery. Genome Biol. 10:R82.
7.Elsik, C. G., Tellam, R. L., Worley, K. C., Gibbs, R. A., Choi, J. et al. 2009. The genome sequence of taurine cattle: a window to ruminant biology and evolution. Science. 324:522-528.
8.Fadista, J., Nygaard, M., Holm, L.-E., Thomsen, B., Bendixen, C. 2008. A snapshot of CNVs in the pig genome. PLoS ONE 3:e3916.
9.Fadista, J., Thomsen, B., Holm, L.-E., Bendixen, C. 2010. Copy number variation in the bovine genome. BMC Genomics. 11:284.
10.Gibbs, R. A., Taylor, J. F., Van Tassell, C. P., Barendse, W., Choi, J. et al. 2009. Genome-wide survey of SNP variation uncovers the genetic structure of cattle breeds. Science. 324:528-532.
11.Hou, Y., Liu, G. E., Bickhart, D. M., Cardone, M. F., Wang, K., Kim, E.-S., Matukumalli, L. K., Ventura, M., Song, J., VanRaden, P. M., Sonstegard, T. S., Van Tassell, C. P. 2011. Genomic characteristics of cattle copy number variations. BMC Genomics. 12:127.
12.Iafrate, A. J., Feuk, L., Rivera, M. N., Listewnik, M. L., Donahoe, P. K., Qi, Y., Scherer, S. W., Lee, C. 2004. Detection of large-scale variation in the human genome. Nat. Genet. 36:949-951.
13.Liu, G. E., Hou, Y., Zhu, B., Cardone, M. F. Jiang, L., Cellamare, A., Mitra, A., Alexander, L. J., Coutinho, L. L., Dell'Aquila, M. E., Gasbarre, L. C., Lacalandra, G., Li, R. W., MatuKumalli, L. K., Nonneman, D., Regitano, L. C., Smith, T. P., Song, J., Sonstegard, T. S., Van Tassell, C. P., Ventura, M., Eichler, E. E., McDaneld, T. G., Keele, J. W. 2010. Analysis of copy number variations among diverse cattle breeds. Genome Res. 20:693-703.
14.Hayes, B. J., Bowman, P. J., Chamberlain, A. J., Goddard, M. E. 2009. Invited review: Genomic selection in dairy cattle: progress and challenges. J. Dairy Sci. 92:433-443.
15.Kawahara-Miki, R., Tsuda, K., Shiwa, Y., Arai-Kichise, Y. Matsumoto, T., Kanesaki, Y., Oda, S., Ebihara, S.,Yajima, S., Yoshikawa, H., Kono, T. 2011. Wholegenome resequencing shows numerous genes with nonsynonymous SNPs in the Japanese native cattle Kuchinoshima-Ushi. BMC Genomics. 12:103.
16.Kijas, J. W., Barendse, W., Barris, W., Harrison, B. McCulloch, R., McWilliam, S., Whan, V. 2011. Analysis of copy number variants in the cattle genome. Gene 482:73-77.
17.Lander, E. S., Linton, L. M., Birren, B., Nusbaum, C., Zody, M. C. et al. 2001. Initial sequencing and analysis of the human genome. Nature 409:860921.
18.Lewin, H. A. 2009. Genetics. It's a bull's market. Science. 324:478-479.
19.Liu, G. E., Hou, Y., Zhu, B., Cardone, M. F. Jiang, L., Cellamare, A., Mitra, A., Alexander. L. J., Coutinho, L. L., Dell'Aquila, M. E., Gasbarre, L. C., Lacalandra, G.,Li, R. W., Matukumalli, L. K., Nonneman, D., Regitano, L. C., Smith, T. P., Song, J., Sonstegard, T. S., Van Tassell, C. P., Ventura, M., Eichler, E. E., McDaneld, T. G., Keele, J. W. 2010. Analysis of copy number variations among diverse cattle breeds. Genome Res. 20:693-703.
20.Lupski, J. R. 2007. Genomic rearrangements and sporadic disease. Nat. Genet. 39:S43–47.
21.McCarroll, S. A., Altshuler, D. M. 2007. Copy-number variation and association studies of human disease. Nat. Genet. 39:S37-42.
22.Pinkel, D., Segraves, R., Sudar, D., Clark, S., Poole, I., Kowbel, D., Collins, C., Kuo, W. L., Chen, C., Zhai, Y., Dairkee, S. H., Ljung, B. M., Gray, J. W., Albertson, D. G. 1998. High resolution analysis of DNA copy number variation using comparative genomic hybridization to microarrays. Nat. Genet. 20:207-211.
23.Redon, R., Ishikawa, S., Fitch, K. R., Feuk, L. et al. 2006. Global variation in copy number in the human genome. Nature. 444:444-454.
24.Sebat, J., Lakshmi, B., Troge, J., Alexander, J. Young, J., Lundin, P., Månér, S., Massa, H., Walker, M., Chi, M., Navin, N., Lucito, R., Healy, J., Hicks, J., Ye, K., Reiner, A., Gilliam, T. C., Trask, B., Patterson, N., Zetterberg, A., Wigler, M. 2004. Large-scale copy number polymorphism in the human genome. Science. 305:525-528.
25.Van Eenennaam, A. L., Li, J., Thallman, R. M., Quaas, R. L. Dikeman, M. E., Gill, C. A., Franke, D. E., Thomas, M. G. 2007. Validation of commercial DNA tests for quantitative beef quality traits. J. Anim. Sci. 85:891-900.
26.Van Tassell, C. P., Smith, T. P. L., Matukumalli, L. K., Taylor, J. F. Schnabel, R. D., Lawley, C. T., Haudenschild, C. D., Moore, S. S., Warren, W. C., Sonstegard, T. S. 2008. SNP discovery and allele frequency estimation by deep sequencing of reduced representation libraries. Nat. Methods. 5:247-252.
27.Wang, K., Li, M., Hadley, D., Liu, R., Glessner, J., Grant, S. F., Hakonarson, H., Bucan, M. 2007. PennCNV: an integrated hidden Markov model designed for high-resolution copy number variation detection in whole-genome SNP genotyping data. Genome Res. 17:1665-1674.
28.Zhang, F., Gu, W., Hurles, M. E., Lupski, J. R. 2009. Copy number variation in human health, disease, and evolution. Annu Rev Genomics Hum Genet 10:451- 481.