태그 '정보융합'에 해당하는 글 1건

유전자에게 질병관련 우선순위를 부여하는 방법 2007/05/10 00:28:00
트랙백 주소 : http://freetime.freelog.net/trb.php?id=39716

질병 관련 유전자 우선 순위 결정 방법론

 

질병과 관련된 유전자를 찾아내는 일은 bio-medical research의 주요 agenda이다. 특히 게놈 서열, 유전자 발현 정보, 단백질 상호 interaction 정보, 모티프 정보, pathway 정보 등의 high throughput 정보 및 functional annotation 정보의 홍수 속에서 질병과 관련성이 높은 유전자를 선택하여주는 일은 바이오정보학 분야에서 맡아야 할 분야라 할 수 있겠다.

 

2006년도 NPG에서 발간하는 Computational Biology에 발표된 논문 중에서는 다음과 같은 아이디어로 질병 관련 유전자 우선 순위 결정 알고리즘을 개발했다. 주 아이디어는 이미 target disease와 연관이 알려져 있다고 알려진 유전자와 unknown 유전자와의 유사성을 관련 DB에서 계산하고, 이 계산 결과에 때라 unknown 유전자의 질병 관련성에 대한 ranking을 부여하였다. 이 알고리즘의 저변에 있는 기본 가정들은 아래와 같다.

1.     같은 질병이나 pathway에 관여하는 유전자들은 비슷한 annotation 정보를 가지고 있다.

2.     같은 biological process에 관여하는 유전자들은 sequence similarity가 높다.

ð  따라서 regulation이나 expression 또한 비슷할 것이다.

 

위 방법을 검증하기 위해서 training data (즉 이미 질병과 연관성이 있다고 알려진 유전자들) NCBI OMIM에서 얻어왔다. 그리고 나서 training data에 포함되어 있지 않은 인간 유전자에 대해 여러 DB training data에 속한 유전자와의 연관성을 수치화하였다. 서로 다른 DB에서 연관성을 추출했기 때문에 정보융합(information fusion) 단계를 통해 ranking을 단일화하여 결과를 보고한다.

 

 

Brain storming questions

-> Google의 페이지 랭크 방법론과 질병 관련 유전자 우선 순위 결정 방법론과의 유사성?

 

바이오정보, 질병유전자, 정보융합 댓글(0) l 트랙백(0)