8
SYS - miRNA - 003, MAY 2010 1 YFiles 를 이용한 miRNA-TF Regulation Network 의 그래프 가시화 Graph Visualization of TF-miRNA Regulation Network Using YFiles 김선영 Kim SeonYeong 부산대학교 컴퓨터공학과 [email protected] ABSTRACT microRNA(miRNA) 는 유전자 발현 조절에 관여하는 단백질로 번역되지 않는 기능 RNA 분자 의 일부이다. miRNA의 상단부 조절인자 역할을 하는 TF(Transcription factor) 에 의해 miRNA 가 잘못된 조절을 수행하면 질병을 유발할 수 있어 TF-miRNA regulation 은 중요한 측면으로 인지되고 있으나 현재 식물분야에서 이를 다루는 DB 는 존재하지 않는다. 본 연구실에서 진행 중인 TF-miRNA regulation DB 구축을 완료하면 식물의 생장, 발달단계, 외부자극에 관여하는 유전자 및 매커니즘에 관심있는 생물학자들이 TF-miRNA regulator 와 연관된 기작들을 한 눈에 이해할 수 있도록 이를 시각화하여 나타내는 것이 필요하다. 따라서 본 보고서에서는 TF-miRNA regulation network 를 그래프로 가시화하기 위해 Extensive Java Class Library yFiles 를 이용 하여 시각화하는 방법에 대해 설명한다. TF-miRNA relation 데이터는 아직 구축되지 않은 DB 를 대신해 TestDataSet 파일을 사용하였다. Keywords TF-miRNA regulation network, yFiles, graph visualization 1 서론 microRNA(miRNA) 는 유전자 발현 조절에 관여하는 단백질로 번역되지 않는 기능 RNA 분자의 일부 이다. miRNA의 발현은 상단부 조절인자 (upstream regulator) TF(Transcription factor) 가 활성화 하거나 저해할 수 있다. TF 에 의해 miRNA가 잘못된 조절을 수행하면 질병을 유발할 수 있음을 암 시하는 증거가 증가하고 있어, miRNATF 의 개별 연구에서 TF-miRNA regulation 은 가장 중요한 측면으로 인지되고 있으나[1] 현재 식물분야에서 이를 다루는 DB는 존재하지 않는다. 본 연구실에서 진행 중인 TF-miRNA regulation DB 구축을 완료하면 식물의 생장, 발달단계, 외부자극에 관여하는 유전자 및 매커니즘에 관심있는 생물학자들이 TF-miRNA regulator 와 연관된 기작들을 한 눈에 이해 하고 고려할 수 있도록 이를 시각화하여 나타내는 것이 중요하다. 따라서 본 보고서에서는 TF-miRNA regulation network 를 그래프로 가시화하기 위해 Extensive Java Class Library yFiles 를 이용하여 시각화하는 방법에 대해 설명한다. TF-miRNA regulation network 를 표현하기 위한 입력 데이터로는 아직 구축되지 않은 DB를 대신해 TestDataSet 파일을 사용하였다. Copyright © Graphics Application Lab. Pusan National University

YFiles를이용한 miRNA-TF Regulation Network 의그래프가시화pearl.cs.pusan.ac.kr/~wiki/images/a/ad/SYS201003MIRNA.pdf · 2015-01-18 · SYS - miRNA - 003, MAY 2010 5 3.2 Layout

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: YFiles를이용한 miRNA-TF Regulation Network 의그래프가시화pearl.cs.pusan.ac.kr/~wiki/images/a/ad/SYS201003MIRNA.pdf · 2015-01-18 · SYS - miRNA - 003, MAY 2010 5 3.2 Layout

SYS - miRNA - 003, MAY 2010 1

YFiles를이용한 miRNA-TF Regulation Network의그래프가시화Graph Visualization of TF-miRNA Regulation Network Using YFiles

김선영

Kim SeonYeong

부산대학교 컴퓨터공학과

[email protected]

ABSTRACTmicroRNA(miRNA)는 유전자 발현 조절에 관여하는 단백질로 번역되지 않는 기능 RNA 분자의 일부이다. miRNA의 상단부 조절인자 역할을 하는 TF(Transcription factor)에 의해 miRNA가 잘못된 조절을 수행하면 질병을 유발할 수 있어 TF-miRNA regulation은 중요한 측면으로인지되고 있으나 현재 식물분야에서 이를 다루는 DB는 존재하지 않는다. 본 연구실에서 진행중인 TF-miRNA regulation DB 구축을 완료하면 식물의 생장, 발달단계, 외부자극에 관여하는유전자 및 매커니즘에 관심있는 생물학자들이 TF-miRNA regulator와 연관된 기작들을 한 눈에이해할 수 있도록 이를 시각화하여 나타내는 것이 필요하다. 따라서 본 보고서에서는 TF-miRNAregulation network를 그래프로 가시화하기 위해 Extensive Java Class Library인 yFiles를 이용하여 시각화하는 방법에 대해 설명한다. TF-miRNA relation 데이터는 아직 구축되지 않은 DB를 대신해 TestDataSet 파일을 사용하였다.Keywords TF-miRNA regulation network, yFiles, graph visualization

1 서 론

microRNA(miRNA)는 유전자 발현 조절에 관여하는 단백질로 번역되지 않는 기능 RNA 분자의 일부이다. miRNA의 발현은 상단부 조절인자 (upstream regulator)인 TF(Transcription factor)가 활성화하거나 저해할 수 있다. TF에 의해 miRNA가 잘못된 조절을 수행하면 질병을 유발할 수 있음을 암시하는 증거가 증가하고 있어, miRNA와 TF의 개별 연구에서 TF-miRNA regulation은 가장 중요한측면으로 인지되고 있으나[1] 현재 식물분야에서 이를 다루는 DB는 존재하지 않는다. 본 연구실에서진행 중인 TF-miRNA regulation DB 구축을 완료하면 식물의 생장, 발달단계, 외부자극에 관여하는유전자 및 매커니즘에 관심있는 생물학자들이 TF-miRNA regulator와 연관된 기작들을 한 눈에 이해하고 고려할 수 있도록 이를 시각화하여 나타내는 것이 중요하다. 따라서 본 보고서에서는 TF-miRNAregulation network를 그래프로 가시화하기 위해 Extensive Java Class Library인 yFiles를 이용하여시각화하는 방법에 대해 설명한다. TF-miRNA regulation network를 표현하기 위한 입력 데이터로는아직 구축되지 않은 DB를 대신해 TestDataSet 파일을 사용하였다.

Copyright © Graphics Application Lab. Pusan National University

Page 2: YFiles를이용한 miRNA-TF Regulation Network 의그래프가시화pearl.cs.pusan.ac.kr/~wiki/images/a/ad/SYS201003MIRNA.pdf · 2015-01-18 · SYS - miRNA - 003, MAY 2010 5 3.2 Layout

SYS - miRNA - 003, MAY 2010 2

2 TF-miRNA의 기능

miRNA는 식물에서 전사 후 유전자 조절 레벨에서 타겟 mRNA(messenger RNA)를 절단하거나 번역을 저해하는 역할을 한다. miRNA는 많은 필수 생물학적 과정에서 중요한 역할을 수행하기때문에, 특정miRNA의 기능 장애는 암과 같은 다양한 질병과 연관된다. 전사 단계에서 활동하는 유전자 regulator의 중요한 클래스인 TF에 의해서 miRNA의 발현이 활성화 (activated)되거나 억제 (repressed)될 수있기 때문에, TF가 miRNA 의 upstream regulator 역할을 할 수 있다. TF가 miRNA의 잘못된 조절을유발하면 질병을 일으킬 수 있음을 암시하는 증거들이 증가하고 있어, TF에 의한 miRNA 조절 (TF-miRNA regulation)은 miRNA와 TF의 개별 연구에서도 가장 중요한 측면 중 하나이며, 많은 연구자들의 관심도 끌고 있다. 그러나 아직까지 이에 관한 연구는 인간이나 동물에 관한 것으로 상대적으로

한정되어 있다[1]. 식물 분야에서는 TF-miRNA regulation network를 다루는 DB가 아직 존재하지 않으므로, 본 연구실에서 의미있는 TF-miRNA DB 구축과 이를 시각화하기 위한 연구를 수행하고 있다. VARNA와 같이 RNA 구조를 자동으로 그리고 편집하는 drawing tool[2]이나 대규모 RNA의 평면그림을 생성하는 tool에 관한 연구[3]와 같이 생물학 정보를 시각화하는 drawing tool은 여러가지가연구되고 있으나, 본 보고서에서는 인간 TF-miRNA regulatory network를 가시화한 모습[1]인 그림 1과 같은 방법으로, yFiles을 이용해 식물 TF-miRNA regulatory network를 가시화하였다.

그림 1. 인간 TF-miRNA regulatory network를 가시화한 모습[1]. 초록색 원은 TFs를 나타내고, 빨간색 원은 miRNAs를 나타낸다.

Copyright © Graphics Application Lab. Pusan National University

Page 3: YFiles를이용한 miRNA-TF Regulation Network 의그래프가시화pearl.cs.pusan.ac.kr/~wiki/images/a/ad/SYS201003MIRNA.pdf · 2015-01-18 · SYS - miRNA - 003, MAY 2010 5 3.2 Layout

SYS - miRNA - 003, MAY 2010 3

3 그래프 가시화와 분석을 위한 yFiles Library

yFiles는 독일의 yWorks 에서 개발한 확장 자바 클래스 라이브러리이다. yFiles는 graph, diagram,network의 가시화와 레이아웃 및 분석에 필요한 여러가지 컴포넌트와 알고리즘을 제공하며 크게 basic,layout, viewer 세 부분으로 나눌 수 있다[4]. yFiles는 J2SDK 1.4이상이거나 J2RE 1.4이상, MicrosoftInternet Explorer 6.0이상이거나 Mozilla Firefox 1.5이상의 환경에서 동작한다. 현재 yFiles for Java

그림 2. yFiles의 전체적인 패키지 구조. 크게 basic, layout, view 세 package로 나뉜다.

의 버전은 2.7.0.1까지 개시되었으며, academic version은 그 가격이 $1,440이다.본 연구실에서 보유한 yFiles for Java의 버전은 2.2.1로 주요 업그레이드 사항은 다음과 같다.

1. 각 레이아웃이 세밀한 레이아웃 사용자지정 옵션을 지원함.

2. Swing UI component 사용하여 노드를 rendering하도록 지원함.

3. 노드의 겹침을 명확하게 드러내고, 특정 노드를 이전이나 후에 주어진 참조 노드에 위치시키거나시작이나 끝에 위치 시키도록 명시화하는 사용자정의 제약 노드 순서를 지원하도록 hierarchicallayout 개선.

4. edge 겹침으로 인해 유발되는 시각적인 모호함 해결.

5. 그룹화한 그래프를 위해 새로운 클래스인 swimlane layout 지원.

6. 가족 계통 트리에 적합한 새로운 domain-specific layout algorithm 지원.

버전이 여러 번 바뀌었기 때문에 개선점이나 업그레이드 된 사항이 많으나 대표적으로 바뀐 내용은

위에서 언급한 바와 같다. 그래프로 세밀하게 가시화할 필요가 있으면 2.7 버전을 구매하는 것이 좋으나, 단순한 형태의 그래프를 그리거나 노드를 그룹화하여 세분화하는 기능이 필요하지 않다면 굳이 새

버전을 구매할 필요는 없다고 여겨진다.

Copyright © Graphics Application Lab. Pusan National University

Page 4: YFiles를이용한 miRNA-TF Regulation Network 의그래프가시화pearl.cs.pusan.ac.kr/~wiki/images/a/ad/SYS201003MIRNA.pdf · 2015-01-18 · SYS - miRNA - 003, MAY 2010 5 3.2 Layout

SYS - miRNA - 003, MAY 2010 4

3.1 Basic

yFiles 라이브러리에서 제공하는 기본적인 패키지로 그래프 분석에 필요한 데이터 타입과 필수 클래스들을 제공한다. 이 패키지의 대략적인 구성은 다음과 같다.

1. y.algo : 그래프 분석에 효과적인 인터페이스와 클래스를 제공하는 클래스로써, Bfs, Dfs, ShortestPath, Spanning tree, cycles, path, Network Flows 등에 대한 분석 기능을 제공한다.

2. y.base : yFiles 라이브러리의 가장 기본적인 클래스와 인터페이스를 제공한다. 효과적인 그래프데이터 타입과 노드, 에지에 관련된 클래스로써 Graph, Node, Edge등의 클래스와 EdgeMap,NodeMap 등의 인터페이스를 제공한다.

3. y.geom : 2차원적인 기하와 관련된 연산을 수행하는 클래스로써 Angle, Geom, borderLine, Line-Segment, YPoint, YCircle, YDimension 등의 클래스를 제공한다.

4. y.util : yFiles 라이브러리가 사용하는 utility 클래스로써, Map, Hash, Random, Queue, stack 등의 클래스를 제공한다.

(a) (b) (c)

(d) (e) (f)

그림 3. yFiles에서 제공하는 다양한 레이아웃과 알고리즘을 사용해 그래프를 가시화한예제들. (a)와 (b)는 같은 그래프이나 single cycle 형태이냐 biconnected component에속한 노드들이 독립된 영역에 할당되느냐에 따라 다른 레이아웃을 보인다. (c)는 노드를 색상 별로 분류한 모습이고 (d)는 지정한 노드들을 그룹화할 수 있음을 나타낸다.(e)는 계층구조를 띠고 (f)는 edge router를 이용해 edge의 겹침을 최소화하여 그래프를가시화한 모습이다.

Copyright © Graphics Application Lab. Pusan National University

Page 5: YFiles를이용한 miRNA-TF Regulation Network 의그래프가시화pearl.cs.pusan.ac.kr/~wiki/images/a/ad/SYS201003MIRNA.pdf · 2015-01-18 · SYS - miRNA - 003, MAY 2010 5 3.2 Layout

SYS - miRNA - 003, MAY 2010 5

3.2 Layout

다양한 레이아웃 스타일, 예를 들어 hierarchic, orthogonal, circular 등의 그래프 레이아웃 알고리즘을제공한다. 이 패키지의 대략적인 구성은 다음과 같다.

1. y.layout : 자동으로 그래프 레이아웃 생성을 지원하는 클래스로써, EdgeLayout, GraphLayout,NodeLayout등의 클래스를 제공한다.

2. y.layout.labeling : 노드와 에지의 레이블 위치를 자동으로 결정해주는 클래스이다.

3. y.layout.grouping : 계층 구조의 그룹화 레이아웃을 지원하는 클래스로써, Grouping, Recursive-Layouter 등의 클래스를 제공한다.

4. y.layout.router : 에지의 겹침을 최소화하는 방식으로 에지를 위치시키는 클래스이다.

5. y.layout.transformer : scaling이나 rotating, mirroring과 같은 기하학적인 변형을 수행하는 lay-outer이다.

3.3 Viewer

Basic의 상위 계층에 존재하는 것으로 Swing 기반의 GUI에서 그래프를 가시화하는 기능을 제공한다.그리고 GraphML, YGF, JPG, GIF 와 같은 다양한 그래프와 이미지 파일 포맷을 지원한다.

1. y.anim : animation framework를 위한 핵심 클래스와 인터페이스를 제공한다.

2. y.io : 다양한 파일 포맷에 Graph2D 오브젝트를 쓰거나 읽어들이는 클래스로써, GIFIOhandler,ImageIoOutputhandler, JPGIOHandler, TGFIOHandler 등의 클래스를 제공한다.

3. y.module : yFiles layout algorithms, edge routing algorithms와 몇 가지 그래프 도구를 위한layouter의 상위 클래스이다.

4. y.option : 파라미터 집합을 편집하거나 저장, 관리를 매우 편리하게 하는 클래스로써, Editor,AbstractGuiFactory, ColorOptionItem, FileOptionItem등의 클래스를 지원한다.

5. y.view : 그래프를 편집하거나 에니매이션을 넣거나 볼 수 있게 하는 중요한 인터페이스와 클래스를 제공하는 클래스로써, Drawable, Graph2D, Graph2DView, hotSpotMode등의 클래스를지원한다.

4 yFiles를 이용한 그래프 가시화

그래프로 가시화할 데이터는 파일 입력을 통해 얻는다. 추후 TF-miRNA regulation DB와 연동해 데이터를 파싱할 것이나 현재는 DB가 구축되어 있지 않기 때문에 Test Data Set을 입력파일로 받는다. 그림 4 은 입력받는 파일의 포맷이며, 총 6개의 정보를 포함한다. item1과 item2는 각각 sourceregulator, target regulator를 의미하고, direction은 이들 item의 방향성을 나타낸다. function은 지정한 방향으로 작용하는 기작을 뜻하며, species는 종 명, signaling pathway는 외부 자극의 전달과정을

Copyright © Graphics Application Lab. Pusan National University

Page 6: YFiles를이용한 miRNA-TF Regulation Network 의그래프가시화pearl.cs.pusan.ac.kr/~wiki/images/a/ad/SYS201003MIRNA.pdf · 2015-01-18 · SYS - miRNA - 003, MAY 2010 5 3.2 Layout

SYS - miRNA - 003, MAY 2010 6

의미한다. item들은 node로 생성되며 direction에 따라 edge의 방향이 정해진다. direction은 m2TF,m2m, TF2m, TF2TF 로 총 네 가지의 경우가 존재한다. 여기서 m과 TF는 각각 miRNA와 TF를 뜻하는데, ath-miR160 과 같은 꼴의 단백질 이름이 microRNA이고 ARF10, TAS3 등과 같은 형태가 TF에해당한다. edge의 방향이 결정되었으면 function의 종류에 따라 화살표의 형태가 달라진다. repression일 경우 실선, activation일 경우 점선으로 나타나는 것이 그것이다. 본래 생물학 정보에서 사용되는edge의 형태는 두 가지가 뚜렷이 다른 형태이나 yFiles에서 지원하지 않는 edge의 형태이기 때문에화살표의 선 모양으로 두 가지를 구별하였다. species는 item들이 속한 종을 명시한 것으로 아기장대(arabidopsis),고추(capsicum annum) 등이있으며, signaling pathway는외부자극의전달과정을 auxinsignaling 이나 nutrition metabolism 등으로 분류한 것이다.

그림 4. 그래프로 가시화할 입력 데이터의 파일 포맷. item1과 item2는 각각 source, tar-get regulator이다. direction의종류에따라 edge의화살표방향이정해지며 function에따라 화살표의 종류가 달라진다. 가령 m2TF는 microRNA(ath-miR160등) 에서 TF(ARF16등)으로 edge 방향이 결정되며, direction이 repression일 경우 실선 화살표, activation일경우 점선 화살표가 생성된다.

Algorithm 1 기본 그래프의 생성과 가시화graph = new Graph2D();view = new Graph2DView(graph);Node n1 = graph.createNode();Node n2 = graph.createNode();NodeLabel nLable1 = new NodeLabel(”node1”);NodeLabel nLable2 = new NodeLabel(”node2”);graph.getRealizer(n1).setLabel(nLable1);graph.getRealizer(n2).setLabel(nLable2);Edge e1 = graph.createEdge(n1, n2);graph.getRealizer(e1).setArrow(Arrow.STANDARD);EdgeRealizer er = graph.getRealizer(e1);er.getLabel().setText(”edge1”);

그림 4 과 같은 데이터를 입력하여 그래프로 가시화하면 그림 5 와 같은 결과를 얻을 수 있다. 각

Copyright © Graphics Application Lab. Pusan National University

Page 7: YFiles를이용한 miRNA-TF Regulation Network 의그래프가시화pearl.cs.pusan.ac.kr/~wiki/images/a/ad/SYS201003MIRNA.pdf · 2015-01-18 · SYS - miRNA - 003, MAY 2010 5 3.2 Layout

SYS - miRNA - 003, MAY 2010 7

노드가 중복없이 다른 노드들과 edge로 연결되어있음을 확인할 수 있다. 분홍색 원은 miRNA이고 오렌지 색 사각형은 TF를 의미하며, 각 노드에 regulator의 이름이 표시되어 있어 쉽게 구분할 수 있다.파란색 실선 화살표는 repressed 정보이고 빨간색 점선 화살표는 activated 정보를 나타낸다. 추후 화면에 데이터 정보를 나타낼 예정이고, 나타낼 정보로는 총 miRNA 의 수, 총 TF의 수, 아직 사용하지않은 데이터인 signaling pathway의 종류에 따른 miRNA의 수, TF의 수가 있다.

그림 5. 그림 4 의 파일을 입력으로 받아 그래프로 가시화한 모습. 노드들이 중복없이생성된 것을 확인할 수 있으며, 각 노드에 해당하는 regulator의 이름이 labeling 되어나타나있다. 여기서 분홍색 원은 miRNA를, 오렌지색 사각형은 TF를 의미한다. 파란색실선 화살표는 repression, 빨간색 점선 화살표는 activation을 의미한다.

기본적인 그래프를 생성하고 레이블을 다는 방법은 Algorhithm 1을 실행하여 쉽게 생성할 수 있고,실행결과 생성된 그래프는 그림 6 과 같다. 그림 6은 두 개의 노드와 이를 연결하는 edge이다. 각 node와 edge에는 label을 달 수 있다.

5 결론 및 추후 연구

본 보고서에서는 yFiles 라이브러리를 이용하여 TF-miRNA regulation network를 그래프로 가시화하는 방법에 대해 알아보았다. TF-miRNA는 질병을 유발하는 원인으로 대두되고 있는데 식물 분야에서TF-miRNA regulation 정보를 다루는 데이터베이스는 존재하지 않기 때문에 본 연구실에서 이들 관계의 network를 데이터베이스로 구축하는 일을 하고 있다. 그러나 식물의 생장, 발달단계, 외부 자극에

Copyright © Graphics Application Lab. Pusan National University

Page 8: YFiles를이용한 miRNA-TF Regulation Network 의그래프가시화pearl.cs.pusan.ac.kr/~wiki/images/a/ad/SYS201003MIRNA.pdf · 2015-01-18 · SYS - miRNA - 003, MAY 2010 5 3.2 Layout

SYS - miRNA - 003, MAY 2010 8

그림 6. 코드 1 의 실행결과 생성된 그래프. node가 두 개, 두 node를 잇는 edge가 하나생성되었고, node와 edge에 모두 label을 달 수 있다.

관여하는 유전자 및 매커니즘에 관심있는 생물학자들이 TF-miRNA regulation과 연관된 기작을 한눈에 이해하기 위해서는 구축한 데이터베이스를 시각화해야 할 필요성이 있다. 따라서 본 보고서에서

는 yWorks사에서 개발한 extensive java class library인 yFiles를 이용하여 각 regulatory 간의 연관기작을 그래프로 가시화하여 나타내었다. 추후 signaling pathway 정보에 따라 각 TF와 miRNA의 현황을 파악하기 쉽도록 그래프를 가시화한 화면에 함께 정보를 나타낼 예정이며 TF-miRNA regulationdatabase가 구축되면 이와 연동하여 데이터를 좀 더 안정적으로 관리할 수 있을 것으로 기대한다. 또한특정 매커니즘을 시뮬레이션 할 수 있도록 가시화 기능을 추가적으로 강화할 계획이다.

참고 문헌

1. Juan Wang, Ming Lu, Chengxiang Qiu, and Qinghua Cui, “Transmir: a transcription factor-micrornaregulation database,” Oxford University Press, vol. 38, pp. 119–122, 2010.

2. Kevin Darty, Alain Denise, and Yann Ponty, “Varna: Interactive drawing and editing of the rna secondarystructure,” Bioinformatics, 2009.

3. Yanga Byun and Kyungsook Han, “Pseudoviewer3 : generating planar drawings of large-scale rna struc-tures with pseudoknots,” Bioinformatics, 2009.

4. yWorks, “http://www.yworks.com,” .5. Park Soo-Hyun, “yfiles를 이용한 그래프 가시화 시스템의 구현,” Technical Report, REP-07-002-BIO, 2007.

Copyright © Graphics Application Lab. Pusan National University