Pengertian Bioinformatika
Bioinformatika,
sesuai dengan asal katanya yaitu “bio” dan “informatika” adalah gabungan antara
ilmu biologi dan teknik informasi (TI). Sebagai suatu disiplin ilmu,
bioinformatika merupakan kajian yang memadukan disiplin biologi molekul,
matematika dan teknik informasi (TI). Bidang ini masih tergolong relatif baru
sehingga masih banyak kesalahpahaman mengenai definisinya. Secara umum,
bioinformatika dapat digambarkan sebagai segala bentuk penggunaan komputer
dalam menangani masalah-masalah biologi. Tetapi dalam prakteknya, definisi yang
digunakan lebih bersifat terperinci. Bioinformatika itu sendiri mempunyai
pengertian suatu teknologi pengumpulan, penyimpanan, analisis, interpretasi,
penyebaran dan aplikasi dari data-data biologi molekul. ilmu bioinformatika
lahir atas insiatif para ahli ilmu komputer berdasarkan artificial
intelligence. Mereka berpikir bahwa semua gejala yang ada di alam ini bisa
dibuat secara artificial melalui simulasi dari gejala-gejala tersebut. Untuk mewujudkan
hal ini diperlukan data-data yang menjadi kunci penentu tindaktanduk gejala
alam tersebut, yaitu gen yang meliputi DNA atau RNA. Perangkat utama
Bioinformatika adalah software dan didukung oleh kesediaan internet dan server
World Wide Web (WWW). Syarat utama yang harus dimiliki dalam bidang
bioinformatika adalah keberadaan database. Database informasi dasar saat ini
telah tersedia. Untuk database DNA yang utama adalah GenBank (Amerika Serikat).
Sementara untuk protein, databasenya dapat ditemukan di Swiss-Prot (Swiss)
untuk sekuen asam aminonya, dan Protein Data Bank (PDB) untuk struktur tiga
dimensinya.
Kajian
ini semakin penting, sebab perkembangannya telah mendorong kemajuan
bioteknologi di satu sisi, dan pada sisi lain memberi efek domino pada bidang
kedokteran, farmasi, lingkungan dan pada bidang lainnya termasuk pertanian dan
peternakan. Topik utama bidang ini adalah basis data sekuens biologis,
penyejajaran sekuens (sequence alignment), prediksi struktur untuk meramalkan
bentuk struktur protein maupun struktur sekunder RNA , analisis filogenetika ,
dan analisis ekspresi gen. Kajian baru Bioinformatika ini tak lepas dari
perkembangan biologi molekul modern yang ditandai dengan kemampuan manusia
untuk memahami genom, yaitu cetak biru informasi genetik yang menentukan sifat
setiap makhluk hidup yang disandi dalam bentuk pita molekul DNA (asam
deoksiribonukleat).
Kemampuan
untuk memahami dan memanipulasi kode genetik DNA ini sangat didukung oleh TI
melalui perangkat keras maupun lunak. Dengan Bioinformatika, data-data yang
dihasilkan dari proyek genom dapat disimpan dengan teratur dalam waktu yang
singkat dengan tingkat akurasi yang tinggi sekaligus dianalisa dengan
program-program yang dibuat untuk tujuan tertentu. Di Indonesia, Bioinformatika
masih belum dikenal oleh masyarakat luas. Hal ini dapat dimaklumi karena
penggunaan komputer sebagai alat bantu belum merupakan budaya. Bahkan di
kalangan peneliti sendiri, barangkali hanya para peneliti biologi molekul yang
sedikit banyak mengikuti perkembangannya karena keharusan menggunakan
perangkat-perangkat Bioinformatika untuk analisa data. Sementara di kalangan TI
masih kurang mendapat perhatian.
Ketersediaan
database dasar (DNA, protein) yang bersifat terbuka/gratis merupakan peluang
besar untuk menggali informasi berharga daripadanya. Database genom manusia
sudah disepakati akan bersifat terbuka untuk seluruh kalangan, sehingga dapat
digali/diketahui kandidat-kandidat gen yang memiliki potensi
kedokteran/farmasi. Dari sinilah Indonesia dapat ikut berperan mengembangkan
Bioinformatika. Kerjasama antara peneliti bioteknologi yang memahami makna
biologis data tersebut dengan praktisi TI seperti programmer, dan sebagainya
akan sangat berperan dalam kemajuan Bioinformatika Indonesia nantinya.
BIG DATA FOR BIOINFORMATICS
Munculnya
data set besar dalam pengaturan klinis menyajikan tantangan dan peluang dalam
penyimpanan data dan analisis. Hal ini disebut dengan “Big Data”. Kemajuan
teknologi informasi dan komunikasi menyajikan solusi yang paling layak untuk
analisis big data dalam hal efisiensi dan skalabilitas.
Kerangka
pemrograman MapReduce menggunakan dua tugas umum dalam pemrograman fungsional,
Map dan Reduce. MapReduce adalah kerangka pemrosesan parallel baru dan hadoop
adalah implementasi open-source pada node komputasi tunggal atau cluster.
Penggunaan MapReduce dan Hadoop memiliki keuntungan antara lain;
- Penyimpanan
toleran sehingga pengolahan data yang dapat diandalkan dengan mereplikasi
tugas komputasi dan cloning potongan data yang berbeda komputasi node di
cluster komputasi.
- Pengolahan
data high-throughput dan Hadoop Distributed File System (HDFS).
Data disimpan dalam HDFS dan dibuat tersedia di slave node dan
digunakan untuk perhitungan.
Contoh
singkatnya adalah jika dulu dalam penggabungan gen atau sel harus dilakukan di
super computer yang ukurannya sangat besar dan dengan harga yang tinggi
(high-cost), hal itu tidak diperlukan lagi di era ini.
Saat
ini kita memiliki teknologi big data. Jadi, proses penggabungan gen atau sel
itu bisa dilakukan secara digital di atas big data dan tentunya low-cost.
Proses pengolahan data ini memerlukan tools yang disebut
Hadoop. Labs247 (Solusi247) sendiri memiliki teknologi tersebut yang
dinamakan Hadoop Grid (HGrid247)
Contoh
lain adalah, “Jika ada suatu penyakit baru yang belum diketahui, dengan
teknologi big data ini, kita dapat langsung mengidentifikasi dengan cara
mencocokan gejala-gejala penyakit tersebut dengan data-data yang sudah tersedia
di bank data." Ujar Pak Arifin.
Beberapa aplikasi bioinformatika
1. Transformasi sekuen menjadi
informasi genetik
Intinya adalah menjual data, dalam
bentuk gen komplit, atau fragmen, yang dapat digunakan oleh pihak lain untuk
mencari potensi terhadap gen tersebut.
2. Pasien sebagai komoditas
Pasien dengan kecenderungan
terhadap penyakit tertentu dapat diketahui, sehingga mudah sekali bagi
perusahaan obat untuk menawarkan produknya.
3. Mencari potensi gen
Potensi dari sebuah gen sangat
beragam, bergantung pada ekspresi gen tersebut. Aplikasi lebih lanjut dapat berupa
transgenik, terapi genetik, atau berbagai rekayasa dan pemanfaatan genetik
lainnya.
Referensi: