Labs247: BigData for Bioinformatics

Apa itu Bioinformatics?

Bioinformatics adalah ilmu yang mempelajari atau penerapan tehnik komputasional untuk mengelola dan menganalisis informasi biologis. Bidang ini mencakup penerapan metode-metode matematika, statistika, dan informatika untuk memecahkan masalah-masalah biologis, terutama dengan menggunakan sekuens DNA dan asam amino serta informasi yang berkaitan dengannya. Contoh topik utama bidang ini meliputi basis data untuk mengelola informasi biologis. penyejajaran sekuens (sequence alignment), prediksi struktur untuk meramalkan bentuk struktur protein maupun struktur sekunder RNA, analisis filogenetik, dan analisis ekspresi gen.

Singkatnya, penggabungan gen atau sel tidak lagi dilakukan secara manual melainkan bisa dilakukan secara digital.

Forum Riset Life Science Nasional

Rabu – Kamis, 24-25 Agustus 2016, Labs247 dari PT. Dua Empat Tujuh mengirim beberapa perwakilan yaitu Bpk. Solechoel Arifin, Bagus Rully Muttaqien dan Gaidha N. Annisa untuk mengikuti IT Showcase Forum Riset Life Science 

Nasional 2016  atau biasa disebut FRLN2016 di Sheraton Grand Jakarta Gandaria City, Jalan Sultan Iskandar Muda, Jakarta Selatan, bertajuk “Tantanngan Menuju Kemandirian Riset Nasional” yang diselenggarakan oleh Kementrian Riset Teknologi dan Pendidikan Tinggi Republik Indonesia, Kementrian Kesehatan, Biofarma dan HAKTEKNAS.

BIG DATA FOR BIOINFORMATICS

Munculnya data set besar dalam pengaturan klinis menyajikan tantangan dan peluang dalam penyimpanan data dan analisis. Hal ini disebut dengan “Big Data”. Kemajuan teknologi informasi dan komunikasi menyajikan solusi yang paling layak untuk analisis big data dalam hal efisiensi dan skalabilitas.

Kerangka pemrograman MapReduce menggunakan dua tugas umum dalam pemrograman fungsional, Map dan Reduce. MapReduce adalah kerangka pemrosesan parallel baru dan hadoop adalah implementasi open-source pada node komputasi tunggal atau cluster. Penggunaan MapReduce dan Hadoop memiliki keuntungan antara lain;

  1. Penyimpanan toleran sehingga pengolahan data yang dapat diandalkan dengan mereplikasi tugas komputasi dan cloning potongan data yang berbeda komputasi node di cluster komputasi.
  2. Pengolahan data high-throughput dan Hadoop Distributed File System (HDFS). Data disimpan dalam HDFS dan dibuat tersedia di slave node dan digunakan untuk perhitungan.

Contoh singkatnya adalah jika dulu dalam penggabungan gen atau sel harus dilakukan di super computer yang ukurannya sangat besar dan dengan harga yang tinggi (high-cost), hal itu tidak diperlukan lagi di era ini.

Saat ini kita memiliki teknologi big data. Jadi, proses penggabungan gen atau sel itu bisa dilakukan secara digital di atas big data dan tentunya low-cost. Proses pengolahan data ini memerlukan tools yang disebut Hadoop. Labs247 (Solusi247) sendiri memiliki teknologi tersebut yang dinamakan Hadoop Grid (HGrid247)

Contoh lain adalah, “Jika ada suatu penyakit baru yang belum diketahui, dengan teknologi big data ini, kita dapat langsung mengidentifikasi dengan cara mencocokan gejala-gejala penyakit tersebut dengan data-data yang sudah tersedia di bank data." Ujar Pak Arifin.