Wednesday 17 October 2012

Review Materi: Basis Data Multimedia

Jelang UTS pekan depan, saya sekarang mencoba mereview materi yang sudah didapat.

Materi pertama adalah introduction, yang membahas apa itu multimedia database. Multimedia database adalah database yang mengelola data multimedia yang meliputi teks, dokumen, suara, gambar, dan video. Berbagai contoh tantangan yang dihadapi dalam multimedia database antara lain bagaimana mengidentifikasi identitas seseorang berdasarkan foto, atau cuplikan pembicaraan telepon, atau perilakunya yang terekam dalam video.

Materi kedua adalah representasi data multimedia. Untuk teks, digunakan unformatted text seperti ASCII atau formatted text seperti HTML. Untuk image, representasinya adalah pixel, dan setiap pixel direpresentasikan dalam byte dengan ukuran yang berbeda-beda sesuai banyaknya warna yang disimpannya. Misalkan untuk B&W, greyscale, dan 256 color 1 byte, untuk 64K color 2 byte, 16M color 3 byte, dst. Untuk audio, representasi yang digunakan adalah berupa sinyal digital yang didapat dari proses sampling suara asli. Untuk video, representasinya berupa frame yang dijalankan sejalan dengan waktu. Banyak format yang digunakan seperti VCD, DVD, dan HD-video. Selain itu juga dibahas tentang multimedia requirement, antara lain Storage Capacity (melibatkan kompresi) dan Bitrate & Continuity (melibatkan kinerja IO dan network).


Materi ketiga adalah multidimensional data structure. Data multimedia harus mampu sekurang-kurangnya merepresentasikan ruang dan waktu. Oleh karena itu dibutuhkan representasi n-dimensional untuk menyimpan atribut-atributnya. Teknik penyimpanan data struktur ini biasanya dalam bentuk hierarki (pohon). Jenis-jenis pohon yang dibahas di sini adalah: k-d Trees, point-quadtrees, MX-quadtrees, R-trees.

Materi selanjutnya diborong pas hari sabtu dari jam 8 sampai jam 11.
Materi keempat adalah document database. Di sini dibahas bagaimana menguji kesamaan dokumen, berbagai kendala seperti sinomin dan polisemi, dan ukuran kinerja document retrieval seperti precision dan recall. Dibahas juga berbagai berbagai variabel yang berkaitan dengan kinerja retrieval system.

Segitu dulu sementara, nanti dilanjutkan lagi, insya Allah.

UPDATE:

UTS telah lama berlalu, dan saya baru sekarang sempat update lagi review ini. Biarlah terlambat daripada tidak sama sekali. Berikut ini masih membahas materi-materi pra-UTS.

Materi kelima adalah image database. Perancangan image database adalah untuk memudahkan pengguna untuk mencari informasi yang terkandung dalam sekumpulan gambar. Misalkan kita mempunyai foto seseorang, lalu kita meminta sistem image database untuk mencari foto-foto yang mengandung wajah orang tersebut beserta identitasnya. Tentu ini sangat memudahkan daripada harus mengecek satu-satu kumpulan foto yang kita miliki secara manual. Bagaimana caranya agar sistem bisa berbuat demikian? Caranya adalah dengan menambahkan apa yang disebut object properties pada tiap gambar. Foto wajah manusia misalnya, terbagi atas objek mata, hidung, telinga, bibir, dsb. Objek-objek ini kemudian dihubungkan dengan berbagai properti seperti warna, bentuk, dan tingkat kecerahan. Nantinya sistem akan melakukan pencarian ke dalam daftar properties tersebut. Pada materi ini dibahas juga teknik pengecekan kemiripan gambar dan teknik kompresi.

Materi selanjutnya adalah video database. Yang diinginkan dari database ini adalah pengguna dapat mencari informasi sedetil mungkin dari sekumpulan video yang kita miliki. Misalkan kita ingin mencari dalam film Batman: The Dark Knight Rises, pada menit berapa saja wajah Bane (tokoh jahatnya) muncul, apa saja yang ia lakukan, bersama siapa saja ia dalam adegan tersebut. Hal ini mungkin dilakukan jika kita menyimpan properties-properties dalam struktur data yang tepat, sebagaimana pada image database. Bedanya, video butuh lebih banyak penyimpanan karena ia merupakan kumpulan gambar (frame). Selain itu, video memiliki dimensi waktu yang juga harus disimpan dalam database.  Dibahas juga soal apakah harus kita menyimpan properties per frame? ternyata tidak. Mengapa? Alasan pertama adalah jumlah frame yang begitu banyak sehingga boros storage. Alasan kedua adalah umumnya tidak ada adegan dalam video yang ditampilkan dalam satu frame. Adegan orang menoleh saja bisa memakan hingga 30 frame.  Lagipula, adakah orang yang bisa begitu jeli matanya sampai bisa melihat video dalam satuan frame? tampaknya tidak ada.

Materi selanjutnya adalah audio database. Tidak berbeda jauh dengan video database kecuali jenis filenya yang hanya mengandung suara tanpa gambar. Penyimpanan dalam audio database ini terdiri dari 3 channel. Channel pertama berisi waktu. Channel kedua berisi siapa yang berbicara atau bersuara pada waktu tersebut. Channel ketiga berisi apa yang sedang dibicarakan/dibunyikan pada waktu tersebut. Untuk mengisi channel-channel tersebut dalam database secara otomatis, digunakan teknologi yang disebut speaker recognition (untuk channel kedua) dan speech recognition (untuk channel ketiga). Namun sekarang ini kedua teknologi ini masih memiliki banyak keterbatasan, terutama jika banyak noise, banyak orang berbicara pada satu waktu, atau bahasa pembicaraan yang berbeda-beda. Jika ingin akurat, maka pilihan paling mungkin adalah membayar orang untuk mendengarkan setiap file audio yang ada, lalu mengisi channel kedua dan ketiga secara manual. Tentu saja pengerjaannya akan jauh lebih lama.

Materi selanjutnya adalah multimedia database. Multimedia database adalah sistem yang menyimpan konten-konten multimedia yang mencakup hal-hal yang dibahas pada materi sebelumnya: teks, dokumen, gambar, video, dan audio. Pada materi ini dibahas tiga jenis arsitektur multimedia database.

  • Yang pertama adalah arsitektur autonom, yang memisahkan indeks untuk tiap jenis konten yang berbeda, sehingga konten teks, dokumen, video, dan audio memiliki indeks dan struktur datanya masing-masing. Keuntungannya adalah aksesnya yang cepat karena indeks yang terpisah, namun kerugiannya adalah rumitnya algoritma dan teknik penyatuan konten untuk ditampilkan ke pengguna. 
  • Yang kedua adalah arsitektur uniform, yang menyatukan semua indeks untuk jenis konten yang berbeda. Keuntungannya adalah mudah implementasinya karena struktur data yang seragam untuk semua konten, namun kerugiannya perlu banyak usaha untuk mengisi struktur data tersebut dengan informasi yang tepat secara manual, karena sistem yang dapat mengekstrak informasi dari konten-konten tersebut secara sempurna belum ada.
  • Yang ketiga adalah arsitektur hibrid, yang menggabungkan keunggulan dari dua arsitektur di atas. Untuk konten yang nature-nya mirip dibuat struktur data yang seragam, contohnya audio dan video. Sedangkan untuk konten lain yang lebih cocok dengan struktur data lain dipisahkan.
Dibahas juga pada materi ini media abstraction untuk merepresentasikan konten-konten di dalam database, yang terdiri dari states, features, attribute values, mapping states-features, relation antar attributes, relation antar states, dan variables. 

Demikian review materi sebelum UTS. Mudah-mudahan sempat review kembali materi tambahan sebelum UAS.

UPDATE:

Oke, besok (Kamis, 19/12/2012) UAS. Ada tiga materi lagi yang tersisa sebelum UAS.

Yang pertama adalah tentang storage, atau penyimpanan data. Pada materi ini dibahas pentingya teknologi storage dalam implementasi multimedia database. Tidak hanya besarnya kapasitas yang diinginkan, tetapi juga reliability dan data transfer continuity, terutama untuk data-data streaming audio/video yang diakses oleh banyak user. Dibahas juga jenis-jenis perangkat penyimpanan data, yang mencakup pita magnetik, piringan magnetik (harddisk, floppy disk), piringan optik (CD, DVD, Bluray Disc), dan solid state storage. Penyimpanan optik seperti CD dan DVD menggunakan laser untuk menulis data pada lapisan logam, sehingga dihasilkan pola "land" dan "pit" yang dapat dibaca oleh komputer. Perkembangan bahan lapisan logam beserta laser penulisnya semakin hari semakin mampu menyimpan pola "land" dan "pit" yang semakin rapat, sehingga data yang dapat disimpan pun semakin besar. Harddisk menyimpan data dalam piringan magnetik, dan sejak dulu hingga sekarang sekarang ini semakin kecil ukurannya karena bahan magnetisnya yang lebih rapat sehingga memungkinkan penyimpanan data lebih banyak. Pada harddisk dimungkinkan terjadi fragmentasi yang dihasilkan dari banyaknya proses insert dan delete data sebelumnya. Untuk menanganinya digunakanlah teknik defragmentasi, sedangkan pada media optik tidak terjadi fragmentasi karena data selalu disimpan secara kontinyu. Dalam dunia Harddsik dikenal sebuah teknologi RAID untuk meningkatkan performance. Tipe RAID terdiri dari beberapa nomor, yaitu 0, 1, 2, 3, 4, 5, 6, 7, 10, dan 53. Dibahas juga tentang perspektif lain dalam penyimpanan data, antara lain DAS (Direct Attached Storage), NAS (Network Attached Storage), dan SAN (Storage Attached Network). DAS penerapannya seperti harddisk yang ada di dalam PC sekarang ini. NAS penerapannya adalah dengan menyimpan storage di tempat lain yang dapat diakses lewat jaringan komunikasi. SAN mirip dengan NAS, namun jaringan yang digunakannya dedicated untuk kepentingan input-output data saja, tidak disatukan dengan jaringan komunikasi data pada umumnya.


Materi berikutnya adalah Multimedia Presentation. Pada materi ini kita dihadapkan pada tiga pertanyaan: apa, kapan, dan di mana konten multimedia dipresentasikan. Ketiga pertanyaan ini harus dijawab oleh presentation author, yang merancang presentation schedule untuk diimplementasikan oleh presentation system. Objek yang ditampilkan dalam presentation adalah berupa "virtual object", yaitu gabungan dari berbagai jenis "real object" yang diretrieve dengan query dengan kondisi-kondisi tertentu. Sedangkan schedule presentasi direpresentasikan dalam constraints, yang menentukan kapan suatu objek muncul, berapa lama ia harus dieksekusi, dan kapan ia harus segera digantikan oleh objek lain. 

Materi terakhir adalah Distributed Multimedia, yang membahas implementasi terdistribusi dari sistem database multimedia. Analogi yang digunakan adalah warehouse. Warehouse terhubung dengan beberapa pabrik yang memiliki kapasitas produksi yang berbeda-beda. Ada pabrik yang dalam 1 hari dapat menghasilkan 4, 7, atau 2 unit barang. Jika user atau klien hanya memesan barang lewat satu pabrik, pastinya akan sangat terbatas hasilnya. Namun jika memesan lewat warehouse, maka warehouse akan melihat ketersediaan barang di pabrik-pabrik yang terhubung dengannya, sehingga lebih terjamin hasilnya. Begitu pula halnya dengan multimedia database, seperti pada sistem TV on demand di pesawat penumpang komersial. Setiap penumpang memiliki akses ke layar TV, dimana mereka dapat memilih film apa saja yang ingin ditonton. Tentu jika semua penumpang dilayani satu server akan sangat berat, bisa terjadi delay akibat antrian request yang terlalu panjang, dan tentu saja hal ini tidak diinginkan. Namun jika untuk setiap penumpang disediakan satu server, bayangkan anggaran yang harus disediakan misalkan untuk satu pesawat berkapasitas 500 penumpang, pastinya akan mahal sekali. Oleh karena itu, digunakanlah konsep terdistribusi semacam warehouse tadi, sehingga 500 penumpang mungkin saja sudah terlayani oleh 10 server dengan manajemen request yang baik. Retrieval plan dan commitment record juga dibahas sebagai detail dari sistem terdistribusi ini.

Demikian review materi sebelum UAS. Semoga besok lancar. Aamiin...

1 comment:

  1. artikel yang menarik, kami juga punya artikel tentang 'data multimedia' silahkan buka link ini
    http://repository.gunadarma.ac.id/bitstream/123456789/2833/1/A-1.%20Aries%20Muslim%20dan%20Cut%20Maisyarah%20Karyati.pdf
    semoga bermanfaat ya

    ReplyDelete