Browsed by
Tag: semantic web

Bubunews: Menyentuh Web Semantik

Bubunews: Menyentuh Web Semantik

Ketika kita berbicara tentang semantik, kita selalu berputar di dataran teori tanpa banyak bisa mengungkap manfaat nyata topik tersebut. Memang secara teori bisa diperkirakan bahwa manfaat web semantik akan cukup fenomenal. Namun sampai sekarang belum banyak yang bisa menemukan bentuk implementasinya.

Mungkin ya mungkin tidak.

Google juga punya fitur yang tampaknya memberdayakan unsur semantik. Jika Anda sempat mencoba fitur timeline di Google search, maka Anda akan bisa merasakan hasil-hasil pencarian terhubung dalam suatu rangkaian waktu. Tanpa mengetahui makna suatu konten, tak mungkin google bisa menghubungkan dan meletakkan konten tersebut dalam suatu deretan garis waktu. Mungkin.

What is Bubunews?

First thing first, Bubunews tidak ada kaitannya dengan Bubu Award. Bubunews adalah sebuah agregator konten plus plus. Plus satu, karena berani menambah koleksi another news agregator. Plus satu lagi karena Bubunews bukan sekedar news agregator.

Fitur utama dari Bubunews adalah analisa konten. Dengan menganalisa konten, Bubunews mampu menawarkan fitur timeline yang mampu menampilkan kluster berita dalam urutan waktu. Kluster berita ini didasarkan pada ekstraksi entitas yang ada dalam konten, misal: Google, Yahoo, Honda, dll.

Ada juga visualisasi dalam bentuk map untuk melihat sebaran berdasar lokasi. Akan menarik untuk menilik bagaimana berita bergerak dari satu wilayah ke wilayah lain. Mungkin kita bisa menarik suatu hipotesa tertentu berdasar birdview dari kluster berita ini.

Apa yang bisa membuatnya lebih menarik?

Saya membayangkan seorang jurnalis atau periset mengkoleksi datanya dalam gudang data yang mendukung semantik. Kluster bisa divisualisasikan dan ditaruh dalam bentuk saling bertumpuk untuk menggabungkan beberapa data hipotesa.

Kluster satu dan lain bisa dihubungkan lewat titik baru membentuk rangkaian besar yang menuntun pada suatu teori konspirasi. Entitas orang dihubungkan lewat peristiwa, lewat lokasi, lewat unit waktu. Who knows. Anda bisa menemukan fakta yang selama ini disembunyikan.

Dengan menambahkan API supaya pihak ketiga bisa turut memanfaatkan datanya, the sky is the limit untuk pemanfaatannya. Kalau selama ini kita hanya bisa melakukan mashup dengan mengandalkan tipe data (teks, angka, tanggal) maka selanjutnya kita lebih punya banyak variabel untuk dipasang-pasangkan. Tentu saja, hasil kombinasi dan permutasinya lebih banyak.

For Us

Data semantik dan data-data lain sedang dan akan menjadi abundant. Hal-hal yang kemarin tidak mungkin akan menjadi mungkin. Anda sudah siap menjadi pemain?

Jangan lupa menaruh poin ini dalam watchlist Anda. If it works, it will be quite disruptive. Semua yang belum pakai recommendation engine bisa dibilang cupu dan tidak cerdas.

Karena pembelajaran dari manusia juga diperlukan dalam pengembangan platform, maka bisa muncul peluang micropayment dan microtransaction untuk menghargai effort mereka. Kita mungkin bakal punya model Amazon Turk lokal. Who knows.

PS:

Bubunews sudah bertransformasi menjadi Gresnews.

Semantic Web dan Social Media

Semantic Web dan Social Media

trendsmap
Ternyata ada hal menarik dibalik implementasi fitur tagging di Facebook. Well, selain jadi sarana baru untuk nge-poke friends, ternyata fitur tersebut bisa dikategorikan dalan perkakas semantik.

Sebelumnya, Facebook tidak punya cara untuk merujuk suatu entitas pengguna dengan tepat, kecuali di fitur Photos. Sekarang, dengan fitur tagging dalam status, kita bisa merujuk entitas pengguna dan bahkan Page atau Group. Hal ini membuat status punya makna lebih daripada sekedar text yang kemudian akan jadi sampah.

Dengan adanya kemampuan ini, kita bisa membuat graph hubungan antara pengguna satu dengan yang lain. Dan bahkan pengguna dengan Page sebuah brand. Ini berarti akan ada lebih banyak informasi yang bisa dicerna bagi siapapun yang menginginkannya. Brand jadi tahu siapa saja yang beraktifitas di dalam Page-nya, pengguna siapa saja yang disinggung dalam percakapan dan komentar di Wall, dan seterusnya.

Pengguna mungkin tidak akan merasakan dampakya secara langsung. Namun tidak bisa dipungkiri fitur ini pasti akan banyak membantu kegiatan brand dan Facebook sendiri. Iklan dalam Facebook mungkin akan lebih targetted dan bisa diterima oleh pengguna. Dan brand akan punya informasi lebih dalam rangka engage dengan para konsumennya. Ujungnya pengguna Facebook dan konsumen secara global akan merasakan dampaknya.

Di lain kubu, Twitter juga akan segera melampirkan data lokasi geografis dalam tweet kita. Twitter yang sudah mendunia ini mulai kehilangan value datanya karena besarnya userbase. Hashtag memang bisa memberi nilai tambah namun dengan banyaknya pengguna membuat data tersebut menjadi sangat mentah. Penambahan informasi geografis akan membuat data ini kembali bernilai karena punya konteks tambahan yang cukup spesifik. Proses data mining akan lebih punya banyak output dan tafsiran atau kesimpulan yang bisa ditarik pun akan semakin variatif.

Bagaimana menurut Anda? Apakah fitur-fitur baru tersebut akan bermanfaat? Coba lihat trendsmap.com, apa yang Anda bayangkan?

Get More From Twitter

Get More From Twitter

Owl Smile

Setelah melewati pengamatan yang non akademis, saya berkesimpulan bahwa timeline twitter saya justru tampak sangat menarik saat lewat tengah malam. Well, sebenarnya no-brainer sih karena lebih dari setengah yang saya follow adalah orang-orang yang tinggal di belahan bumi yang lain (lihat map-nya). Lalu, bagaimana supaya saya tidak terlewatkan hal-hal menarik tersebut?

Stay up

Mungkin bisa diakali dengan mengubah jam biologis menjadi tidur siang dan bangun di malam hari. Sayangnya hal ini tidak dimungkinkan karena pagi hari masih ada kewajiban bekerja. Tapi kita sebenarnya bisa menyalakan twitter client kita sepanjang malam untuk menangkap tweets yang muncul lewat tengah malam. Hanya saja kadang kala kemampuan twitter client kita terbatas. Dan ada resiko komputer bisa crash karena kehabisan memory. Saat ini saya belum  menemukan twitter client yang cukup pandai untuk mengarsipkan timeline ke disk.

Save the feed, save our night time

Ya ini adalah ide bagus. Masukkan saja feed timeline ke dalam Google Reader/Feedly. Kita bisa lihat kapan saja tanpa khawatir melewatkan satu tweet pun. Sepertinya ide yang brilian sampai saya sadar bahwa feed timeline kita diproteksi oleh suatu skema autentikasi. Mungkin ada beberapa dekstop feed reader yang punya fasilitas autentikasi. Sayangnya saya belum rela untuk menginstall feed reader terpisah hanya untuk membaca tweets. Terlalu merepotkan.

Saya berangan-angan andai ada layanan OAuth proxy yang bisa kita pakai untuk mendapatkan feed kita dengan lebih mudah. Seperti yang dituliskan di blog ini misalnya. Mungkin bisa kita install di AppEngine karena Python based.

Semantics

Salah satu masalah yang selalu mengikuti kita adalah signal vs noise ratio. Semakin banyak kita berlangganan informasi maka semakin besar pula resiko kita untuk mendapatkan lebih banyak noise daripada signal. Daripada melakukan scanning secara manual terhadap timbunan besar informasi, alangkah menyenangkan jika informasi tersebut bisa disaring dan diproduksi keyword-nya. Apalagi jika keyword tersebut bisa kita jadikan tag cloud yang akan jadi alat navigasi untuk menjelajahi data kita.

Saya punya ide melewatkan feed timeline saya ke OpenCalais dan mendapatkan anotasi semantik. Sejauh ini kendalanya adalah autentikasi dan output OpenCalais. Autentikasi mungkin bisa terpecahkan dengan solusi OAuth proxy di atas. Namun output OpenCalais ini agak kurang bersahabat. Jika kita melewatkan feed ke OpenCalais, OpenCalais akan menambahkan anotasinya dalam bentuk teks yang ditambahkan ke field deskripsi feed. Hal ini merepotkan proses ekstraksi semantik. Belum lagi, jika kita lewatkan feed dari twitter, Twitter akan selalu muncul sebagai salah satu anotasi yang ditambahkan.

Kita bisa saja melewatkan satu persatu item dalam feed kita, namun bisa dipastikan kita akan menghabiskan jatah pemanggilan API yang dibatasi tiap harinya.

Anda punya tips yang bisa dibagi?

Semantic Desktop

Semantic Desktop

semantic

Semantic web boleh saja menjadi agenda utama web di 2010, namun transformasi ini tidak harus dimulai dari web itu sendiri. Semantic desktop juga akan punya peran besar dalam pembentukan semantic web. How come?

Kenapa semantic web/dekstop penting?

Memang akan susah menerangkan nilai penting dari sesuatu yang belum ada bentuknya. Namun dari sisi akademis, semantic web/desktop bisa dipastikan akan bisa memberikan kemampuan lebih pada komputer untuk lebih mengerti kita. Bayangkan layanan delicious.com sebagai contoh. Setelah kita memberikan tag pada begitu banyak URL, akhirnya komputer bisa tahu topik apa yang kita minati. Berdasarkan data yang disumbangkan orang lain, konputer bisa menawarkan URL lain yang mungkin kita sukai.

Desktop adalah area non kolaboratif (privat)

Bukannya kita tidak berkolaborasi di ranah desktop namun ada kecendurangan bagi kita untuk tidak membagi area ini untuk konsumsi publik. Lain dengan web yang jadi area terbuka bagi siapa saja untuk bekerja sama. Semantic web akan punya energi pembentuknya sendiri, dari kolaborasi orang-orang di seluruh dunia.

Akan tetapi area web yang terbuka ini justru menjadi faktor penghalangan bagi partisipasi 100%. Tidak semua data yang kita miliki kita sebar di web. Banyak data-data penting yang justru sering kita operasikan berada di ranah desktop yang bisa memenuhi privasi. Keraguan untuk berpartisipasi dalam pembentukan semantic web justru lebih banyak berkurang di ranah desktop.

Desktop adalah the blackhole of semantic

Semua yang dipindahkan ke desktop akan terputus dari konten sumber. Attachment yang diunduh menjadi tidak ketahuan lagi e-mail-nya. Log percakapan via instant messenger juga tidak bisa dirunut dengan tepat karena hanya berupa catatan nickname dan stempel waktu. Data kontak yang kita punya di desktop juga tersebar tanpa bisa dengna mudah kita ketahui detil cara menghubunginya. Saya yakin masih banyak data lagi yang berupa bahan mentah berserakan di desktop kita.

Memang tidak sepenuhnya benar bahwa dekstop adalah black hole. Data gambar dan audio terkadang punya metadata yang menerangkan kadang data tersebut dibuat, oleh siapa dan berbagai anotasi lain. Justru ini semakin menguatkan posisi dekstop sebagai pembentuk momentum terwujudnya semantic web.


Yang menarik nantinya adalah semantic web justru tidak akan ada. Lho? Tidak ada berarti kita tidak lagi bersentuhan langsung. Fungsinya sudah sedemikian terintegrasi dengan aplikasi-aplikasi yang kita pakai. Web akan kembali ke fungsi aslinya sebagai jaringan penghubung simpul-simpul penyimpan data.

Well, paragaraf di atas adalah angan-angan saya. Menurut Anda sendiri bagaimana? Apakah semantic web nantinya memang web dengan tambahan semantic, atau justru web sebagai infrastruktur pendukung semata.

The 2010 Web

The 2010 Web

google squared

I’m going to write this as short as possible. My head almost explodes from the successive writing activity :(.

Bagi yang belum tahu, baru-baru ini Scoble berdebat soal web 3.0 dan web 2010. Scoble tidak setuju kalau web selanjutnya adalah web 3.0. Scoble lebih suka web 2010 atau pelabelan dengan model tahun. Web 2.0 bukanlah web versi 2.2.0 hanya dipakai sebagai penanda adanya beberapa perubahan mendasar dari model yang yang sebelumnya populer sampai dengan masa dot com bubble burst.

I’m a Scoble believer, I’ll stick with web 2010. jadi apa kira-kira bentuk web 2010? Dugaan saya sih web semantik. Demand ke arah ini sudah ada sejak lama. Dan kini teknologi pendukungnya mulai bermunculan. Wanna know?

Google Squared

Hari ini Google menjawab tantangan Wolfram. Google meluncurkan Google Squared. Squared memang tidak mirip dengan Wolfram dalam hal tampilan. Squared menyajikan tabel dengan memberikan analisa semantik atas result dari pencarian. Yang cukup mengesankan adalah pencarian tentang planet yang menghasilkan daftar planet dan atribut-atributnya. Yang jgua menarik adalah fitur yang memperbolehkan kita mengkombinasikan hasil pencarian dan menyimpan pencarian. Hasilpencarian untuk beberapa kunci memang terkadang meleset. Tapi saya kira hal ini akan segera diperbaiki baik lewat perbaikan algoritma atau integrasi partisipasi pengguna (wiki-like)

Semantic Twitter

Twitter dan sederet layanan microblogging lain adalah fenomena serupa web 1.0. microblogging saat ini adalah bentuk awal yang pastinya akan mengalami evolusi sebagaimana yang dialami oleh web. Saat ini kita sedang mengalami microblogging bubble. Pertumbuhan datanya sangat pesat, dan arahannya tidak pasti. Microblogging digunakan untuk berbagai keperluan dan konsep 140 karakter membuat usaha membaca data menjadi semakin rumit. Microblogging akhirnya berubah menjadi SMS on steroid, dengan berbagai singkatan kata yang tidak standar demi memenuhi batasan 140 karakter.

What we really need is another semantic for this microblogging services. Usaha ke arah ini sudah dipelopori oleh beberapa orang. Mereka membentuk sebuah “foundation” yang menawarkan sebuah proposal bagaimana microblogger bisa memformat datanya supaya menjadi machine processable dan tetap human readable.

Sama nasibnya dengan web. Metode bottom-up ini mungkin susah berjalan. Lihat saja microformats yang adem ayem saja. Perlu gebrakan top-down semacam Wolfram alpha atau Google Squared untuk membuat warga internet sadar akan manfaat semantic dan mau berpartisipasi secara bottom-up.

Who’s the Player?

Google sudah naik panggung. Siapa pemain selanjutnya? I won’t bet for Microsoft even they have their talented people in their house. Pemain selanjutnya ayng akan naik panggung adalah IBM. IBM sudah terkenal dengan konsep akademisi. Semantic lebih dekat dengan persoalan akademisi/lab. So, saya rasa IBM akan punya kesempatan kedua untuk kembali mendapat sorotan seperti dulu di awal era Personal Computing.

Pemain-pemain semantic seperti Calais, dan Wolfram. Apa yang akan terjadi dengan mereka saat the big guys waking up? Mereka harus banting setir supaya menjadi cukup berguna bagi akuisisi, atau bergerak ke arah niche menjadi makelar konsumen semantik. Jika mereka bisa menawarkan analisis semantik sebelumnya tentunya mereka sudah jadi ahli bagaimana cara memanfaatkan data hasil analisis tersebut.

Okay, sisanya silahkan go wild dalam kolom komentar. I need to rest my boiling head. Ayo jin-jin semantik, keluarlah kalian!

Persaingan Mesin Pencari di Era Semantic Web

Persaingan Mesin Pencari di Era Semantic Web

Kemarin kita sudah sempat menyinggung semantic web dan mesin pencari. Jika semantic web sudah terimplementasi, apa yang terjadi pada mesin pencari? Jika semantic web sudah terwujud maka proses pencarian bisa memberikan hasil yang sangat akurat. Pada point ini tingkat akurasi tak akan lagi jadi persaingan di antara mesin pencari. Lalu inovasi apa yang kira-kira harus diangkat sebagai nilai jual? Mari kita coba tebak bersama-sama.

  1. Koleksi indeks. Saat ini pun, koleksi indeks masih tetap jadi bahan persaingan. Tiap mesin pencari melakukan klaim memiliki indeks yang lebih besar dibanding yang lain. Ingat apa sesumbar Cuil kemarin?
  2. Dukungan Bahasa Natural. Dukungan bahasa natural, seperti yang dipakai sehari-hari, akan menjadi semakin seksi. Hal inilah yang menjadikan Hakia dan Powerset menjadi incaran banyak investor.
  3. Kemampuan menurunkan inferensi (menyimpulkan). Mesin pencari diharapkan tidak hanya mengerti apa yang diketikkan pengguna akan tetapi juga menebak keinginan sebenarnya. Tidak hanya sekedar berupa word spelling akan tetapi lebih ke tujuan pencarian. Mungkin evolusi dari related result akan termasuk di dalamnya.

Anda punya tambahan alternatif jawaban?