Browsed by
Tag: search engine

Smaller Version Of The Enterprise

Smaller Version Of The Enterprise

Pekerjaan baru saya beberapa bulan ini lumayan menyenangkan. Saya lebih sering meninggalkan meja dan bertemu orang-orang baru yang selama ini belum pernah saya temui atau cuma saya dengar namanya saja. Saya berusaha merekam dan menganalisa apa sebenarnya yang terjadi di dunia enterprise dan di mana startup bisa mendapat celah untuk masuk.

Redhat Business Now Makes Sense To Me

Dulunya saya tak begitu paham bagaimana support bisa dijual. Secara teori, support memang bisa dijual karena tentunya pasti ada yang membutuhkan dukungan. Tapi seberapa banyak yang membutuhkan dan tipe support seperti apa yang bisa dikomersialkan? Semakin lama, saya makin merasakan bahwa dunia enterprise memang punya demand akan support services. Dunia enterprise yang kompleks seringkali tak punya waktu untuk kejutan. Support memastikan akan lebih sedikit kejutan yang terjadi dna kalaupun terjadi maka akan bisa segera diatasi.

Redhat tidak menjual RHEL, namun dukungan untuk update paket-paket baru demi alasan performa atau keamanan hanya tersedia dalam bentuk subscription. Selain langganan update, pemeliharan server juga dikomersialkan. Adalah menakjubkan untuk melihat bagaimana instan enterprise begitu memerlukan layanan seperti ini. Work like a pro, you’ll have your way to the enterprise world.

So Many Things You Can Build

Beberapa waktu lalu saya sempat menghadiri presentasi sebuah search engine appliance (platform search engine yang bisa dipasang di server sendiri). Tentu saja, karena ditawarkan untuk kelas enterprise, fiturnya sangat banyak dan cukup kompleks. Tapi yang menarik adalah konsep-nya tak jauh dari apa yang bisa Anda pelajari lewat Lucene. Synonim, facet, stopwords, you name it. Bedanya terletak di kesiapan deployment dan integrasi dengan konten instansi kita. Sebagai paltform besar, banyak gaya free-style yang bisa kita lakukan dengan produk tersebut. Infrastruktur dan rekomendasi arsitektur juga sudah termasuk dalam paket penawaran.

Saya takjub, kembali, karena sebenarnya kita juga bisa membuat sendiri produk serupa. Tentu saja dengan skala yang lebih kecil. Dengan berbagai macam produk open source yang ada, kita bisa meracik sendiri produk hebat versi kita. Kita juga bisa membuat search engine appliance sendiri.

It Takes Time

Produk search engine yang saya bicarakan di atas sudah punya track record 15 tahun. Saya tak menganjurkan Anda untuk langsung head-to-head. Pesannya adalah butuh waktu untuk sampai ke tahap itu. Appliance yang fungsional, walau agak minimal, bisa saja jadi dalam waktu satu minggu. Tapi untuk sampai pada tingkat keterujian yang sama, produk kita perlu menambah jam terbang terlebih dahulu.

Beberapa orang akan beringsut duluan setelah membayangkan jam terbang yang harus dikantongi. Namun beberapa dari Anda pasti ada yang menyongsong tantangan ini dengan passionate. Bagi Anda yang passionate dan sabar, inilah kesempatan Anda. Ada celah-celah yang bisa diisi dengan produk baru. Dan bagi Anda yang belum punya kesabaran, jadilah lebih lihai untuk bekerjasama dengan orang-orang yang lebih sabar.

The smaller enterprise itu ada pasarnya. Yakinlah seperti halnya Apple ketika meluncurkan iPad untuk mengisi ceruk di antara iPhone dan Macbook.

Some Things Best Left Very Expensive

Some Things Best Left Very Expensive

Free applies to many things, but big customer can never accept free. You can free the product but you always need to charge for the service or support. Yang benar-benar dicari sebenarnya sebuah pihak untuk disalahkan saat terjadi hal-hal yang tidak dikehendaki. Kebanyakan dari kita tidak membuat sendiri semua yang kita perlukan karena kita tak punya cukup waktu dan ada hal lain yang lebih efektif untuk dikerjakan sendiri.

Yang hendak saya bicarakan sebenarnya adalah produk  search engine. Setelah setahun lalu dicerahkan dengan SOLR, beberapa waktu lalu saya bertemu dengan ElasticSearch. Dibandingkan dengan SOLR yang memerlukan konfigurasi eksplisit sebelum bisa berfungsi, ElasticSearch malah sudah siap langsung dipakai tanpa meributkan schema data. Proses tuning search result pun lebih dipermudah dengan penggunaan JSON untuk memodifikasi parameter scoring on the fly.

Tahap pertama dari mesin pencari adalah bisa memakan banyak data. Tak perlu menjadi terlalu pintar karena pintar bisa diemulasi dengan mengetahui banyak hal walaupun tidak bisa menyimpulkan apapun dengan data tersebut. Value search engine bisa diturunkan dari berapa banyak field yang diindeks. Tidak semua site bisa optimal diindeks dalam 3 jenis data saja: URL, judul halaman, deskripsi. Jika kita punya setidaknya leih dari 3 jenis data tersebut, ada kemungkinan kita sudah punya nilai unggul daripada Google. Tidak dalam skala global tentunya. Skala yang dipakai mungkin tumpukan data korporasi besar nasional, perpustakaan propinsi, perusahaan telco, atau departemen kependudukan.

Berapa harga yang harus dipasang? Produknya sendiri bisa didapatkan semua orang dengan gratis. Namun requirement gathering, penyusunan solusi, pengembangan, deployment dan setup infrastruktur tidak harus gratis. Belum lagi jika kita berbicara SLA yang ketat. See, you can make everything free (with the exception of service).

So, bagaimana cara kita memasarkan mesin pencari? Seperti biasa, kita harus menemukan pain point. Poin yang pasti adalah ketidaknyamanan atau ketakutan. Kenapa konsumen yang tak memiliki mesin pencari harus merasa tidak nyaman? Mudah. Bayangkan hidup Anda tanpa Google. Bayangkan Anda tidak bisa menemukan dokumen yang terletak di meja Anda sendiri karena tertutupi oleh banyak kertas yang mirip. Jika kita sendiri tidak tahu apa yang ada dalam meja kita, bagaimana kita bisa tenang? Anda, pasti butuh mesin pencari.

Poin kedua, something more than adequate. Taruhlah suatu institusi telah punya search engine yang bisa bekerja dengan lancar, apakah institusi tersebut akan memerlukan search engine yang kita tawarkan? Tentu saja iya. Selalu jawab dengan iya. Jika search engine yang dipunyainya sudah punya nilai nyata berarti search engine yang kita tawarkan akan bisa memberikan nilai jauh lebih baik. Pengaruhnya pada neraca laba rugi akan lebih terlihat. Kenapa kita bisa yakin kita mampu memberi lebih? Kebanyakan institusi seringkali merasa cukup dengan kemampuan FULLTEXT pada database relasional. Search engine tidak terbatas pada pencarian teks parsial, tapi juga synonym dan similar. Belum lagi relevansi dan scoring untuk menentukan item mana yang harus ditaruh paling depan dan belakang.

Poin ketiga, privilege. Untuk mendapatkan perasaan menjadi istimewa, biasanya customer mau membayar mahal. Kebutuhannya bukan lagi yang bisa dilihat dan diukur secara kuantitatif, namun lebih ke arah kepuasan emosional (atau branding). Untuk ukuran kepuasan yang sebenarnya susah diukur, kita bisa memasang harga yang juga susah diukur. Harga yang mahal tak akan pernah jadi masalah.

Tiga poin di atas juga bisa dijumpai dalam piramida kebutuhan yang dibuat oleh Abraham Maslow. Tidak hanya dibatasi pada produk search engine, tingkatan kebutuhan tadi bisa diplikasikan untuk produk lain juga. yang terpenting kita harus tahu di mana calon pembeli kita tinggal dalam piramid tersebut. Setelah kita tahu, maka kita bisa memberikan tawaran dan harga yang tak bisa ditolak.

Silakan dicoba 😉

PS:

Saya sebenarnya agak sebal karena belum melihat banyak yang menggarap pasar ini. Jika ada startup yang mulai membangun search engine, jangan lupa masukkan Launchpad. Saya akan beri endorsement + 1

E-Commerce: Navigasi dan Search Engine

E-Commerce: Navigasi dan Search Engine

Loupe

Hal pertama yang krusial dalam urusan e-commerce adalah soal etalase dan navigasi. Etalase penting karena sebelum calon pembeli bisa mengenal Anda, mereka harus tertarik dahulu dengan situs Anda. Yang kedua adalah navigasi. Seringkali etalase sudah mampu menahan calon pembeli untuk tidak cepat-cepat lari, atau sebaliknya sama sekali tidak berguna dan tak menarik. Jika calon pembeli masih mencoba bertahan demi mencari apa yang dia inginkan, maka navigasi akan menjadi pertahanan kedua bagi situs Anda.

Ada dua tipe navigasi. Yang pertama adalah yang standar, yang memberikan overview dan peta penjelajahan situs. Biasanya bisa ditemukan secara konsisten baik di bagian atas, samping atau footer.

Yang kedua adalah navigasi versi advance. Jenis ini masih bertujuan memberikan alat untuk menelusuri situs, namun dengan cara lebih spesifik. Misal lewat kategori, pengarang, produsen, range harga, dan lain lain. Navigasi semacam ini sebenarnya mirip dengan fitur search namun sudah diberi antar muka yang lebih intuitif. Alih-alih model kotak isian teks kosong, calon pembeli diberi beberapa nilai default yang bisa dipakai lewat link yang disediakan. Lebih keren lagi, calon pembeli bisa melakukan penelusuran bertingkat, misalnya: kategori buku, di-drilldown dengan topik “IT dan Marketing”, di-tune lagi pada level berikutnya dengan range harga 100 ribu sampai 400 ribu, lalu difinalisasi dengan “reviewed by NavinoT”. Calon pembeli pun akan sampai pada apa yang benar-benar dia cari.

Sebenarnya masing-masing CMS e-commerce pasti telah dilengkapi dengan built-in (terintegrasi) search engine. Akan tetapi search engine tersebut akan mengalami breakdown pada titik tertentu, misalnya saat pengguna situs sudah mencapai jumlah tertentu, koleksi data yang membengkak, serta saat model pencarian ingin diganti.

Saat jumlah pengguna menanjak, performa fitur search yang umumnya sekedar bergantung fasilitas internal akan mengalami degradasi. Ini terjadi karena fitur pencarian ini sebenarnya tidak didesain secara optimal untuk proses pencarian intensif, namun hanya sekedar ada untuk melengkapi fitur.

Performa juga akan terganggu saat koleksi data membengkak. Untuk menampilkan data seperti biasanya saja akan memerlukan waktu ektra, apalagi jika hasil menelusur database lewat fitur searching. Kadangkala data regular pun bisa disajikan (offloading) via search engine demi mengurangi penalti normalisasi database (yang lebih cocok untuk data mining daripada site performance)

Isu ketiga adalah penggantian model pencarian. Fitur pencarian internal tentunya telah di desain dengan batasan tertentu. Ketika situs Anda tumbuh tentunya Anda akan semakin tahu pola pemakaian oleh pengguna. Termasuk di dalamnya adalah pola pencarian dalam rangka mendapatkan pengalaman terbaik dalam pemanfaatan situs.

Dalam edisi JuTek (Jumat Tekno) kali ini, akan disajikan beberapa alternatif mesin pencari eksternal bisa Anda implementasi untuk meningkatkan performa dan user experience di situs Anda.

Read More Read More

Persaingan Mesin Pencari di Era Semantic Web

Persaingan Mesin Pencari di Era Semantic Web

Kemarin kita sudah sempat menyinggung semantic web dan mesin pencari. Jika semantic web sudah terimplementasi, apa yang terjadi pada mesin pencari? Jika semantic web sudah terwujud maka proses pencarian bisa memberikan hasil yang sangat akurat. Pada point ini tingkat akurasi tak akan lagi jadi persaingan di antara mesin pencari. Lalu inovasi apa yang kira-kira harus diangkat sebagai nilai jual? Mari kita coba tebak bersama-sama.

  1. Koleksi indeks. Saat ini pun, koleksi indeks masih tetap jadi bahan persaingan. Tiap mesin pencari melakukan klaim memiliki indeks yang lebih besar dibanding yang lain. Ingat apa sesumbar Cuil kemarin?
  2. Dukungan Bahasa Natural. Dukungan bahasa natural, seperti yang dipakai sehari-hari, akan menjadi semakin seksi. Hal inilah yang menjadikan Hakia dan Powerset menjadi incaran banyak investor.
  3. Kemampuan menurunkan inferensi (menyimpulkan). Mesin pencari diharapkan tidak hanya mengerti apa yang diketikkan pengguna akan tetapi juga menebak keinginan sebenarnya. Tidak hanya sekedar berupa word spelling akan tetapi lebih ke tujuan pencarian. Mungkin evolusi dari related result akan termasuk di dalamnya.

Anda punya tambahan alternatif jawaban?

Detiksearch dan Mesin Pencari di Indonesia

Detiksearch dan Mesin Pencari di Indonesia

What does it take to create your own search engine? Tentu saja membuat mesin pencari tidaklah mudah. Paling tidak seseorang harus mempunyai infrastruktur yang memadai, baik dalam hal penyimpanan data dan pemrosesan data. Pun Google akhirnya harus berinovasi untuk mengatasi isu infrastuktrur ini (Big Table, software framework, custom filesystem, etc). Jadi, mesin pencari itu memang sesuatu yang serius dan berskala besar.

Read More Read More

Mencari Peluang di Pasar Mesin Pencari

Mencari Peluang di Pasar Mesin Pencari

Dengan semakin banyaknya data, ditambah lagi tren user-generated content (UCG), fungsi mesin pencari menjadi semakin penting dan dibutuhkan. Banyak yang berusaha masuk ke pasar yang selama ini didominasi oleh Google dengan algoritmanya yang canggih, namun masih saja belum ada yang cukup patut dipertimbangkan. Saya sendiri mulai dengan Yahoo sebagai mesin pencari, namun akhirnya terpaku dengan Google di halaman utamaku. Masih adakah peluang bagi pendatang baru?

Read More Read More

Tren Mesin Pencari

Tren Mesin Pencari

Tren pertama

Dulu, mesin pencari yang menjadi pilihan saya adalah HotBot. Sebelum mengenal Google, HotBot saya sukai karena menyediakan fitur boolean operator. Dengan HotBot kita bisa memakai AND atau OR untuk mengkustomisasi query kita. Selain HotBot, ada juga Altavista dan Yahoo, serta Google. Mesin pencari yang muncul di dot com boom pertama ini tidak memberikan fitur macam-macam selain berusaha membantu pengguna internet untuk menemukan apa yang hendak dicari di web yang mulai berkembang tak terkontrol. Ini adalah tren pertama, tren pencarian horisontal tanpa spesialisasi apapun kecuali relevansi.

Tren kedua

Semakin menumpuknya data di web membuat sekedar menemukan teks tak lagi hip/keren. Pengguna internet mendambakan sesuatu yang lebih. Mereka tahu ada bermacam-macam jenis data di internet. Meskipun semua berbentuk teks, data ini mempunyai makna tertentu yang berhubungan erat dengan apa yang hendak dicari pengguna. Di titik inilah muncul vertical search. Pencarian yang mengkhususkan pada satu bidang atau topik saja.Misalnya: properti, elektronik, dan sebagainya. Contoh-contoh nyata misalnya: google image search, google blog search, krugle (untuk pencarian dalam source code), dll

Tren ke depan

Ada beberapa kemungkinan yang bisa terjadi dengan tren mesin pencari di masa depan. Berikut ini kita bahas satu persatu.

Yang pertama adalah semantic search. Semantik bisa diartikan dengan penuh makna, jadi alih-alih sekedar teks akan ada makna tambahan yang melekat di teks tersebut. Misalnya kumpulan angka bisa bermakna nomor telepon, dua kata bisa saja sebuah nama orang atau judul buku.

Semantik web sendiri sepertinya masih mengalami tarik ulur. Walau pun infrastuktur tampak sudah tersedia, tetap saja semantik web yang pernah dideskripsikan oleh Tim Berners — Lee tak kunjung datang. Mungkin karena bentuk semantik dan perkakas pemberi semantik yang tak kunjung membumi. Semantik web sepertinya masih dikonsumsi di tingkatan geek. Entah kapan semantik web bisa terwujud, kita lihat saja pendekatan mana yang akan lebih dulu menang. Pendekatan top down (machine tagged atau machine intensive – usaha pemberian semantik yang tidak banyak melibatkan manusia alias lebih mengeksploitasi mesin) atau bottom up (human tagged – usaha pemberian semantik yang melibatkan tenaga manusia secara intensif). Selama semantik web belum terwujud maka semantic search pun akan tertunda kedatangannya. Contoh: Spock.com yang mengkhususkan diri pada pencarian orang. Spock memanfaatkan beberapa data di web yang sudah diberi “tag” sebagai data persona, misalnya: LinkedIn. Selain Spock, ada juga Hakia dan Powerset yang juga merambah ke ranah semantik, bahkan dengan mencoba mengeksplorasi bahasa natural (natural language) — bahasa yang mirip dengan bahasa sehari-hari.

Yang kedua adalah collaborated search dan open search. Hal ini didasari oleh metode pencarian sudah mencapai titik saturasi, paling tidak untuk horisontal search.Vertical search sendiri tidak dapat berkembang pesat tanpa kerjasama pemilik data. Oleh karena itu bentuk search yang mungkin lebih subur berkembang adalah collaborated search atau pencarian dengan sistem kerjasama. Dimana sebuah mesin pencari yang sudah established membuka diri, membuat pemilik data atau yang lebih tahu tentang detil data untuk menambahkan atribut-atribut baru atau yang lebih tepat. Kepentingan kolaborasi, memunculkan policy atau bentuk kerjasama yang strategis: open search. Dalam open search, search engine meminjamkan infrastrukturnya termasuk “algoritma” pencarian, dan relevancy scoring. Sementara visualisasi, penambahan atribut data spesifik dan sebagainya dilimpahkan kepada partner. Inilah yang diinisiasi oleh Yahoo!BOSS

Hal tersebut adalah opsi yang advance, untuk versi minimalis, partner hanya diperkenankan untuk melengkapi hasil pencarian yang dihasilkan oleh search engin dengan data-data pribadi-nya. Hal ini membuat hasil pencarian yang sebelumnya hanya berupa judul, dan summary bisa dilengkapi dengan data finansial (khusus untuk item institusi profit), jadwal putar film (untuk judul film baru), catatan box office (untuk film lama), atau portofolio kerja (khusus item bertipe “person”). Hal ini sudah diawali dengan diluncurkannya Yahoo Search Monkey

Jadi, kira-kira akan jadi seperti apa mesin pencari di masa depan? Bagaimana dengan peluang mesin pencari di Indonesia? Yang terakhir ini akan coba kita singgung sedikit di lain hari 😉

Credits: celetukan @rampok di Plurk.