Apa itu spider ? yang pasti bukan laba laba. Jadi apa itu spider ? Menurut referensi sy pernah sy baca. Spider adalah program komputer otomatis memonitor dokumen yg ada di World Wide Web (WWW). Spider juga bisa disebut robot, softbot, wanderer, crawler, penjelajah web, dan fish. Dokumen World Wide Web (WWW) ini berupa halaman web yg nantinya otomatis diindex.
Cara Kerja Spider
Kebanyakan halaman web setidaknya memiliki satu link merujuk ke halaman lain. Otomatis antar halaman web telah terjalin koneksi. Spider memanfaatkan struktur web ini dengan mengindex satu halaman web kemudian mengikuti link halaman web lain yg ada di halaman web tsb.Fungsi Spider
Beberapa spider menyimpan URL (Uniform Resource Locator) atau alamat setiap halaman web situs yg pernah mereka kunjungi. Kegunaan spider ini bagi search engine adalah software pengindex halaman web sehingga pengguna search engine dapat mengakses informasi topik tertentu. indexing spider juga menyimpan judul dan ringkasan isi web atau keseluruhan halaman situs sehingga pengguna search engine bisa lebih detail melakukan pencarian.Beberapa spider memiliki fungsi lebih dimana dia menyimpan URL halaman stus yg belum terdaftar dengan tujuan agar search engine bisa update daftar atau menyediakan daftar halaman situs baru. Beberapa spider mencatat URL yg tidak lagi valid demi menjaga validitas daftar index searce engine. Btw, Untuk lebih memahami search engine, kamu bisa membaca Referensi Belajar Search Engine dan WebCrawler. Semoga kedua referensi tersebut bisa bermanfaat mempelajari teknologi search engine.
Search Engine, Definsi dan Referensi Belajar
Apa itu Search Engine ? Search engine, program software yang membantu user mencari informasi yg tersimpan dalam PC (personal computer) dan jejaring jaringan komputer seperti jaringan internet dan jaringan intranet.
Search Engine Populer
Beberapa search engine paling populer di dunia, yaitu Google Inc., Yahoo! Inc, dan Microsoft Network (MSN) Search. Ketiganya diurut bedasar popularitas layanan. Selain ketiga search engine populer tersebut, juga ada minoritas lain, yaitu altavista, webcrawler, dan live. Setiap search engine dapat diakses menggunakan web browser dan pengguna layanan pencarian mereka tidak dipungut biaya alias gratis.Cara Menggunakan Search Engine
Untuk memakai search engine, Seorang user harus memasukkan search term (Kata / frase yg hendak dicari). Kemudian sesuai cara kerja search engine, akan dihasilkan daftar situs World Wide Web (WWW), atau daftar dokumen file file bebas download.Cara Kerja Search Engine
Cara kerja search engine itu dengan menscan / mengcrawl konten web dalam komputer dan jaringan, atau juga dengan menganalisa / memparsing hasil index crawling tsb dan kemudian disusun index keyword konten web.Layanan pencarian web ini bekerja dengan membangun index sekaligus secara rutin mengupdate index halaman web dan file. Semua ini berkat bantuan sejenis web browser otomatis atau spider robot atau web crawler yg menjelajahi internet, mengumpulkan setiap halaman situs yg dapat crawler tsb temukan.
Halaman situs tsb akan mengalami proses index berdasar susunan kata, frase, dan kalimat yg mengisi konten. Proses index search engine ini melakukan perlakuan khusus pada judul dan header. Sehingga saat user memasukkan query, search engine akan menscan database index dan kemudian memunculkan daftar halaman yg paling sesuai dgn query pencarian user. Biasanya hasil scan akan didapatkan dalam hitungan detik.
Perbedaan Antar Search Engine
Umumnya saat engine mesin pencari menampilkan daftar hasil, halaman dirangking sesuai dengan seberapa banyak situs lain melink ke halaman tsb. Asumsi dibangun atas dasar semakin berguna sebuah situs, maka akan semakin sering situs lain mengirim user ke sana. Google menjadi pionir tehnik menilai kualitas link. Nama teknologi search engine ini Pagerank.Namun perlu diingat kalau Pagerank bukan satu satunya kriteria penilaian SEO. Namun pagerank bukan satu satunya kriteria. Catatan penting lainnya, setiap search engine memiliki kriteria masing masing. Itulah mengapa dibalik rahasia perbedaan hasil pencarian google dengan hasil pencarian yahoo. Sebagai awal belajar pagerank, kamu bisa membaca 4 Optimasi Konten demi Peningkatan Pagerank.
Perlu juga diperhatikan kalau hasil pencarian tidak sepenuhnya mewakili kualitas link. Penyebabnya adanya link yg disebut link sponsor. Link sponsor adalah link yg tampil pada hasil pencarian bukan disebabkan kualitas link melainkan perusahaan third party membayar jasa komisi searce engine untuk meletakkan link mereka pada hasil pencarian atau SERP (Search Engine Result Page). Dalam kontens google adsense, mereka yg membeli link google disebut adwords publisher.
Referensi Belajar Search Engine Lanjutan
Website berikut ini adalah referensi website bagi pembaca yg tertarik mendalami teknologi search engine. Seluruh website memiliki kelebihan dan kekurangan tersendiri. Namun tetap menyediakan dokumentasi lengkap sejarah search engine jauh sebelum masa dominasi yahoo dan google mendominasi dunia bisnis search engine ini.- Web Links Panduan Optimasi Search Engines : Situs komersil ini menawarkan ribuan artikel search engine beragam topik menarik. http://www.searchability.com/
- Search Engine Watch : Search Engine Watch, situs komersil, menyediakan penjelasan cara kerja search engine, tutorial search engine, kamus istilah, tips optimasi search engine, review terkini, dan sumber lain http://www.searchenginewatch.com/
- Searching the Internet — Searchable Indexes : Internet Scout Project menyediakan penjelasan singkat mengenai search engine termasuk menyediakan informasi dan fitur search engine. http://scout.cs.wisc.edu
- Search Engine Showdown : Situs yg dikelola pribadi ini menyediakan statistik, review, dan informasi perbandingan search engine http://www.notess.com
- Searching the Internet: Recommended Sites and Search Techniques : Situs perpustakaan universitas amerika ini, universitas Albany, menawarkan informasi bermacam jenis search engine; Informasi tsb berisi review kelebihan dan kekurangan masing masing search engine. http://library.albany.edu/internet/search.html
Catatan Newbie
Sebagai catatan newbie search engine, sebenarnya dalam blog bakawan techblog ini ada banyak pembahasan search engine, terutama google dan yahoo. Namun sayangnya tidak fokus pada topik search engine saja. Kategori-nya webmaster, Google Tool, Building Traffic, dan SEO.Namun secara keseluruhan, posting penjelasan search engine tersebar di dalam blog dan tidak dikategorikan secara khusus. Jadi bila ingin mengetahui maka kamu harus mengetik pada searchbox yg disediakan. Atau click link pencarian search engine ini. Sebagai kalimat penutup referensi yg mulai kepanjangan ini, mari kita simak kata mutiara James Thurber berikut ini : It is better to ask some of the questions than to know all the answers.
Bila kamu belajar otodidak seperti kami, maka besar kemungkinan kamu menyimpan pertanyaan tersembunyi. Berbagilah dengan kami. Siapa tau kami, bakawan web desain, bisa membantu.
WebCrawler
Apa itu Webcrawler? yang pasti bukan web crawler karena webcrawler adalah salah satu jenis search engine, aplikasi software yang berguna mengindex informasi World Wide Web (WWW).Awalnya, Webcrawler dikembangkan mahasiswa universitas Washington, Brian Pinkerton, pada tahun 1994. Namun sekarang dimaintain America Online, inc, internet service provider (ISP) komersial.
Webcrawler menggunakan program yg disebut spider dalam penjelajahan internet mencari dokumen baru. Dokumen itu bisa berupa halaman web atau file file yg gratis, boleh didownload, dan mudah diakses. Nantinya setiap kata halaman web dokumen itu diindex.
Cara penggunaan webcrawler, sama seperti cara penggunaan search engine lainnya. Seseorang harus menginputkan keyword kata kunci yg nantinya diubah menjadi query search engine. Coba cek beberapa contoh query google search engine ini.
Kemudian webcrawler memproses permintaan query dan menampilkan hasil pencarian berupa daftar dokumen yg berisi kata kunci query. Setiap judul ngelink ke situs dokumen asli di WWW. Jadi user dapat langsung menuju situs dokumen bersangkutan
No comments:
Post a Comment
Thank you, for your comment.