Apache Nutch adalah perangkat lunak web crawler sumber terbuka (open source) yang digunakan untuk melakukan scan atau crawl ke semua halaman-halaman internet untuk membuat indeks dari data yang dicari di situs-situs internet.
Pakar big data Wayan M Wijaya mengatakan Apache Nutch sudah sangat terkenal andal karena memiliki sifat skalabel yakni dapat digunakan dalam berbagai skala kebutuhan mulai dari skala terkecil hanya dengan satu laptop hingga skala besar dengan ratusan server dalam suatu sistem terdistribusi seperti Hadoop.
Baca Juga: Apa Itu Big Data?
"Apache Nutch memiliki kemampuan parsing, indexing, kemudian memungkinkan pengguna untuk membangun mesin pencari sendiri dengan pencarian yang dapat dikostumasi sesuai kebutuhan," katanya sebagaimana dikutip oleh Warta Ekonomi di Jakarta, Jumat (20/12/2019).
Dengan menggunakan Apache Nutch, Wayan Wijaya menjelaskan bahwa setiap orang dapat membangun mesin pencari (search engine) sendiri layaknya Google.
Baca Juga: Menyimak Perjalanan Google Berdayakan Big Data
"Pada penerapannya Apache Nutch dapat dikembangkan melalui pengombinasian dengan sistem lain seperti Elasticsearch, Solr, MongoDB, maupun Apache Hbase," pungkasnya.
Mau Berita Terbaru Lainnya dari Warta Ekonomi? Yuk Follow Kami di Google News dengan Klik Simbol Bintang.
Editor: Cahyo Prayogo
Tag Terkait: