LJSear.ch - layanan bagi mereka yang membutuhkan file "Live Journal"
Layanan Web / / December 24, 2019
Apakah Anda ingin menemukan di "Belajar" record abad-tua, tapi tidak bisa, karena pencarian terbatas untuk satu bulan? Anda akan membebaskan layanan LJSear.ch, Yang berisi arsip dari bahasa Rusia LiveJournal untuk periode 2000-2015. Bicara tentang hal itu penciptanya Roman Ivanov (kukutz).
Roman Ivanov
Product Manager di "Yandex". Telah meluncurkan pencarian blog, personalisasi pencarian "Yandex", beberapa versi dari "Yandex. Mail "layanan" Yandex. Lenta "" Ya.ru "" Yandex. Gambar "dan beberapa orang lain. Hal ini sekarang terlibat dalam "Yandex. Browser "dan LJSear.ch.
Apa LJSear.ch?
"Belajar" Ini lebih dari sebuah arsip terabyte. Diindeks dan tersedia untuk mencari 340 juta posting dan komentar 1 miliar dari tahun 2000 sampai musim gugur 2015. Dan semua ini dengan akrab bagi blog perangkat pencarian: Batas penulis, berdasarkan tanggal, oleh masyarakat.
entri baru tidak diindeks, seperti yang kita mempertimbangkan proyek kami sebagai arsip, memorial.
Proyek ini sepenuhnya non-profit, tidak ada iklan, dan cara-cara lain untuk membuat uang tidak dimaksudkan.
Mengapa saya membutuhkan layanan?
Pada musim gugur 2015 kemampuan pencarian untuk blog "Yandex" terbatas hanya bulan lalu. Penjelasannya sederhana: sebagian besar orang mencari informasiTerkait dengan catatan terakhir, dan pencarian yang mendalam bagi mereka adalah berlebihan.
Itu benar. Bulan lalu sudah cukup untuk tugas-tugas seperti pemantauan berkala atau ulasan pencarian kesombongan beberapa peristiwa baru-baru. Tapi ada masalah dan penelitian lebih dalam.
Saya percaya bahwa dalam "Belajar" yang terjadi, atau setidaknya tercermin hampir semua budaya berbahasa Rusia dari nol tahun. Nilai arsip ini tidak bisa berlebihan. Ketika "Yandex" memiliki pencarian arsip tertutup, saya sangat kecewa, karena yakin bahwa koleksi ini informasi harus dipertahankan bagi umat manusia. Baik dan saya bertanya, "Yandex" arsip, dan tiba-tiba ia setuju dan memberi mereka.
Arsip Blog cukup unik, karena begitu banyak tidak dapat didownload di "Belajar". Banyak majalah yang dihapus oleh penulisnya, beberapa rusak dan hancur oleh hacker, dalam beberapa kasus, catatan tidak dihapus, tetapi tersembunyi di bawah kunci dan kunci.
Enam bulan terakhir pada saya bertanggung jawab untuk memastikan bahwa data tidak hilang. Aku menelepon pada bantuan teman-teman, dan di antara mereka ada orang-orang yang setuju untuk membantu memahami apakah kita dapat membuat informasi yang tersedia untuk pencarian. Kami telah menciptakan sebuah LJSear.ch layanan dan tampaknya mengantarnya ke keadaan waras.
Relawan banyak?
Yang ditemukan. Seorang ahli terkenal di bidang UX Kohl Zayarny Saya datang dengan desain. Sasha Belyanskiy Aku mengambil BEM-vorstku dan frontend pada Node.js. Spaceinvaderz terlibat administrasi sistemik. pemrograman backend di PHP saya mulai atas dasar prototipe itu sendiri, yang membuat teman saya tobe.
Masalah terbesar adalah besi: siapa yang akan membayar untuk hosting? Teman yakin bahwa Anda dapat mengumpulkan uang untuk situs kraudfandingovyh, tapi saya skeptis. Dan ada orang-orang yang indah datang kepada kami dari Servers.ru dan menawarkan untuk membantu. Sebagai hasilnya, kami memiliki dedicated server besar dengan SSD untuk mengindeks dan mencari backend ditambah awan server virtual untuk frontend.
Yang mungkin tertarik dalam proyek?
Sebagai catatan baru tidak diindeks, penonton, yang saya rasa - adalah peneliti. Bagaimana harfiah peneliti lapisan budaya nol tahun, dan atau mantan pengguna "Belajar", yang ingin mencari sesuatu yang ditulis pada tahun-tahun. Dan karena saya tidak membatasi Searches waktu eksekusi maksimum: penyidik bisa menunggu untuk query yang kompleks dan menit, dan dua. Tentu saja, pertanyaan sederhana dieksekusi dengan cepat, dan jika layanan mendeteksi bahwa permintaan sekarang banyak, itu termasuk degradasi dikendalikan, termasuk batas batas waktu permintaan.
LJSear.ch →