YaCy

YaCy
Logo YaCy
Logo programu
Ilustracja
Autor Michael Christen
Aktualna wersja stabilna 1.922 / 13 października 2019; około 6 lat temu
Język programowania java
System operacyjny POSIX (w tym GNU/Linux), Windows, Mac OS
Rodzaj Wyszukiwarka
Licencja GPL
Strona internetowa

YaCy – rozproszona wyszukiwarka zbudowana na zasadzie sieci peer-to-peer (P2P). Podstawą jest program napisany w Javie, funkcjonujący na kilku tysiącach komputerów (stan na rok 2011), tak zwanych YaCy-peers. Każde YaCy-peer niezależnie przeszukuje internet, analizuje oraz indeksuje znalezione strony i gromadzi rezultaty indeksowania we wspólnej bazie danych (tak zwanym indeksie), który jest współdzielony z innymi użytkownikami YaCy tak, jak w sieciach P2P.

W odróżnieniu od częściowo rozproszonych wyszukiwarek, sieć YaCy cechuje się zdecentralizowaną architekturą. Wszystkie węzły (YaCy-peers) są równoważne i nie ma żadnego serwera centralnego. Program może funkcjonować albo w trybie crawl albo jako pośrednik sieciowy (proxy) indeksujący odwiedzane przez użytkownika strony (kilka różnych mechanizmów broni prywatności użytkownika).

Dostęp do wyników wyszukiwania zapewniony jest poprzez uruchamiany lokalnie serwer wyszukiwania ze stroną wyszukiwania i polem do wprowadzania zapytań. Wyniki przedstawiane są w typowy sposób, tak jak na innych stronach czy portalach.

Program udostępniany jest na licencji GPL.

Architektura

Wyszukiwarka YaCy opiera się na czterech elementach:

Crawler
Robot poruszający się ze strony na stronę i analizujący ich kontekst.
Indexer
Tworzy "odwrotny indeks słów" (Reverse Word Index - RWI) np. każde słowo zawarte w RWI ma listę powiązanych z nim URL i informacje rankingowe. Słowa zapisywane są w formie hashy.
Wyszukiwanie i interfejs administracyjny
Stworzone jako interfejs sieciowy udostępniany lokalnie przez HTTP.
Sieć P2P
Używana do magazynowania bazy danych RWI przy użyciu rozproszonej tablicy hashy.

Zalety

  • Jako że nie ma centralnego serwera, wyników nie da się ocenzurować, i niezawodność jest (przynajmniej teoretycznie) wyższa.
  • Dzięki temu że silnik wyszukiwarki nie jest własnością firmy, nie ma centralnej usługi reklamowej ani manipulowanego rankingu.
  • Ze względu na sposób w jaki zaprojektowane zostało YaCy, może być używane do indeksowania "ukrytych sieci" takich jak Tor, I2P czy Freenet.

Wady

  • Jako że nie ma centralnego serwera a sieć otwarta jest dla każdego, wrodzy użytkownicy (teoretycznie) mogą być w stanie częściowo manipulować efektami wyszukiwania.
  • Na chwilę obecną YaCy daje zdecydowanie mniej wyników i jest znacznie wolniejsze niż duże komercyjne wyszukiwarki.
  • Protokół YaCy używa zapytań HTTP, znacznie wolniejszych niż protokoły UDP czy TCP z ciągłymi połączeniami.

Linki zewnętrzne

Content Disclaimer

Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.

  1. The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
  2. There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
  3. It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
  4. Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
  5. Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.
Kembali kehalaman sebelumnya