Semalt: Răzuiți orice pagină web cu un singur clic de mouse

WebHarvy este unul dintre cele mai bune instrumente de razuire a datelor și de crawling web de pe net. Este utilizat pentru a raza imagini, adrese URL, text și e-mailuri dintr-un număr mare de site-uri. Cu WebHarvy, puteți salva conținutul web într-o varietate de formate și puteți extrage date utile doar cu câteva clicuri.
Creează o varietate de site-uri:

Folosind WebHarvy, puteți să zgâriați cu ușurință URL-uri, adrese de e-mail, imagini, fișiere video și audio și text din paginile web. În modul său de configurare, trebuie doar să mutați indicatorul mouse-ului peste pagină, iar datele vor fi razuite automat. Puteți evidenția, de asemenea, informațiile pe care doriți să le razuiți și WebHarvy va începe să își îndeplinească funcția instantaneu. Odată extrasă datele, acestea sunt evidențiate cu fundalul galben și puteți verifica calitatea acestora. Uimitor, WebHarvy remediază toate erorile minore din fișierele dvs. și va afișa rezultatul final într-o fereastră Capture. Dacă datele nu sunt evidențiate cu fundalul galben, ar trebui să schimbați setările instrumentului și să le reporniți imediat pentru a obține rezultate bune.
Identificați elemente de date similare:
Cu WebHarvy, puteți identifica elementele de date similare și puteți scăpa de conținut de calitate scăzută. De exemplu, dacă ai răzuit o anumită pagină anterior și ai uitat de ea, WebHarvy nu va extrage date din aceeași pagină și îți va economisi timp și energie. În schimb, puteți accesa aceste date în baza de date WebHarvy și le puteți descărca instantaneu pe hard disk. În mod similar, puteți captura mai multe elemente de date dintr-o pagină utilizând acest instrument și puteți efectua mai multe sarcini de razuire simultan.
Scartați imagini cu WebHarvy:
În timpul configurației, când facem clic pe un fișier PNG sau JPG, WebHarvy va începe să-l răzuie instantaneu. După extragerea imaginii, aceasta este descărcată automat pe hard disk sau este stocată în baza de date WebHarvy pentru utilizări offline. Puteți razi până la 100 de fișiere imagine și documente PDF simultan cu acest serviciu. Opțiunea 'Capture Image' poate fi de asemenea folosită pentru a razi documentele HTML și puteți aplica expresii obișnuite pentru a obține adresa URL a imaginii în cel mai scurt timp.

Răzuiți documentele HTML:
Cu WebHarvy, puteți razi documentele HTML cu doar câteva clicuri. Pentru aceasta, ar trebui să selectați opțiunea „Captura HTML” și să faceți clic pe butonul „Mai multe opțiuni” din fereastra Captare. Aici va fi afișat codul HTML al elementului selectat. Faceți clic pe butonul „Capture HTML” și capturați HTML-ul elementului selectat.
Interfață punct-și-clic:
WebHarvy este cel mai cunoscut pentru interfața punct-și-clic. Nu trebuie să scrii coduri sau scripturi în timp ce razuiești datele. În schimb, puteți utiliza WebHarvy pentru a naviga prin diferite pagini web și a zgâria cât de multe pagini doriți cu un singur clic de mouse. WebHarvy identifică automat modelele de date și oferă rezultate precise și fiabile. Puteți salva informațiile în formate XML, CSV, JSON și TSV. Puteți chiar să vă zgâriați anonim paginile web și să împiedicați WebHarvy să vă blocheze adresa IP.