Skip to content

Latest commit

 

History

History
19 lines (10 loc) · 625 Bytes

README.md

File metadata and controls

19 lines (10 loc) · 625 Bytes

Soubor skriptů pro usnadnění celoplošných sklizní

Skripty byly vytvořeny za účelem zjednodušení práce při celoplošných sklizních a jako potenciální základ pro automatizaci sklízení.

Obsah

xml_logs_to_csv.py

Python script, který podle regexů vytáhne z xml souboru vráceného heritrixem požadované informace a převede je do csv souboru pro snažší spracování.

To-Do

[] Ovládání celé smečky crawlerů najednou.

[] Výměna a generování konfigurace crawlerů.

[] Script na průběžnou kontrolu stavu sklizně.

[] Přidat script na kontrolu kvality.