crawlerSimple
Pozadavky
- wget
- boilerpipe
Poznamky
- Jednoduchy crawler, ktery stahne N stranek ze zadane adresy.
- wget ani httrack toto omezeni neumi
- data se stahuji do adresare data
- kdyz se data stahnou, tak se vycisti
Pouziti
- ./crawlerSimple.sh 'http://cs.wikipedia.org/wiki/' 20
- stahne 20 stranek z ceske wikipedie