A jak być inaczej ma? Tylko potrzebne 😉
wget z opcjami
wget --user-agent=Mozilla --content-disposition \ -E -m -N -r \ --reject svg,png,jpeg,jpg,gif,js,ttf,svg,png,jpeg,jpg,gif,js,ttf,zip,rar,7z,msi,exe,run,dmg,pkg,mp4,mpeg,mpg \ https://www.co.pobrac.z.internetu/ \ -X fonts,photo
Po kolei, co oznacza co?
- -E (–adjust-extension) – zapis dokumentów HTML/CSS z właściwymi rozszerzeniami.
- -m – tworzy obraz strony
- -N – nie pobiera ponownie plików, chyba że są nowsze niż lokalne.
- -r – rekurencyjnie przeszukuje w głąb
- –reject – odrzucenie plików o określonych rozszerzeniach
- -X – wyłączanie katalogów, do których wget nie będzie zaglądał (przydatne przy rekurencyjnym pobieraniu)
listowanie zamontowanych dysków
lsblk -o NAME,FSTYPE,LABEL,MOUNTPOINT,SIZE,MODEL
wyłączanie gdm dla ubuntu
sudo systemctl set-default multi-user.target
zaś przywrócenie:
sudo systemctl start gdm3.service
instalacja modelu językowego spacy
python3 -m spacy download pl_core_news_lg
403 podczas requests.get w pythonie
Na stronie https://www.zenrows.com opisane zostały fajne sposoby