Wget проблема.
Black_Ru 6 сентября, 2009 - 09:52
Не копирует все фыйлы с хоста, перепробовал всевозможные варианты, выкурил уже несколько манов.
Не берет файлы doc и некоторые (как ни странно) htm
Пробовал копировать так:
wget --tries=45 l10 -r bogomysl.narod.ru/
wget --mirror bogomysl.narod.ru/
etc.
ви***вой софтиной скопировать получилось, но как-то даже обидно, почему wget-ом не получается?
»
- Для комментирования войдите или зарегистрируйтесь
wget - r bogomysl.narod.ru/ у
wget - r bogomysl.narod.ru/
у меня все качает
Дожно быть 25 МБ. У меня
Дожно быть 25 МБ.
У меня только 2.6 выкачивает
My website: http://comb.org.ru
С ноября 2022 нетбук HP mini (Processor: Atom n570)
.
Загружено: 26 файлов, 2,6M
на том сайте вроде битых ссылок полно.
Откуда вы взяли про 25 Мб?
Это подпись, которую невозможно истолковать неправильно
Потому что я оффтоповой
Потому что я оффтоповой прогой (уж не буду упоминать) гружу 25 мб. и знаю, что там лежит столько, так как сам их когда-то туда заливал.
Только что подгрузил VirtualBox с хрюшей и ***** загрузил 25.
Тут уже вопрос, как работает wgеt и оффтоп?
Ссылки не битые, а организованы
td FORM ACTION="odoctr.htm"
input type="submit" value=показать /FORM /td
т.е. в виде кнопки.
Получается вгет заходит на главуню страницу сайта и идет по ссылкам a href
а мне нужно получить все файлы, лежащие на сайте. T******m-то получается это сделать.
В связи с чем вопрос - как работает wget? И можно ли его настроить на режим работы полной скачки?
My website: http://comb.org.ru
С ноября 2022 нетбук HP mini (Processor: Atom n570)
Твоя беда в другом
Твоя беда в другом (в первую очередь в качестве вёрстки загружаемого сайта).
Вот ошибка, на которой обламывается
wget
:Беглый просмотр мана не дал ответа на вопрос: что такого сказать ему, чтобы он игнорировал эти ошибки и продолжал скачивать.
ЗЫ: Ереси (в виде формата .doc) там много.
:wq
--
Live free or die
Цитата: Recursive
Есть шанс, что это поможет (с данным файлом).
Надо еще --level большой поставить
попробуйте
попробуйте также
net-misc/pavuk
www-client/httrack
:)
Шаманыш
Спасибо, попробую.
My website: http://comb.org.ru
С ноября 2022 нетбук HP mini (Processor: Atom n570)
Вопрос из личного опыта
Среди тех файлов, которые не выкачиваются
wget
'ом случаем нет содержащих проблеы и прочие интересные символы в имени файла?:wq
--
Live free or die
В имени файлов точно нет
В имени файлов точно нет. Я когда делал этот сайт, уже успел прочитать учебник по html
А может быть такое, что wget сначала заходит на index, а потом с него уже идет по ссылкам?
My website: http://comb.org.ru
С ноября 2022 нетбук HP mini (Processor: Atom n570)
net-misc/pavuk www-client/htt
net-misc/pavuk
www-client/httrack
Потестировал и эти, результат тот же. Выводы пока рано делать.
My website: http://comb.org.ru
С ноября 2022 нетбук HP mini (Processor: Atom n570)
Anarchist
Подскажите а как с таким бороться , у меня как раз wget скачивает файлы в полном объеме (вроде как см. в долфине)
а при открытии пишет нет такого файла ))), это случается если в имени файла русские буквы или интересные символы&пробелы.
Раньше было нормально, такое появилось на ядре 30-r5
А что, просто переименовать
А что, просто переименовать файл нельзя?
My website: http://comb.org.ru
С ноября 2022 нетбук HP mini (Processor: Atom n570)
если бы было все так просто,
если бы было все так просто, вопрос не задавался --а по существу обновил на 14-ю версию, все нормально.
.
Ну... С описываемой ситуацией не сталкивался...
ls -l
для скачанного файла что говорит?Моя ситуация несколько проще: у меня заранее известно что нужно выкачать (имя выкачиваемого файла задаётся с использованием метасимволов).
И я просто задаю имя файла, под которым надо сохранить скачанный:
--output-document=blah-blah-blah
.:wq
--
Live free or die