Wget проблема.

Black_Ru 6 сентября, 2009 - 09:52

Общение

Не копирует все фыйлы с хоста, перепробовал всевозможные варианты, выкурил уже несколько манов.
Не берет файлы doc и некоторые (как ни странно) htm
Пробовал копировать так:
wget --tries=45 l10 -r bogomysl.narod.ru/
wget --mirror bogomysl.narod.ru/
etc.

ви***вой софтиной скопировать получилось, но как-то даже обидно, почему wget-ом не получается?

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

wget - r bogomysl.narod.ru/ у

Автор Brainsburn, дата создания 6 сентября, 2009 - 10:17.

wget - r bogomysl.narod.ru/

у меня все качает

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

Дожно быть 25 МБ. У меня

Автор Black_Ru, дата создания 6 сентября, 2009 - 10:30.

Дожно быть 25 МБ.
У меня только 2.6 выкачивает

—

С ноября 2022 нетбук HP mini (Processor: Atom n570)

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

.

Автор patamooshta, дата создания 6 сентября, 2009 - 13:03.

Загружено: 26 файлов, 2,6M
на том сайте вроде битых ссылок полно.
Откуда вы взяли про 25 Мб?

—

Это подпись, которую невозможно истолковать неправильно

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

Потому что я оффтоповой

Автор Black_Ru, дата создания 6 сентября, 2009 - 16:47.

Потому что я оффтоповой прогой (уж не буду упоминать) гружу 25 мб. и знаю, что там лежит столько, так как сам их когда-то туда заливал.
Только что подгрузил VirtualBox с хрюшей и ***** загрузил 25.

Тут уже вопрос, как работает wgеt и оффтоп?

Ссылки не битые, а организованы
td FORM ACTION="odoctr.htm"
input type="submit" value=показать /FORM /td

т.е. в виде кнопки.

Получается вгет заходит на главуню страницу сайта и идет по ссылкам a href
а мне нужно получить все файлы, лежащие на сайте. T******m-то получается это сделать.
В связи с чем вопрос - как работает wget? И можно ли его настроить на режим работы полной скачки?

—

С ноября 2022 нетбук HP mini (Processor: Atom n570)

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

Твоя беда в другом

Автор Anarchist, дата создания 8 сентября, 2009 - 17:16.

Твоя беда в другом (в первую очередь в качестве вёрстки загружаемого сайта).

Вот ошибка, на которой обламывается wget:

--2009-09-08 17:14:21--  http://bogomysl.narod.ru/arh1.aad
Устанавливается соединение с 194.186.213.2:8080... соединение установлено.
Запрос Proxy послан, ожидается ответ... 404 Not Found
2009-09-08 17:14:21 ОШИБКА 404: Not Found.

ЗАВЕРШЕНО --2009-09-08 17:14:21--
Загружено: 25 файлов, 2.6M за 0.2s (11.4 MB/s)

Беглый просмотр мана не дал ответа на вопрос: что такого сказать ему, чтобы он игнорировал эти ошибки и продолжал скачивать.

ЗЫ: Ереси (в виде формата .doc) там много.

—

:wq
--
Live free or die

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

Цитата: Recursive

Автор NightNord, дата создания 9 сентября, 2009 - 00:52.

Цитата:

Recursive Accept/Reject Options

-A acclist --accept acclist
-R rejlist --reject rejlist

Есть шанс, что это поможет (с данным файлом).
Надо еще --level большой поставить

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

попробуйте

Автор Шаманыш, дата создания 6 сентября, 2009 - 18:06.

попробуйте также
net-misc/pavuk
www-client/httrack

—

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

Шаманыш

Автор Black_Ru, дата создания 7 сентября, 2009 - 15:25.

Шаманыш написал(а):

попробуйте также
net-misc/pavuk
www-client/httrack

Спасибо, попробую.

—

С ноября 2022 нетбук HP mini (Processor: Atom n570)

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

Вопрос из личного опыта

Автор Anarchist, дата создания 7 сентября, 2009 - 14:59.

Black_Ru написал(а):

но как-то даже обидно, почему wget-ом не получается?

Среди тех файлов, которые не выкачиваются wget'ом случаем нет содержащих проблеы и прочие интересные символы в имени файла?

—

:wq
--
Live free or die

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

В имени файлов точно нет

Автор Black_Ru, дата создания 7 сентября, 2009 - 15:26.

В имени файлов точно нет. Я когда делал этот сайт, уже успел прочитать учебник по html

А может быть такое, что wget сначала заходит на index, а потом с него уже идет по ссылкам?

—

С ноября 2022 нетбук HP mini (Processor: Atom n570)

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

net-misc/pavuk www-client/htt

Автор Black_Ru, дата создания 8 сентября, 2009 - 16:30.

net-misc/pavuk
www-client/httrack

Потестировал и эти, результат тот же. Выводы пока рано делать.

—

С ноября 2022 нетбук HP mini (Processor: Atom n570)

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

Anarchist

Автор leomuz, дата создания 8 сентября, 2009 - 17:30.

Anarchist написал(а):

Black_Ru написал(а):

но как-то даже обидно, почему wget-ом не получается?

Среди тех файлов, которые не выкачиваются wget'ом случаем нет содержащих проблеы и прочие интересные символы в имени файла?

Подскажите а как с таким бороться , у меня как раз wget скачивает файлы в полном объеме (вроде как см. в долфине)
а при открытии пишет нет такого файла ))), это случается если в имени файла русские буквы или интересные символы&пробелы.
Раньше было нормально, такое появилось на ядре 30-r5

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

А что, просто переименовать

Автор Black_Ru, дата создания 8 сентября, 2009 - 18:10.

А что, просто переименовать файл нельзя?

—

С ноября 2022 нетбук HP mini (Processor: Atom n570)

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

если бы было все так просто,

Автор leomuz, дата создания 9 сентября, 2009 - 06:36.

если бы было все так просто, вопрос не задавался --а по существу обновил на 14-ю версию, все нормально.

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

.

Автор Anarchist, дата создания 10 сентября, 2009 - 16:23.

leomuz написал(а):

Подскажите а как с таким бороться , у меня как раз wget скачивает файлы в полном объеме (вроде как см. в долфине)
а при открытии пишет нет такого файла ))), это случается если в имени файла русские буквы или интересные символы&пробелы.
Раньше было нормально, такое появилось на ядре 30-r5

Ну... С описываемой ситуацией не сталкивался...
ls -l для скачанного файла что говорит?

Моя ситуация несколько проще: у меня заранее известно что нужно выкачать (имя выкачиваемого файла задаётся с использованием метасимволов).
И я просто задаю имя файла, под которым надо сохранить скачанный: --output-document=blah-blah-blah.

—

:wq
--
Live free or die

Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".

Меню

Вход на сайт

Навигация

Активные обсуждения форума

Новые записи в блогах

Сейчас на сайте

Сбор новостей

Wget проблема.

wget - r bogomysl.narod.ru/ у

Дожно быть 25 МБ. У меня

.

Потому что я оффтоповой

Твоя беда в другом

Цитата: Recursive

попробуйте

Шаманыш

Вопрос из личного опыта

В имени файлов точно нет

net-misc/pavuk www-client/htt

Anarchist

А что, просто переименовать

если бы было все так просто,

.

Настройки просмотра комментариев