Question Pourquoi `wget` télécharge-t-il index.html au lieu d'un fichier direct?


J'essaie juste de télécharger ceci, mais il redirige toujours vers la page principale et à la fin il suffit de télécharger le fichier index.html, pas le fichier que j'essaie de télécharger:

http://tweaking.com/files/setups/tweaking.com_windows_repair_aio.zip

Est-ce que vous savez comment le télécharger correctement? J'ai utilisé --user-agent = "firefox + linux, IE + windows (tout ce que vous pouvez penser)" mais cela ne fonctionne pas.

Ceci est la sortie, est la même chose avec --user-agent activée:

jaheaga@jaheaga:~$ wget  http://www.tweaking.com/files/setups /tweaking.com_windows_repair_aio.zip--2012-04-13 19:40:07--  http://www.tweaking.com/files/setups/tweaking.com_windows_repair_aio.zip
Resolviendo www.tweaking.com... 199.119.100.39
Conectando con www.tweaking.com[199.119.100.39]:80... conectado.
Petición HTTP enviada, esperando respuesta... 302 Found
Ubicación: http://tweaking.com [siguiente]
--2012-04-13 19:40:08--  http://tweaking.com/
Resolviendo tweaking.com... 199.119.100.39
Reutilizando la conexión con www.tweaking.com:80.
Petición HTTP enviada, esperando respuesta... 302 Moved Temporarily
Ubicación: http://www.tweaking.com [siguiente]
--2012-04-13 19:40:08--  http://www.tweaking.com/
Reutilizando la conexión con www.tweaking.com:80.
Petición HTTP enviada, esperando respuesta... 200 OK
Longitud: no especificado [text/html]
Grabando a: “tweaking.com_windows_repair_aio.zip.1”

    [ <=>                                                                            ]     46.913       234K/s   en 0,2s    

2012-04-13 19:40:09 (234 KB/s) - “tweaking.com_windows_repair_aio.zip.1” guardado [46913]

4
2018-04-13 23:25


origine


Quelles erreurs obtenez-vous? - Nifle
Le lien ne fonctionne pas du tout. Au moins pour moi. Que diriez-vous de le télécharger quelque part? Et utilisez le lien direct à partir de là? - Shiki
ça me donne la page principale, mais allez à tweaking.com/files/setups et vous pouvez le vérifier, comportement étrange de ce lien - Jaheaga
BTW: Je suis curieux. Quelle est la raison du téléchargement du fichier avec wget au lieu de l'intérieur du navigateur? Je veux dire que vous avez certainement utilisé un navigateur pour trouver l'URL de téléchargement :) - zpea
devoir noté, est un script batch que j'utilise pour réparer les ordinateurs Windows vraiment cassés. - Jaheaga


Réponses:


L'agent utilisateur est un bon début, mais pas suffisant dans ce cas. Une autre valeur d'en-tête HTTP souvent vérifiée est "Referer" [sic!]. Voir Wikipedia: HTTP Referer.

wget a un --referer=url option pour spécifier la page de référence. Analyser le trafic pour un téléchargement réussi Wireshark montre qu'il a utilisé la demande suivante d'un système de test de la mienne:

GET /files/setups/tweaking.com_windows_repair_aio.zip HTTP/1.1
Host: www.tweaking.com
User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:11.0) Gecko/20100101 Firefox/11.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: en-gb,en;q=0.5
Accept-Encoding: gzip, deflate
Connection: keep-alive
Referer: http://www.tweaking.com/content/page/windows_repair_all_in_one.html

Pour ce cas, il semble même que vous n'ayez pas besoin de faire semblant User-Agent.

wget --referer=http://www.tweaking.com/content/page/windows_repair_all_in_one.html  http://www.tweaking.com/files/setups/tweaking.com_windows_repair_aio.zip

Fait le tour


9
2018-04-14 00:17



fonctionne vraiment. Merci - Jaheaga