Question Comment puis-je déterminer le type de fichier sans extension sous Windows?


Je reçois parfois des fichiers de mes clients qui ont une extension de fichier incorrecte. Par exemple, le nom est image.jpg mais le fichier est en réalité une image TIFF. Dans de nombreux cas, je peux le clarifier en ouvrant le fichier dans un éditeur de texte, en examinant les premiers octets, puis en en déduisant le type de fichier.

Cela fonctionne pour moi avec des fichiers JPEG, TIFF, GIF et PDF. Cependant, il existe beaucoup plus de types de fichiers.

Est-il possible d'automatiser l'identification du type de fichier correct en analysant les données contenant?


145
2018-04-24 07:36


origine


Pour les intéressés le file commande le fait sur les machines * nix. - boehj
Très belle question! Quelque chose que j'avais secrètement voulu tout ce temps, mais j'ai toujours oublié de demander :) - pepoluan
Je ne comprends pas pourquoi cette question est hors sujet (après 3 ans). Je ne demande pas de logiciel spécifique (j'ai reformulé ma question pour le souligner). Je demande juste une solution. - Martin
Je ne comprends pas pourquoi 26 personnes pensent que le commentaire relatif à boehj * nix ci-dessus "ajoute quelque chose d'utile à la publication". Cette question est balisée windows, mais le commentaire implique: "Vous ne pouvez pas faire cela sous Windows, vous devez utiliser plutôt * nix". Alors? Le commentaire est destiné "aux personnes intéressées". En ce que? Changer d'ordinateur? :( - Aacini
@Aacini utile pour les personnes * nix qui viennent ici de Google. - jingyu9575


Réponses:


Vous pouvez utiliser le Trid outil qui contient une bibliothèque croissante de définitions de types de fichiers pour identifier les fichiers.

Screenshot

Les caractères génériques sont pris en charge. Dans votre exemple, vous pouvez simplement placer toutes les images à examiner dans un dossier, par ex. C: \ verifyimages - alors vous pouvez utiliser la commande:

trid C:\verifyimages\*

Cela examinera tous les fichiers dans le verifyimages dossier.


Il existe également une version GUI disponible, TrIDNet:

Screenshot

Il existe une documentation sur la façon dont vous pouvez facilement intégrer TrID ou TrIDNet dans Windows Explorer et Total Commander:

Windows Explorer

Commandant Total


138
2018-04-24 07:47



Notez qu'il indique qu'il n'est pas sous licence pour un usage commercial, uniquement pour un usage personnel - Chris Magnuson
J'ai eu du mal à déterminer quels fichiers de téléchargement étaient nécessaires pour utiliser ce programme. Donc, ce commentaire vise à faciliter cela. Vous devrez télécharger deux fichiers. Tout d'abord, l'utilitaire de ligne de commande ou l'utilitaire d'interface graphique. Deuxièmement, un dossier de définitions XML appelé "TrID XML defs". Placez les fichiers XML de définition dans le même répertoire que TrID. Ensuite, scannez les définitions. Enfin, vous pouvez commencer à l'utiliser. - mrtsherman


fichier

Fichier teste chaque argument pour tenter de le classer. Il existe trois ensembles de tests, exécutés dans cet ordre: tests de système de fichiers, tests de nombres magiques et tests de langage. le premier test qui réussit provoque l'impression du type de fichier.

Le type imprimé contiendra généralement l'un des mots texte (le fichier ne contient que des caractères d’impression et quelques caractères de contrôle communs et il est probablement sûr de le lire sur un terminal ASCII), exécutable (le fichier contient le résultat de la compilation d'un programme sous une forme compréhensible par un noyau UNIX ou un autre), ou Les données signifiant n'importe quoi d'autre (les données sont généralement "binaires" ou non imprimables). Les exceptions sont les formats de fichiers connus (fichiers core, archives tar) connus pour contenir des données binaires.


48
2018-04-24 07:38



file est standard, mais sur les systèmes plus anciens (surtout non-Linux) pas très bien informés. Pour Ubuntu etc, il devrait être assez respectable et même installé en standard. - Thorbjørn Ravn Andersen
@Anm_LA, ce n'est pas du tout standard sous Windows, mais le lien dans la réponse est un port de la version GNU de file à Windows. Si d’autres commandes * nix vous intéressent en tant qu’utilisateur Windows, alors faites le tour ce site trouver toutes sortes de gemmes. - RBerteig
Je doute fort que file est un expert des fichiers créés par les applications Windows. - Robin Green
@Robin: Vous êtes invités à le tester. - Ignacio Vazquez-Abrams
@Robin: Je doute fort que vous ayez utilisé file du tout, et pourtant vous avez presque décidé de son efficacité. - tzot


J'avais l'habitude de travailler pour la Bibliothèque nationale française pour construire un système d'archivage numérique contenant non seulement des livres numérisés, mais aussi des millions d'artefacts numériques avec toutes sortes de types de fichiers étranges. Nous avons utilisé JHOVE reconnaître les formats de fichiers.

JHOVE est open source, il est maintenu par JSTOR et la bibliothèque de l'Université de Harvard. C'est plutôt simple de utilisation.


12
2018-04-24 13:16



cool! mais reconnaît-il les formats propriétaires comme TrID? de toute façon, je faire avoir des utilisations pour identifier des sous-formats / variantes de formats non propriétaires (ou, pour être précis, des «extensions» propriétaires de formats standardisés), cela serait donc utile. merci pour le heads-up! - pepoluan


j'utilise Bibliothèques Oracle InsideIn dans mes programmes. Pas gratuit, mais ils fonctionnent bien, surtout pour les images. Le marché dit qu’il supporte plus de 500 types de fichiers.


1
2018-04-24 11:30





Vous pouvez vérifier le type de fichier depuis n'importe quel ordinateur, y compris Windows, à

http://www.checkfiletype.com


0
2018-06-04 11:24



Bienvenue sur Super User! Lisez s'il vous plaît comment recommander un logiciel dans les réponses, en particulier les bits dans audacieux; puis modifiez votre réponse pour suivre les directives là-bas. Cela s'applique même si vous recommandez un site Web! À votre santé - bertieb