2011-04-24 07:36:29 +0000 2011-04-24 07:36:29 +0000
155
155

Come posso determinare il tipo di file senza estensione su Windows?

A volte ricevo dei file dai miei clienti che hanno l'estensione sbagliata. Per esempio, il nome è image.jpg ma il file è in realtà un'immagine TIFF. In molti casi posso chiarirlo aprendo il file in un editor di testo, guardando i primi byte, poi deducendo quale tipo di file è.

Questo funziona per me con i file JPEG, TIFF, GIF e PDF. Tuttavia ci sono molti altri tipi di file là fuori.

È possibile automatizzare l'identificazione del tipo di file corretto analizzando i dati che lo contengono?

Risposte (5)

147
147
147
2011-04-24 07:47:21 +0000

Puoi usare lo strumento TrID che ha una crescente libreria di definizioni di tipi di file con cui identificare i file.

I caratteri jolly sono supportati, quindi nel tuo esempio potresti semplicemente mettere tutte le immagini da esaminare in una cartella, per esempio C:\verifyimages - poi puoi usare il comando:

trid C:\verifyimages\*

Questo esaminerà tutti i file nella cartella verifyimages.


C'è anche una versione GUI disponibile, TrIDNet :

È disponibile una documentazione su come è possibile integrare facilmente TrID o TrIDNet in Windows Explorer e Total Commander:

Windows Explorer

Total Commander

53
53
53
2011-04-24 07:38:08 +0000

file

File testa ogni argomento nel tentativo di classificarlo. Ci sono tre serie di test, eseguiti in questo ordine: test del filesystem, test del numero magico e test della lingua. Il primo test che ha successo causa la stampa del tipo di file.

Il tipo stampato di solito contiene una delle parole text (il file contiene solo caratteri di stampa e alcuni comuni caratteri di controllo ed è probabilmente sicuro da leggere su un terminale ASCII), executable (il file contiene il risultato della compilazione di un programma in una forma comprensibile a qualche kernel UNIX o altro), o data che significa qualsiasi altra cosa (i dati sono di solito “binari” o non stampabili). Le eccezioni sono formati di file ben noti (file core, archivi tar) che sono noti per contenere dati binari.

14
14
14
2011-04-24 13:16:09 +0000

Lavoravo per la Biblioteca Nazionale Francese, per costruire un sistema di archivio digitale che contiene non solo libri digitalizzati ma anche milioni di artefatti digitali con tutti i tipi di file strani. Abbiamo usato JHOVE per riconoscere i formati di file.

JHOVE è open source, è mantenuto da JSTOR e dalla Harvard University Library. È piuttosto semplice da usare .

1
1
1
2018-06-04 11:24:55 +0000

Puoi controllare il tipo di file da qualsiasi computer, incluso windows, a http://www.checkfiletype.com

1
1
1
2011-04-24 11:30:15 +0000

Io uso le librerie OutsideIn di Oracle nei miei programmi. Non sono gratuite, ma funzionano bene, specialmente per le immagini. La voce di mercato dice che supporta oltre 500 tipi di file.