Metagoofil
Outil automatisé d'extraction de métadonnées pour récupérer des informations cachées dans les documents publics
Qu'est-ce que Metagoofil ?
Un outil Python puissant pour la reconnaissance passive
Automatisation
Téléchargement automatique via Google Search
Extraction
Métadonnées EXIF, Office, PDF automatiques
Cartographie
Identification employés et infrastructure
Rapports
Génération HTML avec statistiques visuelles
Fonctionnalités principales
Capacités avancées pour la reconnaissance passive
Téléchargement automatique
Recherche et télécharge automatiquement tous les documents publics d'un domaine cible via les moteurs de recherche.
Extraction de métadonnées
Extrait automatiquement les métadonnées EXIF, propriétés des documents Office, PDF metadata et informations cachées.
Cartographie des utilisateurs
Identifie les noms d'utilisateurs, auteurs, créateurs de documents pour établir une cartographie du personnel.
Infrastructure discovery
Révèle les chemins réseau, noms de serveurs, imprimantes et infrastructure IT interne via les métadonnées.
Rapports HTML détaillés
Génère des rapports HTML interactifs avec statistiques, graphiques et listes détaillées des découvertes.
Filtrage avancé
Options de filtrage par type de fichier, limite de résultats, profondeur de recherche et domaines spécifiques.
Types de métadonnées extraites
Informations récupérées automatiquement des documents
Auteur & Créateur
Noms des auteurs, créateurs, dernière modification, organisation
Dates & Timestamps
Dates de création, modification, impression, dernière sauvegarde
Logiciels & Versions
Applications utilisées, versions, système d'exploitation
Infrastructure IT
Chemins réseau, noms de serveurs, imprimantes, partages
Propriétés Document
Titre, sujet, mots-clés, commentaires, catégorie
Informations cachées
Révisions, annotations, métadonnées supprimées partiellement
Formats de fichiers supportés
Types de documents analysés par Metagoofil
Documents Office
Documents PDF
OpenOffice/LibreOffice
Autres formats
Cas d'usage pratiques
Scénarios réels d'utilisation de Metagoofil
Reconnaissance d'entreprise
Cartographie du personnel et de l'infrastructure IT
Workflow détaillé
Collecte documents
metagoofil -d target.com -t pdf,doc,xls
Extraction métadonnées
Analyse automatique des propriétés
Cartographie auteurs
Liste des employés et départements
Infrastructure IT
Serveurs, imprimantes, chemins réseau
Rapport HTML
Génération du rapport consolidé
Analyse patterns
Conventions de nommage et structure
Évaluation de la sécurité
Audit des fuites d'informations sensibles
Workflow détaillé
Scan domaine
Recherche de documents publics exposés
Identification fuites
Détection d'informations sensibles
Analyse chemins
Révélation de l'architecture interne
Logiciels obsolètes
Détection de versions non patchées
Documentation risques
Liste des vulnérabilités trouvées
Recommandations
Mesures de remédiation
Investigation OSINT
Enquête sur une organisation cible
Workflow détaillé
Collecte massive
Téléchargement de tous types de documents
Corrélation données
Recoupement des informations
Timeline
Construction de la chronologie
Organigramme
Reconstruction de la hiérarchie
Technologies
Stack technique de l'organisation
Rapport OSINT
Synthèse intelligence complète
Exemples de commandes
Commandes pratiques pour différents scénarios
Recherche basique
metagoofil -d example.com -t pdfRecherche uniquement les fichiers PDF du domaine
metagoofil -d example.com -t doc,xls,pptRecherche des documents Office (Word, Excel, PowerPoint)
metagoofil -d example.com -t all -l 100Recherche tous types de fichiers, limite à 100 résultats
Options avancées
metagoofil -d example.com -t pdf,doc -l 200 -n 50 -o downloadsLimite 200 résultats Google, télécharge 50 fichiers dans 'downloads'
metagoofil -d example.com -t pdf -f results.htmlGénère un rapport HTML des métadonnées extraites
metagoofil -d example.com -t doc -e -o metadataActive l'extraction de métadonnées et sauvegarde dans 'metadata'
Reconnaissance ciblée
metagoofil -d target.com -t pdf,doc,xls,ppt -l 500 -n 100 -f report.htmlReconnaissance complète avec rapport HTML détaillé
metagoofil -d company.com -t all -e -o intelligenceCollecte intelligence complète avec extraction métadonnées
metagoofil -d organization.org -t pdf -l 1000 -w wordlist.txtCollecte massive avec génération de wordlist des auteurs
Analyse & Export
metagoofil -d example.com -t pdf,doc -f full_report.html -o downloadsAnalyse complète avec rapport HTML et sauvegarde des fichiers
metagoofil -d target.com -t all -e -u usernames.txtExtraction utilisateurs dans un fichier texte
metagoofil -d company.com -t pdf -l 200 --delay 5Recherche avec délai de 5 secondes entre requêtes (stealth)
Bonnes pratiques
Recommandations pour une utilisation optimale et légale
À Faire
- Limiter les requêtesUtiliser des délais pour éviter le rate limiting de Google
- Vérifier les autorisationsS'assurer d'avoir l'autorisation pour la reconnaissance
- Analyser les rapports HTMLUtiliser les rapports générés pour analyse visuelle
- Corréler les donnéesRecouper avec d'autres sources OSINT pour validation
- Documenter les sourcesGarder trace des URL et dates de collecte
- Générer des wordlistsCréer des listes d'utilisateurs pour tests autorisés
À Éviter
- Scans non autorisésNe jamais scanner sans autorisation explicite
- Requêtes excessivesÉviter de surcharger les moteurs de recherche
- Ignorer les faux positifsToujours vérifier la validité des informations
- Divulguer les donnéesNe pas publier d'informations sensibles trouvées
- Négliger la légalitéRespecter RGPD et lois sur la vie privée
- Utilisation malveillanteNe jamais utiliser pour du phishing ou attaques
Installation
Guide d'installation de Metagoofil
Via pip (recommandé)
pip3 install metagoofilInstallation rapide depuis PyPI
Via GitHub (version développement)
git clone https://github.com/laramies/metagoofil.gitcd metagoofilpip3 install -r requirements.txtDépendances requises
- Python 3.6 ou supérieur
- BeautifulSoup4 (parsing HTML)
- Requests (requêtes HTTP)
- python-magic (détection types fichiers)
Vérification de l'installation
metagoofil -hDevrait afficher l'aide de Metagoofil
Considérations légales et éthiques
Metagoofil est un outil puissant qui peut révéler des informations sensibles sur une organisation. Son utilisation doit toujours s'inscrire dans un cadre légal et éthique avec autorisation préalable.
Utilisations légitimes :
- Audits de sécurité autorisés (pentesting)
- Évaluation de votre propre exposition
- Formation et recherche en cybersécurité
- Bug bounty avec scope défini
Ressources et documentation
Liens utiles pour approfondir vos connaissances
Prêt à extraire des métadonnées ?
Découvrez d'autres outils OSINT et améliorez vos compétences en reconnaissance passive