Metagoofil

Outil automatisé d'extraction de métadonnées pour récupérer des informations cachées dans les documents publics

PDF/DOC/XLS
Types de fichiers
Auto
Download & Extract
HTML
Rapports détaillés

Qu'est-ce que Metagoofil ?

Un outil Python puissant pour la reconnaissance passive

Automatisation

Téléchargement automatique via Google Search

Extraction

Métadonnées EXIF, Office, PDF automatiques

Cartographie

Identification employés et infrastructure

Rapports

Génération HTML avec statistiques visuelles

Fonctionnalités principales

Capacités avancées pour la reconnaissance passive

Téléchargement automatique

Recherche et télécharge automatiquement tous les documents publics d'un domaine cible via les moteurs de recherche.

Auto-Discovery
Google SearchMulti-formatBatch

Extraction de métadonnées

Extrait automatiquement les métadonnées EXIF, propriétés des documents Office, PDF metadata et informations cachées.

Deep Analysis
EXIFOfficePDF

Cartographie des utilisateurs

Identifie les noms d'utilisateurs, auteurs, créateurs de documents pour établir une cartographie du personnel.

User Mapping
AuteursEmployésPatterns

Infrastructure discovery

Révèle les chemins réseau, noms de serveurs, imprimantes et infrastructure IT interne via les métadonnées.

Infrastructure
ServeursCheminsNetwork

Rapports HTML détaillés

Génère des rapports HTML interactifs avec statistiques, graphiques et listes détaillées des découvertes.

Reporting
HTMLStatsVisual

Filtrage avancé

Options de filtrage par type de fichier, limite de résultats, profondeur de recherche et domaines spécifiques.

Customizable
FiltresLimitesCiblage

Types de métadonnées extraites

Informations récupérées automatiquement des documents

Auteur & Créateur

Noms des auteurs, créateurs, dernière modification, organisation

Nom completEmailOrganisationDépartement

Dates & Timestamps

Dates de création, modification, impression, dernière sauvegarde

CreatedModifiedPrintedSaved

Logiciels & Versions

Applications utilisées, versions, système d'exploitation

MS OfficeAdobeOpenOfficeOS Version

Infrastructure IT

Chemins réseau, noms de serveurs, imprimantes, partages

\\server\sharePrinter namesNetwork paths

Propriétés Document

Titre, sujet, mots-clés, commentaires, catégorie

TitleSubjectKeywordsComments

Informations cachées

Révisions, annotations, métadonnées supprimées partiellement

Track changesCommentsHidden data

Formats de fichiers supportés

Types de documents analysés par Metagoofil

Documents Office

DOC/DOCX
Documents Microsoft Word avec propriétés complètes
XLS/XLSX
Feuilles de calcul Excel avec auteurs et historique
PPT/PPTX
Présentations PowerPoint avec métadonnées

Documents PDF

PDF
Documents PDF avec métadonnées XMP et propriétés
PDF/A
PDF archivage avec métadonnées étendues

OpenOffice/LibreOffice

ODT
Documents texte OpenDocument
ODS
Feuilles de calcul OpenDocument
ODP
Présentations OpenDocument

Autres formats

RTF
Rich Text Format avec métadonnées
TXT
Fichiers texte avec propriétés système

Cas d'usage pratiques

Scénarios réels d'utilisation de Metagoofil

Reconnaissance d'entreprise

Cartographie du personnel et de l'infrastructure IT

Workflow détaillé

1
Collecte documents

metagoofil -d target.com -t pdf,doc,xls

2
Extraction métadonnées

Analyse automatique des propriétés

3
Cartographie auteurs

Liste des employés et départements

4
Infrastructure IT

Serveurs, imprimantes, chemins réseau

5
Rapport HTML

Génération du rapport consolidé

6
Analyse patterns

Conventions de nommage et structure

Évaluation de la sécurité

Audit des fuites d'informations sensibles

Workflow détaillé

1
Scan domaine

Recherche de documents publics exposés

2
Identification fuites

Détection d'informations sensibles

3
Analyse chemins

Révélation de l'architecture interne

4
Logiciels obsolètes

Détection de versions non patchées

5
Documentation risques

Liste des vulnérabilités trouvées

6
Recommandations

Mesures de remédiation

Investigation OSINT

Enquête sur une organisation cible

Workflow détaillé

1
Collecte massive

Téléchargement de tous types de documents

2
Corrélation données

Recoupement des informations

3
Timeline

Construction de la chronologie

4
Organigramme

Reconstruction de la hiérarchie

5
Technologies

Stack technique de l'organisation

6
Rapport OSINT

Synthèse intelligence complète

Exemples de commandes

Commandes pratiques pour différents scénarios

Recherche basique

metagoofil -d example.com -t pdf

Recherche uniquement les fichiers PDF du domaine

PDFBasique
metagoofil -d example.com -t doc,xls,ppt

Recherche des documents Office (Word, Excel, PowerPoint)

OfficeMulti-format
metagoofil -d example.com -t all -l 100

Recherche tous types de fichiers, limite à 100 résultats

AllLimite

Options avancées

metagoofil -d example.com -t pdf,doc -l 200 -n 50 -o downloads

Limite 200 résultats Google, télécharge 50 fichiers dans 'downloads'

LimiteOutputBatch
metagoofil -d example.com -t pdf -f results.html

Génère un rapport HTML des métadonnées extraites

HTMLReport
metagoofil -d example.com -t doc -e -o metadata

Active l'extraction de métadonnées et sauvegarde dans 'metadata'

ExtractMetadata

Reconnaissance ciblée

metagoofil -d target.com -t pdf,doc,xls,ppt -l 500 -n 100 -f report.html

Reconnaissance complète avec rapport HTML détaillé

Full scanReportRecon
metagoofil -d company.com -t all -e -o intelligence

Collecte intelligence complète avec extraction métadonnées

OSINTIntelligence
metagoofil -d organization.org -t pdf -l 1000 -w wordlist.txt

Collecte massive avec génération de wordlist des auteurs

MassiveWordlist

Analyse & Export

metagoofil -d example.com -t pdf,doc -f full_report.html -o downloads

Analyse complète avec rapport HTML et sauvegarde des fichiers

ReportArchive
metagoofil -d target.com -t all -e -u usernames.txt

Extraction utilisateurs dans un fichier texte

UsersExport
metagoofil -d company.com -t pdf -l 200 --delay 5

Recherche avec délai de 5 secondes entre requêtes (stealth)

DelayStealth

Bonnes pratiques

Recommandations pour une utilisation optimale et légale

À Faire

  • Limiter les requêtes
    Utiliser des délais pour éviter le rate limiting de Google
  • Vérifier les autorisations
    S'assurer d'avoir l'autorisation pour la reconnaissance
  • Analyser les rapports HTML
    Utiliser les rapports générés pour analyse visuelle
  • Corréler les données
    Recouper avec d'autres sources OSINT pour validation
  • Documenter les sources
    Garder trace des URL et dates de collecte
  • Générer des wordlists
    Créer des listes d'utilisateurs pour tests autorisés

À Éviter

  • Scans non autorisés
    Ne jamais scanner sans autorisation explicite
  • Requêtes excessives
    Éviter de surcharger les moteurs de recherche
  • Ignorer les faux positifs
    Toujours vérifier la validité des informations
  • Divulguer les données
    Ne pas publier d'informations sensibles trouvées
  • Négliger la légalité
    Respecter RGPD et lois sur la vie privée
  • Utilisation malveillante
    Ne jamais utiliser pour du phishing ou attaques

Installation

Guide d'installation de Metagoofil

1

Via pip (recommandé)

pip3 install metagoofil

Installation rapide depuis PyPI

2

Via GitHub (version développement)

git clone https://github.com/laramies/metagoofil.gitcd metagoofilpip3 install -r requirements.txt
3

Dépendances requises

  • Python 3.6 ou supérieur
  • BeautifulSoup4 (parsing HTML)
  • Requests (requêtes HTTP)
  • python-magic (détection types fichiers)
4

Vérification de l'installation

metagoofil -h

Devrait afficher l'aide de Metagoofil

Considérations légales et éthiques

Metagoofil est un outil puissant qui peut révéler des informations sensibles sur une organisation. Son utilisation doit toujours s'inscrire dans un cadre légal et éthique avec autorisation préalable.

Utilisations légitimes :

  • Audits de sécurité autorisés (pentesting)
  • Évaluation de votre propre exposition
  • Formation et recherche en cybersécurité
  • Bug bounty avec scope défini

Prêt à extraire des métadonnées ?

Découvrez d'autres outils OSINT et améliorez vos compétences en reconnaissance passive