Guide theHarvester

Maîtrisez theHarvester, l'outil de reconnaissance incontournable pour collecter des emails, domaines et informations publiques depuis diverses sources.

Installation

Via pip (recommandé)

pip install theHarvester

Via git

git clone https://github.com/laramies/theHarvester.git
cd theHarvester
pip install -r requirements.txt

Modules disponibles

Moteurs de recherche

Recherche d'emails et de domaines via les moteurs de recherche

Modules inclus :

googlebingyahooaskbaiduyandexsearchencrypt

Réseaux sociaux

Extraction d'informations des plateformes sociales

Modules inclus :

linkedintwitterinstagramfacebookyoutubepinterest

Services professionnels

Recherche dans les services et plateformes professionnelles

Modules inclus :

indeedcareerbuilderglassdoorstackoverflowgithub

Domaines et DNS

Recherche d'informations sur les domaines et DNS

Modules inclus :

dnsdumpstercrtshthreatcrowdvirustotalshodan

Commandes principales

Recherche de base

theHarvester -d example.com -l 100 -b google

Recherche sur Google avec limite de 100 résultats

theHarvester -d example.com -b all

Recherche sur toutes les sources disponibles

theHarvester -d example.com -b linkedin

Recherche spécifique sur LinkedIn

Options avancées

theHarvester -d example.com -l 500 -b google -f results.xml

Sauvegarde des résultats en XML

theHarvester -d example.com -b google -s 100

Commencer à partir du 100ème résultat

theHarvester -d example.com -b all -v

Mode verbose pour plus de détails

Recherche spécialisée

theHarvester -d example.com -b shodan -k YOUR_API_KEY

Utilisation avec une clé API Shodan

theHarvester -d example.com -b virustotal -k YOUR_API_KEY

Recherche avec VirusTotal API

theHarvester -d example.com -b crtsh

Recherche de certificats SSL

Formats de sortie

FormatExtensionDescription
ConsoleN/AAffichage direct dans le terminal
HTML.htmlRapport HTML avec formatage
XML.xmlFormat XML pour traitement automatique
JSON.jsonFormat JSON pour intégration avec d'autres outils

Bonnes pratiques

Légalité et éthique

Respectez les conditions d'utilisation

  • Vérifiez les conditions d'utilisation des plateformes
  • Respectez les limites de taux (rate limiting)
  • Utilisez des proxy pour éviter les blocages IP
  • Documentez vos activités pour audit

Efficacité opérationnelle

Optimisez vos recherches

  • Utilisez des proxies rotatifs pour éviter les blocages
  • Configurez des délais entre les requêtes
  • Sauvegardez les résultats régulièrement
  • Utilisez des clés API quand disponibles

Qualité des données

Assurez-vous de la qualité des résultats

  • Validez les emails trouvés
  • Vérifiez la pertinence des résultats
  • Croisez les informations avec d'autres sources
  • Filtrez les faux positifs

Exemple pratique

Scénario : Investigation d'une entreprise

1. Recherche d'emails

theHarvester -d example.com -l 200 -b google,bing,linkedin

2. Recherche de sous-domaines

theHarvester -d example.com -b crtsh,dnsdumpster

3. Sauvegarde des résultats

theHarvester -d example.com -b all -f investigation_results.json