Guide theHarvester
Maîtrisez theHarvester, l'outil de reconnaissance incontournable pour collecter des emails, domaines et informations publiques depuis diverses sources.
Installation
Via pip (recommandé)
pip install theHarvesterVia git
git clone https://github.com/laramies/theHarvester.git
cd theHarvester
pip install -r requirements.txtModules disponibles
Moteurs de recherche
Recherche d'emails et de domaines via les moteurs de recherche
Modules inclus :
Réseaux sociaux
Extraction d'informations des plateformes sociales
Modules inclus :
Services professionnels
Recherche dans les services et plateformes professionnelles
Modules inclus :
Domaines et DNS
Recherche d'informations sur les domaines et DNS
Modules inclus :
Commandes principales
Recherche de base
theHarvester -d example.com -l 100 -b googleRecherche sur Google avec limite de 100 résultats
theHarvester -d example.com -b allRecherche sur toutes les sources disponibles
theHarvester -d example.com -b linkedinRecherche spécifique sur LinkedIn
Options avancées
theHarvester -d example.com -l 500 -b google -f results.xmlSauvegarde des résultats en XML
theHarvester -d example.com -b google -s 100Commencer à partir du 100ème résultat
theHarvester -d example.com -b all -vMode verbose pour plus de détails
Recherche spécialisée
theHarvester -d example.com -b shodan -k YOUR_API_KEYUtilisation avec une clé API Shodan
theHarvester -d example.com -b virustotal -k YOUR_API_KEYRecherche avec VirusTotal API
theHarvester -d example.com -b crtshRecherche de certificats SSL
Formats de sortie
| Format | Extension | Description |
|---|---|---|
| Console | N/A | Affichage direct dans le terminal |
| HTML | .html | Rapport HTML avec formatage |
| XML | .xml | Format XML pour traitement automatique |
| JSON | .json | Format JSON pour intégration avec d'autres outils |
Bonnes pratiques
Légalité et éthique
Respectez les conditions d'utilisation
- Vérifiez les conditions d'utilisation des plateformes
- Respectez les limites de taux (rate limiting)
- Utilisez des proxy pour éviter les blocages IP
- Documentez vos activités pour audit
Efficacité opérationnelle
Optimisez vos recherches
- Utilisez des proxies rotatifs pour éviter les blocages
- Configurez des délais entre les requêtes
- Sauvegardez les résultats régulièrement
- Utilisez des clés API quand disponibles
Qualité des données
Assurez-vous de la qualité des résultats
- Validez les emails trouvés
- Vérifiez la pertinence des résultats
- Croisez les informations avec d'autres sources
- Filtrez les faux positifs
Exemple pratique
Scénario : Investigation d'une entreprise
1. Recherche d'emails
theHarvester -d example.com -l 200 -b google,bing,linkedin2. Recherche de sous-domaines
theHarvester -d example.com -b crtsh,dnsdumpster3. Sauvegarde des résultats
theHarvester -d example.com -b all -f investigation_results.json