Stai cercando un raschietto web che è un'applicazione progettata per leggere i dati su una pagina Web e elaborarla . Il raschietto fa parte di un crawler (il crawler attraversa anche i collegamenti su una pagina per trovare altre pagine sulla rete).
I web scrapers e i crawler devono rispettare lo standard di esclusione dei robot specificato in robots.txt. Per Facebook, questo è al link
Nota l'elenco specifico di agenti utente consentiti (ad esempio googlebot). E l'ultimo:
User-agent: *
Disallow: /
Che dice "non dovresti fare qualsiasi cosa se non ti è permesso".
C'è una pagina menzionata nella parte leggibile da umani di robots.txt:
# Notice: if you would like to crawl Facebook you can
# contact us here: http://www.facebook.com/apps/site_scraping_tos.php
# to apply for white listing. Our general terms are available
# at http://www.facebook.com/apps/site_scraping_tos_terms.php
Il link inizia con:
- These terms govern your collection of data from Facebook through automated means, such as through harvesting bots, robots, spiders, or scrapers ("Automated Data Collection"), as well as your use of that data.
- You will not engage in Automated Data Collection without Facebook's express written permission.
Suggerirei di leggere Come sono stato denunciato da Facebook - I loro avvocati hanno i denti.