[Equipe 3] La forteresse Ameli

Le scrapathon passe à la vitesse supérieure : les équipes ont été constituées et commencent à travailler sur leurs sujets concrets. Nous vous proposons une série de billets pour présenter chacune des équipes en lice pour ce 1er scrapathon…

Equipe n°3 – mission :  la forteresse Ameli

Membres de l’équipe : Cédric, Martin et Franck

SafariScreenSnapz165Ah, la base Ameli ! Combien de batailles avons-nous mené en ton nom ? Plus sérieusement, cette 3ème équipe s’est donné pour mission de récupérer une partie des données publiées sur le site Ameli-Direct, comme avait pu le faire en leurs temps le projet Fourmi Santé, par exemple… Le sujet a bien sûr intéressé l’initiative Transparence Santé qui est venue se présenter lors du scrapathon.

C’est quoi le problème ?

Visiblement, nos scrappers ne sont pas les premiers à s’atteler à la base Ameli : les protections anti-scrapping sont multiples et souvent invisibles pour les internautes lambda que nous sommes. Ainsi le site génère un « token » valable uniquement pour quelques minutes, donc il faut régulièrement se reconnecter pour faire tourner son script.

La stratégie d’approche retenue est de partir sur un périmètre relativement restreint, avec une question précise : quels sont les dépassements d’honoraires pratiqués pour une opération de la cataracte dans 5 grandes villes de France ?

Où en sont-ils ?

Au sandwich. Signe que visiblement ils ne sont pas trop inquiets des protections mises en place autour de la forteresse Ameli, nos scrappers sont partis prendre des forces loin de leur clavier…  Affaire à suivre.

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s