Science des données : ne soyez pas un sauvage !

cloud cost optimization CSC Blogs

J’ai commencé à envoyer des emails en 1995 – à une époque où chaque personne pouvait avoir sa propre adresse IP, et les emails clients étaient des lignes de code que nous gardions sur un serveur local.

Je me suis rapidement rendu compte que cette habitude que j’avais d’effacer les emails une fois qu’ils étaient traités n’était pas la meilleure – qu’arriverait-il si dans 20 ans, j’avais besoin d’une information contenue dans l’un de ces mails ? Je vous l’accorde, cela peut sembler un petit peu exagéré sur les bords, surtout à cette époque-là – mais devinez quoi : en ce début d’année j’ai dû former un dossier avec toutes les choses que j’ai réalisé dans le département informatique dans lesquels j’ai travaillé en citant des références – et une partie de ces informations se trouvait dans mes (au combien poussiéreuses) archives d’emails !

Là c’est l’entasseur compulsif qui jubile !

De nos jours la majorité des fournisseurs de boîte mail proposent une option pour « Archiver » ses emails que l’on préfère à l’option « Effacer » ; la conservation de ce genre d’information coûte très peu cher et ne connaît presque pas de limites – alors pourquoi vouloir effacer des emails que vous pouvez avoir besoin de consulter dans le futur si cela ne vous coûte rien de les conserver ?

Il est légitime de se poser la question de la confidentialité et de la sécurité dans des cas comme ça – mais le stockage local des données cryptées est une alternative autre que la destruction des données et tout aussi viable.

Mais pourquoi vous parler de mes petites manies avec mes emails, me direz-vous ?

Parce que l’anecdote que je viens de raconter fait le lien avec une question bien plus importante :

Pourquoi est-ce qu’une entreprise aurait besoin de nos jours d’effacer des informations ? (exigences légales mises à part)

Voici une autre histoire, celle d’une compagnie du bâtiment qui lance un service de devis en ligne. Pour une raison pratique cette entreprise décide d’effacer les informations qui n’ont pas abouti à une commande sous 60 jours, et d’archiver, après 30 jours, les informations venant des applications de partenaires.

Un peu plus tard, un data scientist qui travaille pour l’entreprise découvre un algorithme qui établit une corrélation entre ces devis n’ayant pas abouti à une vente et les « logs » de son serveur web. Cette corrélation pourrait expliquer pourquoi les personnes d’entre 25 et 30 ans habitant dans un quartier bien précis au sud de Paris ne font jamais appel aux services de cette entreprise. Grâce à ces précieuses informations, l’entreprise va pouvoir corriger le tir pour son offre afin qu’elle paraisse alléchante pour cette partie concrète de la population, ou revoir son catalogue de produits pour en créer un particulièrement pensé pour eux.

Mais il est trop tard! Les données ont été effacées… L’entreprise a raté une belle occasion !

L’idée commune à ces deux anecdotes est la suivante:

Au moment de la collecte des informations, leur utilité n’était pas flagrante. Apparemment leur utilité immédiate n’était plus d’actualité.

Pour l’exemple de mes emails le fait de les conserver aurait été utile 20 ans plus tard ! Pour celui de l’entreprise du bâtiment leur comportement destructif (un comble !) leur a fait rater une opportunité de faire des affaires.

Mais il est vrai qu’il y a dix ans, bien avant l’avènement des services de sauvegarde presque sans limites et à un prix dérisoire (comme Amazon Glacier), et l’émergence des sciences des données en tant qu’outil stratégique de taille pour les entreprises, il était pour le moins compréhensible de vouloir de manière pragmatique faire une purge régulière des systèmes de production.

Cependant, la croissance rapide de l’utilisation de la science des données nous permet d’imaginer un potentiel presque sans limites à toutes ces informations. La science des données comprend trois grandes caractéristiques (du moins pour le sujet que nous sommes en train de traiter), et que mon collègue Jerry Overton détaille de la manière suivante :

  1. La nature même de la science des données est expérimentale.
  2. Les questions que la science des données peut résoudre sont celles pour lesquelles nous disposons des informations.
  3. Nous ne pouvons pas savoir par avance à quelle question chaque groupe de données pourra répondre.

La meilleure manière de procéder est donc de garder sous la main la plus grande quantité d’information possible, sur le plus de sujets de différents possibles, aussi longtemps que possible.

Les données en format numérique ne sont plus une fin en soi – elles représentent un atout de taille avec un réel potentiel commercial tant pour aujourd’hui que pour demain.

Ces grands bouleversements sont un sujet central que vous pouvez retrouver dans nos documents sur la trajectoire digitale des entreprises, particulièrement pour des secteurs comme la banque, la santé ou l’assurance.

Donc, par pitié, ne vous transformez pas en sauvage de la science des données ! Si vous êtes un DSI, ne détruisez pas les informations au combien précieuses de votre entreprise ! Si vous êtes un fournisseur de services technologiques auprès des entreprises, ne gâchez pas ces informations si utiles de vos clients !

Il ne reste plus qu’à se lancer à la conquête de ces habitants du sud de Paris !


Auteur: Martin Bartlett est un acteur majeur du pôle assurance de CSC dans les marchés d’Europe Occidentale et du Sud. Depuis son arrivée dans la compagnie en 1988, il a joué un rôle central dans l’architecture, l’élaboration, le développement, l’implantation et le déploiement des projets les plus stratégiques de CSC dans le monde de l’assurance. Il est considéré le principal architecte de la structure GraphTalk A.I. A. et est un grand défenseur des solutions de cloud déployées en mode SaaS et de l’économie API. Voir sa biographie.

Trackbacks

  1. Bead Blog says:

    Ne Soyez Pas En Retard Pour

    […] azon Glacier), et l’émergence des sciences des données en tant qu’outil st […]

    Like

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: