Warning: "continue" targeting switch is equivalent to "break". Did you mean to use "continue 2"? in /homepages/0/d482343892/htdocs/jomv3/wp-content/plugins/revslider/includes/operations.class.php on line 2722

Warning: "continue" targeting switch is equivalent to "break". Did you mean to use "continue 2"? in /homepages/0/d482343892/htdocs/jomv3/wp-content/plugins/revslider/includes/operations.class.php on line 2726

Warning: "continue" targeting switch is equivalent to "break". Did you mean to use "continue 2"? in /homepages/0/d482343892/htdocs/jomv3/wp-content/plugins/revslider/includes/output.class.php on line 3624

Warning: Cannot modify header information - headers already sent by (output started at /homepages/0/d482343892/htdocs/jomv3/wp-content/plugins/revslider/includes/operations.class.php:2722) in /homepages/0/d482343892/htdocs/jomv3/wp-content/plugins/stripe/includes/core/libraries/wp-session/class-wp-session.php on line 146
Le Big Data, nouvelle révolution industrielle ? | Jeunesse Outre mer
Wendy Alexandre vous habille en RAHRE !
12 février 2017
[INTERVIEW] Marie-Antoinette Séjean : “Manger autant que possible les produits du terroir est un geste citoyen.”
27 février 2017
Voir tout

Le Big Data, nouvelle révolution industrielle ?

Le Big Data, ou données de masse, parfois appelé le nouvel or noir, jouit d’une popularité et d’une réputation grandissante pour un public de plus en plus large. Mais qu’est-ce que le Big Data ? Quelles sont les problématiques associées ? Quels enjeux implique cette notion et qu’annonce-t-elle pour l’avenir ?

Qu’est-ce que le Big Data ?

Le Big Data se réfère à l’explosion quantitative de données de tous types. Avec la prolifération des outils connectés, de l’internet des objets notamment, le nombre de données créées quotidiennement augmente de façon exponentielle. Pour donner un exemple chiffré, selon le magazine « Fortune », de l’ère des  dinosaures à 2003, 5 Milliards de GB de données ont été enregistrées. Cette quantité était enregistrée tous les 2 jours en 2011, et toutes les 10 minutes en 2013 !  Dans le même temps, plus de 220 milliards de recherches ont lieu chaque mois sur Google.

3 V caractérisent classiquement le Big Data: le Volume, qui correspond à une énorme quantité d’informations, la Vélocité, qui signifie que le flux d’entrée de ces données est très important, et la Variété, puisque ces données peuvent être de tout type (image, texte, numérique). 2 V complètent parfois cette description: la Véracité, qui est la confiance accordée aux données, et la Valeur, faisant référence à l’utilité de ces dernières.

 

À quoi sert le Big Data ?

Pour certains, le Big Data constitue une réelle révolution industrielle. En effet, l’essor récent des méthodes d’analyse de données prouve la valeur ajoutée qu’apporte le traitement d’information. Un exemple concret de champ d’application qui tire profit d’analyses statistiques est l’épidémiologie qui consiste à étudier la distribution et les déterminants d’une maladie dans des populations humaines. En effet, les études de cohortes notamment se font à l’aide de modélisations statistiques qui permettent de répondre sur certaines notions de causalité, de facteurs déterminants, ou même sur l’évaluation de certains traitements. Bien d’autres domaines très variés font usage de l’analyse de données tels que le webmarketing ou encore la météo.

L’objectif, lié au Big Data, serait ainsi de pouvoir traiter de façon pertinente, c’est-à-dire, aussi efficacement que sur des bases de données plus réduites, ces gigantesques flux de données qui regorgent  d’informations stratégiques. Par exemple, à la suite d’un achat sur un site de commerce en ligne, des suggestions sont faites pour l’article suivant qui peuvent ainsi dépendre du profil de l’utilisateur, en fonction de ses précédentes recherches, de son comportement sur internet, mais également en tenant compte des achats effectués par les autres acheteurs du même produit. Cette question de flux de données soulève évidemment un ensemble de questions éthiques, et notamment juridiques, sur les moyens d’obtention, ou la possibilité de garder ou de traiter ces données. En effet,  très peu sont les utilisateurs qui prennent réellement la mesure de l’utilisation de leurs données sur la toile.

Problématiques techniques

Malheureusement, le traitement efficace de ces données de masse reste aujourd’hui une chimère. La trop grande quantité de données pose dans un premier temps la question du stockage de ces dernières. Les Data Centers nécessiteraient ainsi à eux seuls 10% de la consommation nationale d’énergie en France. Par ailleurs, la représentation de ces données, et également leur analyse impose des capacités de calcul trop importantes pour des outils classiques qui deviennent rapidement obsolètes.

Différentes stratégies ont ainsi été développées en ce sens. Il y a notamment la parallélisation des traitements, c’est-à-dire que les données sont séparées, traitées de façon parallèle (map-reduce), puis les résultats sont rassemblés.  Les contraintes de stockage de bases de données volumineuses ont  également accéléré le développement de bases de données non relationnelles (No SQL). Celles-ci se démarquent des schémas classiques des bases de données relationnelles qui utilisent des tableaux de colonnes fixes et des relations prédéfinies pour faire le lien entre ces différents tableaux. Ces solutions ne sont toujours pas satisfaisantes, et doivent encore être développées. Elles nécessitent par ailleurs des profils techniques spécialisés dans le Big Data, très valorisés sur le marché de l’emploi, avec des niveaux de rémunération parfois plus élevés pour un développeur de ce domaine.

 


Le Big data : le futur des politiques publiques en Outre-Mer ?

En novembre 2016, une étude co-pilotée par la Fédération nationale des collectivités concédantes et la Caisse des dépôts  introduisait le Big Data territorial. De nombreuses applications directes en matière de politiques publiques pourraient découler de l’utilisation des données telles que la prédiction des probabilités d’embauche par secteur, l’analyse des comportements de mobilité des individus etc. Ces différents usages se heurtent notamment à certaines limites, telles que le coût de déploiement pour accéder aux données ou la question de la sécurité des données.

Enfin, dans le rapport de mars 2016, sur l’Égalité Réelle Outre-Mer, l’appropriation du Big data, couplée à celle de l’internet des objets, constitue directement l’une des recommandations. Cette notion intervient  notamment dans la volonté d’inscrire la démarche d’égalité réelle dans un monde en mutation technologique. Il s’agissait ainsi de mettre en œuvre une plateforme numérique efficace pour la recherche d’emploi.

Il est aujourd’hui indéniable que le Big Data continuera encore quelques temps d’alimenter les groupes de réflexion, sur sa mise en œuvre et son développement. Il est essentiel  de s’imprégner de ces outils, afin de construire et déployer les différentes plateformes d’utilisation de données et de Big Data dont le potentiel n’est plus à démontrer. Toutefois, il reste nécessaire de penser les limites à l’utilisation et au traitement de telles quantités de données. En effet, ceci soulève des problématiques éthiques et épistémologiques concernant l’automatisation des prises de décisions que le Big Data continuerait d’alimenter.

The following two tabs change content below.
Kersane Zoubert-Ousseni

Kersane Zoubert-Ousseni

Féru de mathématiques, mon souhait est d'étudier des méthodologies pointues et innovantes au service direct de problématiques concrètes dans le domaine des statistiques et des probabilités. Actuellement en thèse en mathématiques appliquées, j'ai à cœur de présenter une image de cette discipline qui soit plus positive pour un large public.
Kersane Zoubert-Ousseni

Derniers articles parKersane Zoubert-Ousseni (voir tous)

1 Comment

  1. Avatar Brandon Byrs dit :

    Superbe article! Vivement le Bigdata en OM

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

%d blogueurs aiment cette page :