Big Data et calcul informatique de pointe (CIP)

Le Big Data. On en parle de plus en plus. Le calcul informatique de pointe (CIP), c'est moins fréquent, mais tout aussi important ! Les bases de données « explosent » et demandent de nouvelles solutions technologiques pour traiter ces métadonnées : le calcul informatique de pointe (CIP).

Les bases de données demandent en effet plus de puissance et de mémoire allant du terabyte, au petabyte, au exabyte au zettabyte… Toutes ces unités de mesure expriment la capacité de stockage d’une mémoire, selon l’Office québécoise de la langue française. L’exabyte (EB) serait l’équivalent de 1.5 milliard de disques CD-ROM. « Ça en fait de la donnée ! » En 2010, l’utilisation mondiale d’internet nécessitait déjà 21 exabytes par mois. Puis 6 ans plus tard, la planète utilisait 96 exabytes par mois. Pour 2021, on estime l’utilisation mondiale mensuelle de données sur internet à 278 exabytes. On parle alors de 3.3 zettabytes (ZB).

Big data, grâce à la rapidité et la puissance de calcul informatique de pointe

Cette rapidité et cette puissance de calcul des ordinateurs permettent des avancements dans la science des données, notamment l’apprentissage profond et l’automatisation des prises de décision jusque dans le Génie 4.0.

Le Big Data est un « volume impressionnant de données produites, collectées, rassemblées et structurées ou non, en temps réel ou non », tel qu’expliqué dans un précédent article sur l’intelligence artificielle. L’apprentissage profond a été rendu possible grâce à la puissance de calcul des ordinateurs et la quantité massive de données. Ce volume impressionnant de données produites, collectées, rassemblées et structurées ou non, en temps réel ou non, ce sont les mégadonnées. Des superordinateurs ont vu le jour, mais des supercalculateurs l’ont aussi devancés. Calcul Québec explique l’évolution de ces « machines » et des grappes de calcul, ce « qui consiste à acheter plusieurs micro-ordinateurs et à les connecter en réseau ».

Le Big Data et le calcul informatique de pointe (CIP)

Calcul Québec explique qu’autrefois le calcul de haute performance était « réservé aux chercheurs et entreprises œuvrant dans des domaines tels la dynamique des fluides, la physique ou la chimie, le calcul informatique de pointe (ou CIP) englobe maintenant, en plus de la modélisation et de la simulation numérique, l’exploration de données (data mining), l’exploitation de bases de données complexes et le traitement numérique de données. » Voyons ces concepts plus en détails pour mieux en exploiter le potentiel.

4 cas d’application du Big Data et du CIP (calcul informatique de pointe)

1. Modélisation et simulation numérique

La simulation numérique, aussi nommée simulation informatique, permet de reproduire un phénomène physique grâce à une série de calculs de haute performance. Le simulateur de vol de CAE ou le Commit-Assistant d’Ubisoft (détection les risques de bugs informatiques dans la conception de jeux vidéos) seraient deux exemples de simulation numérique au Québec.

2. Exploration de données

Le Data Mining est un ensemble d’algorithmes qui permettent de segmenter les données à l’aide de « patterns » ou de répétitions de données. Cette classification peut être réalisée à l’aide d’une analyse de séquence, d’une association entre des données ou encore d’une prédiction.

3. Exploitation de bases de données complexes

La manipulation des données se fait généralement à l’aise d’une base utilisant le language SQL. Il y a de nouvelles bases NoSQL qui sont plus performantes pour analyser des quantités massives de données.

4. Traitement numérique de données

Des infrastructures de serveurs ont été mises sur pied pour faciliter le traitement numérique de ces données massives, voire même en temps réel. Nommons par exemple Hadoop ou encore Apache Spark, un moteur de traitement parallèle de données open-source qui contient un grand nombre d’algorithmes pour faciliter l’exploration de données.

Le Big Data est bien plus qu’une quantité massive de données ou une base de données. C’est une mine d’or en informations stratégiques et prédictives permettant une meilleure prise de décision et l’automatisation de processus. Son champ d’application s’élargit en prenant de plus en plus de place dans le secteur industriel : les entreprises 4.0.

 

Revenir au dossier [RDG] Génie 4.0 : 4e révolution industrielle

Abonnez-vous à nos infolettres pour ne rien manquer