Outils pour utilisateurs

Outils du site


6

Glossaire

  • Cadriciel : Mot valise formé à partir de deux mots, cadre et logiciel.
  • Hadoop : « High-Availability Distributed Object-Oriented Plat-form » a été créé par Doug Cutting et fait partie des projets de la fondation logicielle Apache depuis 2009.
  • HDFS : « Hadoop Distributed File System »
  • Cluster : Dans un système informatique, un agrégat, ou « cluster », est un groupe de ressources, telles que des serveurs.
  • NoSQL : « Not Only SQL »
  • Sharding : très forte distribution des données et des traitements associés sur de nombreux serveurs
  • Consistent Hashing : partitionnement horizontal des données sur plusieurs nœuds ou serveurs
  • Audit : Procédure de contrôle.
  • Variété : Ensemble d’élément différents.
  • Véracité : Caractère de ce qui est vrai.
  • Vélocité : Vitesse pensé à la force véloce.
  • Data-Lakes(Lac de données): C’est un référentiel de données permettant de stocker une très large quantité de données brutes dans le format natif pour une durée indéterminée. Cette méthode de stockage permet de faciliter la cohabitation entre les différents schémas et formes structurelles de données, généralement des blobs d’objets ou des fichiers.
  • Data-Warehouse(Entrepôt de données): Désigne une base de données utilisée pour collecter, ordonner, journaliser et stocker des informations provenant de base de données opérationnelles et fournir ainsi un socle à l'aide à la décision en entreprise.
  • Données brutes: Ce sont les données non interprétées émanant d'une source primaire, ayant des caractéristiques liées à celle-ci et qui n'ont été soumises à aucun traitement ou toute autre manipulation.
  • Machine learning: L’apprentissage automatique ou apprentissage statique est un champ d'étude de l’intelligence artificiel qui se fonde sur des approches mathématiques et statistiques pour donner aux ordinateurs la capacité «d’apprendre» à partir de données, c'est-à-dire d'améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune. Plus largement, il concerne la conception, l'analyse, l'optimisation, le développement et l'implémentation de telles méthode.
6.txt · Dernière modification : 2020/07/26 16:27 de 127.0.0.1