Main Content

Résultats des concours d’allocation de ressources pour 2022

Sommaire

La plateforme de calcul informatique de pointe (CIP) était mise au service de la recherche au Canada par la fédération Calcul Canada, un partenariat entre Calcul Canada, ses organisations régionales (WestGrid, Calcul Ontario, Calcul Québec et ACENET) et des établissements de partout au pays. Offrant l’infrastructure et l’expertise pour effectuer des recherches transformatrices de niveau international, cette plateforme de CIP desservait au 1er janvier 2022 près de 19 000 utilisatrices et utilisateurs, dont plus de 5 100 chercheuses et chercheurs d’universités canadiennes.

Calcul Canada en est à sa dernière année d’opération. En date du 1er avril 2022, l’Alliance de recherche numérique du Canada (l’Alliance) remplacera Calcul Canada à la coordination et la gestion du financement de la plateforme nationale de CIP. Calcul Canada, ses établissements membres, ses partenaires régionaux et l’Alliance se sont engagés à minimiser la perturbation du service pendant la période de transition. 

La façon d’accéder aux ressources restera la même. Malgré le fait que Calcul Canada n’existera plus, les membres de la fédération Calcul Canada resteront en place; vous pourrez donc vous attendre à la même qualité de service que vous avez toujours reçu de leur part. Certaines ressources clés, par exemple le wiki de documentation technique, porteront encore le nom de Calcul Canada jusqu’à ce qu’un nouveau nom leur soit donné; ces ressources restent cependant valides.

Dans le cadre des concours pour l’allocation des ressources pour 2022, la plateforme nationale de CIP disposait d’environ 293 312 cœurs CPU, 62 000 CPU virtuels, 3 062 GPU et 181 Po d’espace de stockage sur les grappes et Arbutus (Université Victoria), Cedar (Université Simon-Fraser), Graham (Université de Waterloo), Niagara (Université de Toronto), et Béluga et Narval (Calcul Québec).

L’augmentation croissante des besoins fait que la demande reste toujours plus forte que l’offre. Les concours pour 2022 ont reçu le plus grand nombre de candidatures à ce jour avec 716 projets, une hausse de 10 % par rapport à 2021. Cependant, les concours de cette année n’ont satisfait que 54 % des demandes de ressources de calcul, 94 % des demandes d’espace de stockage et 24 % des demandes de GPU. Pour leur part, les demandes de vCPU (CPU virtuels) sur les nuages Arbutus, Béluga, Cedar et Graham ont été satisfaites à 79 %.

Bien que près de 80 % (en moyenne) des ressources sont allouées par voie de concours, nous réservons environ 20 % au service d’accès rapide qui met de petites capacités de calcul, de stockage et de ressources infonuagiques à la disposition de ceux et celles qui détiennent un compte.

Pour la définition de plusieurs termes utilisés ici, consultez le glossaire technique. Toute question relative au présent rapport peut être adressée à allocations@tech.alliancecan.ca.

Tableau 1 : Candidatures aux concours d’allocation de ressources

Année Demandes reçues Augmentation par rapport à l’année précédente
2022 716 10 %
2021 651 10 %
2020 590 16 %
2019 507 8 %
2018 469 15 %
2017 409 12 %
2016 366 5 %
2015 350 20 %
2014 291 38 %
2013 211 33 %
Candidatures par année (Graphique)

*En date du 9 février 2022

Ressources de calcul

Allocations de CPU

Les concours de 2022 ont satisfait à 54 % la demande en ressources de calcul (cœurs-année), soit autant qu’en 2021. Béluga, Cedar, Graham, Narval et Niagara fournissent 100 % de la capacité disponible, soit environ 293 312 cœurs, dont près de 80 % sont alloués par voie de concours.

Tableau 2 : Allocations de CPU pour 2022

  Cœurs-année disponibles (100 % de la capacité) Cœurs-année demandés Cœurs-année alloués Pourcentage de la capacité totale allouée
Béluga 28 960 36 844 20 006 69 %
Cedar 91 968 137 207 74 467 81 %
Graham 34 784 49 387 25 556 73 %
Narval 61 760 76 842 44 133 71 %
Niagara 75 840 136 500 70 113 92 %
Total 293 312 436 780 234 275 80 %

Tableau 3 : Évolution de la demande de CPU

  Cœurs-année disponibles Cœurs-année demandés Cœurs-année alloués Écart Demande satisfaite à
2022 293 312 436 780 234 275 202 505 54 %
2021 232 704 468 498 188 925 279 573 40 %
2020 232 704 455 892 181 502 274 390 40 %
2019 201 320 390 352 157 262 233 089 40 %
2018 211 020 284 347 158 612 129 325 56 %
2017 182 760 255 638 148 100 107 538 58 %
2016 155 952 237 862 128 463 109 399 54 %
2015 161 888 191 690 123 699 67 991 65 %
2014 190 466 172 989 133 508 39 481 77 %
2013 187 227 142 106 126 677 15 429 89 %
Évolution des allocations de CPU (Graphique)

Mise à l’échelle des demandes de calcul

Comme mentionné ci-dessus, les ressources en CIP ne suffisaient pas à satisfaire les demandes reçues pour les concours de 2022.

Les demandes ont donc été mises à l’échelle pour les adapter aux ressources insuffisantes. La procédure, cautionnée par les présidentes et présidents des comités d’examen, a été mise en place afin que seules les candidatures ayant une note égale ou supérieure à 3,0 (sur 5) reçoivent une allocation de ressources. Les chercheuses et chercheurs qui n’ont pas reçu d’allocation peuvent toutefois se prévaloir de la possibilité d’une utilisation opportuniste par le biais du service d’accès rapide. La note moyenne attribuée à l’ensemble des demandes pour 2022 se situe à 3,7.

Les demandes en termes de cœurs-année sont mises à l’échelle d’après la note générale obtenue par la demande et la capacité demandée. Les détails de la fonction de mise à l’échelle et quelques exemples sont présentés ici. Pour plus d’information, écrivez à allocations@tech.alliancecan.ca.

Quantité minimale de ressources allouées par concours et accès opportuniste aux ressources de calcul

Tous les chercheurs et chercheuses et leurs utilisateurs parrainés qui disposent d’un compte actif peuvent se prévaloir d’un accès opportuniste aux CPU et aux GPU par le service d’accès rapide. Puisque l’utilisation est purement opportuniste, il est impossible de garantir combien de ressources peuvent être consommées par les projets qui n’ont pas fait l’objet d’une demande aux concours.

Les demandes minimales admissibles aux concours d’allocation de ressources sont présentement 50 cœurs-années et 10 GPU-années. Ces valeurs servent en partie à contrôler la quantité de demandes qui doivent être soumises à l’examen. Comme le nombre de demandes augmente chaque année, la charge de travail des comités d’examen augmente aussi proportionnellement. Le fait de disposer d’une allocation égale au minimum admissible garantit une plus haute priorité aux tâches soumises. 

Même en se prévalant d’une utilisation opportuniste, nos données montrent que plusieurs groupes qui n’ont pas reçu d’allocation par suite des concours peuvent atteindre et même dépasser les minimums mentionnés ci-dessus. Pour maximiser l’utilisation en calcul, les stratégies suivantes sont employées :

  • conserver des tâches dans la queue de façon régulière;

  • tolérer un temps d’attente plus long avant le lancement des tâches;

  • soumettre des tâches ayant des caractéristiques optimales.

Par exemple, des tâches opportunistes de courte durée qui nécessitent quelques cœurs d’une grappe d’usage général seront habituellement exécutées plus rapidement que celles qui requièrent quelques dizaines de cœurs.

Pour savoir comment maximiser l’utilisation de ressources si vous ne disposez pas de ressources allouées par voie de concours, veuillez lire attentivement les pages Allocation et ordonnancement et Politique d’ordonnancement des tâches ou écrivez à support@tech.alliancecan.ca.

Allocations de GPU

La concurrence pour les ressources GPU est toujours plus forte que celle pour les CPU; les tableaux 4 et 5 indiquent que la demande en GPU est environ trois fois plus grande qu’il y a cinq ans. La demande pour 2022 a été comblée à 24 %. 

Les allocations de GPU sont déterminées d’après la note générale obtenue par la demande; la justification technique des besoins en ressources; la preuve d’une utilisation précédente de GPU; le domaine de recherche (par exemple intelligence artificielle, apprentissage machine, etc.); et la taille du groupe de recherche.

Il ne faut pas oublier que :

  1. les chercheuses et chercheurs qui présentent une demande aux concours trouvent difficile d’estimer leurs besoins en GPU et, dans la plupart des cas, ils en demandent beaucoup plus qu’ils n’en utilisent. Avant de présenter une demande, nous les encourageons fortement à faire deux choses : commencer à utiliser les GPUpour mieux cerner leurs besoins, et consulter notre équipe technique qui peut les aider à évaluer la performance de leurs programmes et à estimer plus exactement leurs besoins en GPU;

  2. les allocations de GPU sont contraintes entre autres par le type de GPU demandé (Pascal, Volta, T4) et le nombre disponible sur chaque grappe;

  3. les demandes de GPU pour des applications d’intelligence artificielle ont considérablement augmenté.

Tableau 4 : Allocation de GPU par grappe pour 2022

  GPU-année disponibles (capacité 100 %) GPU-année
demandés
GPU- année alloués Capacité allouée
Béluga 688 2 108 426 62 %
Cedar 1 352 3 964 1 072 79 %
Graham 498 1 634 268 54 %
Narval 524 1 364 395 75 %
Total 3 062 9 070 2 161 71 %

Tableau 5 : Évolution de la demande de GPU

  GPU-année disponibles GPU-année
demandés
GPU- année alloués Écart Demande satisfaite à
2022

3 062

9 070 2 161 6 909 24 %
2021 2 610 9 980 2 187 7 370 22 %
2020 2 552 12 885 1 936 11 165 15 %
2019 1 664 6 555 1 331 5 224 20 %
2018 976 4 092 840 3 252 20 %
2017 1 420 2 790 1 047 1 743 38.5 %
2016 373 1 357 269 1 088 20 %
2015 482 608 300 308 49 %
2014 NA 420 308 112 73 %
2013 NA 390 259 131 66 %
Évolution des allocations de GPU (Graphique)

Allocations de ressources infonuagiques

La grappe Arbutus de l’Université de Victoria peut allouer 41 920 vCPU (CPU virtuels). Ils sont disponibles via les concours d’allocation de ressources et le service d’accès rapide et sont aussi utilisés par les services internes pour le développement de logiciels et l’hébergement. Des petites capacités infonuagiques sont aussi disponibles sur Cedar, Graham et Béluga. La demande globale de vCPU a augmenté de 14 % en 2022 : la demande pour les vCPU de calcul a connu une hausse de 14% et celle pour les vCPU persistants de 21%.

Le surprovisionnement des vCPU persistants à un ratio de 10:1 a permis une expansion significative des allocations persistantes au cours des dernières années. L’utilisation des cœurs réels a suivi le rythme des ajouts de matériel et dépasse largement 80 %, un seuil au-delà duquel l’ajout d’instances de calcul devient difficile.

Avec Arbutus et les nœuds ajoutés à Cedar, Graham et Béluga, nous avons pu allouer par concours 79 % des vCPU demandés. 

Tableau 6 : Évolution de la demande de vCPU

  vCPU-année disponibles vCPU-année
demandés
vCPU- année alloués Écart Demande satisfaite à
2022

62 549

34 536 27 444 7 092 79 %
2021 62 549 30 323 24 443 5 880 81 %
2020 50 501 18 330 18 229 101 99 %
2019 29 147 19 479 18 511 968 95 %
2018 24 854 12 480 11 829 651 95 %
 
Évolution de la demande de vCPU (Graphique)

Allocations de stockage

Ensemble, les ressources intégrées à Arbutus, Béluga, Cedar, Graham, Narval et Niagara permettent le stockage en ligne d’environ 181 Po pour 2022. Ainsi, 94 % de la capacité de stockage a été allouée.

Tableau 7 : Allocations de stockage (en To)

Catégorie Type Espace disponible Espace demandé Espace alloué Demande satisfaite à
CHP project 66 230 61 715 51 571 84 %
HPC nearline 87 800 72 077 73 620 102 %
HPC dCache 13 680 13 091 13 090 100 %
nuage volumes et instantanés 4 980 3 562 2 948 83 %
nuage objet 7 000 7 325 7, 15 100 %
nuage partagé 2, 00 1 628 1 618 99 %
  Total 181 690 159 398 150 162 94 %
 

Processus d’évaluation

Calcul Canada basait les concours d’allocation de ressources annuels sur les exigences de la Fondation canadienne pour l’innovation (FCI) en vue d’attribuer les ressources de CIP selon le mérite scientifique des projets. En plus de devoir satisfaire à ces exigences, la justification technique de la demande est aussi examinée.

Deux processus étaient en place :

  • un examen scientifique effectué bénévolement par plus de 100 pairs experts en provenance de divers établissements d’enseignement canadiens qui jugent du mérite des projets soumis aux concours. Chaque demande reçoit une note qui sert à guider objectivement les décisions relatives à l’allocation des ressources;

  • une évaluation technique effectuée par le personnel, qui vérifie le bien-fondé des ressources nécessaires au projet décrites dans la demande et recommande la grappe appropriée au projet, selon ses besoins.

Les processus d’évaluation sont supervisés par le comité administratif du programme d’accès aux ressources composé de représentants de chacune des régions et des sites hôtes de l’infrastructure nationale de calcul.

Les nouvelles demandes sont soumises aux examens techniques et scientifiques, alors que seul un examen technique est fait pour les demandes accélérées et les demandes pluriannuelles pour les projets de plateformes et portails de recherche.

Principes directeurs

Les principes directeurs des concours pour l’allocation des ressources sont :

  • toutes les demandes sont traitées équitablement;

  • les ressources sont allouées sur la base du mérite du projet plutôt que sur le mérite du programme de recherche; 

  • la quantité de ressources de calcul allouée n’est pas directement proportionnelle à la qualité ou à l’excellence des résultats escomptés; certaines recherches importantes peuvent être accomplies avec relativement peu de ressources de calcul; 

  • les difficultés posées par le manque de ressources et les autres contraintes liées aux systèmes sont partagées entre toutes les candidatures.

Examen technique

Cet examen est effectué par l’équipe technique pour

  • veiller à ce que le chercheur principal ou la chercheuse principale soumette une demande pour une ressource appropriée et assurer la disponibilité des logiciels nécessaires;

  • évaluer l’efficacité et la scalabilité de la demande;

  • identifier les groupes qui pourraient avoir besoin d’aide avec l’optimisation du code et des processus;

  • relever les disparités entre la demande soumise en ligne et la description complète du projet;

  • repérer les exigences logicielles particulières;

  • fournir une opinion technique sur le caractère raisonnable de la demande.

 

Avant d’avoir accès aux demandes, le personnel technique doit signer une entente de confidentialité et de non-divulgation.

Examen scientifique

Un comité de pairs experts examine chaque demande et lui attribue une note au mérite scientifique. Avant d’avoir accès aux demandes, les membres des comités de pairs experts doivent signer une entente de confidentialité et de non-divulgation et accepter de se conformer à la politique en matière de conflits d’intérêts.

La note accordée à une demande se base sur :

  • l’excellence scientifique du projet pour lequel les ressources de calcul sont demandées;

  • la faisabilité scientifique et technique du projet;

  • la pertinence des ressources demandées par rapport aux objectifs du projet;

  • la probabilité que les ressources demandées seront utilisées de façon efficiente.

Les demandes sont évaluées par les comités suivants : 

  • Astronomie, astrophysique et cosmologie

  • Bio-informatique

  • Chimie, biochimie et biophysique

  • Sciences informatiques et mathématiques

  • Génie

  • Sciences de la Terre et de l’environnement

  • Sciences humaines et sociales

  • Nanotechnologie, matériaux et matière condensée

  • Neurosciences, imagerie médicale et physique médicale

  • Physique des particules subatomiques, physique nucléaire et physique cosmique

Valeur monétaire des allocations pour 2022

Le tableau suivant montre les moyennes pour l’ensemble de la plateforme de CHP; les montants incluent le coût en capital et le coût d’exploitation des ressources et services. Il ne s’agit pas de la valeur sur le marché. La valeur est calculée sur une base annuelle.

Tableau 8 : Valeur des allocations

Ressources 2022
1 cœur-année 124 $
1 GPU-année 2 460 $
1 To de stockage /​project par année 56 $
1 To de stockage /​nearline par année 26 $
1 vCPU-année 43 $
1 vGPU-année 615 $
1 To de stockage pour les volumes et instantanés (Ceph) par année 49 $
1 To de stockage objet 49 $
1 To de stockage dans un système de fichiers partagé 49 $