Définition de la Collecte des Données du projet HIV_Sequence (HDBP0263)

Définition de la Collecte des Données du projet HIV_Sequence (HDBP0263)

Dans les fichiers ci-dessous, vous trouverez les spécifications de la définition de la collecte des données (Data collection Definition - DCD) du registre HIV_Sequence. Il s'agit d'une description détaillée du contenu des DCD avec les noms des champs, les formats, les valeurs, les règles de validation, les textes d'aide, les messages d'erreur, les traductions, etc. Ces spécifications ont été utilisées pour élaborer les formulaires et les fichiers csv pour ce projet, que vous pouvez également trouver dans ce manuel de projet.

  1. Un fichier de métadonnées contenant les informations relatives à l'analyse du registre HIV_Sequence:

2. Le fichier CSV contenant les nucléotides doit être un fichier ne contenant que trois colonnes : « filename », « recordname » et « genetic_sequence ».

HD_DCD_SPEC_REG0263_HIV_Sequence_NucleotideSequenceSFTP_v1.xlsx

Les enregistrements entre les deux fichiers sont liés sur la base des champs « File name » (appelé TX_ATT dans le fichier de métadonnées et appelé « filename » dans le fichier CSV avec nucléotides) et « Record name » (appelé TX_ATT_RECRD dans le fichier de métadonnées et appelé « recordname » dans le fichier CSV avec nucléotides). Ces champs doivent suivre la convention de nomenclature suivante et sont automatiquement générés si vous utilisez l'application RShiny qui a été développée pour vous aider dans la préparation des données (voir https://collaboration.sciensano.be/sites/E1989/).

Nom du fichier : ce champ est utilisé comme première clé de liaison entre les données envoyées par HD4DP1 (données sur les patients et les échantillons) et SFTP (données sur les séquences nucléotidiques). Ce champ doit contenir la même valeur pour les deux enregistrements téléchargés afin de permettre le lien « 1 to 1 ». Veuillez utiliser cette convention : ARL_yyyymmddHHMMSS (nom de l'ARL et date et heure du fichier, par exemple HSP_20240827092014). Le nom du fichier csv contenant les séquences nucléotidiques envoyé par SFTP doit avoir cette valeur afin d'être lié à l'enregistrement téléchargé via HD4DP1 (données sur le patient et l'échantillon), par exemple : HSP_20240827092014.csv.

Nom de l'enregistrement : ce champ est utilisé comme deuxième clé de liaison entre les données envoyées par HD4DP1 (données sur les patients et les échantillons) et SFTP (données sur les séquences nucléotidiques). Ce champ doit contenir la même valeur unique pour les deux enregistrements téléchargés afin de permettre le lien « 1 to 1 . Veuillez utiliser cette convention : ARL_yyyymmddHMMSS_xxxxx (nom de l'ARL, date et heure du fichier et un numéro unique à 5 chiffres, par exemple : HSP_20240827092014_00001).

Cette documentation est encore en construction. Nous essayons de présenter les informations aussi correctes, complètes et aussi claires que possible. Cependant, si vous voyez un élément dans la documentation qui est incorrect, ne correspond pas à votre expérience ou nécessite des éclaircissements supplémentaires, veuillez créer ticket support via notre portail (https://healthdatabe.atlassian.net/servicedesk/customer/portals) ou nous envoyer un e-mail à support.healthdata@sciensano.be pour signaler ce problème de documentation. N'oubliez pas d'inclure l'URL ou l'adresse Web de la page avec le problème de documentation. Nous ajusterons ensuite la documentation. Merci!

Adelaide.DAmore mar 03/06/2025 - 09:45