Fork me on GitHub

Outils pour utilisateurs

Outils du site


platforms:contribute:pkb

Comment créer une PKB (bases de connaissance éditeur)

Description

Le fichier platform_AllTitless_YYYY-MM-DD.txt contient les correspondances entre les identifiants de la plateforme en question et un ISSN ou autre identifiant normalisé. En particulier, le champ KBART appelé title_id est utilisé pour faire cette correspondance avec le champ print_identifier (cas du papier) ou online_identifier (cas électronique). La liste complète des champs KBART et leur signification est consultable.

Il peut y avoir plusieurs fichiers PKB(*) pour une même plateforme et ils peuvent être :

  • récupérés sur les sites des éditeurs sous forme de fichier KBART
  • générés automatiquement grâce à un programme spécifique appelé scraper
  • édités manuellement
platform_AllTitles_YYYY-MM-DD.txt
publication_title	print_identifier	online_identifier	date_first_issue_online	num_first_vol_online	num_first_issue_online	date_last_issue_online	num_last_vol_online	num_last_issue_online	title_url	first_author	title_id	embargo_info	coverage_depth	coverage_notes	publisher_name	publication_type	date_monograph_published_print	date_monograph_published_online	monograph_volume	monograph_edition	first_editor	parent_publication_title_id	preceding_publication_title_id	access_type
ACS Applied Materials & Interfaces	1944-8244	1944-8252							http://pubs.acs.org/page/aamick/about.html		aamick													
Analytical Chemistry	0003-2700	1520-6882							http://pubs.acs.org/doi/abs/10.1021/ac404188g		ac													

(*) : dans le cas où il existe plusieurs fichiers PKB, ils sont tous lus par ezPAARSE et il doit y avoir unicité de l'identifiant title_id. L'outil pkbvalidator permet de contrôler cette unicité au sein de l'ensemble des fichiers.

Enrichissement a posteriori du fichier PKB

Le fichier PKB a un nom du type platform_AllTitles_YYYY-MM-DD.txt

Il est tout à fait envisageable de travailler pas à pas pour constituer une pkb et d'utiliser ezPAARSE pour assister une démarche incrémentale.

Par exemple, dans le cas où l'analyse de logs conduite par ezPAARSE signale que certaines lignes ne sont pas reconnues à cause de lacunes dans les pkb, il suffit de récupérer le fichier lines-pkb-miss-ecs.log (en cliquant sur le lien “PKBs manquantes” de la page de résultat d'un traitement FIXME insérer ici une impression d'écran) et de s'en aider pour compléter une ou plusieurs pkb.

Validation des bases de connaissance

Les bases de connaissances sont chargées par ezPAARSE et leur structure doit être préalablement contrôlée par la commande pkbvalidator

platforms/contribute/pkb.txt · Dernière modification: 2014/05/06 12:52 par porquet