Domain-Specific Language Model Pretraining for Biomedical Natural Language Processing

Table of Contents

Title: BioGPT: Generative Pre-trained Transformer for Biomedical Text Generation and Mining

Authors: Yu Gu, Robert Tinn, Hao Cheng, Michael Lucas, Naoto Usuyama, Xiaodong Liu, Tristan Naumann, Jianfeng Gao, Hoifung Poon

Published: Jul 31 2020

Summary (Generated by Microsoft Copilot):

Introduction:

Challenges:

Methods:

Novelties:

Results:

Performances:

Limitations:

Discussion:

BLURB

Benchmark: BLURBはBiomedical Language Understanding & Reasoning Benchmarkの略である。これは公開されているデータセットから編集された包括的な生物医学NLPベンチマークである。
Tasks: 固有表現認識（NER）、エビデンスベースの医療情報抽出（PICO）、関係抽出、文類似性、文書分類、質問応答など、幅広いタスクが含まれている。
Leaderboard: BLURBベンチマークを特徴とするリーダーボードが作成され、生物医学NLPの研究を加速させるのに役立っている。
Purpose: このベンチマークは、生物医学NLPにおけるドメイン固有事前学習とタスク固有ファインチューニングの評価を促進することを目的としている。