日本データベース学会の皆様
奈良先端科学技術大学院大学の若宮と申します.
医療言語処理シェアードタスクNTCIR-17 Medical Natural Language Processing for Social media
and Clinical texts (MedNLP-SC) のご案内です.
すでに多くの参加登録をしていただいておりますが,締切を6/26まで延長いたします.
ぜひご参加をご検討いただければ幸いです.
よろしくお願いいたします.
============================================
NTCIR-17 MedNLP-SC
https://sociocom.naist.jp/mednlp-sc/
参加登録締切: 2023年6月26日
Formal run 開始: 2023年7月10日
============================================
近年,医療記録が電子化されることが多くなり,医療分野における情報処理技術の重要性が高まっています.
しかし,日本語をはじめとした非英語圏では匿名化された医療テキストデータがまだ多くありません.
このような状況を打開するため,我々は,ソーシャルメディアデータと医療文書(読影レポート)を用いた医療言語処理シェアードタスク・ワークショップを企画しています.
下記ページにてサンプルデータを公開しております.
https://sociocom.naist.jp/mednlp-sc/
----------------
コーパス・タスク
----------------
MedNLP-SCタスクには2種類のコーパスに基づく2つのサブタスクがあります.
コーパス:
◎ Social Media コーパス(日本語,英語,ドイツ語,フランス語)
ソーシャルメディアのデータセットです.
日本語のツイートデータをもとに擬似テキストデータを生成し,人手でアノテーションを行ったあと,英語,ドイツ語,フランス語に機械翻訳して作成した,日本語,英語,ドイツ語,フランス語のパラレルコーパスです.
◎ MedTxt-RR コーパス(日本語)
肺癌CT画像症例に対し,複数人の放射線医がレポートを記述したデータセットです.
サブタスク:
◎ Social Media (SM) サブタスク
薬物有害事象 (Adverse drug event detection, ADE) 情報を抽出するタスクです.
ADE症状の有無のラベルを各テキストに付与するタスクです.
言語に基づく4つのトラック (Japanese, English, German, French) があります.
◎ Radiology Report (RR) サブタスク
放射線科の読影レポートを複数の基準で分類する際のNLPモデルの汎化能力を評価するために,がんの病期分類 (TNM staging) を行うタスクです.
あらかじめ定義された基準に従って,腫瘍 (T),リンパ節 (N),転移 (M),臨床病期 (cStage)
の4つのラベルを各レポートに付与するタスクです.
日本語のトラックのみとなります.
------------------
今後のスケジュール
------------------
* March 2023: データセット配布
* June 26, 2023: タスク参加登録締切
* June 26, 2023: 学習データ(最終版)配布
* July 10, 2023: テストデータ配布・Formal Run 開始
* July 17, 2023: 結果の提出
* August 1, 2023: 評価結果の返送
* August 1, 2023: タスク概要論文一部公開
* September 1, 2023: タスク参加者論文(ドラフト) 提出締切
* November 1, 2023: タスク参加者論文・タスク概要論文 提出最終締切
* December 12-15, 2023: NTCIR-16 カンファレンス(NII, 東京)
------
主催者
------
(JAPAN)
Eiji Aramaki, Ph.D. (NAIST, Japan)
Yuta Nakamura, M.D., Ph.D. (The University of Tokyo, Japan)
Shoko Wakamiya, Ph.D. (NAIST, Japan)
Shuntaro Yada, Ph.D. (NAIST, Japan)
Lis Weiji Kanashiro Pereira, Ph.D. (NAIST, Japan)
Shouhei Hanaoka, M.D., Ph.D. (The University of Tokyo, Japan)
Gabriel Herman Bernardim Andrade (NAIST, Japan)
Faith Wavinya Mutinda, Ph.D. (NAIST, Japan)
Noriki Nishida, Ph.D. (RIKEN, Japan)
Tomohiro Nishiyama (NAIST, Japan)
Hiroki Teranishi, Ph.D. (RIKEN, Japan)
Narumi Tokunaga (RIKEN, Japan)
Akiko Aizawa, Ph.D. (NII, Japan)
Yuji Matsumoto, Ph.D. (RIKEN, Japan)
(FRANCE)
Cyril Grouin, Ph.D. (Université Paris-Saclay, CNRS, LISN, France)
Thomas Lavergne, Ph.D. (Université Paris-Saclay, CNRS, LISN, France)
Aurélie Névéol, Ph.D. (Université Paris-Saclay, CNRS, LISN, France)
Patrick Paroubek, Ph.D. (Université Paris-Saclay, CNRS, LISN, France)
Hui-Syuan Yeh (Université Paris-Saclay, CNRS, LISN, France)
Pierre Zweigenbaum, Ph.D. (Université Paris-Saclay, CNRS, LISN, France)
(GERMANY)
Lisa Raithel (DFKI, Germany, TU Berlin, Germany, and Université
Paris-Saclay, CNRS, LISN, France)
Roland Roller, Ph.D. (DFKI, Germany)
Philippe Thomas, Ph.D. (DFKI, Germany)
* MedNLP-SC連絡先:mednlp-sc[at]is.naist.jp