NLPの評価型タスクに興味ある皆様:
(複数のMLにお送りしております.重複して受け取られた際にはどうかご容赦ください)
[Apologize for multiple copies]
本ワークショップでは、現在、日本での自然言語処理の代表的なデータ(R4C, 日本語Roberta,日本語GPT-2,JGLUE, mLUKE,
森羅など)を作られている先生方をお招きして「構造化された知識をどのように言語処理アプリケーションに利用するのか」についてパネルパネルディスカッションを行います。また、協働による知識構築の手法でWikipediaの構造化を目指している、森羅プロジェクトの2022年の最終報告会も併せて行います。
<日時>
2023年1月18日(水) 14:00-16:30
<参加方法>
オンライン(Zoom) =参加登録の際にリンクをお渡しします
<参加申し込み>
https://c5dc59ed978213830355fc8978.doorkeeper.jp/events/149118
<タイムテーブル>
14:00 オープニング
14:05 森羅2022最終報告会
14:05 タスク説明、結果報告
14:25 参加システムの紹介
(15:00 休憩)
15:10 パネルディスカッション
「構造化知識を使った言語処理応用」
・井之上直也先生(北陸先端科学技術大学院大学)
・河原大輔先生(早稲田大学)
・山田育矢様(株式会社Studio Ousia)
・中山功太(理研AIP/筑波大学)
・関根聡<司会>(理研AIP)
16:10 森羅2023の紹介
16:25 クロージング
(16:30 閉会)
<ホームページ>
http://shinra-project.info/shinra2022-final-report-workshop/
森羅2022実行委員会
理研AIP 言語情報アクセス技術チーム
====
(パネリスト紹介)
・井之上直也先生(北陸先端科学技術大学院大学)
知識を使って推論し言葉の行間を読むマシンをつくることを目指し、構造化知識とテキスト上の知識の統合的埋め込みによる説明付き推論などの研究に取り組んでいる。読解システムのためのベンチマークR4C、簡潔に説明可能な質問応答システムSuQAなどを公開。
・河原大輔先生(早稲田大学)
人間と同程度に言語を理解することのできる人工知能システムを目指し、言内・言外の意味を統合した知識フレームの獲得と言語理解への応用などの研究に取り組んでいる。RoBERTa日本語Pretrainedモデル、GPT-2日本語Pretrainedモデル、日本語言語理解ベンチマークJGLUEなどを公開。
・山田育矢様(株式会社Studio Ousia)
2007年に自然言語処理の研究開発を行うStudio
Ousiaを共同創業。自然言語処理のシステムを構造化された知識で改善することに取り組んでいる。多言語単語及びエンティティの文脈付き訓練済みモデルmLUKE、多言語テキスト分類モデルM-BoE、エンティティリンキングモデルSTEELなどを開発、公開。開発した質問応答技術は、世界最高峰のAIに関する国際会議NIPS(現NeurIPS)2017で開催されたコンペティションにおいて世界最高性能を獲得。
・中山功太(理研AIP/筑波大学)
理研AIPにて、学生インターンからリサーチアソシエイトとなり、森羅プロジェクトの実行委員として開始当初から継続的に携わる。森羅の分類、属性抽出タスクのベースラインシステムを深層学習を用いて実現。今年度、延べ700人を集めた4回にわたる「学生・若手研究者のためのBERTワークショップ」において講師を務めるなど深層学習の技術に詳しい。
・関根聡<司会>(理研AIP)
ニューヨーク大学にて情報抽出、固有表現抽出などの研究を推進。2017年から理研AIPにてWikipediaの構造化知識「森羅」を「協働による知識構築」という手法により構築するプロジェクトを推進。パナソニック、SONY、楽天技術研究所NYなどの研究所でも活躍。