日本データベース学会の皆様
#重複してお受け取りの場合はご容赦ください。
国立情報学研究所 情報学研究データリポジトリ(IDR)より,新規データセット
の提供についてアナウンスさせて頂きます。
--------------------------------------------------------------------
2024/08/20
「日本の判例HTMLデータ」提供開始のお知らせ
https://www.nii.ac.jp/news/2024/0820-1.html
--------------------------------------------------------------------
国立情報学研究所 情報学研究データリポジトリ(IDR)では,「研究者等提供
データセット」として,情報・システム研究機構 データサイエンス共同利
用基盤施設 人工知能法学研究支援センターより受け入れた「日本の判例HTML
データ」の提供を開始しました。
本データセットは,最高裁判所が公開している判例集のPDFデータをテキスト
化(HTMLデータ化)したものです。
最高裁判所のサイトで検索可能な最高裁判所判例集,高等裁判所判例集,下
級裁判所裁判例速報,行政事件裁判例集,労働事件裁判例集,知的財産裁判
例集のPDFデータをHTML化しており,2024年1月11日時点で検索可能であった
1947年~2023年までの約65,000件の判例データからなります。
HTMLデータでは,本文内容に無関係な部分を除去し,小見出し,箇条書き,
段落などの構造を認識して,それぞれに応じたタグを付与しています。
データは情報学研究データリポジトリ(IDR)のサイトよりオンライン申請
にて入手可能です。提供は無償で,利用は学術研究目的に限ります。
データの内容や利用条件等の詳細については以下をご覧ください。
→ 情報学研究データリポジトリ - 日本の判例HTMLデータ
https://www.nii.ac.jp/dsc/idr/rdata/HANREI/
--------------------------------------------------------------------
IDRでは,「研究者等提供データセット受入要項」に基づき,大学等の研究者が
作成したデータセットの受入を行っています。本データセットはこの受入要項
に基づき受入・提供を行うものです。データセット受入の詳細に関しては下記
をご覧ください。
→ 大学等研究者提供データセット受入
https://www.nii.ac.jp/dsc/idr/service/rdata.html
また,その他提供中のデータセットについては次のウェブサイトをご覧ください。
国立情報学研究所 情報学研究データリポジトリ
https://www.nii.ac.jp/dsc/idr/
--
===========================================
国立情報学研究所 IDR事務局(大須賀 智子)
〒101-8430 東京都千代田区一ツ橋2-1-2
E-Mail : idr(a)nii.ac.jp
URL :
https://www.nii.ac.jp/dsc/idr/
===========================================