日本データベース学会の皆様
#重複してお受け取りの場合はご容赦ください。
国立情報学研究所 情報学研究データリポジトリ(IDR)より,データセットの
更新についてアナウンスさせて頂きます。
--------------------------------------------------------------------
2026/05/11
提供中の「日本の判例HTMLデータ」を更新しました
https://www.nii.ac.jp/news/2026/0511.html
--------------------------------------------------------------------
国立情報学研究所 情報学研究データリポジトリ(IDR)では,2024年から提
供している「日本の判例HTMLデータ」につきまして,最新のデータに更新し
ましたのでお知らせ致します。
本データセットは,情報・システム研究機構 データサイエンス共同利用基
盤施設 人工知能法学研究センターが作成した,最高裁判所が公開している
判例集のPDFデータをテキスト化(HTMLデータ化)したものです。
これまで,2024年10月10日時点の65,855件の判例データを使用していました
が,今回の更新で,2026年3月23日時点で検索可能な,1947年~2026年まで
の67,313件の判例データに拡充されました。
また小見出し,箇条書き,段落といった構造に加え,意味セクションのタグ
が追加されるとともに,自動解析の精度が改善されています。
さらに,各判例のメタデータや,HTMLデータから抽出した裁判官・当事者,
キーワード,参照法令,参照特許などの情報,PDFのページ数などをTurtle
形式でRDF化したデータも新たに付随しています。
データは情報学研究データリポジトリ(IDR)のサイトよりオンライン申請
にて入手可能です。提供は無償で,利用は学術研究目的に限ります。
データの内容や利用条件等の詳細については以下をご覧ください。
→ 情報学研究データリポジトリ - 日本の判例HTMLデータ
https://www.nii.ac.jp/dsc/idr/rdata/HANREI/
--------------------------------------------------------------------
その他提供中のデータセットについては次のウェブサイトをご覧ください。
国立情報学研究所 情報学研究データリポジトリ
https://www.nii.ac.jp/dsc/idr/
提供データは今後も増やしていく予定です。研究に広くご活用いただければ
幸いです。
--
===========================================
国立情報学研究所 IDR事務局(大須賀 智子)
〒101-8430 東京都千代田区一ツ橋2-1-2
E-Mail : idr(a)nii.ac.jp
URL :
https://www.nii.ac.jp/dsc/idr/
===========================================