Japanese expressions of an invasion of personal rights
Description
日本語人権侵害表現データセット
これは、言語処理学会2023において”権利侵害と不快さの間:日本語人権侵害表現データセット”の発表で用いた、誹謗中傷等の表現を集めたデータセットです。
仕様は変更される可能性があります
Release Date
Version 0.1 2023/03/09
NLP2023発表時点でのデータセットになります。
1.調査対象
民事事件
- 発信者情報開示請求事件
- 損害賠償等請求事件
インターネット上の投稿による人権侵害を争った事件よりこのデータセットは作成されています。
2.項目
データセットはそれぞれの項目に対応するjsonl形式です。
1:本件投稿:テキスト
本件投稿は,判例の投稿記事目録や事実・理由部分から,権利侵害の有無が争われた表現を匿名化してタグを付与し、書き起こしたテキストである.
もとの投稿記事目録や事実・理由部分では,原告に関わるような,個人情報と考えられるテキストが、アルファベット,記号,黒塗り等で置き換えられている.
この匿名化済みの記述に対して,個人の身元証明に関わる記述は[P1],企業や団体の身元証明に関わる記述は[G1],商品や制作物に関する記述には[M1],住所など個人情報に関わる部分には[INFO1]のタグを,それぞれ同一人物や同一表現がわかるように番号分けて付与する.
本件投稿中にURLが含まれる場合URLを[URL]タグに置換している。
2:本件投稿に関わる他の投稿(コンテキスト):テキスト
本件投稿への判断に考慮されたスレッドタイトル・会話・前後の投稿を判例で引用している場合がある.
本件投稿に関わる他の投稿は,そのようなテキストを書き起こしたものである.
本件投稿と同様の方法で匿名化処理を施している.
コメントの冒頭に[comment:1]のような形で、出現順に番号を付与している。
[commentP1:1]のような形式の場合は、P1の人物によって行われた発言であるとわかる場合には、人物タグを付与している
3:人格権侵害
本件投稿が,どの人格権の侵害を含んでいるか,問題が争われた権利の類型とその判断についてラベルで示したものである.
裁判の主文を反映してたものではない。
3-1:人格権の類型1:ラベル
権利侵害の類型1は,本件投稿がどの権利に対する侵害であるか,裁判で争われた点についてラベルで示したものである.
裁判においては,問題とされる投稿によって侵害されている権利を原告側が訴えるものであり,裁判所は,それぞれ訴えについて判断を下す.
1つの本件投稿に対して,複数の権利侵害の訴えが存在する場合,侵害が認められた権利を含む最大2つを抽出する.
判例文中で,本件投稿に対して「社会的評価」、「名誉権」といった文言を含む判断が行われている場合は名誉権,「社会通念上許容される限度を超えた侮辱」「名誉感情」という文言を含む判断が行われている場合は名誉感情,「プライバシー」という文言を含む判断が行われている場合はプライバシー権を扱い、上記の3項目に該当しないが「人格権」という文言を含む場合は、その他の人格権をラベルとして選択する。
加えて裁判例の中には,本件投稿の表現は原告を標的としていると推認出来ないと判断されるものなど,人格権といった権利侵害についての判断が下される前に,主張が棄却された事例の場合,Noneを付与する.
3-2:類型1の判断:ラベル(2項目)
「原告の名誉感情を違法に侵害するものである。」のように,人格権等に対する侵害を認める表現が含まれる場合,本件投稿による類型1の権利侵害が認められた事例として1を,「社会通念上許される限度を超えて原告を侮辱するものとは評価できない。」のように本件投稿が人格権等に対する侵害が認められると言えないと判断される表現が含まれる場合,権利侵害が否定された事例として0を付与する.
3-3,4:権利侵害の類型2, 類型2の判断
複数の権利について裁判で争われた場合,類型1の場合と同様に2つ目の項目の類型を選択し,判断についてラベルを付与する.
4:事件番号
本件投稿の引用元となった事件番号と争われた裁判所である.
5:文献番号
本件投稿の引用元となった文献番号である.
現在はLEX/DBより引用している。
6:プラットフォーム
事件の本件投稿が発生したコンテンツプラットフォームが明記されている場合,記載する.
Files
Files
(280.1 kB)
Name | Size | Download all |
---|---|---|
md5:7276716845a1af6c473384cfbeffcc69
|
280.1 kB | Download |