タグ

webと著作権と性に関するu-liのブックマーク (3)

  • 書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド

    私(安岡孝一)の2016年2月26日の日記の読者から、近江龍一・西原陽子・山西良典の『ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング』(人工知能学会第31回全国大会論文集, 2M2-OS-34a-1, 2017年5月24日)という論文を読んでほしい、との御連絡をいただいた。読んでみたのだが、書写言語研究におけるサンプルデータの重要性を全く理解していない論文で、正直、頭が痛くなった。 研究では猥褻な表現に関する文を集めるために,pixivに投稿されているR-18小説を用いた.R-18小説に分類される小説の中から,2016年10月のウィークリーランキングTop10の小説を選択し,分析に用いた. そんな偏ったサンプルデータ10で、まともな結果が出るわけが無いだろう。しかも、なぜpixivに限定しなければいけないのか、pixivに限定する意図は何なのか、この論文には全く書

    書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド
    u-li
    u-li 2017/05/30
    「西原陽子と山西良典は、以前、キラキラネームの研究に際しても、かなりおかしなサンプルデータを使っており、私自身こっぴどく指摘した」「そのサンプルデータの妥当性を検討しておくべきだ」
  • 立命館pixiv論文問題Q&A

    違法? 合法?→合法無断で引用していいの?→著作権法第32条に基づき、公表されてる著作物は無断で引用していいことになってます分析だから引用じゃない!→あっ、ひょっとしてかける数とかけられる数は違うって信じてる宗派の方ですか? 全文を機械分析するなんて引用の範囲を超えている!→著作権法第47条の7「情報解析のための複製等」に該当し合法です pixivは会員しか見れないけど?→不特定の誰か1人以上、あるいは50人くらいの人数より多くの特定多数に公開することを公表といいます会員制なのに公表してるってみなされるのおかしくない?→お金を払ってシュリンク破らないと読めない商業漫画も公表されたものですが何か 判例はあるの?→教師・生徒300人に配られた中学校の卒業文集は公表されてるので引用OKという判例→http://www.u-pat.com/h-1.html支部の規約で引用は禁止されてるよね?→規約

    立命館pixiv論文問題Q&A
    u-li
    u-li 2017/05/28
    “学者じゃない人も学問の自由を尊重しないといけないの?→そりゃオタクじゃない人も表現の自由を尊重しないといけませんから” “即売会に行けば会えちゃうじゃん?→何か起こる前に気づけてよかったですね” 同感
  • jsai2017:2M2-OS-34a-1 ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング

    Web上に投稿される情報の中には青少年にとって有害な情報,特に猥褻な意味を持つ言葉は直接記述されず暗喩により表現されることが多い.研究の目的は暗喩を用いて表現されている有害な文に対してフィルタリングを行うことである.提案手法では有害表現が含まれる文をドメインごとに機械学習し有害表現の分類器を作り,有害表現をフィルタリングする.提案手法の有用性を評価する実験をR-18指定の小説を使い行った.

    u-li
    u-li 2017/05/25
    “情報の中には青少年にとって有害な情報,特に猥褻な意味を持つ言葉は直接記述されず暗喩により表現されることが多い.本研究の目的は暗喩を用いて表現されている有害な文に対してフィルタリングを行うことである”
  • 1