[B! NLP][English][Corpus] kana0355のブックマーク

kana0355 id:kana0355

NLPとEnglishとCorpusに関するkana0355のブックマーク (56)

Center for Advanced Intelligence Project
kana0355 2020/12/14
NLP

CogLing

Corpus

Education

English
リンク
Z会、英語スピーキングの採点をAIで自動化へ　公正な採点を低コストで実現する狙い
Z会と、教育 ITシステムなどを手掛けるEdulab（東京都渋谷区）は9月10日、AIを活用して英語のスピーキングテストを自動採点する技術の共同研究を始めたと発表した。約8000人が受験するZ会の「英語CAN-DOテスト」で集まった数万点の音声データと評価データを活用。EdulabのAIを使った自動採点技術を組み合わせ、受験者が話した英語を自動採点する技術の研究開発を進める。開発の背景には、学習指導要領の改訂や、大学入試センター試験が大学入学共通テストに変わる大学入試改革がある。グローバル化が進む中で、読み書きだけでなく「話す」「聞く」などの技能も教育で重要視するようになったが、話す技能の測定には人件費がかかるうえ、評価する人によって測定結果にばらつきが出るなどの懸念もある。関連記事英検の採点にAI　ライティング・スピーキングも自動採点英検のライティングとスピーキング試験に、AIに
kana0355 2019/09/10
“AIを活用して英語のスピーキングテストを自動採点する技術の共同研究を始めたと発表”

English

Education

Corpus

NLP
リンク
プログラミング必須英単語600+ | プログラミング英語検定
概要プログラミングをする際には、APIリファレンスやソースコードのコメントなどを英語で読むことが求められます。場合によっては英語で関数名を付けたり、ちょっとしたマニュアルを書いたりする機会もあります。ただしプログラミング時に求められる英単語は、一般的な英語で求められる英単語とは異なります。本必須英単語リストでは、プログラミング時に求められ、特に目にすることが多い英単語を以下のカテゴリーに分けて選定しています（注1）。プログラミング英語の学習や知識確認にご活用ください。
kana0355 2019/09/05
English

CogLing

Corpus

NLP
リンク
英語論文から単語を抽出&登場回数順にソートし、さらに意味も載った単語帳まで作ってみた。 - Qiita
はじめに英語論文を読み始めの頃、知らない単語、特に専門単語が多すぎてつまづくことがよくある。紙へ新出単語をリストアップしていくのも悪くはない。しかし、これをPythonにやらせたら楽になるのではないか、と思い表題のことをやってみた。今回は専門用語の意味を調べるところまでは行かなかったが、一般的な単語の意味を調べるところまではできた。 ipynbファイルは、ここに置いた。ダウンロードの仕方が分からない方はここをクリックするとzipファイルがダウンロードされる。目次 0.論文pdfを収集。 1. 各pdfをそれぞれtxtに変換。 2. 作った各txtを１つにまとめる。 3. txt内の各単語の登場回数を調べる。 4. Mac内蔵辞書を使って単語帳（登場回数順）の作成。 0. 論文pdfを収集。 Google Scholarとかから拾ってくる。 1. 各pdfをそれぞれtxtに変換。ターミ
kana0355 2019/02/14
Corpus

English

NLP

Python

論文
リンク
Yusuke Kondo on the Web | 霑題陸縲�謔�莉九�繝壹�繧ｸ
ﾂ祥� 2007窶扼窶忸窶堋ｩ窶堙ｧ2008窶扼窶忸窶堙懌�堙��ｰﾃ闇�wﾅ陳､窶ｹ窶�窶敕ｯ窶｢ﾃ｢ﾂ鞘�｢窶ｹﾃ�ﾂ　(ﾅｽﾃ｡ﾅｽﾃｨﾅ陳､窶ｹ窶�(B) ﾋ�ｪ窶敕� ﾅ�Oﾂ坂�佛津ｪ窶ｹﾂｳﾋ�ｧ: 窶ｰpﾅ津ｪﾅ�wﾂ習ﾅｽﾃ停�堙娯�ｰﾂｹ窶愿��堙俄�堋ｨ窶堋ｯ窶堙ｩ窶ｰC窶板･窶堙固陳､窶ｹ窶�ﾂ：ﾂ坂ぎ窶禿壺�ｰﾅｾ窶愬｡窶板斃彑窶堙俄�堙ｦ窶堙ｩ窶｢]窶ｰﾂｿ窶堙娯�｢ﾂｪﾂ静坂�堙��ｰﾂｹ窶ｹﾂｿﾅ�w窶廬窶伉ｪ窶凖ｨ)窶堙個鞘�｢ﾂ青ｬ窶堙ｰﾅｽﾃｳ窶堋ｯ窶堙�行窶堙≫�堋ｽﾅ陳､窶ｹ窶�窶堙個青ｬ窶ｰﾃ岩�堙��堋ｵ窶堙�、窶ｰpﾅ津ｪﾅ�wﾂ習ﾅｽﾃ停�堙娯�ｰﾂｹﾂ青ｺ窶堙ｰﾅ津ｶﾅ�J窶堋ｵ窶堙懌�堋ｷﾂ。ﾋ�遺�ｰﾂｺ窶堙家断ﾂーﾆ耽窶堙固�T窶牌窶堙ｰﾅｽﾂｦ窶堋ｵ窶堙懌�堋ｷﾂ。ﾅ陳､窶ｹ窶�窶禿壺�廬窶堙��堋ｱ窶堙姑断ﾂーﾆ耽窶堙ｰﾅｽg窶
kana0355 2018/08/07
NLP

Education

English

Corpus
リンク
Type Token Ratio (TTR) を使うのはもう止めようという話 - Qiita
（V:異なり語数, N:総語数）という単純な式で表されます。テキストマイニングで有名な同志社大の金先生のサイトにも紹介され、たまに論文でも見かける指標ですが、注意して扱わないと間違った結論を引き出しかねません。というのもTTRにはサンプルサイズ依存性があり、Nが異なる文書間ではTTRを比較することができないからです（したがって上記サイトで安倍首相は福田総理よりも語彙が豊富と結論しているのは誤りだと思う）。以下、説明とその対策を見ていきたいと思います。サンプルサイズ依存性この問題はBaayen(2001)の"Word Frequency Distributions"に詳しく書かれています。一言で言うと、問題は異なり語数Vが総語数Nの増加に対して線形には増加していかないことにあります。TTRは異なり語数を総語数で割ったものなのですが、この性質から、一般的には総語数が少ない文書のほう
kana0355 2018/01/05
NLP

CogLing

English

research

Corpus

statistics

Python
リンク
VOICE - Project
kana0355 2017/08/26
ELF Corpus

English

Corpus

research

Education

NLP
リンク
ネットで発音記号を再生させる方法
IPAの発音記号が与えられた時に、それがどういう音なのかを個々の発音記号の知識がなくてもオンラインで調べたい、と思い、やり方を調べてみました。(ツールをインストールしても良ければ espeak でできるようです) 結論と […] IPAの発音記号が与えられた時に、それがどういう音なのかを個々の発音記号の知識がなくてもオンラインで調べたい、と思い、やり方を調べてみました。(ツールをインストールしても良ければ espeak でできるようです) 結論としては、過去にいくつかあったサイトは今は無くなっていて、昨年末に公開された Amazon Polly を使うのが良さそうに思いました。AWSのアカウントを作る必要はありますが。 Amazon Polly のコンソール版を開く。現時点ではPollyがまだ東京リージョンにはまだ来ていないので、北米や欧州でPollyが提供されているリージョンのサービス
kana0355 2017/06/28
NLP

CogLing

Corpus

e-learning

English
リンク
台湾にやって来るのは久しぶり。 - 武蔵野日記
またしても娘が6時前に起き、朝から相手をする。21時に寝てくれるようになったのはいいのだけど、6時に起きて1時間ほど一緒に遊ぶなら20時に寝てほしいような？（夜も20時からの1時間くらいは絵本を読んだりかくれんぼしたりお姫様ごっこや電話ごっこしたりしているのである。）午前中は大学に出勤。 Foster and Andersen. GenERRate: Generating Errors for Use in Grammatical Error Detection. BEA 2009. 学習者の誤りパターンを用いて擬似コーパスを生成する話で、ちゃんと読んだのは初めてで、ポイントを押さえた紹介をしてくれたので分かりやすかったけど、ワークショップ論文（NAACL 2009 の併設ワークショップ）のためか詳細が若干不明。主要な貢献も何か分かりにくいような……。その後我々が Lang-8 コーパ
kana0355 2017/05/30
“誤りパターンの大規模学習者コーパスからの抽出は絶大な効果があるということで、大事なのは大規模な実データからパターンを抽出する、そして取れたデータの使い方に気をつける”

NLP

CogLing

Corpus

English
リンク
Structured Abstracts
What are structured abstracts? A structured abstract is an abstract with distinct, labeled sections (e.g., Introduction, Methods, Results, Discussion) for rapid comprehension (see Figure 1). What kinds of structures are used? Standardized formats for structured abstracts have been defined for original research studies, review articles and clinical practice guidelines (1,2). The IMRAD format (INTRO
kana0355 2017/03/16
Move付きPubMed Abstract

NLP

CogLing

Corpus

English

write

research

論文
リンク
Datasets
kana0355 2017/03/15
NLP

CogLing

Corpus

English

Education
リンク
GitHub - UniversalDependencies/UD_English-ESL: English as a Second Language
kana0355 2017/03/15
NLP

CogLing

Corpus

English

Education
リンク
Research - Duolingo
kana0355 2016/10/10
NLP

Corpus

CogLing

English

Education

論文
リンク
jkn21.com
kana0355 2016/08/08
NLP

Corpus

CogLing

English

write
リンク
SoLET Lab at ASU
kana0355 2014/12/06
NLP

CogLing

Corpus

Education

English

statistics
リンク
KH Coderによる英語データの分析
kana0355 2014/10/24
NLP

Corpus

CogLing

English
リンク
JSSS2014 Symposium (Atsushi Mizumoto)
The document summarizes a presentation given by Atsushi Mizumoto at the Japan Society for Speech Sciences Open Forum in 2014. The presentation discussed lexical bundles, which are recurrent multi-word expressions, and analyzed the top 250 4-word lexical bundles found in articles from 10 applied linguistics journals between 1995-2008. Mizumoto's research identified common lexical bundles and analyz
kana0355 2014/10/15
English

Corpus

CogLing

Education

NLP
リンク
立命館学術成果リポジトリ
Hierarchically Creating English Academic Expression Lists: New Application of an Institutional Repository as a Language Resource
kana0355 2014/10/08
NLP

Corpus

CogLing

English

Education

論文
リンク
暦本式英語スピーチ練習法 - NextReality
原稿を準備してスピーチするような、わりと公式性の高い英語プレゼンのときの練習法です(Mac限定): 原稿をテキストファイルにセーブ。ターミナル（アプリケーションの中の「ユーティリティ」フォルダに入っています）。を開きます。 say コマンドで、原稿を音声ファイルに変換します： $ say -f script.txt -o script.aiff これで、テキスト原稿script.txtが英語音声ファイル script.aiff に変換されるので、iTunes経由でiPhoneやiPodにコピーします(最後の-o script.aiff を指定しなければ直接スピーカーから音声が出ます)。あとはひたすら生成されたスピーチファイル聞きながらシャドーイング。ジョギングしながらでも英語についていって淀みなく言えるように練習します。以上です。macのsayコマンドは、感情的表現こそありませんが、
kana0355 2014/06/23
Mac

Tips

NLP

Corpus

English
リンク
NTT HOME > NTT持株会社ニュースリリース > 主な研究開発内容
kana0355 2014/06/03
NLP

Corpus

CogLing

English
リンク
1 2 3 次のページ