WEKO3
アイテム
カーネル埋め込みを用いた英語学習者向け用例検索
http://hdl.handle.net/10748/00010544
http://hdl.handle.net/10748/000105447fa7e718-ae08-4810-95f7-c92a918ecbc3
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2019-04-01 | |||||||
タイトル | ||||||||
タイトル | カーネル埋め込みを用いた英語学習者向け用例検索 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 修士論文 | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 首都大学東京大学院 | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 自然言語処理 | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 学習支援 | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 用例検索 | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | Master's Thesis | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | TMU | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | Natural Language Processing | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | Learning Support | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | Example Sentences Retrieval | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_46ec | |||||||
資源タイプ | thesis | |||||||
著者 |
塩田, 健人
× 塩田, 健人
|
|||||||
著者(ヨミ) |
シオダ, ケント
× シオダ, ケント |
|||||||
著者別名 |
Shioda, Kent
× Shioda, Kent |
|||||||
抄録 | ||||||||
内容記述タイプ | Abstract | |||||||
内容記述 | 近年,英語学習者向けの学習支援に関する研究が多くされている.学習支援システムの中には,学習者が書いた英文の誤りを発見するものやその誤りを訂正するもの,また英文を書く際に補助となるような英作文支援システムが存在している.英作文の支援をすることは,英語学習者の英作文時の負荷を減らすと同時に間違いを減らすことに貢献するので有意義である.しかし,熟練した英語学習者であっても特定のドメインにおいて適切な表現や様式に沿って英文を書くことは難しい.従って,英語学習者が英文を書く際に書きたい文に関係するキーワードを用いて特定ドメインのコーパスに基づき,英文を検索して表示するシステムは有益である.そこで,我々は英作文支援のアプローチの一つである用例検索に取り組む.英語学習者が書きたい文に関係する英文を検索する場合,GoogleやYahoo!などの既存の検索エンジンを用いてキーワードに関連する英文を検索することがあると考えられる.しかしながら,既存の検索エンジンでは英語学習者が英文を書く際に用例検索をすることに最適化されていないため,英語学習者が期待するような検索結果を得られることは難しいと考えられる.また,既存の英作文検索ツールは,学習者が検索をするためにクエリに入力した単語の表層を利用して用例文を検索するものが多い.そのようなツールにおいては,英語学習者の書きたい英文を表すクエリ,つまり,学習者が持つ情報要求に即したクエリを考えて入力することが前提とされている.しかし,学習者にとっては自身の情報欲求を再現するような英文を表現する適切なクエリを考えることは困難であると考えられる.そこで,我々は学習者が考えたクエリの背景にある潜在的な情報要求を満たす新しい文検索手法を提案する.我々が提案する手法は,クエリと検索対象の文にそれぞれを表すような潜在的な確率分布が存在すると仮定することにより,各分布間の距離が近いものを潜在的な意味を考慮したクエリと文の組み合わせとして扱うことを可能にする.さらに,潜在的な確率分布を考慮することにより,文検索においてクエリに表現力を追加することができると考えられる.我々は潜在的な確率分布と分布間の距離を表現するために,分布のカーネル埋め込みの枠組みを用いてこの問題に取り組んだ.分布のカーネル埋め込みとは,カーネルで表現される高次元空間上に分布をマップすることである.この手法を使うことにより,分布間の類似度を比較的容易に計算することが可能となる.加えて,クエリと検索対象文の分布間の距離はそれぞれのインスタンス間の内積によって計算されるが,単純なこの方法でのクエリ-文間の類似度はクエリの単語と全く関係がない文中の単語まで計算に考慮されてしまい,クエリの潜在的な意味が十分に反映されない問題がある.そこで,我々はN-gram窓を用いることにより,クエリと関係度が高い文中の単語をピンポイントで考慮することを可能にすることを示した.英語学習者によってアノテーションされたクエリ-適合文のデータセットを使ったPrecision@kによる評価実験の結果,我々の提案手法は文間類似度タスクの先行研究における教師なし手法より高い適合率を達成した,本研究の貢献は以下の3つである.・分布のカーネル埋め込みとN-gram窓を用いた新しい文検索の類似度計算法を提案した.・大学広報に関するコーパスを作成し,2語のクエリに関連する英語学習者のための例文をアノテーションした,・我々が作成したコーパスを用いた評価実験で,先行研究である教師なし文間類似度計算法に対して提案手法が高い適合率を達成した. | |||||||
抄録 | ||||||||
内容記述タイプ | Abstract | |||||||
内容記述 | In recent years, there are many studies on learning support for English as a Second Language (ESL) learners. There are some writing assistant tools that find and correct errors in English sentences written by learners. Assisting English writing is meaningful as it contributes to reducing the burden of ESL English composition at the same time as reducing the mistakes. However, even for advanced ESL learners, it is difficult to write sentences con-forming to the styles and expressions in a specific domain. In existing search engines, systems are not optimized for retrieving example sentences when writing English sentences, so it is considered difficult to obtain query intent expected by English learners. Also, existing tools search for example sentences using the surface layer of the words that the learner has entered in the query because the query is assumed to represent an English sentence that the ESL learner wishes to write. However, it is considered difficult for ESL learner to think of an appropriate query that expresses English sentences that reproduce his or her information need. Therefore, it is beneficial for non-native speakers to search for sentences using keywords that the writer aims to use. So, we tackle example sentence search with latent intent to support English composition for ESL learners. ESL learners are familiar with web search engines, but generic web search results may not be adequate for composing documents in a specific domain. However, if we build our own search system specialized to a domain, it may be subject to the data sparseness problem. Recently proposed word2vec partially addresses the data sparseness problem, but fails to extract sentences relevant to queries owing to the modeling of the la-tent intent of the query. We address this problem by using a kernel embedding framework. Kernel embeddings make it possible to add expressiveness to the query in sentence retrieval by using latent probability distribution. In addition, our method of taking N-gram windows boosts the precision of sentence retrieval by considering words that are highly related to the query. This method implicitly models latent intent of query and sentences, and alleviates the problem of noisy alignment. Our results show that our method achieved higher precision in sentence retrieval for ESL in the domain of a university press release corpus, as compared to a previous unsupervised method used for a semantic textual similarity task. The main contributions of this study are as follows: • We propose a novel sentence similarity metric based on kernel embeddings and N-gram windows. • We build a corpus of university press releases and annotated example sentences for ESL, given a. query of two words. • We show that our proposed method outperforms unsupervised baselines on our dataset. | |||||||
内容記述 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 首都大学東京, 2018-03-25, 修士(工学) | |||||||
書誌情報 | p. 1-28, 発行日 2018-03-25 | |||||||
著者版フラグ | ||||||||
出版タイプ | AM | |||||||
出版タイプResource | http://purl.org/coar/version/c_ab4af688f83e57aa | |||||||
その他のタイトル | ||||||||
その他のタイトル | Suggesting Sentences for English as a Second Language using Kernel Embeddings | |||||||
学位名 | ||||||||
学位名 | 修士(工学) | |||||||
学位授与機関 | ||||||||
学位授与機関名 | 首都大学東京 | |||||||
学位授与年月日 | ||||||||
学位授与年月日 | 2018-03-25 |