日本語 WordNet

概要 * 詳細 * 画像 * 参考文献 * 関連プロジェクト * English * 国立研究開発法人情報通信研究機構

新着情報

ダウンロード

本サイトでは国立研究開発法人情報通信研究機構で開発されたバージョンのみを配布しております。 最新版は以下のサイトから入手することができます。

http://compling.hss.ntu.edu.sg/wnja/

ご利用に際し、お申し込みは不要です。

日本語 WordNet (1.1) 最新版

1.0版からデータを修正しました

57,238 概念 (synsets); 93,834 語; 158,058 語義 (synsetと単語のペア)

135,692 定義文; 48,276 例文

注:: このリリース版では、全エントリーのうちの5%ほどがエラー と考えられます。これは細かくチェックするより、まずはなるべく広くカバー することに力を注いだためです。今後は意味タグ付きテキストを翻訳する予定ですので、その過程で多くのエラーを発見・訂正していこうと考えております。 エラーに関するフィードバックも頂けると幸いです。

ライセンス準拠について

日本語ワードネットのデータを何らかの形でオンラインまたはアプリでご利用になる場合は、 以下のように(あるいは、他の言語の同じ意味の文章で)日本語ワードネットのサイトへリンクしてください:

Japanese Wordnet (vXX) © NICT, 2009-2010
linked to http://nlpwww.nict.go.jp/wn-ja/index.en.html
or
日本語ワードネット (XX版)© 情報通信研究機構, 2009-2010 
linked to http://nlpwww.nict.go.jp/wn-ja/

データを再配布する場合は、ライセンスも共に配布してください。

Open Clipart Library

日本語WordNet同義対データベース

本データベースには、日本語の概念辞書である「日本語WordNet」(version1.1)において、同じsynset(同じ概念を共有する語のまとまり)に掲載されている語を組み合わせて語対とし、このうち人手で同義関係にあると判定された11,753対が収録されています。例えば、synset00623862-nには「いざこざ、困り者、故障、トラブル...」といった表現が収録されていますが、ここから「いざこざ/困り者」「いざこざ/故障」「いざこざ/トラブル」といった語対を作成し、このうち「いざこざ/トラブル」のように同義関係にあると判定されたものが本データベースに収録されています。詳細については、データに添付されている説明書(readme.j.ver.1.0.pdf)をご覧ください。  

今後の予定

古い版

日本語 WordNet (1.0)

56,741 概念 (synsets); 92,241 語; 157,398 語義 (synsetと単語のペア)

135,692 定義文; 48,276 例文 (この版より、全ての定義文・例文の日本語訳が追加されています)

日本語 WordNet (0.92)

49,655 概念 (synsets); 87,133 語; 146,811 語義 (synsetと単語のペア)

日本語 WordNet (0.91)

50,739 概念 (synsets); 88,146 語; 151,831 語義 (synsetと単語のペア)

日本語 WordNet (0.90) 初公開版

49,190 概念 (synsets); 85,966 語; 156,684 語義 (synsetと単語のペア)


Francis Bond <bond@ieee.org>

Linguistics and Multilingual Studies
Nanyang Technological University
&
NICT 情報分析研究室
情報通信研究機構