Download
Download
著作権および利用規約
動詞項構造シソーラスは,広く自然言語処理で利用するための無償の言語資源として開発されたものである.動詞項構造シソーラスの著作者は岡山大学竹内孔 一,奈良先端科学技術大学院大学 乾健太郎,竹内奈央,名古屋大学 藤田篤が保持する.本言語資源の使用,改変,再配布については特に制限を課すことはしない.
本言語資源は開発途中であり本言語資源の著作者はその安全性,正確性,確実性,有用性のいかなる保証も行わないものとする.また本言語資源の著作者は,原形あるいは改変された形で配布された本言語資源に関連して生じる一切の損失について保証の責を負わないこととする.
本言語資源を利用された場合は竹内孔一、乾健太郎、竹内奈央、藤田篤によって文科省科研費基盤研究(B)「語彙意味論に基づく言い換え計算機構の工学的実 現と言い換え知識獲得への応用」(17300047,代表:乾健太郎) の支援を受けて作成されたことを記述してください。
本規約の準拠法は日本法とする。
ユーザは上記のことを了解してdownloadすること.
downloadデータ
- 動詞項構造シソーラスv0.902 (verb thesaurus 0.902) 2010年10月29日
- 特徴: 学研の「基本語データベース」のlexeed-IDを付与しました(2010/08/03)
データの説明
Download データはeuc-jpまたはsjis で記述されています.第一行目に列の説明があり
id,Lexeed語義id,見出し語,格1(深層格),格1(表層格),格1(FILLED),格1(フレーム変数),格2(深層格),格2(表層 格),格2(FILLED),格2(フレーム変数),格3(深層格),格3(表層格),格3(FILLED),格3(フレーム変数),格4(深層格),格 4(表層格),格4(FILLED),格4(フレーム変数),格5(深層格),格5(表層格),格5(FILLED),格5(フレーム変数),例文,大分 類1,大分類2,中分類,小分類1,小分類2,フレーム
の要素からなります.
idは動詞項構造シソーラスでの整理番号で1番から順に記述されています
Lexeed語義idは学研から発売されている「基本語データベース」に添付されている Lexeed.txtの第1列-第25列_第24列の形式として記録してします.例えば「自給する」の 暮らすという意味の語義は11010150-1_0-0-0-0-0で表現されています.
(注)cvsデータとして出力するがeuc形式であるためかexcelで直接立ち上げようとするとエラーになる. eucを扱えるテキストエディタ(xyzzy など)で見ること.
例文ですが,助詞を5段階のレベルに分けて整理して記述しています.具体的には 格1,格2,格3,格4,格5とわけてだいたい,(1)誰が,(2)何を,(3)どこから,(4)どこに/へに, (5)その他の意味で分類しています.
